文章專區

2024-09-30斥資百億日圓 日本矢志將科研成果全面開放取用 513 期

Author 作者 劉雨如/英國諾丁罕大學遺傳學博士

今(2024)年2月,日本文部科學省宣布日本將投資100億日元(約新臺幣22億元)發展科研成果的開放取用(open access, OA),除投資建立存放科學論文、基礎數據和其他研究材料的網站,也會規劃統一基礎研究分析軟體、標準化的機構典藏庫。為確保國內所有研究論文能被免費取得,自明(2025)年4月起,受到日本政府資助的研究人員被要求將他們的論文存放在機構典藏庫中,以推動日本國內研究的全面開放取用。目前日本800多所大學中,已有超過750所擁有機構典藏庫。

在數位典藏的可能性出現之前,科學家對於公開研究資料與成果的想法十分保守,甚至視這些成果為私有財產且不願外傳,通常只有領域內的少數研究者之間會互通有無。直到大數據時代來臨,大量的研究資料和更多的跨領域研究量能出現,增進了研究資料與成果的通透性,對於學科發展的速度有極大的影響。2016年威金森(Mark Wilkinson)等人在《科學資料》(Scientific Data)上發表了〈科學資料管理與治理的FAIR指導原則〉(The FAIR Guiding Principles for scientific data management and stewardship),其中提及的「可查找、可取得、可交換、可再用」(findable, accessible, interoperable, reusable, FAIR),逐漸成為開放科學的準則之一。


日本斥資百億,學術開放取用跨出一大步

日本本次斥資百億日幣的計畫,可望增強研究資訊的長期可追溯性,並促進二次研究,推動更多學術合作。日本此舉是繼六年前美國和歐洲學術基金組成的cOAlition提出極具影響力的Plan S之後,全世界大型學術資料開放取用計畫的一大進展。美國在2022年規定所有由美國納稅人資助的研究,必須從2026年起免費提供獲取。而日本是世界上首批制定全國性開放取用計劃的國家,也是首批在開放取用方面取得顯著進展的亞洲國家。

但這方面的進展絕非一蹴可及,2022年日本即推出預印發表(pre-print)平臺伺服器Jxiv,然而卻鮮少有日本研究人員使用,至今只有幾百篇預印本文章發表於該平臺。在去(2023)年的調查中,只有大約1/5的受訪研究者知道該平臺的存在。

現階段日本主要推行「綠色開放取用」(Green OA),期望作者將已被接受但尚未定稿的版本上傳到數位典藏庫中。此舉距離足以推行「金色開放取用」(Gold OA),也就是經過期刊編輯和潤飾最終版本的文章開放取用還有一段路。出版商會對選擇開放取用的投稿文章收取處理費(article processing charge, APC),用以支付出版成本,因此如果所有的發表都選擇開放取用出版,對於大學來說將造成過大的負擔,更不用說APC的價碼還以4.3%的速率逐年增加中。

國際學者相當支持日本的做法,因為這樣一來不論發表在什麼期刊、是否選擇開放取用,研究者都能實現開放取用的政策。以國家為單位託管所有研究資料,對研究產出也可以有統一的記錄。另外還有一個好處,就是以日文發表的研究也不會被歧視,一律都能被典藏。


臺灣學術成果開放取用的最新進展

為了強調研究資料的長期保存與公眾取用,美國國家科學基金會(National Science Foundation)已經開始要求研究計畫申請書中,需檢附「資料管理與共享方案」(data managment and sharing plan, DMP),詳述計畫執行期間將產出的資料,以及這些資料在後續取用與分享的規畫,而這些資料發布的成本與論文出版費用一樣都可同時提列於計畫書中,申請經費補助。日本也將在今後要求政府經費支持的研究成果,都必須屬於開放取用。

相較之下,臺灣推行開放科學的力道就小很多,國科會中只有永續學門自2021年起開始,鼓勵研究團隊提交計畫書的同時提出DMP。國科會永續學門提供計畫經費鼓勵研究者,公開他們的研究資料,最多可獲得額外的10%計畫經費補助,做為研究資料管理的資源。至於其他學門的研究領域,則還沒有任何政策面的推動。

在資料庫的部分,臺灣大學圖書館設立的「臺灣學術機構典藏」(Taiwan Academic Institutinal Repository, TAIR)匯集臺灣各機構研計成果,整理成書目資料(metadata),是大型的學術資料檢索系統,不過全文的開放性還是受出版商的限制。為提升研究資料共享及研究通透性,中研院為人文社科領域設立「學術調查研究資料庫 SRDA」(Survey Research Data Archive),六年前也為科學領域設立「研究資料寄存所實驗室 depositar」提供數位資料的長期儲存場所。SRDA可免費寄存研究文件,並採會員制對外開放資料使用。Depositar則有數種開放授權條款可供選擇,可限制取用也可以完全開放給公眾領域(public domain)。

舉例來說,中央研究院生物多樣性研究中心助研究員林子皓,就將研究中收集到的聲景原始資料寄存於depositar中,並設置為完整開放,相關資料集伴隨著清楚的研究計畫資訊、研究資料蒐集時間與地點、資料授權條款、資料引用格式,同時也釋出開源的聲景分析工具,甚至公開資料分析教學,引導有興趣的大眾一起了解聲景。

然而與日本Jxiv的命運相似的是,現階段臺灣學術研究者普遍較為缺乏研究資料開放的意識,使得目前研究資料再利用的可能性近乎於零,未能顯現典藏庫的應用價值。

雖然如此,depositar仍舊努力推廣DMP的普及化。國際上針對幫助研究者們撰寫DMP的線上工具,已有 DMPonline、DMP Tool等可供使用。Depositar自2022年開始,與臺灣生態多樣性資訊機構(Taiwan BiodiversityInformation Facility, TaiBIF)合作,舉辦DMP撰寫工作坊,希望研究者能熟悉典藏與運用研究資料的流程。臺灣生物多樣性資訊聯盟(Taiwan Biodiversity Information Alliance, TBIA)整合TaiBIF、農業部生物多樣性研究所、林業保育署、海洋保育署、國家公園署、林試所、臺博館、水利署、科博館,以及生命大百科(TaiEOL),共十個機構的資料庫,希望能解決資料四散、格式不一的問題。學術界開放取用已為大勢所趨,即使在臺灣,日後對於學術出版與開放資料的要求也會愈來愈多,研究者可及早做準備。


Alphafold 3在開放科學帶來的爭議

但科學知識共享中的研究成果開放取用仍遭遇許多困難。今年5月初,Google旗下的DeepMind推出新一代,可預測蛋白與DNA及RNA複合物的立體折疊結構的AI模擬器「AlphaFold 3」,並發表在《自然》(Nature)期刊。Alphafold 3具備的功能可望成為生物醫學基礎研究和新藥開發的重要工具,然而文章才剛發表,Alphafold 3就隨即飽受批評與質疑。由於前一代AlphaFold 2在發表後公開了完整的程式碼,研究者可藉此處理大規模的資料,嘉惠許多研究。但現階段的AlphaFold 3只提供了程式運作方式的描述、未公開完整程式碼,並且只能在Google網頁上使用。雖然應用程式開放給任何擁有Google帳戶者都能使用,但每個帳號每天只能進行十次預測,而且不再適用於大規模資料。

雖然開發AlphaFold的機構Google是一家以營利為目的的公司,並非公眾經費支持的研究機構,沒有需要公開成果或商業機密的義務,但一向宣稱支持開放科學、開放取用的《自然》期刊,對Google的做法卻毫無抨擊,實在啟人疑竇。甚至在《自然》期刊的審稿過程中,同儕審查人多次要求檢視原始程式碼也未能一睹。機器學習的高昂計算成本,對經費有限的學術機構來說是項沉重的負擔,相當依賴學術發表中公開的研究成果。AlphaFold 3在《自然》期刊發表,卻未能實踐FAIR的標準,令人遺憾。

對此,《自然》期刊在5月底發表聲明指出,DeepMind的研究副總裁科利(Pushmeet Kohli)在社群平臺X上發布消息,聲稱團隊正努力在六個月內發布AlphaFold 3模型(包括權重)以提供學術使用,而《自然》期刊也將在程式碼發布後更新已發表的論文。至於為什麼允許未公開完整數據和程式碼的研究逕行發表呢?《自然》期刊表示,他們目前已與Code Ocean合作,確保研究作者向讀者提供材料、數據、程式碼和相關協議,且沒有設定不當限制,否則編輯有權拒絕該論文,希望能藉此實現研究的可重現性及可追溯性。但《自然》期刊也承認這項政策具有一些彈性,若研究作者在投稿時向編輯提出不共享代碼或算法的理由,且編輯團隊進行評估後與作者達成共識,可有例外。

編輯評估的基礎在於缺乏數據報告標準,或缺乏公開存放數據和結構化數據庫的技術基礎設施,需要保護機密性,或者出於安全或法律因素,研究作者可選擇不公開數據。此舉先前在化學、氣候變遷和病毒學的研究發表中都有前例。

私營企業資助了許多研究和開發,許多研究結果並未發表在同行評審的期刊上。《自然》期刊認為學術出版應該持續與私營企業及科學家合作,讓他們的研究也能經過同儕審察和發表,進而擴大知識分享與研究驗證的範疇。《自然》期刊也在文中一再重申,這些做法並不是最終結論,而是對話的開始。每位研究者都是未來知識的產生者,科學知識的開放與否更是與所有人息息相關。對於開放科學與這些爭議,你的看法又是如何呢?

延伸閱讀
Chawla, D. S. (2024 May 30). Japan's push to make all research openaccess is taking shape. Nature.https://www.nature.com/articles/d41586-024-01493-8