文章專區

2023-12-15認識「開放科學」三維度,讓科研成果發揮更大的效益 504 期

Author 作者 鄭瑋/臺灣大學圖書資訊學系副教授;黃寶霈/臺灣大學圖書資訊學系計畫研究專員

「開放科學」(open science)涵蓋了非常寬泛的概念,學派也非常多元。它的主要意涵是期望學者們將研究過程和成果公諸於眾,與社會分享知識和資源,以促進更廣泛的科學交流。
 

最新的科學典範以「資料」為重心

回溯到2000年代,計算機和資訊領域的先驅海伊(Tony Hey)等人,提出了「資料密集典範」(data-intensive)的觀念。這意味著科學的發展已經從實驗、理論,以及電腦運算等典範,進化到現今以「資料」為核心的階段。在此典範下,即使是單一實驗室也能迅速產出大量資料,因此更注重研究資料的品質與價值。
 
到了2016年,英國學者里昂(Liz Lyon)基於資料科學的發展趨勢,進一步明確界定了開放科學的三大面向:開放近用(open access)、通透度(transparency)、研究參與(圖一)。「開放近用」指的是學者公開分享研究中的原始資料,以供更多人參照和應用。除了較為人知的開放近用,里昂也談及研究的「通透度」,讓研究方法和結果可以被其他學者檢視和驗證,與近年的研究再現性(reproducibility)問題息息相關。最後「研究參與」則鼓勵公眾以各種方式參與學術研究,實現知識的民主化。


圖一|開放科學三面向圖(資料來源:Lyon, 2016)

 

開放近用:研究人員分享研究資料有哪些動機與阻礙?

伴隨著資料科學(data science)與運算技術的進步,科學家們不斷嘗試運用複雜的資料分析技巧,對多元領域的數據與文字進行深入解析,以期得出有意義的結論。在這股科技與資料科學興盛的研究典範下,研究者和研究資料之間的互動日趨緊密,更需要精確的分享與管理策略。
 
不過,儘管分享研究資料的概念深獲學界的認同,但學者在實際分享與使用上卻阻礙重重。過去的研究曾探討研究人員分享和使用開放研究資料的動機和阻礙,但直到2020年,才由祖德維克(Anneke Zuiderwijk)等學者爬梳過去開放研究資料的相關理論,識別與釐清影響學者分享或使用他人資料的11個關鍵因素:
 
1. 研究者的個人背景:例如領域、經驗、年齡、性別 和學者所在的地理位置,皆會影響他們開放自身研究資料的意願。
2. 資料分享的自願性或強制性:例如研究資助或期刊投稿要求。
3. 內部驅動:例如利他主義、對學界的看法及個性。
4. 外部驅動:期望得到的成果、獎勵或更高引文數。
5. 可利用的技術資源,例如新的AI技術和日益增加的運算能力,為研究者提供了巨大的機會。
6. 對資料來源或使用者的信任。
7. 社交影響:例如同儕和學術社群的影響。
8. 預期的付出:包括金錢、時間和其他資源。
9. 過去的經驗:先前分享或使用資料的好壞經驗。
10. 國家級的法律、政策和規定:例如政策規定獲得國家獎助的研究者需公開他們的數據。
11. 資料的特性:例如資料具有機敏性而不得直接公開。
 
祖德維克等人的研究揭示了研究人員面對分享、使用研究資料時的多重糾結與思量,為2020年代以前的開放研究資料理論和研究,劃定了一個重要的階段性里程碑。奠基於此,學界得以更加理解設計、分享與使用資料的機制,增加驅動力與降低摩擦力,進而達成開放近用的願景。
 

研究通透度—實踐預註冊、重視再現性

「通透度」對於臺灣學術社群來說,是一個比較新的名詞。研究通透度不僅在上述「開放近用」的基礎上要求研究產品公開,它的終極目標是提升研究的再現性。當代學界重視的研究透明度與再現性,可能並不單純是為了確保研究能被重製,更是關注於科研結果的真實性——研究結果是否真如科學家所宣稱的一樣。近年來,面對眾多學術界的不當行為爭議,在缺乏確鑿證據的情況下,學術社群難以直接指控作者造假,卻可以基於研究難以再現撤銷有高度疑慮違反學術誠信的研究。
 
為了提升研究通透度,想在開放科學有良好實踐的學者,需要更加重視記錄研究中的重大事件,如此一來才能積極回報採取研究方法的理由、更改實驗步驟的決定等細節。在這方面實踐中,除了要求學者公開原始數據,也更加注重詳盡記錄實驗程序,以及預先公開研究計畫時所設定的假設與參數,即在研究初始便進行預註冊(pre-registration)〔註〕。這些紀錄都讓他方有機會辨識與確認研究成果是否來自於最初始的研究假設,避免研究者為獲得最佳研究成果,而暗自操弄研究方法。在《科技報導》474期中的文章也提到,「註冊報告」與「材料分析報告」發表制度可加強研究通透度與再現性,皆為相同的概念。

 

(Adobe Stock)

 

〔註〕預註冊是指在開始研究之前,研究者會提出一份記錄研究中預計採用研究方法(如假設、變數、操作流程、統計分析等)的文件,將此文件放入外部的典藏庫(repository),例如開放科學平臺(Open Science Framework, OSF),以作為一種對外宣告研究歷程的公開時間戳記。

 

參與研究—公民科學計畫

「參與研究」指的是在科學家於研究過程中納入其他合作夥伴,以共同設計、提供資源、蒐集分析與發表研究。在學界引入公眾參與的過程中,有多種不同的模式,如科學募資平臺、公民科學計畫,或者如專業民調中心時常參考群眾預測市場來預測選舉或公決意向等。近年來國際學術社群蓬勃發展的公民科學計畫,就是開放科學的這個面向中最重要的實踐之一。
 
從國外記錄生物多樣性的平台iNaturalist、結合賞鳥活動的eBird,到臺灣本土發展成形的路殺社、海龜點點名、慕光之城等計畫,這些公民科學計畫背後的期待與信念,不只是研究者向公眾開放並邀請其參與科研產製,也是試圖創造三贏局面:公眾獲得相關議題知識與個人成就感、學者獲得研究上的協助,以及社會獲得有益的科研成果,並讓多方利益關係者間進行對話。
 

開放科學在臺灣:資料科學與公眾參與的交匯點

面對開放科學的浪潮,目前臺灣學界也正在積極拓展研究視野與蓄積自身的能量。中研院資訊科學研究所的副研究員莊庭瑞與研究團隊,為累積臺灣本土於資料儲存庫(data repository)的開發經驗,建置以實踐FAIR資料原則〔註〕為訴求的「depositar研究資料寄存所」,期待研究資料能被尋找、取用、理解與再用。此外,該團隊也建立研究資料管理推進室,提供經驗分享與交流討論平臺,協助研究人員厚實自身管理研究資料的能力,部分研究資料管理推進室的文章內容也同步刊登於《科技報導》中。這些作為可謂為臺灣推展開放科學中近用概念的重要基礎建設之一。
 

〔註〕FAIR資料原則:即可被找到(findable)、可被取用(accessible)、可相互操作(interoperable)、可再次使用(re-usable)。上述四概念所形成的縮寫簡稱,目的是為增進研究資料的再用價值。更多FAIR資料原則的資訊,可參閱Go Fair組織的文章:https://www.go-fair.org/fair-principles/

 
同時,臺灣大學圖書資訊學系也有以開放科學為研究焦點的DxLab,該研究團隊致力於理解開放科學三維度中的實踐與機制,例如探索研究人員分享資料的正式誘因——資料論文的投稿動機(開放近用)、公民科學計畫資料徵集與品質維護(公民參與),以及利用新興區塊鏈科技輔助研究通透度等。而在秉持開放科學的理念下,該研究團隊也正積極整理過往研究並出版中文的研究報告,期待能回應開放科學的價值,向公眾分享研究成果。

 

(Adobe Stock)

 

除了資訊科學領域的學者之外,臺灣的心理學界同樣積極推動開放科學概念。舉例來說,串聯全臺六所大學實驗心理學教師的臺灣心理科學協作群(Taiwan Collaboration for Psychological Scientific Research)〔註〕便致力向社會與行為科學界推廣開放科學的理念與實踐方式,更著手規劃心理學研究可重製教程,期待有助於領域內外對於開放科學的思考與發展。
 

〔註〕詳見連結:https://tcpsr.netlify.app/

 

開放科學與永續發展議題

隨著大眾對於永續議題的關注度不斷上升,開放科學也 助於研究社群,在研究上達成永續的目標。開放科學提倡研究資料與成果皆能被他者所近用,因此能讓既有的研究與相關資源被他方再運用,學術界也不須重複花費成本產製類似的科研成果,使資源的運用能得到最大化效益。另一方面,開放科學視通透性為研究流程的重要原則,不僅確保了研究的真確性,具備公眾的信任下更讓研究的影響力得以綿延。此外,當開放科學直接協助到永續研究議題時,除了能更進一步推動永續目標之外,若公眾作為研究參與者之一,也有可能從中開展出較為永續的生活方式。
 
開放近用、通透度、研究參與這三個維度,若能被完整地整合入科學研究中,便能使科研成果發揮更大的效益。不僅僅是學者公開和透明地展現自身的研究過程、資料和工具,獲得大眾的信賴與肯定;而且也能確保科學研究的謹慎、通透和可再現性,展現科學的誠信和價值。此外,給予公眾機會參與學術研究,更能加深學界與社會之間的連結及理解。最終,這種開放性和透明性不僅有助於推進科學發展,還能更好地滿足社會的期待和需求。

 
延伸閱讀
1. Lyon, L. (2016). Transparency: The emerging third dimension of open science and open data. LIBER Quarterly: The Journal of the Association of European Research Libraries, 25(4), 153-171.
2. Zuiderwijk, A. et al. (2020). What drives and inhibits researchers to share and use open research data? A systematic literature review to analyze factors influencing open research data adoption. PLoS one, 15(9), e0239283.