文章專區

2021-10-19疫情之下,我們可以信任哪些資訊?如何取用知識?-《研下知疫》 478 期

Author 作者 莊庭瑞/中央研究院資訊科學研究所

大傳染病COVID-19在2020年初擴散全球之後,日常的生活逐漸有了新的樣態。疫情的規模與發展因地而異,但是眾人的生活或多或少都受到影響,個人的生活需要調整,彼此也要適應新的互動方式。COVID-19這場全球的公共衛生危機,帶來的全域、共時,以及普遍的個人經驗,衝擊眾人的常規與思維有可能產生變化。而個人各自的生活與人類全體的存活兩者之間,也產生微妙的連結。各地政府以及國際組織對於這次危機的應對處置,更彰顯了現有體制的僵硬與欠缺,或將促使眾人做出結構性的改變。

可信任的資訊?維基百科與世界衛生組織

新型傳染病蔓延之初,眾人對傳染途徑與防治方式的瞭解有限,新的研究發現也不容易及時轉換為易於瞭解的知識,這時來自政府公共衛生部門的資訊與指引,是眾人自我保護以及抑制流行病散布的行為依據。以這次的新冠肺炎大流行為例,來自政府的指引包括:戴口罩的效用與時機,避免群聚的地區與規模等。在這同時,不實資訊的傳播也造成個人和群體的恐慌與傷害。如何抑制不實資訊的散布,並有效傳播事實資訊,是防治大規模傳染病的重要工作。然而,來自各國政府以及其所組成的國際組織的資訊,是否就可被信任?另一方面,由民間團體自行編輯呈現的資訊,是否就比較不可靠?這些問題無疑可採用相對(而非絕對)的應答態度:政府的資訊不盡然可信(但不是完全不可信),而來自民間的訊息不必然不可靠(但也不是完全可靠)。中國政府在新冠肺炎疫情初期的資訊不透明,以及世界衛生組織2020年1月14日在推特(Twitter)的發文─「中國當局進行的初步調查發現,沒有明確的證據證明在中國武漢發現的新型冠狀病毒(2019-nCoV)在人與人之間傳播」─或可作為例證。世界衛生組織發出那則推文的兩週之前,也就是2019年12月31日,臺灣「批踢踢實業坊」(PTT)八卦版(Gossiping)出現標題為〈武漢疑爆發非典型肺炎冠狀病毒群聚感染?〉的貼文,內容擷取自武漢醫護人員的群組對話,表示武漢當地有「不明原因肺炎群聚感染」。之後的疫情發展,證實了來自PTT鄉民的這則訊息,不僅可信而且非常珍貴。

忠實呈現並即時散布可信任的資訊,在新冠肺炎大流行的當下分外重要,不同的組織也協力進行各種新嘗試。世界衛生組織跟營運維基百科的非營利組織「維基媒體基金會」(Wikimedia Foundation)在2020年底開始的一項合作,值得注意。雙方在10月22日共同發布新聞稿,表示將協力於增進「公眾取用」(the public's access to)即時且可信賴的COVID-19資訊。世界衛生組織將釋出圖文、影片,以及關於公共衛生的數位資源,存放在維基媒體基金會所維運的數位媒材庫「維基共享資源」(Wikimedia Commons),供大眾使用。

維基百科的條目內容,包括維基共享資源中的數位媒材,事實上都採用創用CC「姓名標示-相同方式分享」授權條款(Creative Commons Attribution-ShareAlike License),任何人都可以自由下載、複製、散布與改作,但需要標示原作者跟原授權條款。這批來自世界衛生組織的圖文與影音內容也不例外。這些內容由特定人員上傳,以確認來自世界衛生組織並已採用創用CC授權。這項合作意味著,世界衛生組織認為經由維基媒體所傳播的防疫資訊,是受大眾信任的。根據全球網站受訪次數的調查,維基百科的確是全球最受歡迎的網站之一。維基百科由眾人所共同編寫,在事實查核有一定的準則與程序,或有部分地方不精確,但內容出大錯的機率不高。2005年《自然》雜誌的一篇分析指出,維基百科的精確度約略與大英百科相當(當然大英百科當時也提出異議)。從幾年前開始,有些社群媒體(如Facebook)以及影音平臺(如YouTube)在可受爭議的內容網頁,同時提示維基百科相關條目的連結,供使用者自行點閱查核事實資訊。

世界衛生組織跟維基媒體基金會的合作固然有其意義,但也不容忽略其在「知識普及」(Universal Access to Knowledge)全球脈落中的混雜背景。以臺灣來說,能否以合適的地位「有意義的參與」世界衛生組織,是我們關注的焦點。這議題雖然引發許多討論,到目前為止還看不到實務上可行的方式。經由非官方的研究網絡,臺灣在國際疫情資訊的取得未必落後太多,但是因為欠缺「政府間國際組織」(Intergovernmental Organization,IGO)如世界衛生組織這樣的管道,臺灣不容易跟各國政府分享自身的防疫策略與經驗,這是相互的損失。在這同時,維基百科雖然開放給所有人自由使用,但來自集權政府的干擾與封鎖卻也不曾間斷。2019年5月起中國境內已完全連不上任何語言版本的維基百科,華語版本更早之前就已被屏蔽。中國境內(不含港澳)人口約14億,約占全球人口數的18%。

資訊的傳遞與病毒的散布有相似之處。眾人各自接收品質不一的資訊,也同時傳播給別人,有如病毒透過個體傳染群體。人體就是載體,而且個人所處的環境,也常影響所傳播的資訊與病毒。瞭解所處資訊環境的特質與限制,對個人與群體而言,跟瞭解所在的衛生環境一樣重要,尤其在傳染病大流行的時候。

關閉的校園圖書館與限制取用的期刊論文

在新冠病毒大規模傳播的當下,深受影響的地區採取嚴厲的禁令:限制人群聚集,關閉公共空間,並要求學校改為線上授課。校園圖書館的功能受到衝擊,而學生使用電子書以及線上論文的需求大增。「圖書館組織國際聯盟」(International Coalition of Library Consortia)在2020年3月出面呼籲:向出版商訂閱數位資源時,線上同時使用人數的限制必須移除。「網際網路典藏庫」(Internet Archive)並開始以「受控制的數位借閱」(Controlled Digital Lending)的方式,將自行數位化藏書所得的電子檔案借給讀者,但限定一本實體藏書只能出借一份電子檔給讀者,直到借出的讀者歸還。數家出版商卻在同年6月提出告訴,認為這是侵權行為。網際網路典藏庫遂提前結束這項數位借閱服務。

圖書、論文、影音等各類廣義著作的流通,是知識普及不可或缺的一環。關於知識的開放取用,也可以從學術出版品的「生產」(production)與「使用」(use)出發,瞭解目前的困境。「圖書館組織國際聯盟」與「網際網路典藏庫」已指出並嘗試緩解公共衛生危機之下,知識使用艱困之境。至於高等教育和研究機構所面臨的,則是生產與使用兩面兼具,因為研究者既使用學術出版品,自己也同時生產。2020年1月底疫期初始之時,英國的「衛爾康信託」(Wellcome Trust)聯合眾多科研機構、學術協會、慈善基金會以及學術期刊出版商公開呼籲:與新冠肺炎相關的研究與資料必須「快速且公開分享」,以即時回應全球公共衛生危機。這項呼籲建議:與這次新興傳染病相關且已通過同儕審查的期刊論文,至少在疫情期間,應以「開放取用」(Open Access)的方式立即釋出,尚未刊出或還在同儕審查的論文(包括所使用的研究資料)應放在「預刊本」(pre-print)伺服器供人自由下載。

會出現這樣的呼籲,是因為多數學術期刊是由營利出版商發行。研究者撰稿論文沒有稿酬、同儕審查論文也是無償,但在論文刊出之後,卻要付費才能下載使用。目前少數幾家出版商握有眾多學術期刊,並採用套裝訂閱的銷售策略,要求大學及研究機構支付高額年費,整批訂閱旗下出版的期刊。針對衛爾康信託的聯合呼籲,多位研究人員指出其局限:就算以新冠肺炎為題的論文已開放取用,但這些論文所引用的論文,多數還是鎖在出版商的付費牆之內。如果以「冠狀病毒」(coronavirus)為關鍵字搜尋出版商所經營的論文資料庫,根據2020年3月初的一項統計,1960年代起已有1萬3千篇論文發表,但其中大部分的論文還是需用付費才能下載使用。

這種情形目前稍有改善。至少與COVID-19相關的期刊論文,許多出版商已同意論文可以免費下載,但這僅是一時的安排(疫情消散之後未必允許)。而且這是在研究社群極力催促下才轉向開放的:2020年2月起眾多研究者集結向出版商施壓、用線上連署公開陳情、並透過社群媒體如推特傳播訴求並與出版商直接互動(或說是喊話)。若不是因為大流行病帶來的立即危機,相同的呼籲與策略可還能奏效?值得我們思索。另外,公共衛生議題也不只限於新冠肺炎,舉例來說,關於空氣污染防制的研究論文也與眾人的健康息息相關,是否也應該全面開放?關於全球氣候變遷以及人類永續發展的學術出版品,在開放取用上或許不比大流行病防治的論文來得緊急,但難道不是同等重要?

新冠病毒疫情有如一把放大鏡,彰顯過去圖書借閱與流通作法的限制,這些限制約束了眾人的知識取用行為;這場疫情也突顯目前學術期刊訂閱方式帶給研究者的不便與束縛,許多大學與研究機構對於現行唯利是圖的期刊商業發行環境感到不耐,並開始改變。

取自於眾、用之於眾的疫情資料與病毒序列

相較於研究論文的開放取用,及時疫情資料彙集統計與開放使用,與眾人的健康安全有更直接的關聯。每日更新累計、可信任、涵蓋全球各區的精細確診與死亡人數,是防堵疫情的重要資訊,也是個人評估所處地區染疫風險的依據。然而,可信任的疫情數字由誰彙集維護?在使用上有無限制?

網站「從資料看世界」(Our World in Data)每日更新全球各國行政區的確診病例數與死亡人數,並提供與新冠肺炎相關的各種分析圖表,例如各國每百萬人口的新確診數、每日每千人口的檢測量、疫苗施打人口累計總數與比例。這網站由麥斯.羅瑟(Max Roser)發起、維護,於2010年創立於英國牛津馬丁學院。10年來計畫團隊持續收錄、發展相關的資料集,包括貧窮、疾病、氣候變遷資料等。網站上的原始資料來自眾多研究機構,但由團隊成員的統整分析。網站上的資料集、敘述、圖表以及所開發的程式,都提供給任何人下載使用(圖1)。

圖1:以2020 年2 月7 日起一年內於美國、英國、南非、日本、臺灣每百萬人每日新確診數作為範例。(Our World in Data, CC BY 4.0)


「從資料看世界」的網站上說自己是「公共財」(public good)。精確地說,網站上的文字和圖表視為著作,以創用CC公眾授權條款釋出,所有人都可自由複製改作並散布,只需標明出處。程式則採用MIT授權條款(MIT License),使用的權利與限制跟創用CC授權類似,眾人可以自由取用改作。資料集則依原始來源的規範使用。一般來說,事實性的資料屬於「公眾領域」(Public Domain),沒有使用上的限制。這些與大流行病相關的人口統計數字,源自眾人自身,加總累計之後,又歸於眾人使用。

取之於眾、用之於眾的資料使用原則,也實現在「全球共享流感資料倡議組織」(GISAID)協作平臺,但以較為限制的方式規範資料的使用。GISAID鼓勵科學家快速分享各種流感病毒與其變異的核酸序列。此協作平臺發起於2006年的世界衛生大會,2008年起受德國聯邦政府支持設立,並與各國科研機構合作。研究者只要註冊並同意GISAID的資料庫取用條款,無論是資料的提供者或是使用者,都可以無償使用網站上所有的病毒核酸序列資料。

GISAID的資料庫取用條款所要求的,不外乎群體互助的使用方式:資料使用者需註明所用病毒序列的來源與提供的實驗室,同樣的,病毒序列的提供者需允許使用者運用其資料在研究上。經由資料彙集與再次使用的互惠安排,來自全球各地的病毒核酸序列可被共同使用。GISAID在2020年1月10日首次收到兩筆新冠病毒核酸序列,來自中國疾病預防控制中心的病毒病預防控制所。截至2021 年2月1日止,GISAID已收錄超過45萬3千筆新冠病毒序列,來自100多個國家。其中,臺灣提供了150筆病毒序列,第一筆於2020年1月27日由衛生福利部的疾病管制署提交送出。

蒐集整理並將資料開放給所有人,在疫情當下發揮了關鍵作用。在新冠病毒出現之前,GISAID跟「從資料看世界」這兩項計畫已進行了十多年。不過這類型的研究計畫,卻未必受到政府的重視。政府出資補助的科研計畫通常著重於關鍵突破或經濟潛能,但是像GISAID這樣的研究資料基礎設施貴在協調統合,產出可共同使用且持續更新的資料集,成為人類的公共財。

書 名|《研下知疫:COVID-19 的人文社會省思》
編 者|康豹、陳熙遠
出版社|中央研究院出版中心
出版日| 2021 年7 月12 日

實體書籍 ╳ 主題網站共同推出中央研究院12處研究單位 ╳ 20位研究人員關於疫情,看看他們怎麼說?
全球遭遇的COVID-19危機,除了迫切需要科學出面解決,人文領域也能有所貢獻。中央研究院近代
史研究所特聘研究員康豹,率領院內共12間研究所、共20位研究員,發揮研究專長,或針對疫情進行數據分析、問卷調查;或針貶時事、反省法規;
或從文學找到共鳴,從歷史得到啟發。直面社會問題,以所學回應社會需求。