文章專區

2023-09-15「文章農場」造假氾濫,學術出版社集結對抗惡性商業模式 501 期

Author 作者 劉雨如/英國諾丁罕大學遺傳學博士

今(2023)年5月,德國馬德堡大學(Otto von Guericke Universitity Magdeburg)的神經心理學家薩貝爾(Bernhard Sabel)在預印發表平臺medRxiv發表了一篇調查。他掃描5000多份2020年發表的學術文章,發現其中有造假嫌疑的比例非常高,在神經科學類別中估計有34%,醫學類別中有24%。這數字明顯比2010年的調查結果要高出許多,也遠遠高出去(2022)年出版社集團報告(publishers’group report)中估計的基準值2%。學術文章有如此高比例的造假嫌疑真的很令人難以置信,感覺就像有人告訴你,每天吃下肚的東西裡有1/3是有毒的。
 
泰勒-弗朗西斯出版集團(Taylor and Francis Group)也在相關討論表示,根據經驗被造假偵查系統(簡稱真偽系統)標示出有問題的學術文章有半數都來自於「文章農場」(paper mills)。這些問題文章數量在2019~2022年間成長了十倍,而今年到年中的累積數量,已經追平去年一整年。文章農場顯然已經商業化、規模化了。
 
薩貝爾的發現也支持了一直以來都被廣為懷疑的情況,學術期刊其實已經被一波波文章農場產出的大量假文章嚴重傷害。這些文章農場秘密為付款的「金主」們,以造假文章或是虛構作者的方式,墊高金主的學術發表數量與學術地位。文章農場看準了學術出版業無力還擊的弱點賺取大筆的財富。他們造成的傷害顯而易見,今年5月2日學術出版社Hindawi就宣布,由於文章農場的影響將停刊旗下四本期刊。
 
薩貝爾用於分辨假文章的軟體工具主要會看兩個部分,一是根據作者的聯絡電子信箱,如果是私人、非機構的網域名稱就很可疑;二是根據單位,如果是附屬於醫院的也不太可靠。雖然這個方法並非完美,有很高的偽陽率;然而其他學術文章偵偽系統開發者,也很少公開他們辨偽的準則,並且同樣難以避免高偽陽性的問題。
 
文章農場產出大量的假文稿形態多樣,有可能從內文、數據到影像全是捏造的;也可能是部分造假,再經過幽靈作者的潤飾而產生;有些文章則是只有經過作者自薦的同儕審查就發表出來了。愈來愈多這樣的文章在學術研究領域裡流通,將直接威脅科學文獻的正確性、誤導讀者,甚至扭曲整個審查系統。
 

人工智慧參戰學術發表,帶來的風險與助益並存

最近發展快速的人工智慧(artificial intelligence, AI)工具,如ChatGPT和各種影像生成軟體,在學術出版業打擊文章農場的戰役中,不但沒有助益反而火上澆油。Meta在去年11月15日,發表了Galactica的網頁試用版,這是一款意在幫助研究者撰寫學術文章的AI工具,以4800萬篇科學文章、網頁、教科書、課堂筆記及百科全書為它的語言訓練資料庫,具備摘要學術文章、解數學題、生成Wiki文章、科學編程、註解分子與蛋白等功能。但是不知為何,Galatica產出的文章最後竟然夾雜了許多不正確的資訊、或是種族歧視的內容。Galatica掀起了一陣極快速的網路海嘯,一時間負評如潮,Meta也因此在發表後三天就將它下架。只是專家們認為類似的AI工具,可能仍然是未來的發展趨勢。
 
AI確實能幫助研究者解決一些問題,如文獻回顧的重點整理、英文文法的修正、尋找研究合作對象等,速度極快且正確率也頗高。但目前來說,AI所提供的資訊仍然帶有風險,使用AI的研究者必須改變過去一切親力親為的工作思維,轉而將心力放在檢視與查核AI產生的內容。
 

學術出版社集結並發展偵偽系統

今年5月24日,英國非營利組織國際出版倫理委員會(Committee on Publication Ethics, COPE)及國際科學、技術和醫學出版者協會(International Association of Scientific, Technical and Medical Publishers, STM)共同舉辦UNITED2ACT峰會,聚集了來自世界各地的學術誠信分析專家、學術基金會及出版社的代表們,共同討論打擊文章農場的方法。其中一個做法是要求文章作者提供實驗結果的原始數據,讓出版社能確認研究的原創性與真實性。目前各家出版社對原始數據的要求並不一致,因此建立統一的原始數據投稿要求將會有助於評量文章的學術誠信。不過事實上並不是每一個研究機構都有提供數據管理的資源和設施,為避免加劇資源不均,還需要更多的討論與規畫。
 

(Adobe Stock)
 

STM集結了120個出版社的力量,領銜開發新偵偽工具Integrity Hub。不過,他們不願透露偵偽的方法,Integrity Hub的產品經理梵羅森(Joris van Rossum)認為這就像是一場角力賽,為防止文章農場見風轉舵,最好還是不公開技術方法以保持戰力。不過有一個很可靠的方法,就是根據參考文獻中是否出現過已經被撤下的文章,以及作者服務單位及寄出文稿的電子信箱,是否有來自看起來幾可亂真的假單位。
 
目前共有20家學術出版社協助Integrity Hub的發展,其中包括領域中的龍頭,如愛思唯爾(Elsevier)、施普林格・自然(Springer Nature)、約翰威立(Wiley)。已經有十家學術出版社,正式開始使用在4月發表的Integrity Hub偵偽系統。STM將在今年發表另一個可以抓出文稿一稿多投的系統,此行為不但不符合學術道德,也是文章農場的常用技倆之一。學術出版界出現如此大型的合作,代表今後各出版社將不再閉門造車,改採集中火力共同解決文章農場這個大問題。
 
只是不論資源再豐富、參與的出版社再多,可能永遠都不會有一個完美的自動化偵偽系統。有參與者比喻,偵偽系統頂多就像是電子郵箱裡的垃圾信件過濾器,還是需要定期翻找一下,看看有沒有被誤會的重要信件埋藏在其中。
 
STM才剛推出偵偽系統,目前還沒有偽陽率的數據,但可以預期此系統或多或少會有一些錯誤判斷。薩貝爾的偵偽系統雖然能正確的標記近九成的假文章及撤銷文章,但也將多達44%的原創文章都標為可疑,因此仍然需要非常有經驗的審查人來進行確認。其他偵偽系統的問題也大同小異,但若是沒有可靠的自動化檢驗方式,很難在較短的時間內判斷大量文章的真偽,學術出版社的編輯們也只能隨機的抓出幾篇來仔細查看,結果只會造成更多漏網之魚或是加劇許多不公平的狀況。
 

減少出版社負擔與發表壓力,破解惡性循環

審查文章相當耗時,例如2021年施普林格・自然為了準備在美國眾議院討論關於文章農場的聽證會,僱用了十位正職及兼職人員審查多達3000篇過去發表在自家期刊上的文章,而實際上該出版社每年刊登超過40萬篇的學術文章。
 
依據COPE過去的出版指引建議,學術出版社如果發現文章有可疑處,最好向作者們詢問更多的資訊與確認,但缺點是文章的審查在來回溝通聯絡的過程中拉得很長、耗時費力,有可能拖遲了重要科學發現的發表時程,也會增加出版社的運作負擔。而在COPE 4月新修的期刊出版指引中,則改為建議學術出版社可以整批退回他們懷疑出自文章農場的文章,即使只有間接證據也可以退回,此一做法或許能減輕一些學術出版社的負擔。
 
此外,許多研究機構的研究者承受著「沒發表就沒飯碗」(publish or perish)的壓力,這也是打擊文章農場的阻力。像是臨床醫師為了要升等或保住現職,明明沒有學術研究的經驗還是硬要產出發表,因此只能轉往文章農場尋求協助。這就是為什麼審查作者單位附屬於醫院的文章時,學術出版社的編輯們會特別小心。這是整個研究評量機制的問題,學術出版社也想和研究機構討論是否有可能改變這種惡性循環。
 
另外,找出被文章農場相中的期刊能夠快速阻止更多的假文章投稿。中國科學研究院曾經釋出一份可能含有農場文章的期刊列表,來自於學術文章偵偽系統Papermill Alarm發現這些期刊大多數內容都來自於文章農場。在這份列表公開之後,農場文章數量大減、幾乎降為零。
 

學術出版社與研究者應合作,打擊文章農場

局外人可能會好奇,出版社打擊文章農場有什麼好處?出版社如果採用黃金開放取用(gold open access, Gold OA)的方式,文章刊出之後立即對大眾免費公開取用,而所有的文章出版費用都由作者負擔,那麼文章農場送來更多的文章來發表,出版社不就可以收更多出版費、賺更多錢嗎?但其實這中間存在有很大的利益衝突,刊出農場文章不但嚴重影響期刊出版品的品質、降低它的學術影響力,更有損期刊及出版社的聲譽,甚至危及出版社的存亡。
 
學術出版社與研究者應該站在同一陣線上,歡迎偵偽系統的協助,不過這同時也需要判定方式的透明化。如果工具是在黑箱裡做出來的,那就沒人能夠評點或是調查這些工具的功能。有些觀察家擔心,文章農場在遭遇這些改變造成的壓力之後,可能轉向影響係數(impact factor, IF)較低、沒有足夠的資源來做偵偽的期刊。然而,如果大多數的期刊都採取正確的行動,其實不用真的抓出每一篇假文章,只要發展一個能落實的方式對抗文章農場的商業模式,就有機會使這套產業規模漸驅縮小。希望在學術出版社與研究者們更公開、更廣泛的合作下,能讓學術期刊在偵偽的速度上贏過文章農場,進而扼止它們的成長甚至是促使它消失。
 
延伸閱讀
Brainard, J. (2023). Fake Scientific Papers Are Alarmingly Common. Science, 380(6645), 568-69.