Search / 搜尋

- 文章分類 -

文章專區

2023-09-15「文章農場」造假氾濫，學術出版社集結對抗惡性商業模式 501 期

Author 作者劉雨如／英國諾丁罕大學遺傳學博士

農場文章人工智慧學術出版社偵偽系統期刊

今（2023）年5月，德國馬德堡大學（Otto von Guericke Universitity Magdeburg）的神經心理學家薩貝爾（Bernhard Sabel）在預印發表平臺medRxiv發表了一篇調查。他掃描5000多份2020年發表的學術文章，發現其中有造假嫌疑的比例非常高，在神經科學類別中估計有34％，醫學類別中有24％。這數字明顯比2010年的調查結果要高出許多，也遠遠高出去（2022）年出版社集團報告（publishers’group report）中估計的基準值2％。學術文章有如此高比例的造假嫌疑真的很令人難以置信，感覺就像有人告訴你，每天吃下肚的東西裡有1／3是有毒的。

泰勒-弗朗西斯出版集團（Taylor and Francis Group）也在相關討論表示，根據經驗被造假偵查系統（簡稱真偽系統）標示出有問題的學術文章有半數都來自於「文章農場」（paper mills）。這些問題文章數量在2019～2022年間成長了十倍，而今年到年中的累積數量，已經追平去年一整年。文章農場顯然已經商業化、規模化了。

薩貝爾的發現也支持了一直以來都被廣為懷疑的情況，學術期刊其實已經被一波波文章農場產出的大量假文章嚴重傷害。這些文章農場秘密為付款的「金主」們，以造假文章或是虛構作者的方式，墊高金主的學術發表數量與學術地位。文章農場看準了學術出版業無力還擊的弱點賺取大筆的財富。他們造成的傷害顯而易見，今年5月2日學術出版社Hindawi就宣布，由於文章農場的影響將停刊旗下四本期刊。

薩貝爾用於分辨假文章的軟體工具主要會看兩個部分，一是根據作者的聯絡電子信箱，如果是私人、非機構的網域名稱就很可疑；二是根據單位，如果是附屬於醫院的也不太可靠。雖然這個方法並非完美，有很高的偽陽率；然而其他學術文章偵偽系統開發者，也很少公開他們辨偽的準則，並且同樣難以避免高偽陽性的問題。

文章農場產出大量的假文稿形態多樣，有可能從內文、數據到影像全是捏造的；也可能是部分造假，再經過幽靈作者的潤飾而產生；有些文章則是只有經過作者自薦的同儕審查就發表出來了。愈來愈多這樣的文章在學術研究領域裡流通，將直接威脅科學文獻的正確性、誤導讀者，甚至扭曲整個審查系統。

人工智慧參戰學術發表，帶來的風險與助益並存

最近發展快速的人工智慧（artificial intelligence, AI）工具，如ChatGPT和各種影像生成軟體，在學術出版業打擊文章農場的戰役中，不但沒有助益反而火上澆油。Meta在去年11月15日，發表了Galactica的網頁試用版，這是一款意在幫助研究者撰寫學術文章的AI工具，以4800萬篇科學文章、網頁、教科書、課堂筆記及百科全書為它的語言訓練資料庫，具備摘要學術文章、解數學題、生成Wiki文章、科學編程、註解分子與蛋白等功能。但是不知為何，Galatica產出的文章最後竟然夾雜了許多不正確的資訊、或是種族歧視的內容。Galatica掀起了一陣極快速的網路海嘯，一時間負評如潮，Meta也因此在發表後三天就將它下架。只是專家們認為類似的AI工具，可能仍然是未來的發展趨勢。

AI確實能幫助研究者解決一些問題，如文獻回顧的重點整理、英文文法的修正、尋找研究合作對象等，速度極快且正確率也頗高。但目前來說，AI所提供的資訊仍然帶有風險，使用AI的研究者必須改變過去一切親力親為的工作思維，轉而將心力放在檢視與查核AI產生的內容。

學術出版社集結並發展偵偽系統

今年5月24日，英國非營利組織國際出版倫理委員會（Committee on Publication Ethics, COPE）及國際科學、技術和醫學出版者協會（International Association of Scientific, Technical and Medical Publishers, STM）共同舉辦UNITED2ACT峰會，聚集了來自世界各地的學術誠信分析專家、學術基金會及出版社的代表們，共同討論打擊文章農場的方法。其中一個做法是要求文章作者提供實驗結果的原始數據，讓出版社能確認研究的原創性與真實性。目前各家出版社對原始數據的要求並不一致，因此建立統一的原始數據投稿要求將會有助於評量文章的學術誠信。不過事實上並不是每一個研究機構都有提供數據管理的資源和設施，為避免加劇資源不均，還需要更多的討論與規畫。

（Adobe Stock）

STM集結了120個出版社的力量，領銜開發新偵偽工具Integrity Hub。不過，他們不願透露偵偽的方法，Integrity Hub的產品經理梵羅森（Joris van Rossum）認為這就像是一場角力賽，為防止文章農場見風轉舵，最好還是不公開技術方法以保持戰力。不過有一個很可靠的方法，就是根據參考文獻中是否出現過已經被撤下的文章，以及作者服務單位及寄出文稿的電子信箱，是否有來自看起來幾可亂真的假單位。

目前共有20家學術出版社協助Integrity Hub的發展，其中包括領域中的龍頭，如愛思唯爾（Elsevier）、施普林格・自然（Springer Nature）、約翰威立（Wiley）。已經有十家學術出版社，正式開始使用在4月發表的Integrity Hub偵偽系統。STM將在今年發表另一個可以抓出文稿一稿多投的系統，此行為不但不符合學術道德，也是文章農場的常用技倆之一。學術出版界出現如此大型的合作，代表今後各出版社將不再閉門造車，改採集中火力共同解決文章農場這個大問題。

只是不論資源再豐富、參與的出版社再多，可能永遠都不會有一個完美的自動化偵偽系統。有參與者比喻，偵偽系統頂多就像是電子郵箱裡的垃圾信件過濾器，還是需要定期翻找一下，看看有沒有被誤會的重要信件埋藏在其中。

STM才剛推出偵偽系統，目前還沒有偽陽率的數據，但可以預期此系統或多或少會有一些錯誤判斷。薩貝爾的偵偽系統雖然能正確的標記近九成的假文章及撤銷文章，但也將多達44％的原創文章都標為可疑，因此仍然需要非常有經驗的審查人來進行確認。其他偵偽系統的問題也大同小異，但若是沒有可靠的自動化檢驗方式，很難在較短的時間內判斷大量文章的真偽，學術出版社的編輯們也只能隨機的抓出幾篇來仔細查看，結果只會造成更多漏網之魚或是加劇許多不公平的狀況。

減少出版社負擔與發表壓力，破解惡性循環

審查文章相當耗時，例如2021年施普林格・自然為了準備在美國眾議院討論關於文章農場的聽證會，僱用了十位正職及兼職人員審查多達3000篇過去發表在自家期刊上的文章，而實際上該出版社每年刊登超過40萬篇的學術文章。

依據COPE過去的出版指引建議，學術出版社如果發現文章有可疑處，最好向作者們詢問更多的資訊與確認，但缺點是文章的審查在來回溝通聯絡的過程中拉得很長、耗時費力，有可能拖遲了重要科學發現的發表時程，也會增加出版社的運作負擔。而在COPE 4月新修的期刊出版指引中，則改為建議學術出版社可以整批退回他們懷疑出自文章農場的文章，即使只有間接證據也可以退回，此一做法或許能減輕一些學術出版社的負擔。

此外，許多研究機構的研究者承受著「沒發表就沒飯碗」（publish or perish）的壓力，這也是打擊文章農場的阻力。像是臨床醫師為了要升等或保住現職，明明沒有學術研究的經驗還是硬要產出發表，因此只能轉往文章農場尋求協助。這就是為什麼審查作者單位附屬於醫院的文章時，學術出版社的編輯們會特別小心。這是整個研究評量機制的問題，學術出版社也想和研究機構討論是否有可能改變這種惡性循環。

另外，找出被文章農場相中的期刊能夠快速阻止更多的假文章投稿。中國科學研究院曾經釋出一份可能含有農場文章的期刊列表，來自於學術文章偵偽系統Papermill Alarm發現這些期刊大多數內容都來自於文章農場。在這份列表公開之後，農場文章數量大減、幾乎降為零。

學術出版社與研究者應合作，打擊文章農場

局外人可能會好奇，出版社打擊文章農場有什麼好處?出版社如果採用黃金開放取用（gold open access, Gold OA）的方式，文章刊出之後立即對大眾免費公開取用，而所有的文章出版費用都由作者負擔，那麼文章農場送來更多的文章來發表，出版社不就可以收更多出版費、賺更多錢嗎?但其實這中間存在有很大的利益衝突，刊出農場文章不但嚴重影響期刊出版品的品質、降低它的學術影響力，更有損期刊及出版社的聲譽，甚至危及出版社的存亡。

學術出版社與研究者應該站在同一陣線上，歡迎偵偽系統的協助，不過這同時也需要判定方式的透明化。如果工具是在黑箱裡做出來的，那就沒人能夠評點或是調查這些工具的功能。有些觀察家擔心，文章農場在遭遇這些改變造成的壓力之後，可能轉向影響係數（impact factor, IF）較低、沒有足夠的資源來做偵偽的期刊。然而，如果大多數的期刊都採取正確的行動，其實不用真的抓出每一篇假文章，只要發展一個能落實的方式對抗文章農場的商業模式，就有機會使這套產業規模漸驅縮小。希望在學術出版社與研究者們更公開、更廣泛的合作下，能讓學術期刊在偵偽的速度上贏過文章農場，進而扼止它們的成長甚至是促使它消失。

延伸閱讀
Brainard, J. (2023). Fake Scientific Papers Are Alarmingly Common. Science, 380(6645), 568-69.

相關推薦

科學月刊 9月號/2023 第645期：探索醣科學-已完售-無庫存

科學月刊 9月號/2023 第645期：探索醣科學-已完售-無...

新訂一年方案：《科學月刊》一年12期

新訂一年方案：《科學月刊》一年12期

新訂兩年方案：《科學月刊》二年24期

新訂兩年方案：《科學月刊》二年24期

台北市大安區羅斯福路三段 77 號 7 樓
服務電話：+886-2-2363-4910
電子郵件：scimonth@scimonth.one
服務時間：週一至週五 09:30~17:30，例假日除外。

認識科月

關於科月

各期目錄

投稿須知

合作洽談
讀者服務

購買雜誌

訂閱雜誌

網路會員

訂閱電子報

隱私政策服務條款

© 1970- by Science Monthly 若需轉載、使用科學月刊或科技報導的文字、圖像或影音等，請洽本公司。

網頁設計 : 藝誠網頁設計公司