文章專區

2024-10-21告別ChatGPT?可安裝於電腦的小型AI模型 514 期

Author 作者 編譯|陳亭瑋

在人工智慧(artificial intelligence, AI)技術快速發展的今天,大型語言模型(large language models, LLMs)已經成為許多科學研究工作者的得力助手。然而,最新趨勢顯示,科學家正轉向在自己的筆記型電腦上安裝小型AI模型,而非依賴網路版的ChatGPT等服務。這種轉變不僅帶來便利性,更為科研工作提供新的可能性。

近年來,多家科技巨頭和研究機構紛紛推出小型且開放的AI模型。例如Google DeepMind、Meta和Allen Institute for Artificial Intelligence等單位都發布了各自的小型AI模型。雖然被稱為「小型」,不過這些模型的參數量仍有300億之多,相較早期模型已經相當龐大。微軟(Microsoft)在這一領域更是表現突出,於去(2023)年和今(2024)年陸續推出了Phi系列模型,其中部分版本還具備圖像處理能力。值得注意的是,即使是最小的Phi模型,在某些測試中的表現也優於去年的OpenAI GPT-3.5 Turbo。

小型AI模型的優勢主要有幾個方面。首先,對於需要處理敏感資料的研究人員來說,使用直接安裝於電腦的AI模型,相較於連網的大型LLM來說資訊安全性更高,可以避免使用者在無意中違反個資保護的相關法規。例如醫生根據開放軟體開發AI系統,用於轉錄和總結患者的訪談內容,以確保患者的隱私不被洩露。其次,與訂閱商業AI服務相比,使用直接安裝於電腦的AI模型可以大幅降低成本,這對於長期進行大量AI輔助工作的研究人員來說尤為重要。

此外,研究人員可以根據特定需求,對下載進電腦中的模型進行微調。例如生物醫學科學家可以利用開放模型,微調設置為專門用於自身科學研究領域的新模型。與不斷更新的商業模型不同,這些裝設在電腦中的AI模型在不更新的情況下,仍可以保持穩定不變的運作邏輯,對於需要使用同一種方法分析結果的科學研究至關重要。最後,在網路連接不穩定的地方,安裝在電腦中的AI模型可以確保研究工作不受影響,這對於在野外工作的科學家有很大的幫助。

在實際應用中,小型AI模型已經展現出巨大潛力。像是醫生利用此AI模型從醫學報告中找出診斷資訊,並生成訓練數據,以開發能夠預測心臟病診斷的AI系統。還有研究人員使用特定模型設計新的蛋白質序列,以進行主要組織相容性複合體(major histocompatibility complex, MHC)分子分析的演算法研究。韓國一家製藥公司開發的系統則利用可離線的LLMs分析細胞類型聚類,甚至可將細胞的基因表達等特徵總結為一句話。

現階段已有多種不須聯網的LLMs可供選擇。例如開源軟體Ollama支援Mac、Windows和Linux系統,可下載並透過命令行使用多種開放模型;GPT4 All是一款跨平臺應用程式,提供圖形操作界面;Llamafile則可將LLMs轉換為單個文件,在多種操作系統上運行。隨著LLM的選擇變得多樣化,選擇適合自己的軟體是一大關鍵。也因為技術不斷進步,不須連網的AI助手將在未來的科學研究中扮演愈來愈重要的角色。

新聞來源
Hutson, M. (16 September 2024). Forget ChatGPT: why researchers now run small AIs on their laptops. Nature. https://www.nature.com/articles/d41586-024-02998-y