文章專區

2022-10-15從數個月變成幾分鐘 科學家應用AI設計前所未見的蛋白質 490 期

Author 作者 編譯|陳亭瑋

在過去,設計並製造一種新型的蛋白質需要研究人員密集的試驗以及錯誤嘗試,經過短則數個月長則數年的努力才有機會成功。今(2022)年7月,根據美國華盛頓大學(University of Washington)生物化學家貝克(David Backer)團隊在《科學》(Science)的發表,顯示了利用人工智慧(artificial intelligence, AI)工具可以在幾秒鐘內完成初步的設計,與過往需要幾個月的時間可謂天壤之別。

AI如何改變蛋白質相關研究?

曾經有一段時間,破解蛋白質結構是個十分耗費時間的工作,即使已經得知了一個蛋白質的一級結構──也就是它的胺基酸序列,也並不代表科學家能切實掌握它的三級或四級結構,但更不用說其實立體結構才是真正決定一個蛋白質功能的重點。破解蛋白質結構不容易,設計一款新型蛋白質當然也就更加地困難。然而近年來人工智慧的進展,生物學家不僅將此技術運用於破解蛋白質的立體結構,更衍伸出以深度學習(deep learning)協助設計新型蛋白質的方法。

英國人工智慧公司DeepMind所研發的AlphaGo人工智慧圍棋軟體,在2016年打敗韓國棋王李世乭,掀起一波對於人工智慧的討論浪潮。DeepMind也將此研發轉向以人工智慧破解蛋白質的結構,在2020年第14屆的蛋白質結構預測技術關鍵評估(Critical Assessment of protein Structure Prediction, CASP)中,AlphaFold的準確度已經與實驗室技術所得的結果不相上下。今年7月,最新版本的AlphaFold更宣布有能力預測目前科學已知的每種蛋白質結構。隨著AlphaFold的進步,用以設計全新蛋白質的人工智慧工具也呈現爆炸式的增長。

快速設計新蛋白質,無限的應用空間

蛋白質在生物體中具有許多功能,科學家如果可以快速設計蛋白質,將有無限的應用空間,無論是清理身體內的有毒廢棄物、治療疾病、研發針對某種病原的疫苗,潛力都非常龐大。根據今年發表於預印平臺bioRxiv的回顧文章統計,應用AI設計蛋白質的工具已經達40種以上。同樣採取人工智慧演算法,但工具間的概念仍可能有所不同,有包括類似AlphaFold那樣針對序列模擬出蛋白質立體結構的工具,也有以解決「逆摺疊」(inverse folding)的問題為主的工具;部分工具則基於類似語言自然網絡(language neural networks)的概念產生「文本」。但無論背後的演算概念如何,重點都在於人工研發出新的蛋白質。考慮到有眾多團隊都在研發蛋白質相關的工具,也有科學家期待出現類似CASP的蛋白質設計競賽,讓此領域有進一步討論與推進的動力。

設計新型蛋白質是本次發表突破的貝克團隊在過去30年間主要的研究重心,過去會採用名為Rosetta的軟體一個步驟一個步驟進行。首先是根據已有的蛋白質形狀,「拼湊」出新型的蛋白質,然後透過軟體推導出相對應的序列「初稿」。但是這些「初稿」的胺基酸長鏈在摺疊的時候,很少會如研究人員所願摺疊成預想的形狀,這時候就需要反覆確認然後調整序列。

過去,由於序列摺疊的方式可能性太多,模擬非常耗費時間與計算資源。但有了AI的協助,這項耗時的工作可以加快許多。貝克實驗室與AlphaFold合力開發了RosettaFold,一開始用來預測胺基酸長鏈的結構,但團隊很快就發現RosettaFold也可以被應用於模擬蛋白質相互作用組裝的狀況。除此之外,貝克實驗室還開發了另一種應用深度學習的工具,被稱為ProteinMPNN,主要用以解決「逆摺疊」的問題:在已知特定蛋白質整體形狀的情況下,確定它的胺基酸序列。ProteinMPNN可以做為前述RosettaFold或者AlphaFold的「拼字檢查」程式,進一步還可以調整序列,以獲得真正可以摺疊、有功能的新型蛋白質。

實驗室工作不可少,仍有待進步空間

雖然加上入ProteinMPNN的調整後,貝克實驗室發表了不錯的成果。但在此之前,第一批以RosettaFold設計的150種蛋白質在微生物培養時,沒有一種能夠完成所預測的摺疊,因此儘管演算法再怎麼肯定,還是要實際進到實驗室裡才能確知預測的成果。另外,貝克實驗室7月發表的內容還包括了在新型蛋白質中嵌入特定序列或結構的演算法、可以用於設計新款進行特定反應的酶或是可以作為呼吸道疾病疫苗的蛋白質。

而DeepMind也在2019年於倫敦成立了分公司「同工異構實驗室」(Isomorphic Labs),預備將AlphaFold投入藥物研發的領域。儘管AI在進行蛋白質設計已經出現驚
人的進展,考慮到蛋白質領域的廣大與應用空間,我們仍可以期待未來會有許多一鳴驚人的新發現。

新聞來源
1. Callaway, E. (2022 September 15). Scientists are using AI to dream up revolutionary new proteins. Nature. https://www.nature.com/articles/d41586-022-02947-7
2. Wang, J., et al. (2022). Scaffolding protein functional sites using deep learning. Science, 377(6604), 387-394.
3. Ferruz, N., et al. (2022). From sequence to function through structure: deep learning for protein design. bioRxiv.