文章專區

2024-12-02當AI 碰上蛋白質 蛋白質結構預測如何改變藥物的發展? 660 期

Author 作者 葉先偉 | 美國加州大學聖塔克魯茲分校助理教授。出生於臺灣,家庭中首位博士畢業生,設計全新發光蛋白用於檢測與影像應用。

Take Home Message
▶ 今(2024)年的諾貝爾化學獎頒給貝克、哈薩比斯、瓊珀,以表彰他們在蛋白質設計和結構預測上的重要貢獻,加速藥物和疾病治療研發。
▶ 貝克實驗室的「Rosetta」與 DeepMind 的蛋白質預測模型「AlphaFold」,藉由 AI 和物理模型顯著提高蛋白質結構預測的準確度,能加速藥物標靶的發現。
▶ 現今的蛋白質設計可以精確地設計蛋白質結構並調整酶的效率,有望開發更高效的催化劑,顯示出它在未來科學和工業中的深遠影響。

(資料來源:Jeffreyjgray, CC BY-SA 3.0, Wikimedia Commons)

大衛.貝克
David Baker(1962 ~)

國籍|美國
任職單位|華盛頓大學
研究領域|蛋白質設計、蛋白質結構預測

(資料來源:DeepMind)

傑米斯.哈薩比斯
Demis Hassabis(1976 ~)

國籍|英國
任職單位| DeepMind
研究領域|人工智慧、機器學習、神經科學

(資料來源:DeepMind)

約翰.瓊珀
John Jumper(1985 ~)

國籍|美國
任職單位| DeepMind
研究領域|人工智慧、機器學習

 

今年的諾貝爾化學獎由美國華盛頓大學蛋白設計研究所( Institute for Protein Design, University of Washington)的教授貝克(David Baker),以及Google 旗下的人工智慧公司DeepMind 團隊的哈薩比斯(Demis Hassabis)和瓊珀(John Jumper)共同獲得,以表彰他們對於蛋白質設計(computational protein design)與蛋白質結構預測(protein structure prediction)的重大貢獻。

蛋白質是由20 種天然胺基酸組成的多肽聚合物(polypeptides),它在人體細胞、組織、器官的結構、功能和調節中扮演至關重要的角色。例如我們的肌肉收縮就是由一連串的肌動蛋白(myosin)形成交叉結構,彼此相互滑動而達成。此外,蛋白質可作為酶(又稱酵素或催化劑),催化生命運作所需的生化反應,或是作為荷爾蒙調節身體運作。當有病毒,例如新型冠狀病毒(SARS-CoV-2)或流感病毒(influenza virus)入侵人體時,蛋白質可作為抗體防禦和治療感染。蛋白質還能運輸和儲存必須分子,例如血紅素(hemoglobin)能載運氧氣並有效地送達組織。

不過要在生命中達到如此多樣化的功能,這些蛋白多肽聚合物必須折疊成特定的三維形狀,也就是說,真正授予蛋白質功能的是它的結構。然而,了解蛋白折疊的過程與最終折疊的產物,一直都是科學界的一大挑戰。


蛋白結構預測的起源

自1950 ~ 1960 年代起,科學家就開始對多肽聚合物如何折疊成三維的蛋白質結構產生興趣。早在1972 年,諾貝爾獎就曾經頒發給美國生化科學家安芬森(Christian Anfinsen)、摩爾(Stanford Moore)、斯坦(William Stein),以表彰他們發現核糖核酸水解酵素(RNase)的胺基酸序列可以決定它的三維蛋白質結構。

自然界的蛋白質大多是由50 ~ 2000 個胺基酸所組成,我們可以將蛋白多肽聚合物視為一串珠子,不同的珠子會以特定的方式相互作用。例如有些胺基酸喜歡與水結合、有些胺基酸偏好靠近其他類似性質的胺基酸,這串珠子會在水環境中折疊成最低能量的狀態,近而形成相對應的三維結構。早期有研究指出,蛋白質折疊的過程理論上能夠透過電腦模擬得出。到了1990 年代,DNA 定序技術的突破,科學家可以從廣泛的生物類別中取得大量的胺基酸序列,還發現不同但相似的序列可以形成相似的三維蛋白質結構。因此,科學家開啟了一連串的研究,希望能利用各種生物體中蛋白質的演化訊息(evolutionary information)預測最終蛋白質折疊的產物。然而,即使計算能力有所提升,想要準確預測蛋白質結構仍然非常困難。


CASP 競賽與貝克的研究

由於當時有許多研究過度宣稱他們在蛋白質結構預測的準確性,美國馬里蘭大學(University of Maryland)教授莫爾特(John Moult)於1994 年啟動了一個每兩年一次,名為「CASP」(Critical Assessment of methods of protein Structure Prediction)的競賽,主要目的是在鼓勵學術研究,並測試這些用電腦模擬蛋白折疊的方法在實際預測未知三維蛋白質結構的能力。

貝克團隊一直以來都是CASP 競賽裡的常勝軍,他發展出的蛋白質結構預測軟體「Rosetta」,利用許多生物物理量(energy terms)的能量函數來模擬這些胺基酸的凡德瓦力(Van der Waals force)、靜電力、氫鍵等複雜相互作用,從而實現不需模板、從零開始的蛋白質結構預測,並構建出它們的3D構型。由於Rosetta 具備了解並敘述這些複雜胺基酸之間相互作用的能力,近年來貝克實驗室也利用這些多年來學到的蛋白質折疊的原理,設計出全新且不存在於自然界裡的蛋白質。2003 年,貝克實驗室成功設計了人類歷史上第一個人造蛋白「Top7」,並開啟了一個未知的研究領域――全新的蛋白質設計(de novo protein design)。……【更多內容請閱讀科學月刊第660期】