文章專區

2023-10-15DeepMind發表全新AI模型AlphaMissense可協助辨識DNA中的錯義突變 502 期

Author 作者 編譯|羅億庭

Google旗下的人工智慧(artificial intelligence, AI)新創公司DeepMind在近日發表了一款名為「AlphaMissense」的AI模型,能用於分類人類基因體中近7100萬個錯義(missense)突變,並辨識出其中89%可能致病的錯義突變與未知的致病基因;相較之下,目前為止僅有0.1%的錯義突變經人類專家確認過它可能導致的疾病。該研究目前已刊登於《科學》(Science)期刊中,DeepMind也表示會將所有的預測結果免費提供給學研界,並開源了AlphaMissense模型的程式碼,期望AlphaMissense在未來能對罕見疾病的研究有所幫助。
 
DNA突變包含許多不同類型,若DNA序列上的某一個核苷酸(nucleotide)被替換成另一個核苷酸,就稱為「點突變」。此點突變如果造成DNA序列後續轉錄(transcription)、轉譯(translation)成蛋白質的序列改變,則會被稱為錯義突變。根據統計,每個人的DNA中平均有超過9000個錯義突變,這些錯義突變大多屬於良性的、幾乎不會對人體造成影響,但某些致病性錯義突變卻有可能嚴重影響蛋白質的功能。而在目前人類已發現的超過400萬種錯義突變中,只有2%被專家標註為致病性或良性,約占所有7100萬種可能錯義突變的0.1%。由於某些罕見疾病,如鐮刀型貧血、肌萎縮側索硬化症(amyotrophic lateral sclerosis, ALS)的成因與錯義突變有關,其中也有少數甚至單一個錯異突變會直接導致疾病發生,因此找出基因體中的錯異突變可用於相關研究中;此外,了解基因體中的錯異突變,對於研究由許多不同類型基因變化組合引起的複雜疾病,如第二型糖尿病也相當重要。
 
AlphaMissense的建構是基於DeepMind過往以胺基酸序列預測蛋白質結構的分析模型AlphaFold,團隊調整了AlphaFold模型使它能預測若蛋白質中單一胺基酸發生錯義突變,可能造成哪些疾病。根據開發人員的測試,現階段AlphaMissense模型針對已知的錯義突變資料,能辨識出此突變造成何種疾病的精確度高達90%。藉由AlphaMissense的幫助,我們可以對89%的突變進行分類,進一步獲得迄今為止最清晰錯義突變資訊。由於人類與靈長類動物的基因體相似,為了訓練AlphaMissense,開發人員也對AlphaFold做了微調,使它能區分人類和靈長類動物的變異;其中,基因體常見的變異被視為良性,從未見過的變異則被視為致病。
 
儘管AlphaMissense無法預測變異突變後的蛋白質結構會如何變化,或變異突變會對蛋白質穩定性造成哪些影響,但它能利用相關的蛋白質序列和突變後結構的背景資料生成一個介於0~1之間的分數,大致評估該錯義突變可能具有的致病性。用戶也可以根據自身需求調整分數的閾值,影響AlphaMissense將該突變分為致病性或良性的標準。
 
目前團隊已經將AlphaMissense的預測免費提供給科學界使用,更分享他們對超過1.9萬種人類蛋白質的2160萬種單個胺基酸序列發生點突變的擴展預測。未來他們也希望AlphaMissense的開發能加速科學界對遺傳疾病的研究,協助探討、預測罕見疾病的遺傳學,並開發挽救生命的新型治療方法。

 
新聞來源
Avsec Z. and Cheng J. (September 19, 2023). A catalogue of genetic mutations to help pinpoint the cause of diseases. Google DeepMind. https://www.deepmind.com/blog/alphamissense-catalogue-of-genetic-mutations-to-help-pinpoint-the-cause-of-diseases