文章專區

2019-01-01中研院利用人工智慧與演算法 開發合成醣分子軟體 445 期

Author 作者 李依庭/科月主編。
醣類(carbohydrate),又稱碳水化合物,主要由碳、氫、氧3種元素構成,廣泛存在自然界,也是生活中常見的物質。不只是作為生物體的營養來源,醣類在生物體中也扮演著舉足輕重的角色,像是儲存養分的肝糖、遺傳物質上的核糖、動物的外骨骼或植物的細胞壁等。
 
近年來,科學家在醣類進行越來越多的研究,也漸漸對其有更多的認識,甚至發現從細胞的基本運作到癌細胞的增生都與醣分子有關。雖然科學家深知醣類對生物體的重要性,不過由於其結構複雜,且不易人工合成,在材料取得不易的情況下,使得科學家無法在醣分子研究上有所突破、對醣分子有更深入的了解。
 
這個瓶頸一直到翁啟惠院士分別在1982、1999年發明「一鍋式酵素反應」和「程式化一鍋式多醣合成法」後有了轉折,一鍋式酵素反應能利用生物方法合成複雜的醣分子、合成大量寡醣;「程式化一鍋式多醣合成法」則是可用化學方法合成任何天然或非天然的寡糖。此2項方法的發明也讓科學家開始能夠利用這些合成醣分子進行更多相關實驗。
 
而近期,合成醣分子的方法又有了新的發展,由中央研究院基因體研究中心吳宗益研究員和資訊科學研究所許聞廉特聘研究員跨領域合作,結合人工智慧(artificial intelligence, AI)及演算法(algorithm),將翁院士所發明的程式化一鍋合成法寫成電腦軟體「Auto-CHO」,並開放與學術社群共享。
 
當年的「程式化一鍋合成法」主要是採用化學方式,將單醣所組成的組合單元(Building blocks, BBL)依據其相對反應值(relative reactivity values, RRV),建入電腦程式資料庫Optimer。研究人員只要將想合成的寡醣結構輸入,該程式即可自動找出適合的組合單元。
 
而Auto-CHO軟體,則是以程式化一鍋合成法的資料庫為基礎,將裡面原有的50個組合單元增加至154個RRV的組合單元,再加上利用電腦模擬的5萬個具預測RRV的「虛擬」組合單元。
 
不僅如此,軟體也能透過人工智慧學習,將經實驗證實的醣組合單元資料以特徵工程(feature engineering)建立出最佳化的「RRV預測模型」,能夠進行交叉驗證(cross-validation)或獨立驗證(independent test),更能進一步透過實驗,驗證多種原先由軟體虛擬出的組合單元。
 
此外,研究團隊也透過程式化一鍋合成法的優化,設計出一套演算法,將醣分子的合成過程拆解成不同階層,讓一個以一鍋化方法合成的醣片段,可作為新的醣元件用於另一個一鍋化,讓不同的一鍋化產物互相使用。除此之外,也將一鍋化方法整理成步驟架構,讓醣分子合成如食譜一般,以流程圖呈現。目前,依據Auto-CHO軟體所提供的「食譜」,已成功合成出4種生物學上重要的寡醣分子。
 
研究人員表示以往的方法雖然已有其規律,讓醣分子就像樂高積木一樣組合,不過因為單元少,所以只能組成小型模型車。不過,現在透過Auto-CHO系統,結合人工智慧與演算法,能夠組合出像超級跑車一樣的規模。而這項研究成果也已發表在《自然通訊》(Nature Communications)期刊中。
 
目前,研究人員將Auto-CHO系統的原始碼公開,提供給學術界免費使用。除了想與更多的使用者分享外,也希望使用該程式的學者們,可將虛擬醣元件的使用心得進行回饋,讓廣大的研究社群可以共襄盛舉,持續修正和增添資料庫的內容。研究人員也希望藉由此程式的開發,未來能幫助科研人員在研究上更快速且廣泛地合成醣分子,發表更多與醣分子有關的研究,解開生物體中醣分子的奧秘。