文章專區

2022-04-01結合生物學、統計學、資訊學的科學生物資訊學是什麼? 628 期

Author 作者 林志鵬/現職英華達醫療電子事業部資深經理,銘傳大學兼任助理教授。曾任有勁基因研究服務銷售總監、有勁生物科技副總經理。

Take Home Message
◆ 生物資訊學是一種結合生物學、資訊學、統計學的科學。生物資訊的資料主要來自於傳統生物實驗數據,再搭配各種物理化學特性,透過電腦軟體將整合資訊整理、發現新的生物法則,進一步解決生物或醫學問題。
◆目前生物資訊學處理最多的資料來源為DNA ∕ RNA 序列資訊。藉由生物資訊學,科學家能快速地計算、分析、比對資料庫中的DNA 序列。
◆生物資訊學也能協助預測蛋白質結構。該方法不僅有助分析蛋白質的功能及生化機制,也能用於不同蛋白質或其他化學分子之間的交互作用,甚至是電腦輔助開發藥物。

手中拿著《科學月刊》的你,想必對於科學一定有基本的熱愛吧?甚至也可能曾經自己動手做過科學實驗,看看能否重現過往書中所提到的科學現象。在實驗過程中,我們通常會透過「觀察、假設、操作、記錄」,綜合實驗中的變因與數據結果,相互推敲出「規則」後,再將這個規則套用在其他實驗,驗證找到的規則是否正確。而除了上述的模式之外,我們也可以從各種不同的大量實驗數據中進一步歸納並推敲,得到其他新的「規則」。

在一般的分子生物學實驗裡,我們會花很多的時間進行「操作」,這歸因於分子生物學實驗操作流程的繁複及不穩定性。因此,早期分子生物學家要獲得實驗數據並不容易,如果想要透過實驗收集大量資料,來進一步歸納出新的發現則更加困難。然而,1989 年的人類基因體計畫(Human Genome Project, HGP),以美國國家衛生研究院(National Institute of Health, NIH)為首,與其他18 個國家的研究團隊合作,花費10 年及30 億美金,終於在西元2000 年解碼出第一個人類染色體上30 億個鹼基的草稿。

接著在2007年,次世代定序技術(next generation sequencing, NGS)的出現,將染色體解碼的速度推向另外一個層級,以目前的最新狀況為例,我們可以在2天內解碼48個人類的基因。科學家能利用電腦協助處理排山倒海的數據,進而讓生物資訊學(bioinformatics)發光發熱。

 
 

生物資訊學:跨領域的科學

生物資訊學就名詞上來看,是一個橫跨生物學及資訊學領域的學科,但其實應該還要再加上統計學或應用數學(圖一)。

圖一:生物資訊學是結合不同的領域所對應的學科。其中包含了生物學、統計學、資訊學等,以解決生物學或醫學等問題。

簡單來說,生物資訊學就是「透過電腦軟體搭配數學統計,計算各種生物相關資料」。這些資料可以是既有的生物數據,也可以再搭配各種物理化學特性,透過軟體將這些資訊整合,從中整理或發現新的生物法則,進一步解決生物或醫學的問題。由於生物資訊的跨領域特色,在當前講求團隊合作的時代,也是一個很好的橋樑,能夠串聯起生物學家和資訊學家,達到更大、更好的合作效果。

尋找DNA的相似程度

受到次世代定序技術的影響,目前生物資訊學處理最大宗的資料來源為DNA/RNA 的序列資訊,其他尚有細胞內的化學分子結構,以及代謝傳遞路徑分析等。其基本的概念,就是希望能以電腦軟體來取代人工資料處理。……【更多內容請閱讀科學月刊第628期】