文章專區

2019-07-01電腦如何擊敗頂尖棋士？淺談AlphaGo人工智慧系統 595 期

Author 作者顏士淨／國立東華大學資訊工程系教授，從事人工智慧、機器學習、電腦對局等研究，圍棋棋力為業餘六段。

AlphaGo 人工智慧類神經網路深度卷積式類神經網路圍棋程式趨勢科技深度學習技術

2016 年 Google DeepMind 團隊的 AlphaGo 擊敗南韓九段圍棋棋王李世乭，震撼全世界，可說是人工智慧的重要里程碑。AlphaGo 主要以人工智慧深度學習的技術開發，並透過強化式學習的方式提高棋力。DeepMind在 2014年開始網羅機器學習與電腦圍棋菁英，包括席維爾（David Silver）、黃士傑（Aja Huang）與麥迪遜（Chris J. Maddison）等專家學者，加上充沛的計算資源與大量的資訊人才，不但影響圍棋的發展，也讓很多人開始思考人工智慧對人類未來的影響。

AlphaGo能擊敗人類，主要是模仿人類棋士的空間比對與思考，其採用 3 種先進的機器學習技術：深度學習（Deep Learning, DL）、強化式學習（Reinforcement Learning, RL）及深度強化式學習（Deep Reinforcement Learning, DRL）。以下將分別敘述這 3 種機器學習技術。

越複雜越好——深度學習

AlphaGo 所使用的深度學習技術是一種類神經網路（Neural Network）技術，早在 20 世紀中期，就有許多學者提出類神經網路的概念，而自 1980 年起，類神經網路開始實際應用在解決現實世界問題。一般的類神經網路可分為輸入層、輸出層與隱藏層(圖一)，輸入層為圖片，輸出層為圖片種類判斷，其餘則為隱藏層。而所謂深度學習網路，其中的深度就是指隱藏層的個數，增加深度可使網路有能力處理更複雜的問題。在相對複雜的圍棋布局中，AlphaGo 的深度學習網路深度設定為 13 層。而深度學習類神經網路原本用於圖形辨識問題，圖一中的深度學習網路便是用於辨識圖形，並予以分類。2011 年起，GPU 繪圖顯示晶片因為可以充分利用大量平行化的運算特性，大幅提高效能至實用階段。

圍棋方面，人工智慧學界從 2008 年起就有將深度卷積式類神經網路（Deep Convolutional Neural Network, DCNN）運用在圍棋的研究。而電腦圍棋界也有許多人將 DCNN 直接應用在圍棋程式裡面，趨勢科技創始人張明正曾經在 2015 年，邀請圍棋棋士王銘琬、趨勢科技的工程師與東華大學共同成立 GoTrend 團隊，同時也研究 DCNN 在圍棋的應用，在 2015年日本 UEC電腦圍棋比賽中獲得不錯的表現。而在 2016年的UEC比賽中，前8名有7隊都是以深度學習技術開發。AlphaGo 團隊也採用深度學習進行辨識棋型，並預測高段棋士的著手。......【更多內容請閱讀科學月刊第 595 期】

圖一：深度學習技術，輸入層為圖片，輸出層為圖片的判別，其餘則為隱藏層。能用於辨識圖形，並進行分類。

文章專區

2019-07-01電腦如何擊敗頂尖棋士？淺談AlphaGo人工智慧系統 595 期

越複雜越好——深度學習

相關推薦

認識科月

讀者服務