文章專區

2019-01-01模仿人類視覺 AI也能辨識物體 445 期

Author 作者編輯部

【本刊訊】來自美國加州大學亨利•薩穆埃利工程與應用科學學院（UCLA Samueli School of Engineering）與史丹佛大學（Stanford University）的共同研究團隊近日於《美國國家科學院刊》（Proceedings of the National Academy of Sciences）發表一款全新的電腦系統，其可以使AI基於與人類相同的視覺方式，透過深度學習後能「看到」並識別出真實世界的物體。

這項先進的電腦系統稱為「電腦視覺（computer vision）」，它讓電腦能夠讀取並識別各種真實世界的圖像。這是AI的重要進展之一，電腦可以透過自我學習，用直觀的方式，並透過推理做出決策，讓AI以更加人性化的方式與人類互動。儘管當前電腦AI的視覺系統已日漸強大並擁有更高的處理效能，但對於執行某些特定的任務時，AI的識別能力受制於訓練的程度及軟體程式編譯的內容。

目前傳統的電腦視覺系統並不是為了自我學習而設計的，它們必須透過學習過的內容進行訓練，例如利用成千上萬張的圖片進行識別某項物體。當然，AI並沒有辦法確定圖片中的物體代表什麼。即使是當今最強大的電腦視覺系統，在看見某項物體的部分時仍然無法將其完整的面貌建構出來；另外當系統遭遇不熟悉的環境設定時，也同時可能會被其他的畫面所誤導。研究人員的目標是使電腦系統具備人類的視覺能力。舉例而言，當人眼看見一張椅子後面只出現爪子和尾巴時，大腦即可判斷出後方的物體是隻小狗。人眼可以透過接收少數的資訊並推斷出其原貌，但AI尚未具備這樣的能力。

研究團隊的新方式是透過以下3個步驟使AI進行學習：首先，系統會將需分辨對象的圖片分成各個小區塊；第二，AI學習將這些區塊進行拼湊組合；最後，AI會查看該主要對象周遭區域的其他物體，並分析這些物體是否與主要對象有所關聯。研究團隊利用網際網路，使AI的識別能力更能貼近人類。研究人員表示，網際網路提供2點幫助AI提升識別能力。其一是網路提供豐富的圖像與影片等資源，讓AI有更多的參考對象；其二是這些物體能從許多不同的角度展示，例如俯瞰及近距離觀看等。

研究人員利用約9000張圖片對系統進行測試，每張圖片中都包含人與其他物體，系統在沒有外部幫忙下建構出人體的細部模型。另外團隊也使用摩托車、汽車及飛機等圖像進行類似的模擬測試，系統仍可清楚建構各項物體的細節與圖像，其表現能力甚至能與訓練多年的傳統電腦系統匹敵，也使AI的識別能力有更大的進展。

新聞來源

Lichao Chen et al., Brain-inspired automated visual object discovery and detection, Proceedings of the National Academy of Sciences, 2018.

文章專區

2019-01-01模仿人類視覺 AI也能辨識物體 445 期

相關推薦

認識科月

讀者服務