文章專區

2019-01-01模仿人類視覺 AI也能辨識物體 445 期

Author 作者 編輯部
【本刊訊】來自美國加州大學亨利•薩穆埃利工程與應用科學學院(UCLA Samueli School of Engineering)與史丹佛大學(Stanford University)的共同研究團隊近日於《美國國家科學院刊》(Proceedings of the National Academy of Sciences)發表一款全新的電腦系統,其可以使AI基於與人類相同的視覺方式,透過深度學習後能「看到」並識別出真實世界的物體。
 
這項先進的電腦系統稱為「電腦視覺(computer vision)」,它讓電腦能夠讀取並識別各種真實世界的圖像。這是AI的重要進展之一,電腦可以透過自我學習,用直觀的方式,並透過推理做出決策,讓AI以更加人性化的方式與人類互動。儘管當前電腦AI的視覺系統已日漸強大並擁有更高的處理效能,但對於執行某些特定的任務時,AI的識別能力受制於訓練的程度及軟體程式編譯的內容。
 
目前傳統的電腦視覺系統並不是為了自我學習而設計的,它們必須透過學習過的內容進行訓練,例如利用成千上萬張的圖片進行識別某項物體。當然,AI並沒有辦法確定圖片中的物體代表什麼。即使是當今最強大的電腦視覺系統,在看見某項物體的部分時仍然無法將其完整的面貌建構出來;另外當系統遭遇不熟悉的環境設定時,也同時可能會被其他的畫面所誤導。研究人員的目標是使電腦系統具備人類的視覺能力。舉例而言,當人眼看見一張椅子後面只出現爪子和尾巴時,大腦即可判斷出後方的物體是隻小狗。人眼可以透過接收少數的資訊並推斷出其原貌,但AI尚未具備這樣的能力。
 
研究團隊的新方式是透過以下3個步驟使AI進行學習:首先,系統會將需分辨對象的圖片分成各個小區塊;第二,AI學習將這些區塊進行拼湊組合;最後,AI會查看該主要對象周遭區域的其他物體,並分析這些物體是否與主要對象有所關聯。研究團隊利用網際網路,使AI的識別能力更能貼近人類。研究人員表示,網際網路提供2點幫助AI提升識別能力。其一是網路提供豐富的圖像與影片等資源,讓AI有更多的參考對象;其二是這些物體能從許多不同的角度展示,例如俯瞰及近距離觀看等。
 
研究人員利用約9000張圖片對系統進行測試,每張圖片中都包含人與其他物體,系統在沒有外部幫忙下建構出人體的細部模型。另外團隊也使用摩托車、汽車及飛機等圖像進行類似的模擬測試,系統仍可清楚建構各項物體的細節與圖像,其表現能力甚至能與訓練多年的傳統電腦系統匹敵,也使AI的識別能力有更大的進展。
 
新聞來源
Lichao Chen et al., Brain-inspired automated visual object discovery and detection, Proceedings of the National Academy of Sciences, 2018.