文章專區

2013-02-01人臉辨識的困難與突破 518 期

Author 作者 楊家輝/任教成功大學電腦通信工程研究所 黃世明、吳思樺/就讀成功大學電腦通信工程研究所

早期有關機器智慧應從人工智慧發展開始,英國的數學家圖林(Turing)於1950年提出如何判斷機器有無智慧,這就是有名的圖林測驗。如果機器能通過一個人類質詢者的詢問,讓他信以為這個機器是一個真正的人,那麼這個機器就可以算是有智慧了。約翰麥卡西(John McCarthy)在1956年提出人工智慧概念,「人工智慧」,也就是「人類賦予機器智慧」,其重點是要如何設計實用且能自行解決問題的機器,並具有自我學習的能力。就像人類一樣,在犯錯中學習,不斷記取教訓,直到不再犯錯。所以,人工智慧的精髓也是在錯誤中學習,直到機器沒有錯誤發生或降低錯誤發生的機率。「人工智慧」的發展曾經遭遇瓶頸,所以,最近又以「機器學習」再度出發。機器學習為人類給予機器一些判斷的準則及告 知調整準則參數的方法,以達到智慧的判斷。

為了證明機器可以有人類的智慧表現,最直接的方式就是比賽。John McCarthy舉辦電腦西洋棋大賽,讓機器跟人類高手一決勝負。IBM 也在1997 年提出深藍計畫,也就是有一部名為「深藍」的電腦和當時的世界西洋棋王比賽。「深藍」可以模擬及思考人類下棋的模式,最後打敗了西洋棋王。不僅如此,IBM 最近又一新作「華生」電腦,「華生」可以聽懂自然語言也可以回答任何問題。而且「華生」在美國益智電視節目Jeopardy 中,戰勝二位益智冠軍。

在生活上也有許多應用,2012 年台灣機場開始建置自動查驗通關系統(eGate),旅客只要先在機場申請註冊並按指紋及人臉拍照,就可以不需人力自動通關。如果旅客要出境,在出境的第一道關卡為將護照放在讀卡機上進行身分掃瞄辨識;第二道關卡則是生物特徵辨識,由電腦自動計算比對臉部特徵及眼球特徵相似度,只有符合才可通關。若臉部辨識失敗,則會再以指紋辨識做進一步確認。接下來,本文將深入探討機器學習於人臉辨識的技術與發展。

何謂人臉辨識

人臉辨識在不同應用上有不同性質的分類,如圖一所示,可分為以下幾類:

人臉偵測(Face Detection):從影像中找出人臉位置是很重要的一項工作,因為要正確辨識人臉資訊之前,必須先有效且精準的定位出人臉在複雜環境背景下的位置。若不能先精準的進行人臉偵測,辨識率再高的系統將無法正常運作。

人臉識別(Face Identification):從一群已知的使用者中,根據偵測到的人臉資訊選擇一位最像的人,這種情況是一種N對一的問題。人臉識別可以進一步的再分成兩類,一種為開放集的人臉識別,一種為密閉集的人臉識別,前者使用者的範圍是沒有限制的,可以為任何人,後者使用者的範圍則限定為已知的一群人。舉例來說,人臉識別可以應用在照片分類上,或是將監視器拍到的畫面來抓小偷等等。

人臉驗證(Face Verification Authentication):根據人臉資訊與其所宣稱的身份,來驗證使用者是否真如其人,這是二選一的問題。舉例來說,人臉驗證可以應用在門禁系統的身份確認或最近在智慧型手機上有別於傳統設置PIN 碼的人臉解鎖方式。