文章專區

2018-10-01Google機器學習研討會 探索深度學習在地圖上的應用 442 期

Author 作者 李依庭/《科學月刊》主編。
還記得最近一次拿著紙本地圖、向當地居民問路是什麼時候嗎?自2005年Google電子地圖(Google Maps)上線之後,便越來越少人使用紙本地圖或是向人問路,而只要動動手指、輸入目的地地址,Google地圖便會幫忙找出最佳路徑,讓人能在最短時間內或以最簡便的方式到達該地。
 
Google地圖,是Google公司的一項電子地圖服務,範圍涵蓋全球,地圖中包含地標、路名、大眾交通等資訊,並提供向量地圖、衛星相片和地形圖3種視圖。不僅如此,現今的地圖上更有「街景(Street View)」的服務,讓使用者可以直接觀看實際街道上所拍到的影像。
 
近年來,在機器學習、深度學習與人工智慧的日益發展之下,Google公司也嘗試透過技術的整合,將相關應用的觸角延伸至Google的各項服務中,在Google地圖服務也不例外。Google地圖研究團隊期望結合深度學習的技術,解決現今在Google地圖上所面臨的問題。
 
在這次的機器學習會議上,邀請到美國總公司的Google地圖團隊軟體工程師盧金比爾(Andrew Lookingbill)分享Google如何透過深度學習,改善地圖中可能面臨的各種問題。首先,他分享了深度學習能成功幫助建立地圖資訊,像是透過注意力機制(attention mechanism)的演算法,幫助機器學習能從真實環境、複雜的門牌資訊中,提供店名或各種可用的標示於地圖上作判讀。
 
另外,研究團隊也透過遞歸神經網路(recurrent neural network, RNN)和長短期記憶網路(long short term memory network, LSTM)等模型,將路上的標誌資訊加以整合,以增進街道名稱的辨識能力。不僅如此,更透過地圖上的資料訓練機器學習,使模型能夠自主學習規範化(normalization),像是讓機器透過學習,知道當法國的路標出現「Av.」時,代表是「街(avenue)」的意思等。
 
除了更加優化地圖的辨別能力外,研究團隊也利用機器學習模型幫助現今地圖資訊較為缺乏的開發中國家,像是利用模型和演算法成功幫助奈及利亞的拉哥斯城其地圖的繪製與整合,包含城中2萬條街道名稱、5萬個地址與10萬間商家的資訊等。此外,盧金比爾也表示,Google團隊也企圖在不同文化的國家提供不同的服務,像是在機車普及的臺灣,團隊則開發出機車模式地圖,以供機車騎士使用。
 
地圖中包含的不只是路名、街道或商家,更有許多的建築物與高樓大廈,因此,研究團隊也嘗試利用機器學習,讓模型能自動化搜尋街道上的建築物,產生建築物影像並在地圖中加入建築物的俯視平面向量圖。目前,已有1.1億個透過演算法繪製的建築物新增至Google地圖上,盧金比爾表示,除了會持續增加外,未來也希望能在建築物內標示出地圖,讓人們即使在複雜的建築物內,也能透過Google地圖,找到欲到達的目的地。