人民網
人民網>>傳媒

專訪百度大腦技術團隊 當"最強大腦"遇上人工智能

2017年01月16日06:42 | 來源:經濟日報
小字號
原標題:當最強大腦遇上人工智能

  給你1張4歲小女孩的照片,再讓你從電腦屏幕上看20個女孩跳舞唱歌,每個女孩隻出現3秒鐘。你能從中找出長大后畫著濃妝、戴著美瞳,甚至可能整容過的她嗎?

  1月6日,江蘇衛視《最強大腦》就以“匆匆那年”為主題,上演了中國版的首次人機對決:31.02秒就可記憶一副無規則扑克牌的人類代表王峰,迎戰百度人工智能機器人“小度”。雙方先比拼人臉識別——僅憑一張童年照認出十幾年后的少女,包括一對雙胞胎﹔第二局,則要從30張畢業照中,即約1500個花生米大小的頭像中,根據長大后的男生照片找出兒時的他。

  同“Master”橫掃人類圍棋大師一樣,人工智能再一次戰勝了人類。百度大腦如何分辨長大后的雙胞胎?它和Master哪個更厲害?它還擁有哪些神奇的功能?《經濟日報》記者就此採訪了百度大腦的技術團隊,得出迄今為止最靠譜的答案。

  小度認出了長大后的雙胞胎之一,人類沒有

  都說“女大十八變”,比賽中,選手王峰表示,自己主要看嘴角、耳朵的相似度。在他眼裡,長幼兩張人臉被分解成一個個相似的五官形狀,此中除了運用人類的記憶力、推理能力,還有人類的本能。

  “千百萬年進化過程中,人腦進化出一個專門的區域負責人臉識別(簡稱FFA)。”百度首席科學家吳恩達被戲稱為小度的“爸爸”,他舉例說,“一個3歲的孩子看見媽媽時,不管媽媽是微笑、生氣,睜著眼、閉著眼,長頭發、短頭發,穿什麼衣服,孩子都可以輕易認出這是媽媽”。

  但是,人腦為何一瞬間就能完成人臉識別,至今全世界的科學家也說不清背后的原理。因此,小度對人臉的識別不是模仿人腦,而是更多基於數據分析和深度學習。

  在人工智能“眼裡”,它看見的不是一個圖形,而是一些按數字1和0記錄的像素點。因此,機器會把人臉分為很多個小方塊來識別。根據眼睛、眉毛、鼻子等器官的特征及其相互之間的幾何位置關系,計算總結出這些點,最終構成了一張人臉。

  如果要辨認這張人臉是誰,機器還要提取面部特征進行特征建模,與需要對比的人臉比較后,根據相似程度,對人臉的身份信息進行判斷。一旦人的面貌發生任何變化,哪怕只是輕微仰頭,燈光變換,機器都需要重新計算一遍。

  據百度深度學習實驗室主任林元慶介紹,“為做到盡量精確,在百度的技術中,我們會在人臉上取72個點,最后通過神經網絡計算,得到128維特征,每一維特征是人臉上的某種特點,比如獅子鼻”。

  至於如何從72個點的信息裡總結出128種特征,並將每種特征與人臉的特點一一對應,這是由深度學習從海量數據裡自動學到的。換句話說,工程師並不知道這種特征究竟是“獅子鼻”,還是別的某種甚至沒有詞匯形容的特征。

  計算機辨認人臉原本就非常困難,但在《最強大腦》的舞台上,又增加了時間跨度。現場嘉賓、北京大學心理學系教授魏坤琳解釋說,成長中的人臉變化極大,一個人一輩子連身份証都要換好幾次。對於人類來說,可以依靠整體神態、氣質等無法言說的因素去主觀猜測,但機器不會猜,隻能根據深度學習得來的規律計算。

  據林元慶介紹,為了備戰,團隊2個月裡讓小度看了200萬個人的2億張照片,並輔以少量有時間跨度的照片。經過“訓練”,小度自己總結出了一種不為人所知的人臉隨年齡變化的規律。

  在遇到蜜蜂少女隊的雙胞胎時,人類和人工智能的差別就顯示出來了:姐妹花長大后外表幾乎一模一樣,連姐妹倆自己都分辨不出舊照片裡的人是誰,王峰用肉眼也無法辨別她們的五官特征。但是,在人工智能的計算方式下,雖然她們的面部骨骼極其相似,差別特別細微,總還是有一點區別。最終,小度計算出,其中一位跟老照片裡的小姑娘有72.98%的相似度,另一位有72.99%,差距僅為萬分之一。

  百度大腦認臉和Master下棋,哪個更難?

  很巧合,在百度大腦參加最強大腦比賽的幾乎同一時間,曾經橫掃國際象棋界的阿爾法狗改名Master,重出江湖,以60場連勝頂尖圍棋手的傲人成績,震驚了全世界。

  這也讓不少人好奇:如果Master和百度大腦比賽,誰輸誰贏?

  “很遺憾,這很可能將是一個永遠沒有答案的問題。”林元慶解釋說,因為百度大腦和Master學習的是兩種完全不同的技能:小度的強項是生活服務,比如人臉識別和語音識別,從來沒有學過下棋。Master目前似乎也隻會下棋,不會辨別人臉。

  那麼,對人工智能來說,認臉和下棋,哪個更難?

  從本質上說,百度大腦和Master都不是記憶和推理的高手,而是數學大師,隻不過一個算棋局的概率,一個算人臉相似的概率。

  國際象棋、圍棋等棋類是計算每一步會帶來的概率變化,計算能力和算法越強,越能照顧到后面局勢的變化。魏坤琳認為,人類不擅長邏輯運算,因此,隻有少數人精於下棋,頂尖高手更是鳳毛麟角。而且,人類腦力有限,即使是聶衛平在巔峰時期,也隻能在局部多計算幾個回合,無法考慮每一步對全盤戰局的影響。

  但邏輯運算是電腦的強項,它每次落子,都可以考慮對全局的影響。這也是為什麼聶衛平等圍棋大師會覺得Master不按常理下棋的原因。因為在某些時候,計算全局和計算局部的結果是不同的。

  反過來,感知和運動是人類擅長的,機器卻不擅長。機器無法理解雨打芭蕉的美,爬個樓梯也很費力,特別是台階的高度、坡度、光照條件等參數無法預知時,機器人很難像人一樣流暢地爬樓梯。

  “同樣,推理辨識長大后的人臉,不是簡單的信息匹配和分類問題,而是從模糊復雜的信息中抽象出規律的問題。”魏坤琳說,“基於極少非結構化的信息來學習推理,這恰恰是人腦擅長的。我們把這些要素都設計到了最強大腦舞台上的挑戰當中”。

  因此,《最強大腦》科學顧問團首席顧問、北京師范大學心理學院院長劉嘉在首次媒體看片會上,曾正面回應道,“小度從計算上的難度來講,甚至可能會超過Master”。

  但魏坤琳不完全贊同。他反復強調這種難易比較只是“可能”,“因為,人工智能對不同認知功能有自身的難易評判,我們不能用人的直覺去作這個評判。這就像蘋果和橘子,不能比”。

  我們不怕汽車比人跑得快,為什麼要畏懼機器比人聰明?

  這場比賽還有一個細節——面對小度,曾經展現出超強記憶力、辨識力的人類選手都不敢應戰,場面一度尷尬。在評委們的鼓勵下,有3位選手帶著點悲壯的感覺主動請戰,稱“即使必輸無疑,也要維護戰隊和個人尊嚴”。

  選手們的畏懼折射出當下人們對人工智能的恐懼心理。最強大腦的選手在記憶力、識別能力等方面都極其出類拔萃。他們在人類最擅長的領域,被最不擅長此項活動的機器打敗,其沖擊大於當年的AlphaGo,再次引發了“人工智能威脅論”。

  “恐懼未知,這是人的正常心理。”魏坤琳覺得,新技術出現時都會造成恐慌,汽車、火車、計算機剛問世都有人害怕。他認為,大多數人其實是擔心自己被人工智能替代,“人工智能的出現,可能讓很多一般智力活動甚至專業人員的工作受到威脅。但是,有些工作被取代了,新的工作又產生了,人類整體的失業率不一定會上升”。

  實際上,從人類生活的質量來說,有了人工智能的輔助,大家的生活變得更“智能”了,自動駕駛、家居機器人、專業決策輔助,這都是前人無法想象的生活。

  在比賽現場,嘉賓就提出,小度可以幫助父母尋找失散多年的孩子,幫助公安機關搜尋偶然被攝像頭拍到的犯罪分子。從商業化的角度,百度的人臉識別已經在浙江烏鎮景區閘機得到應用,可滿足每年千萬人次的游客使用。還有一些國產手機也在接洽,希望使用百度的人臉識別技術。

  而且,人工智能還可以做很多事情。比如小度不僅會辨別人臉,對人類語音的辨別率也能達到97%﹔小度還可以聲情並茂地輸出語句,基本可以代替忙碌的媽媽給孩子們講故事。在智慧醫療、文物挽救、在線個性化教育等方面,人工智能大有可為。因此,近年來,微軟、Facebook、IBM、谷歌、亞馬遜都投入巨資研發人工智能。在最近的消費電子展(CES 2017)上,各大廠商都帶來了自己的人工智能。

  但是,再強的人工智能都是人類智慧的結晶。機器隻能做人教給它的東西,也無法理解人類的感情。比如小度判斷出雙胞胎的存在,給出了兩個概率。因為兩個數字太過接近,在它的系統中無法抉擇,最終還是吳恩達幫它挑選了概率稍高的那一張。

  人工智能要威脅到人類,還有很遠的距離。也許就像王峰說的,人和機器不是敵對的關系,雖然這次他輸給了人工智能,但這其實代表人類的科技又進了一步。(佘 穎)

(責編:宋心蕊、趙光霞)

分享讓更多人看到

傳媒推薦
  • @媒體人,新聞報道別任性
  • 網站運營者 這些"紅線"不能踩!
  • 一圖縱覽中國網絡視聽行業
返回頂部