人民網
人民網>>傳媒>>第三屆世界互聯網大會

王小川:工程師在人工智能時代會處於越來越重要的位置

2016年11月17日14:20 | 來源:人民網-傳媒頻道
小字號

王小川在演講中

人民網11月17日電 (溫靜)11月17日,第三屆世界互聯網大會“移動互聯網論壇”在烏鎮舉行。論壇以“人工智能開啟互聯網新未來”為議題。搜狗公司首席執行官王小川作了主題演講,以下為全文內容:

前面十二場演講嘉賓有技術、有產品,我是希望我給大家的分享能夠再有一些不同的內容,有自己獨有的視角。其實今天一開始大家都提到了Alpha Go,作為今天引爆人工智能的開端,深度學習在中間承擔了最重要的責任。

今天我們大家開始暢想的時候,有可能認為人工智能未來真的會取代人,那麼我希望今天的分享更多的能夠知道人工智能在今天能做什麼,不能做什麼,未來終極的理想又是什麼。

Alpha Go之后,我們看到最重要的領域突破是在語音和圖像,但是事實上在文字領域的進展是緩慢的,今天在機器翻譯裡面有一些突破,但是更多的問答和其他的對語義的理解是不夠,回到圖靈測試,上個世紀五十年代圖靈提出了問答機器推想這樣一個概念,今天我們直觀感受是語音圖像進步很快,但是自然語言的處理其實是比較慢的。

拋開技術作為一個產品經理,我提到人工智能有三個產品方向,今天的會上我們都談到過了。一是識別、語音識別、圖像識別、視頻識別。二是圖像,我們去生產圖像,生成識別都有。三是創造。大家提到了人工智能問前進步的層次,我想換一個語言描述,就是工程師在今天人工智能時代會處於越來越重要的位置。我們開始提到傳統的方法是把規則交給機器,隨著統計系統的發展,包括深度學習,我們開始更容易的將答案交給機器,剛才湯道生講的監督學習就是這樣一個方式,所以在數據的積累下我們就可以讓機器變得更加聰明,這裡面更前沿的方式是將目標交給機器,Alpha Go融合了幾套算法,但是我和他們工程師溝通的時候,這樣的目標交給機器的強化學習,還並不成熟,也就是說如果沒有之前三千萬局人機對戰的棋譜這樣的Alpha Go機器沒有能夠做到隻通過強化學習贏人類的,這是技術層面需要往下突破的重點,如果將目標交給機器能夠做自我學習,有新的突破,那我們離新的人工時代人工智能時代的到來就更近了。

今年六月份,我去了英國倫敦,和Deepmind公司的工程師做了交流,我特別好奇的事情就是下棋的第四局機器輸掉了,我遇到他們問第四局發生了什麼事情,他們和我說不是程序有BUG,就是深度學習本身有瓶頸,圍棋比賽是三月份,我是在六月份去的倫敦,已經過了三個月,三個月的時間,這個問題依然沒有解決。但是我離開以后一個星期,他們的程序能夠正確面對之前的第四局棋譜,我問他是否這個BUG修好了,工程師說沒有,只是代表第四局那個特定問題,正好機器可以解決,但是我們依然不知道什麼情況下,這樣的Alpha Go會繼續出錯。所以我們知道深度學習這樣一個體系其實還是有它的瓶頸所在的。

所以在今天我和大家更多想談以深度學習為代表的今天的人工智能技術,還有哪些不靠譜的地方,在產品上不適用的。第一個問題,語音識別靠譜嗎?在百度、騰訊,都提到了語音識別這樣的能力,今天我給大家的演示也談到了語音識別,這是搜狗自己的技術。我們都提到了在安靜的環境裡面我們的識別准確度已經到了95%,甚至97%,但是一旦有噪音,迅速下降。那這種噪音可能還只是汽車的引擎噪音、風的噪音,這種情況下我們怎麼解決,我們把噪音當成原始數據進入監督學習系統裡去,把這種噪音變成機器見過的問題之一。但是事實上我們見到更多的情況,如果同時兩個月說話會怎樣,在今天的學術界依然無解,同時兩個人說話的時候,這樣的噪音我們都是沒見過的,也沒法提前做訓練。

今年六月份,我問學術界的人,人和機器在語音識別上的區別,究竟怎麼解決?我們用機器的時候,採用立體聲的方式做定向的識別,也就是說我們做一個麥克風矩陣,通過立體的方式知道其中一個人在說話,把另外一個人說話去掉,我想人是這樣干的嗎?如果把一隻耳朵堵上,我是否沒辦法分離出誰在說話及或者把兩個說話的聲音錄在一個單聲道裡面,人可以識別嗎?人是可以的,所以人的方法和機器不一樣,人怎麼識別,因為人的音色不一樣,還是因為兩個人的一個聲音大一個聲音小,還是因為他們說不同的語音,博士說但凡同時兩個人說話的時候,隻能能夠找到差別,人就能夠把其中的一個聲音識別出來,所以人在和機器處理過程當中還有巨大的不同。我在這裡先不展開,語音識別最成熟的領域其實還是和人有很大的區別。

另外一件事情是語義靠譜嗎?就是對語言的理解,谷歌在之前是用知識圖譜的方法解決,現在遇到了瓶頸,也是今年六月,我在一個實驗室看到最先進的人機對話系統,這個系統可以幫你訂餐訂酒店,對話過程當中機器的表現非常驚艷,我們上去試,有一個環節請大家注意,機器開始問你,你是需要停車位還是不要停車位,如果這個時候我們回答說要或者不要都沒問題,我們如果說我沒車。大家知道機器會怎麼樣?他們完全不理解我沒車代表著我不需要停車位,因為今天的機器,在自然語言概念的理解裡面,還是遠遠不夠的。所以自然語言處理是可以做的,但是語義理解到現在還是一個不靠譜的階段。谷歌也在今年發布了一套對於自然語言能夠做句子分析的引擎,把主語、謂語、賓語提出來,但是准確度隻有90%,提不上去了,因為這個時候光靠統計靠語法已經不能支撐,往下是需要對句子當中的具體概念有理解才能消除歧義。我們知道不能把馬路放在冰箱上面,這對於人來講非常好理解,但是對計算機的挑戰非常大,這是深度學習人工智能還不夠的地方。

很敏感的問題,無人駕駛靠譜嗎?今天百度在現場也提出了發布無人駕駛汽車,但是從我的了解,如果以今天人類的技術我們確實對於見過的場景對於封閉場景的無人駕駛汽車可以使用,但是對於真正開放的環境,不隻跑在高速上的汽車,跑在五環上的汽車,對不起以現在人類的技術是不安全的,因為這個場景隻要沒見過,可能會犯嚴重的錯誤,就像AlphaGo下棋一樣會突然發瘋,所以輔助駕駛是可以的,無人駕駛在真正的技術突破以前還做不到。今天的深度學習缺乏推理缺乏符號的理解,如果沒有符號,自然語言的理解就會成為瓶頸。

即便是這樣,我們也提到了能夠取代一些行業,比如說棋手、醫生、司機,機器在裡面都可以做很好的輔助,但是對大家沒見過的創造性的事情,規劃、科研,其實很難,今天在媒體上機器自動寫文章、自動畫圖,在科研層面展示出了一些魔力,但是還不是可以取代人的階段。所以在這裡面我先把大家對人工智能預期降低下來,所以有人在問,是否會出現第三次退潮,前兩次我們都認為人工智能到來了,但是這次可能會比之前好,之前的人工智能兩次退潮前,我們問一個老師,說你是研究人工智能的嗎?這是罵他的話。因為人工智能不靠譜,這次是第一次真正進入到了使用,這就是確實在語言處理、聲音處理、圖象處理,和在一些高維數據空間上能夠比人做的更好。所以這次的區別就是大量資金、資本投入到了人工智能。也有大量的研究人員在畢業以后從事人工智能工作,這是和之前不一樣的。所以一方面開始使用,另外一方面我們開始期待不斷產生新的突破。

我個人對這次是樂觀的,但是我也很緊張,也許我們自己做的搜索引擎就是會被顛覆的一部分。在這裡面我要開始暢想未來的路在什麼地方,從我自己的描述來看,搜索的未來就是人工智能時代的皇冠,為什麼這麼說,搜索的未來是什麼,人工智能的未來又是什麼,為什麼是皇冠?

簡單來講,我認為搜索的未來就是問答機器人。因為我們習慣了一件事情是做搜索的時候我們先輸入關鍵詞,然后給你十條結果,或者叫十條鏈接。但是這真是最好的方法嗎?肯定是不夠的。我們也會提到是否我們用個性化的方法能夠使得搜索的結果更准,但是其實個性化能夠提供的信息非常的有限。真正能夠使得這個系統變得有用的辦法是用問句。以前不用問句的原因是因為機器聽不懂你在說什麼,真正到了問句以后,從給你十條鏈接,變成給你一個答案,就會好很多,如果你去問機器,四個字,烏鎮大會,機器不可能給你想要的內容,最多把新聞,烏鎮的百科或者是官網介紹給你,隻有你問烏鎮大會哪天開,這個時候機器才能理解你要什麼,才有機會給你最好的答案,我相信隨著技術的突破,搜索引擎會自然而然演化成為問答引擎。

這個過程裡面很多公司都在做,蘋果、微軟、亞馬遜、谷歌,這裡面起步最早做對話系統的是蘋果的Siri。這個系統並不成功,在中國用的人很少。為什麼不成功?因為現在技術沒有到來,現在對於自然語言的處理能力、自然語言的理解能力非常有限,為什麼蘋果這樣一個追求極致的公司,會把這個系統發布出來,一種可能性是蘋果對技術了解不夠。另一種可能性我認為是喬布斯的一個遺願,咱們知道發布iPhone手機的時候,喬布斯已經躺在病床上看發布會,發布會完成之后,他很快就離開人世了,所以這像一個早產的嬰兒在iPhone4S裡面發布出來,所以我認為這樣的系統代表著人類終極人機。

交互的暢想。事實上在大量的文學作品電影裡面,科幻裡面,都會提到問答機器人,不管是《星球大戰》、《超能陸戰隊》、《星際穿越》都提到了,阿西莫夫的短篇《最后的問題》,描繪就是人類造了一個機器,把所有的資源都用了上去,但是機器回答不了一個問題,就是宇宙是怎麼誕生的,但是可以回答其他任何問題,這是文學作品對問答機器的思考。除了搜索引擎做問答以外,咱們知道在中國搜狗輸入法擁有三億用戶,輸入法的未來是什麼呢?和自動問答有關系,大家一起來看一個視頻。之前我們討論輸入法的時候很多朋友和我說語音是最重要的,搜狗有完整的語音識別技術和語音合成技術,但是在我內心,這個遠不是輸入法的極致,它真正的極致是能夠開始尋找信息,幫你思考,剛才大家演示的是一個分享的能力,真正的回答能力可以在后面給大家做一個新的演示。

我們討論問答技術和討論人機對話的時候,輸入法也許是最好的一個切入場景,以前提到了百度的“度秘”是獨立的引擎,但是輸入法作為一個人的分身,更容易幫助你建立思考,輸入法也會從一個拼音工具走向一個對話和問答系統。搜狗有兩個核心產品,一個是輸入法一個是搜索。一個是搜索信息一個是表達信息,隨著AI技術的發展,我們更好的解放人的思考。我們有一個理念,兩件事情,一個是做自然的交互,不只是語音,而是語言,另外就是做知識的計算,能讓機器開始逐步建立推理的能力。搜狗輸入法在中國擁有最大的語言數據處理積累,我們有機會在這個領域取得突破。這是我今天的分享,謝謝大家! 

(責編:溫靜、趙光霞)

分享讓更多人看到

傳媒推薦
  • @媒體人,新聞報道別任性
  • 網站運營者 這些"紅線"不能踩!
  • 一圖縱覽中國網絡視聽行業
返回頂部