李彥宏展示"百度大腦"能力 在某些方面已超過人類

百度董事長李彥宏昨天首度全面展示了百度大腦的各項能力

百度的無人車可以准確識別出道路標識、信號燈等
人工智能(AI)是百度近些年技術發力的核心,而百度大腦是百度AI能力的核心。那麼百度大腦具體具備哪些能力?怎樣評價百度大腦的水平?在昨天的2016百度世界大會上,百度董事長李彥宏首度全面展示了百度大腦的各項能力。
百度大腦在某些方面已超過人類
“百度大腦的概念在大約三年前對外講過。那個時候我們講,百度大腦已經具備了大概兩三歲孩子的智力水平了。”那麼現在,百度大腦相當於幾歲人的智力水平呢?李彥宏表示,“我也不知道它現在是多少歲了,因為畢竟人腦和電腦還是有很大的區別,百度大腦雖然是一個人工智能的大腦,但是它和人正常的發育過程還是很不一樣的。”可以說,百度大腦擁有強大的智商,雖然並不全能,無法直接與人類大腦相比較,但是在某些方面,百度大腦甚至已經超越了人類。
那麼百度大腦究竟是什麼呢?據介紹,百度大腦由人工智能的算法、計算能力和數據三大技術組成。在人工智能部分,百度擁有模擬人的神經元組成的超大規模的神經網絡﹔還使用萬億級的參數、千億的樣本和千億的特征進行訓練,這個體量與人腦的相接近。在計算能力部分,百度使用數十萬台的服務器來進行計算,其中很多服務器不是傳統基於CPU(中央處理器)的服務器,而是基於GPU(圖形處理器)﹔李彥宏表示GPU特別適合人工智能,尤其是深度學習的計算。在數據部分,百度收集了全網上萬億的互聯網網頁內容,其中包括百億級的視頻、音頻、圖像,每天數十億次網民的搜索請求和數百億次的網民定位請求。
百度無人車依賴百度大腦
目前,百度大腦最主要的功能分別是:語音的能力、圖像的能力、自然語言的理解能力和用戶畫像的能力。而語音的能力是其中最為成熟的技術。
今年MIT Technology Review(《MIT科技評論》)雜志,把百度的Deep Speech 2語音識別引擎評為“2016改變世界十大突破技術”。該技術主要使用了百度大腦深度學習的能力,目前,該技術的語音識別准確率已達到97%,這樣的准確率已經達到甚至有時已經超過了人對語音的識別能力。此外,百度的語音合成技術也達到了“自然”的體驗,增加了語感。李彥宏透露,目前百度每天要響應2.5億次的語音合成請求,其中一部分是“有聲讀物”的請求。“給它50字句話樣本,它可以模擬任何一個你喜歡的人的說話方式,還可以裝在百度地圖的語音系統中。”
圖像能力是人類視覺的延伸,無論是靜態的圖片,還是動態的視頻,百度的圖像技術都能對其進行精准的識別和理解,目前百度的人臉識別的准確率已經達到了99.7%,不論對方做什麼表情、什麼動作,該系統可以准確識別出。
此外,百度的無人車就利用了圖像識別技術。李彥宏表示:“應該說,計算機視覺或者是圖像識別的技術是‘最后一公裡’,無人駕駛汽車真的要變成沒有人,真的要能夠解決99.999%甚至100%的情況,最終還是要依靠計算機視覺的能力,要識別各種各樣的極端情況。”利用該技術,無人車可以准確識別出道路標識、信號燈、周邊建筑物、行人、路面情況和障礙物等。
百度的自然語言處理技術還處於早期,但也誕生出了“度秘”的產品。度秘類似於Siri,是一個個人智能的助理,可以與用戶以自然語言進行交互。就在前不久的奧運會上,度秘和著名籃球評論員楊毅一起合作做了一場籃球比賽的解說。楊毅說:“它學習過上百場甚至上千場的比賽,對比賽的基本知識儲備是沒問題的,在這個行業裡面,它可能比我知道得還多,因為幾年前的比賽我可能已經忘了,但是仍然裝在它的電腦裡。”美中不足的是,度秘的語速目前還有點慢,但是每次的解說后,它的語速會有所提升。
“用戶畫像”是互聯網的熱門概念,是利用大數據對服務目標群體的特征的勾勒。目前百度擁有接近10億的用戶畫像,其中有千萬級的細分標簽。標簽有兩個維度,一個是通用的維度,它的人口學特征、短期的意圖、位置屬性﹔二是垂直行業的特征,用戶在金融、保險、醫療、旅游、健康等領域都有什麼樣的愛好、習慣,這些特點共同構成了用戶畫像。在6月份上映的《魔獸》電影的前期宣傳中,借助百度的用戶畫像對潛在的觀眾進行推廣,最終使得票房提升了超過200%。
百度將開放百度大腦的能力
百度昨天宣布將全面開放百度大腦,未來百度大腦將與各行各業結合,衍生出不同領域的行業大腦,比如醫療大腦、交通大腦、金融大腦等等。目前百度已經與太原鐵路局合作,做物流優化的工作。
百度首席科學家吳恩達公布了百度人工智能的兩大開放平台:百度深度學習平台(PaddlePaddle)與百度大腦開放平台(ai.baidu.com)。與其他第三方平台相比,百度深度學習平台以更少的數據准備及訓練配置,實現易學易用、性能高效﹔而百度大腦開放平台則向合作伙伴開放技術與培訓資料,實現因智而能,促進行業發展。
吳恩達還透露,目前百度正在研發一個新的語音輸入法,“語音為主的鍵盤”。這種輸入法不僅可以理解自然語言,還可以為語言自動推薦可以配上的表情。此外,還可以同時解決第三方需求,例如在聊天的同時把他人的電話號碼發送給對方等等。(溫婧)
分享讓更多人看到
推薦閱讀
相關新聞
- 評論
- 關注



























第一時間為您推送權威資訊
報道全球 傳播中國
關注人民網,傳播正能量