計算機:會聽會看能思考【3】--傳媒--人民網
人民網>>傳媒>>24小時滾動新聞

計算機:會聽會看能思考【3】

2012年11月20日11:33    來源:光明日報    手機看新聞

  鏈接:

  “懂你”的計算機

  美國紐約賓厄姆頓大學的計算機科學家尹立軍致力於讓計算機識別人類的表情,並據此調整自己的表現。目前尹立軍在這一領域的研究大多以計算機視覺為中心。尹立軍最為感興趣的是讓計算機直接“看到”用戶,最好讓計算機能懂得:當你看它時,你想讓它干什麼。

  通過對100個實驗對象的臉部3D掃描,尹立軍的團隊已經建立起了包含2500個面部表情的數字數據庫。不過,目前數據庫中的表情隻有六種類別:憤怒、厭惡、恐懼、喜悅、悲傷和驚訝。尹立軍希望自己研究的算法不僅可以在視覺上對這六種表情進行簡單區分,還能識別它們之間的微妙變化。目前這個數據庫是對非盈利研究組織免費開放的。

  這一研究不僅能用於開發“懂你”的電腦,還有“懂你”的醫療設備——萬一哪天被病痛折磨的說不出話來,計算機會讀懂你的面部表情。另外,它也能用於幫助自閉兒童學會識別他人的表情。

  計算機同聲翻譯

  近日,微軟首席研究官裡克·拉希德在天津演示了一項新技術——對著新研發的語音識別、翻譯和生成系統說了8句英語,系統隨即模仿他的語調翻譯成普通話,雖然翻譯的普通話聽起來有點“倫敦音”,但每句話的意思基本都得到明確表達。

  微軟方面介紹說,這一技術的工作流程大體是:系統通過接收語音,識別說話者的聲調和語言,建立模型﹔將這些語言翻譯轉換﹔一次性用另一種語言輸出,再由同樣的人聲表達。

  據拉希德透露,計算機同傳實現的關鍵在於微軟研究院和多倫多大學的研究人員取得了一項突破——利用模擬人腦行為的“深度神經網絡”技術,提升了語音識別器的辨識能力。拉希德說,通過這種人腦仿生技術,微軟的語音識別錯詞率較以往降低了30%,以前每4到5個單詞中便有1個錯詞,如今7到8個詞中才錯1個。錯詞率的降低被視作計算機同傳技術中決定性的改變。

  通過計算機實現原聲同傳,是微軟在計算機語音識別技術上的重大進展。拉希德表示,希望再過幾年,“能夠打破人與人之間的語言障礙”。(詹 媛)

(來源:光明日報)

分享到:


24小時排行 | 新聞頻道留言熱帖