雲棲科技評論第101期:發展通用智能,需要無監督學習--傳媒--人民網 雲棲科技評論第101期--傳媒--人民網
人民網首頁
101

卷首語

人民網公眾號

阿裡雲公眾號

發展通用智能,需要無監督學習
   過去十年,機器學習在圖像識別、自動駕駛汽車和圍棋等領域取得了前所未有的進步。這些成功在很大程度上是靠監督學習和強化學習來實現的,這兩種方法都要求由人設計訓練信號並傳遞給計算機:

   在監督學習的情況下,這些是“目標”(例如圖像的正確標簽);在強化學習的情況下,它們是成功行為的“獎勵”(例如在Atari游戲中獲得高分)。因此,強化學習也可以被認為是一種監督學習,這兩者構成了當前機器學習的主要學習方式,也為機器學習構建了一個極限:人類訓練師和數據量決定了機器學習的深度和精度。

   很顯然,機器學習如今遇到了瓶頸,無論是人類訓練師還是數據量,都難以支撐機器學習更進一步地發展出高水平的人工智能,更不用提通用智能,人類和數據成為了通用智能發展的阻礙,無監督學習則是這一難題當前唯一的解決途徑。

   什麼是無監督學習?在知乎上有人答到:是否有監督就看輸入數據是否有標簽,輸入數據有標簽,則為有監督學習﹔輸入數據沒標簽,則為無監督學習。

   換句話說,就像是幼兒學習,不僅有指導(監督學習)和鼓勵(強化學習),還應該有自由探索世界的能力,不需要人為的干預,這就是無監督學習。這就是為什麼,如果要讓AI脫離人類發展出通用智能,必須要讓它掌握無監督學習的技能。

   無監督學習的收益是巨大的,加州大學伯克利分校(UC Berkeley)人工智能研究院(BAIR)最新公布的一項研究成果顯示,通過讓機器人在無監督學習的情況下與環境交互,進而建立一個可預測因果關系的視覺模型,可以讓機器人具備一種“通過模仿及互動模式來學會如何使用工具”的能力,在訓練之后,機器人盡管遇到先前從沒見過的工具,一樣會知道如何使用。

   這意味著未來機器人能夠使用多個物體來完成復雜的多對象任務,甚至可以在新場景下使用即興工具,從而構建起真正具有通用智能的機器人。

                                 阿裡雲研究中心 崔昊

  編輯制作:人民網研究院  內容提供:阿裡雲研究中心
  本刊僅用於行業交流,非商業用途。編輯或專家觀點獨立,不代表本刊立場。部分所選用內容,未能與作者取得聯系,請聯系本刊:yjy@people.cn

1、投資50億的IBM醫療裁員70%


投資50億的IBM醫療裁員70%

  【新聞摘要】 近日,在IEEE Spectrum的特別報告《How IBM Watson Overpromised and Underdelivered on AI Health Care》一文中,細數了Watson醫療曾立下的目標和被潑的冷水,並對比了如今的發展現狀。報告中透露,該部門被傳出預計裁員50%至70%,且到目前為止,監管機構隻批准了少數基於AI的工具用於真實醫院和醫生辦公室:這些開創性產品主要聚集在圖像診斷領域——通過計算機視覺技術分析圖,如X射線和視網膜掃描圖像進行診斷,卻並沒有與IBM有關的分析醫學圖像領域的產品獲批落地。(閱讀報道)
  【小雲評論】 IBM的“首敗”至少可以向技術專家和醫生們証明:試圖創造出一位AI醫生,這是一件極其困難的工作。針對AI在醫療領域的發展,今年圖靈獎得主之一的Yoshua Bengio認為,在醫學文本方面,AI系統無法消歧,也無法找到人類醫生會注意到的細微線索。雖然AI不需要充分了解也可以幫助醫療,但確實還沒有一個AI能與人類醫生的理解和洞察力相匹配。但IBM Watson的失敗並不意味著AI在醫療領域毫無未來,正如報告中所說:“在數字化時代裡, IBM Watson 不是第一個象牙塔的守望者,也不會是最后一個叢林中的引路人。”

2、杜克大學用 AI 識別神經元僅需30分鐘


杜克大學用 AI 識別神經元僅需30分鐘

  【新聞摘要】 美國杜克大學的生物工程師最近發明了一種基於卷積神經網絡 (CNN) 的自動化手段,在保証准確率的前提下,將專業人士需要十幾小時的興奮神經標識任務,縮短至幾十分鐘。這一全新的自動化手段被稱為“STNeuroNet”的3D 卷積神經網絡模型,借助該模型,在不考慮預處理和后加工過程的情況下,神經元識別速度可以達到一秒鐘處理 27 幀視頻,即使考慮了前后處理的時間,處理 10 段視頻的效率也達到了約 17 幀每秒。與此同時,研究人員還發現在某一特定神經元區域訓練的 STNeuroNet 模型,即使在另外一個有著完全不同神經元尺寸和密度的區域,同樣可以實現興奮神經元的標記,並且有較高准確度。(閱讀報道)
  【小雲評論】神經細胞必須在活體的大腦環境中才能正常運轉,因此隻能通過雙光子成像技術,利用光子的穿透性原理,在不損害細胞的情況下,對活體動物的腦內神經元進行實時掃描成像。但即使有了成熟的影像技術,對影片上的單個神經元進行標記仍是一項極具挑戰的工作,處理一段 30 分鐘的視頻成像,一個專業分析師通常要不吃不喝地連續工作 4 至 24 個小時,STNeuroNet 模型的出現能夠實現對興奮神經元更有效地識別,神經學家們或許很快就能實現對腦部神經活動的動態實時分析,並為研究腦部神經與肢體行為之間的關系提供非常多的線索。

3、無監督學習:基於小數據集實現人工智能


無監督學習:基於小數據集實現人工智能

  【新聞摘要】 谷歌旗下人工智能公司DeepMind近日刊文指出,過去十年裡,機器學習在語言處理、圖像識別、自動駕駛等商業應用,甚至圍棋、星際爭霸和DOTA等游戲領域裡都取得了空前進步。這些成功在很大程度上是通過監督學習和強化學習這兩種學習模式中的一種,對神經網絡進行訓練來實現的。有科學家指出,真正的人工智能需要能夠自我學習,把對一個領域的學習成果應用於另一個領域,就像兒童探索世界一樣,因此,人工智能未來的發展將在很大程度上依靠“使用小數據集的無監督學習”來完成,從而避免人類成為人工智能發展的瓶頸。(閱讀報道)
  【小雲評論】在絕大部分時間裡,兒童都是在自我探索世界,通過好奇心、游戲和觀察來理解周遭環境,這就是無監督學習。正如文章中所說,機器進行無監督學習的一個關鍵動力,來自於人類設計訓練信號的一大缺陷:雖然傳遞給算法的數據具有非常豐富的內部結構(比如圖像、視頻和文本),但用於訓練的目標和獎勵通常比較稀少(比如“狗”的標簽隻適用於特定物種,或者隻用1和0代表游戲的成功和失敗)。這意味著,算法學到的大部分內容主要是對數據本身而非對任務的理解,“程序是為了學習而學習”,從而能創造出脫離人類限制邊界的人工智能。

4、DOTA2比賽人工智能選手 2:0吊打世界冠軍


DOTA2比賽人工智能選手 2:0吊打世界冠軍

  【新聞摘要】 OpenAI Five近日在與DOTA 2 國際邀請賽冠軍 OG 戰隊的對戰中,以2:0的成績贏得了比賽,這也是OpenAI Five連續第四次以2:0的成績戰勝高水平的人類DOTA 2戰隊。賽后,OG 隊長 N0tail 在接受採訪時表示,“AI 的表現超乎想象,它雖然在插眼(DOTA 2戰術名詞)等方面還有待進步,買活(DOTA 2戰術名詞)的時機也與人類常識相反,但它的技能釋放十分精准,可能凌駕於所有人類玩家之上,而且有超強的執行力,能夠保証隨時將損失降到最低。或許跟它交戰 50 場之后,我們能贏一場。”(閱讀報道)
  【小雲評論】此次比賽名為“OpenAI Five Finals”,意味著這次公開對決將會是 OpenAI Five 在 DOTA 2 中的最后一次出場,在此之后OpenAI Five將會向全球所有的選手短暫開放挑戰,從而進一步讓玩家們體會AI游戲對手的強大能力。以此為起點,AI或許將會在商業游戲領域獲得進一步的發展,畢竟在針對DOTA 2游戲的AI訓練中,OpenAI Five並沒有使用人類玩家的對戰數據,其中80% 的時間自我對弈,20% 的時間和過去的版本對弈,訓練中每天進行的游戲數量時長相當於人類玩家訓練約 180 年。解放對人類玩家對戰數據的需求,意味著未來商業游戲可以在上市時即可為玩家提供高水平對戰和NPC(非玩家角色)服務。

5、加州大學讓機器人學會使用即興工具


加州大學讓機器人學會使用即興工具

  【新聞摘要】 加州大學伯克利分校人工智能研究院最新公布一項研究成果,研究人員利用演示數據集和無監督經驗,讓機器人通過模仿及互動模式來學會如何使用工具,在訓練之后,機器人盡管遇到先前從沒見過的工具,一樣會知道如何使用。通過設計出允許機器人通過類似模仿和互動模式的算法,來掌握使用工具的技能,機器人不僅學會了把從沒見過的物體當作工具加以使用,甚至在沒有傳統工具可用的情況下,以“即興物品”來替代,例如,沒有掃帚時,推斷出瓶子等普通物品,也可作為工具使用,會更有效率地完成任務。(閱讀報道)
  【小雲評論】許多動物利用觀察和實驗可以學會如何使用工具,比如通過觀察彼此或觀察人類的行為,黑猩猩知道如何使用樹枝來捕抓白蟻。除此以外,處理過去不曾見過的物體,也一直是機器人執行任務時很大的挑戰。因此,模仿能力和無監督學習(識別未曾接觸的物體及做出應對)是未來機器人發展的關鍵,加州大學伯克利分校人工智能研究院的這一研究不僅讓機器人能夠使用多個物體來完成復雜的多對象任務,或是可以在新場景下使用即興工具,更有助於讓機器人更加通用,在日常環境中執行實際的任務。

6、AI數字重建或許可以讓巴黎聖母院“永生”


AI數字重建或許可以讓巴黎聖母院“永生”

  【新聞摘要】 4月16日巴黎聖母院突遭火災,損毀嚴重,重建問題在第一時刻被提出,有技術專家表示,AI數字重建或許可以在重建及重建后的長期遺產保護方面,為巴黎聖母院帶來巨大的價值。2018年11月,瓦薩大學(Vassar College)藝術學院副教授Andrew Tallon完成了對巴黎聖母院的掃描工作,積累了各個角度的建筑全景、3D和細節圖片,其中用於三維存檔的技術(三維激光掃描/激光雷達),已經精確(1-2mm精度)、快速(每秒測量數十萬個點)地獲取了巴黎聖母院的三維幾何信息,基於這些信息未來利用AI技術或許可以在數字空間重建巴黎聖母院,從而讓巴黎聖母院“永生”。(閱讀報道)
  【小雲評論】巴黎聖母院大火牽動了全球民眾的心,也對全球文物保護工作者提出了新挑戰:隨著時間的推移,各種意外都有可能發生在文物身上,造成不可挽回的損失﹔即使沒有意外,由於各種外界因素(如空氣、光照等)的影響,文物實際上都處在“消亡”的進程中。因此,利用數字化技術對文物進行數字化留存,讓文物在數字空間中得到“永生”是迫在眉睫的。由於全球文物存量極大,依靠人力是遠遠不能夠實現這種“永生”的,引入AI技術提高效率,實現批量化的操作,是一種必然選擇。

7、阻止WannaCry的安全專家曾涉足惡意軟件


阻止WannaCry的安全專家曾涉足惡意軟件

  【新聞摘要】 據國外媒體報道,曾阻止了WannaCry勒索軟件擴散的英國安全研究員馬庫斯?哈欽斯(Marcus Hutchins)承認,自己成為惡意軟件研究員之前曾編寫了惡意軟件。公開披露的法庭文件顯示,哈欽斯承認犯有制造和分發惡意軟件,以及協助和教唆分發兩項罪名,政府同意免去了其他的八項罪名。對於其中每一項罪名,哈欽斯可能面臨最高五年監禁,以及最高25萬美元罰款,外加長達一年的監督釋放(指罪犯刑期結束釋放之后仍然需要受到一定的監督)。哈欽斯開發了Kronos和UPAS-Kit兩種針對銀行的木馬病毒,並參與了惡意軟件“Vinny”、“VinnyK”和“Aurora123”的在線宣傳和銷售。這些事情發生在2012年7月到2015年9月之間,之后哈欽斯成為了一名才華橫溢的安全研究員。(閱讀報道)
  【小雲評論】Marcus Hutchins是否開發了這些惡意軟件已經不重要,作為一名知名安全研究員對自己過去經歷的掩蓋以及由此產生的負面影響才是此次事件的重點,而更令人震驚的是,他做這一切的時候還尚未成年。因此,這一次Marcus Hutchins事件為全球信息安全領域敲響了兩聲警鐘:一是安全研究員的背景調查工作需要高度重視﹔二是安全威脅的來源正在越來越多的來自於那些未成年(同樣也未受到安全意識影響)的技術極客,這需要優化未成年技術專家的發現和引導機制。

8、舊金山或成美國首個禁止人臉識別的城市


舊金山或成美國首個禁止人臉識別的城市

  【新聞摘要】 據美國科技媒體The Verge報道,舊金山提出了一項關於監視技術的行政法規《停止秘密監視條例》(Stop Secret Surveillance ordinance),要求該市的政府部門在使用或購買監控技術前征求監事會的批准,並且每年向監察委員會提交監視技術設備或服務的審計報告。針對人臉識別技術,該條例特別指出,“人臉識別技術危害公民權利和公民自由的傾向大大超過了其聲稱的好處,這項技術將加劇種族不平等,並威脅到我們不受政府長期監控的生活能力”。此外,如果獲得批准,該條例還將制定全面禁令,阻止政府部門購買或使用人臉識別技術。(閱讀報道)
  【小雲評論】從全球來看,有部分機構、企業開始對人臉識別技術的應用採取謹慎態度,主要原因多是顧慮人臉識別技術對公民權利和公民自由的危害,以及技術應用所獲得的好處與所造成的危害是否成正比。另一面,據美國國土安全部披露的數據顯示,基於人臉識別技術的生物識別系統推出至今已幫助識別出7000名非法滯留在美國的簽証逾期人員。決定是否採用前沿技術,確實要考慮其“投入產出比”,但仍然建議要留出一個“試驗窗口期”,一味的從政策法規上禁止,隻會白白錯失很多前沿技術所帶來的社會和經濟方面的獲益。

9、據傳蘋果公司開始洽談激光雷達傳感器合作


據傳蘋果公司開始洽談激光雷達傳感器合作

  【新聞摘要】 據國外媒體報道,消息人士透露,就下一代自動駕駛汽車激光雷達傳感器的可能供應商一事,蘋果公司已經與至少四家公司進行了談判。與此同時,蘋果公司也正在開發自己的自動駕駛汽車激光雷達傳感器。這一舉動証明蘋果公司已經重新加入自動駕駛汽車市場的競爭中。目前的激光雷達系統,包括蘋果公司此前測試的自動駕駛汽車上安裝的來自Velodyne公司的設備,不僅價格高、笨重,而且容易出現故障。不過,這些缺點卻被數十家初創公司和成熟公司視作機會,在激光雷達領域投入巨資,通過使激光雷達系統變得更小、更便宜、更穩定,獲得可觀的高潛力市場。(閱讀報道)
  【小雲評論】雖然不清楚蘋果公司重返自動駕駛汽車領域的目標是制造自己的汽車,還是提供自動駕駛汽車的硬件和軟件產品,蘋果公司重返自動駕駛汽車市場都是一種必然,這一市場已經齊聚全球主流科技企業和汽車廠商,原因非常簡單:這是一種未來將會改變人類社會出行方式的技術,同時,還將產生巨量的高價值數據,為更進一步服務消費者提供參考。蘋果公司的自動駕駛汽車項目Project Titan此前已經擁有了超過1200名員工,雖然策略上略有搖擺,但就此次國外媒體披露的消息來說,蘋果公司重返自動駕駛汽車市場幾乎已成定局。

10、沃爾沃高管稱亞馬遜將進入汽車零售業


沃爾沃高管稱亞馬遜將進入汽車零售業

  【新聞摘要】 據彭博社報道,沃爾沃美國子公司首席執行官安德斯?古斯塔夫鬆(Anders Gustafsson)警告經銷商稱,亞馬遜可能會進入汽車零售業,在全美汽車經銷商協會和J.D. Power聯合主辦的這場活動上,古斯塔夫鬆展示了亞馬遜首席執行官杰夫?貝索斯(Jeff Bezos)說過的一句話:“你們的利潤是我的機會。”他表示,汽車行業需要對新想法持開放態度,否則“追逐利潤”的杰夫?貝索斯會比傳統汽車廠商和經銷商跑得更快,進入汽車零售業,並且對傳統渠道形成非常嚴峻的挑戰。(閱讀報道)
  【小雲評論】傳統汽車銷售渠道正在成為汽車零售業變革的阻礙力量:沃爾沃一直在推動通過沃爾沃手機APP和名為“Care by Volvo”的汽車租賃方式(互聯網租車服務)銷售XC40 SUV,但這受到了包括美國加州經銷商在內的諸多傳統汽車銷售渠道的反對,加州經銷商為了阻止沃爾沃的創新銷售計劃,甚至向加州機動車輛管理局提交了長達199頁的請願書。不過,無論汽車經銷商支持與否,沃爾沃汽車公司都沒有放棄推動新車銷售方式的全面改革,這正是企業變革(尤其是數字化轉型)成功的關鍵所在:堅持變革。