云栖科技评论第101期:发展通用智能,需要无监督学习--传媒--人民网 云栖科技评论第101期--传媒--人民网
人民网首页
101

卷首语

人民网公众号

阿里云公众号

发展通用智能,需要无监督学习
   过去十年,机器学习在图像识别、自动驾驶汽车和围棋等领域取得了前所未有的进步。这些成功在很大程度上是靠监督学习和强化学习来实现的,这两种方法都要求由人设计训练信号并传递给计算机:

   在监督学习的情况下,这些是“目标”(例如图像的正确标签);在强化学习的情况下,它们是成功行为的“奖励”(例如在Atari游戏中获得高分)。因此,强化学习也可以被认为是一种监督学习,这两者构成了当前机器学习的主要学习方式,也为机器学习构建了一个极限:人类训练师和数据量决定了机器学习的深度和精度。

   很显然,机器学习如今遇到了瓶颈,无论是人类训练师还是数据量,都难以支撑机器学习更进一步地发展出高水平的人工智能,更不用提通用智能,人类和数据成为了通用智能发展的阻碍,无监督学习则是这一难题当前唯一的解决途径。

   什么是无监督学习?在知乎上有人答到:是否有监督就看输入数据是否有标签,输入数据有标签,则为有监督学习;输入数据没标签,则为无监督学习。

   换句话说,就像是幼儿学习,不仅有指导(监督学习)和鼓励(强化学习),还应该有自由探索世界的能力,不需要人为的干预,这就是无监督学习。这就是为什么,如果要让AI脱离人类发展出通用智能,必须要让它掌握无监督学习的技能。

   无监督学习的收益是巨大的,加州大学伯克利分校(UC Berkeley)人工智能研究院(BAIR)最新公布的一项研究成果显示,通过让机器人在无监督学习的情况下与环境交互,进而建立一个可预测因果关系的视觉模型,可以让机器人具备一种“通过模仿及互动模式来学会如何使用工具”的能力,在训练之后,机器人尽管遇到先前从没见过的工具,一样会知道如何使用。

   这意味着未来机器人能够使用多个物体来完成复杂的多对象任务,甚至可以在新场景下使用即兴工具,从而构建起真正具有通用智能的机器人。

                                 阿里云研究中心 崔昊

  编辑制作:人民网研究院  内容提供:阿里云研究中心
  本刊仅用于行业交流,非商业用途。编辑或专家观点独立,不代表本刊立场。部分所选用内容,未能与作者取得联系,请联系本刊:yjy@people.cn

1、投资50亿的IBM医疗裁员70%


投资50亿的IBM医疗裁员70%

  【新闻摘要】 近日,在IEEE Spectrum的特别报告《How IBM Watson Overpromised and Underdelivered on AI Health Care》一文中,细数了Watson医疗曾立下的目标和被泼的冷水,并对比了如今的发展现状。报告中透露,该部门被传出预计裁员50%至70%,且到目前为止,监管机构只批准了少数基于AI的工具用于真实医院和医生办公室:这些开创性产品主要聚集在图像诊断领域——通过计算机视觉技术分析图,如X射线和视网膜扫描图像进行诊断,却并没有与IBM有关的分析医学图像领域的产品获批落地。(阅读报道)
  【小云评论】 IBM的“首败”至少可以向技术专家和医生们证明:试图创造出一位AI医生,这是一件极其困难的工作。针对AI在医疗领域的发展,今年图灵奖得主之一的Yoshua Bengio认为,在医学文本方面,AI系统无法消歧,也无法找到人类医生会注意到的细微线索。虽然AI不需要充分了解也可以帮助医疗,但确实还没有一个AI能与人类医生的理解和洞察力相匹配。但IBM Watson的失败并不意味着AI在医疗领域毫无未来,正如报告中所说:“在数字化时代里, IBM Watson 不是第一个象牙塔的守望者,也不会是最后一个丛林中的引路人。”

2、杜克大学用 AI 识别神经元仅需30分钟


杜克大学用 AI 识别神经元仅需30分钟

  【新闻摘要】 美国杜克大学的生物工程师最近发明了一种基于卷积神经网络 (CNN) 的自动化手段,在保证准确率的前提下,将专业人士需要十几小时的兴奋神经标识任务,缩短至几十分钟。这一全新的自动化手段被称为“STNeuroNet”的3D 卷积神经网络模型,借助该模型,在不考虑预处理和后加工过程的情况下,神经元识别速度可以达到一秒钟处理 27 帧视频,即使考虑了前后处理的时间,处理 10 段视频的效率也达到了约 17 帧每秒。与此同时,研究人员还发现在某一特定神经元区域训练的 STNeuroNet 模型,即使在另外一个有着完全不同神经元尺寸和密度的区域,同样可以实现兴奋神经元的标记,并且有较高准确度。(阅读报道)
  【小云评论】神经细胞必须在活体的大脑环境中才能正常运转,因此只能通过双光子成像技术,利用光子的穿透性原理,在不损害细胞的情况下,对活体动物的脑内神经元进行实时扫描成像。但即使有了成熟的影像技术,对影片上的单个神经元进行标记仍是一项极具挑战的工作,处理一段 30 分钟的视频成像,一个专业分析师通常要不吃不喝地连续工作 4 至 24 个小时,STNeuroNet 模型的出现能够实现对兴奋神经元更有效地识别,神经学家们或许很快就能实现对脑部神经活动的动态实时分析,并为研究脑部神经与肢体行为之间的关系提供非常多的线索。

3、无监督学习:基于小数据集实现人工智能


无监督学习:基于小数据集实现人工智能

  【新闻摘要】 谷歌旗下人工智能公司DeepMind近日刊文指出,过去十年里,机器学习在语言处理、图像识别、自动驾驶等商业应用,甚至围棋、星际争霸和DOTA等游戏领域里都取得了空前进步。这些成功在很大程度上是通过监督学习和强化学习这两种学习模式中的一种,对神经网络进行训练来实现的。有科学家指出,真正的人工智能需要能够自我学习,把对一个领域的学习成果应用于另一个领域,就像儿童探索世界一样,因此,人工智能未来的发展将在很大程度上依靠“使用小数据集的无监督学习”来完成,从而避免人类成为人工智能发展的瓶颈。(阅读报道)
  【小云评论】在绝大部分时间里,儿童都是在自我探索世界,通过好奇心、游戏和观察来理解周遭环境,这就是无监督学习。正如文章中所说,机器进行无监督学习的一个关键动力,来自于人类设计训练信号的一大缺陷:虽然传递给算法的数据具有非常丰富的内部结构(比如图像、视频和文本),但用于训练的目标和奖励通常比较稀少(比如“狗”的标签只适用于特定物种,或者只用1和0代表游戏的成功和失败)。这意味着,算法学到的大部分内容主要是对数据本身而非对任务的理解,“程序是为了学习而学习”,从而能创造出脱离人类限制边界的人工智能。

4、DOTA2比赛人工智能选手 2:0吊打世界冠军


DOTA2比赛人工智能选手 2:0吊打世界冠军

  【新闻摘要】 OpenAI Five近日在与DOTA 2 国际邀请赛冠军 OG 战队的对战中,以2:0的成绩赢得了比赛,这也是OpenAI Five连续第四次以2:0的成绩战胜高水平的人类DOTA 2战队。赛后,OG 队长 N0tail 在接受采访时表示,“AI 的表现超乎想象,它虽然在插眼(DOTA 2战术名词)等方面还有待进步,买活(DOTA 2战术名词)的时机也与人类常识相反,但它的技能释放十分精准,可能凌驾于所有人类玩家之上,而且有超强的执行力,能够保证随时将损失降到最低。或许跟它交战 50 场之后,我们能赢一场。”(阅读报道)
  【小云评论】此次比赛名为“OpenAI Five Finals”,意味着这次公开对决将会是 OpenAI Five 在 DOTA 2 中的最后一次出场,在此之后OpenAI Five将会向全球所有的选手短暂开放挑战,从而进一步让玩家们体会AI游戏对手的强大能力。以此为起点,AI或许将会在商业游戏领域获得进一步的发展,毕竟在针对DOTA 2游戏的AI训练中,OpenAI Five并没有使用人类玩家的对战数据,其中80% 的时间自我对弈,20% 的时间和过去的版本对弈,训练中每天进行的游戏数量时长相当于人类玩家训练约 180 年。解放对人类玩家对战数据的需求,意味着未来商业游戏可以在上市时即可为玩家提供高水平对战和NPC(非玩家角色)服务。

5、加州大学让机器人学会使用即兴工具


加州大学让机器人学会使用即兴工具

  【新闻摘要】 加州大学伯克利分校人工智能研究院最新公布一项研究成果,研究人员利用演示数据集和无监督经验,让机器人通过模仿及互动模式来学会如何使用工具,在训练之后,机器人尽管遇到先前从没见过的工具,一样会知道如何使用。通过设计出允许机器人通过类似模仿和互动模式的算法,来掌握使用工具的技能,机器人不仅学会了把从没见过的物体当作工具加以使用,甚至在没有传统工具可用的情况下,以“即兴物品”来替代,例如,没有扫帚时,推断出瓶子等普通物品,也可作为工具使用,会更有效率地完成任务。(阅读报道)
  【小云评论】许多动物利用观察和实验可以学会如何使用工具,比如通过观察彼此或观察人类的行为,黑猩猩知道如何使用树枝来捕抓白蚁。除此以外,处理过去不曾见过的物体,也一直是机器人执行任务时很大的挑战。因此,模仿能力和无监督学习(识别未曾接触的物体及做出应对)是未来机器人发展的关键,加州大学伯克利分校人工智能研究院的这一研究不仅让机器人能够使用多个物体来完成复杂的多对象任务,或是可以在新场景下使用即兴工具,更有助于让机器人更加通用,在日常环境中执行实际的任务。

6、AI数字重建或许可以让巴黎圣母院“永生”


AI数字重建或许可以让巴黎圣母院“永生”

  【新闻摘要】 4月16日巴黎圣母院突遭火灾,损毁严重,重建问题在第一时刻被提出,有技术专家表示,AI数字重建或许可以在重建及重建后的长期遗产保护方面,为巴黎圣母院带来巨大的价值。2018年11月,瓦萨大学(Vassar College)艺术学院副教授Andrew Tallon完成了对巴黎圣母院的扫描工作,积累了各个角度的建筑全景、3D和细节图片,其中用于三维存档的技术(三维激光扫描/激光雷达),已经精确(1-2mm精度)、快速(每秒测量数十万个点)地获取了巴黎圣母院的三维几何信息,基于这些信息未来利用AI技术或许可以在数字空间重建巴黎圣母院,从而让巴黎圣母院“永生”。(阅读报道)
  【小云评论】巴黎圣母院大火牵动了全球民众的心,也对全球文物保护工作者提出了新挑战:随着时间的推移,各种意外都有可能发生在文物身上,造成不可挽回的损失;即使没有意外,由于各种外界因素(如空气、光照等)的影响,文物实际上都处在“消亡”的进程中。因此,利用数字化技术对文物进行数字化留存,让文物在数字空间中得到“永生”是迫在眉睫的。由于全球文物存量极大,依靠人力是远远不能够实现这种“永生”的,引入AI技术提高效率,实现批量化的操作,是一种必然选择。

7、阻止WannaCry的安全专家曾涉足恶意软件


阻止WannaCry的安全专家曾涉足恶意软件

  【新闻摘要】 据国外媒体报道,曾阻止了WannaCry勒索软件扩散的英国安全研究员马库斯?哈钦斯(Marcus Hutchins)承认,自己成为恶意软件研究员之前曾编写了恶意软件。公开披露的法庭文件显示,哈钦斯承认犯有制造和分发恶意软件,以及协助和教唆分发两项罪名,政府同意免去了其他的八项罪名。对于其中每一项罪名,哈钦斯可能面临最高五年监禁,以及最高25万美元罚款,外加长达一年的监督释放(指罪犯刑期结束释放之后仍然需要受到一定的监督)。哈钦斯开发了Kronos和UPAS-Kit两种针对银行的木马病毒,并参与了恶意软件“Vinny”、“VinnyK”和“Aurora123”的在线宣传和销售。这些事情发生在2012年7月到2015年9月之间,之后哈钦斯成为了一名才华横溢的安全研究员。(阅读报道)
  【小云评论】Marcus Hutchins是否开发了这些恶意软件已经不重要,作为一名知名安全研究员对自己过去经历的掩盖以及由此产生的负面影响才是此次事件的重点,而更令人震惊的是,他做这一切的时候还尚未成年。因此,这一次Marcus Hutchins事件为全球信息安全领域敲响了两声警钟:一是安全研究员的背景调查工作需要高度重视;二是安全威胁的来源正在越来越多的来自于那些未成年(同样也未受到安全意识影响)的技术极客,这需要优化未成年技术专家的发现和引导机制。

8、旧金山或成美国首个禁止人脸识别的城市


旧金山或成美国首个禁止人脸识别的城市

  【新闻摘要】 据美国科技媒体The Verge报道,旧金山提出了一项关于监视技术的行政法规《停止秘密监视条例》(Stop Secret Surveillance ordinance),要求该市的政府部门在使用或购买监控技术前征求监事会的批准,并且每年向监察委员会提交监视技术设备或服务的审计报告。针对人脸识别技术,该条例特别指出,“人脸识别技术危害公民权利和公民自由的倾向大大超过了其声称的好处,这项技术将加剧种族不平等,并威胁到我们不受政府长期监控的生活能力”。此外,如果获得批准,该条例还将制定全面禁令,阻止政府部门购买或使用人脸识别技术。(阅读报道)
  【小云评论】从全球来看,有部分机构、企业开始对人脸识别技术的应用采取谨慎态度,主要原因多是顾虑人脸识别技术对公民权利和公民自由的危害,以及技术应用所获得的好处与所造成的危害是否成正比。另一面,据美国国土安全部披露的数据显示,基于人脸识别技术的生物识别系统推出至今已帮助识别出7000名非法滞留在美国的签证逾期人员。决定是否采用前沿技术,确实要考虑其“投入产出比”,但仍然建议要留出一个“试验窗口期”,一味的从政策法规上禁止,只会白白错失很多前沿技术所带来的社会和经济方面的获益。

9、据传苹果公司开始洽谈激光雷达传感器合作


据传苹果公司开始洽谈激光雷达传感器合作

  【新闻摘要】 据国外媒体报道,消息人士透露,就下一代自动驾驶汽车激光雷达传感器的可能供应商一事,苹果公司已经与至少四家公司进行了谈判。与此同时,苹果公司也正在开发自己的自动驾驶汽车激光雷达传感器。这一举动证明苹果公司已经重新加入自动驾驶汽车市场的竞争中。目前的激光雷达系统,包括苹果公司此前测试的自动驾驶汽车上安装的来自Velodyne公司的设备,不仅价格高、笨重,而且容易出现故障。不过,这些缺点却被数十家初创公司和成熟公司视作机会,在激光雷达领域投入巨资,通过使激光雷达系统变得更小、更便宜、更稳定,获得可观的高潜力市场。(阅读报道)
  【小云评论】虽然不清楚苹果公司重返自动驾驶汽车领域的目标是制造自己的汽车,还是提供自动驾驶汽车的硬件和软件产品,苹果公司重返自动驾驶汽车市场都是一种必然,这一市场已经齐聚全球主流科技企业和汽车厂商,原因非常简单:这是一种未来将会改变人类社会出行方式的技术,同时,还将产生巨量的高价值数据,为更进一步服务消费者提供参考。苹果公司的自动驾驶汽车项目Project Titan此前已经拥有了超过1200名员工,虽然策略上略有摇摆,但就此次国外媒体披露的消息来说,苹果公司重返自动驾驶汽车市场几乎已成定局。

10、沃尔沃高管称亚马逊将进入汽车零售业


沃尔沃高管称亚马逊将进入汽车零售业

  【新闻摘要】 据彭博社报道,沃尔沃美国子公司首席执行官安德斯?古斯塔夫松(Anders Gustafsson)警告经销商称,亚马逊可能会进入汽车零售业,在全美汽车经销商协会和J.D. Power联合主办的这场活动上,古斯塔夫松展示了亚马逊首席执行官杰夫?贝索斯(Jeff Bezos)说过的一句话:“你们的利润是我的机会。”他表示,汽车行业需要对新想法持开放态度,否则“追逐利润”的杰夫?贝索斯会比传统汽车厂商和经销商跑得更快,进入汽车零售业,并且对传统渠道形成非常严峻的挑战。(阅读报道)
  【小云评论】传统汽车销售渠道正在成为汽车零售业变革的阻碍力量:沃尔沃一直在推动通过沃尔沃手机APP和名为“Care by Volvo”的汽车租赁方式(互联网租车服务)销售XC40 SUV,但这受到了包括美国加州经销商在内的诸多传统汽车销售渠道的反对,加州经销商为了阻止沃尔沃的创新销售计划,甚至向加州机动车辆管理局提交了长达199页的请愿书。不过,无论汽车经销商支持与否,沃尔沃汽车公司都没有放弃推动新车销售方式的全面改革,这正是企业变革(尤其是数字化转型)成功的关键所在:坚持变革。