李彦宏展示"百度大脑"能力 在某些方面已超过人类

2016年09月02日06:45  来源:北京青年报
 
原标题:百度将开放“百度大脑”多项能力

  百度董事长李彦宏昨天首度全面展示了百度大脑的各项能力

  百度的无人车可以准确识别出道路标识、信号灯等

  人工智能(AI)是百度近些年技术发力的核心,而百度大脑是百度AI能力的核心。那么百度大脑具体具备哪些能力?怎样评价百度大脑的水平?在昨天的2016百度世界大会上,百度董事长李彦宏首度全面展示了百度大脑的各项能力。

  百度大脑在某些方面已超过人类

  “百度大脑的概念在大约三年前对外讲过。那个时候我们讲,百度大脑已经具备了大概两三岁孩子的智力水平了。”那么现在,百度大脑相当于几岁人的智力水平呢?李彦宏表示,“我也不知道它现在是多少岁了,因为毕竟人脑和电脑还是有很大的区别,百度大脑虽然是一个人工智能的大脑,但是它和人正常的发育过程还是很不一样的。”可以说,百度大脑拥有强大的智商,虽然并不全能,无法直接与人类大脑相比较,但是在某些方面,百度大脑甚至已经超越了人类。

  那么百度大脑究竟是什么呢?据介绍,百度大脑由人工智能的算法、计算能力和数据三大技术组成。在人工智能部分,百度拥有模拟人的神经元组成的超大规模的神经网络;还使用万亿级的参数、千亿的样本和千亿的特征进行训练,这个体量与人脑的相接近。在计算能力部分,百度使用数十万台的服务器来进行计算,其中很多服务器不是传统基于CPU(中央处理器)的服务器,而是基于GPU(图形处理器);李彦宏表示GPU特别适合人工智能,尤其是深度学习的计算。在数据部分,百度收集了全网上万亿的互联网网页内容,其中包括百亿级的视频、音频、图像,每天数十亿次网民的搜索请求和数百亿次的网民定位请求。

  百度无人车依赖百度大脑

  目前,百度大脑最主要的功能分别是:语音的能力、图像的能力、自然语言的理解能力和用户画像的能力。而语音的能力是其中最为成熟的技术。

  今年MIT Technology Review(《MIT科技评论》)杂志,把百度的Deep Speech 2语音识别引擎评为“2016改变世界十大突破技术”。该技术主要使用了百度大脑深度学习的能力,目前,该技术的语音识别准确率已达到97%,这样的准确率已经达到甚至有时已经超过了人对语音的识别能力。此外,百度的语音合成技术也达到了“自然”的体验,增加了语感。李彦宏透露,目前百度每天要响应2.5亿次的语音合成请求,其中一部分是“有声读物”的请求。“给它50字句话样本,它可以模拟任何一个你喜欢的人的说话方式,还可以装在百度地图的语音系统中。”

  图像能力是人类视觉的延伸,无论是静态的图片,还是动态的视频,百度的图像技术都能对其进行精准的识别和理解,目前百度的人脸识别的准确率已经达到了99.7%,不论对方做什么表情、什么动作,该系统可以准确识别出。

  此外,百度的无人车就利用了图像识别技术。李彦宏表示:“应该说,计算机视觉或者是图像识别的技术是‘最后一公里’,无人驾驶汽车真的要变成没有人,真的要能够解决99.999%甚至100%的情况,最终还是要依靠计算机视觉的能力,要识别各种各样的极端情况。”利用该技术,无人车可以准确识别出道路标识、信号灯、周边建筑物、行人、路面情况和障碍物等。

  百度的自然语言处理技术还处于早期,但也诞生出了“度秘”的产品。度秘类似于Siri,是一个个人智能的助理,可以与用户以自然语言进行交互。就在前不久的奥运会上,度秘和著名篮球评论员杨毅一起合作做了一场篮球比赛的解说。杨毅说:“它学习过上百场甚至上千场的比赛,对比赛的基本知识储备是没问题的,在这个行业里面,它可能比我知道得还多,因为几年前的比赛我可能已经忘了,但是仍然装在它的电脑里。”美中不足的是,度秘的语速目前还有点慢,但是每次的解说后,它的语速会有所提升。

  “用户画像”是互联网的热门概念,是利用大数据对服务目标群体的特征的勾勒。目前百度拥有接近10亿的用户画像,其中有千万级的细分标签。标签有两个维度,一个是通用的维度,它的人口学特征、短期的意图、位置属性;二是垂直行业的特征,用户在金融、保险、医疗、旅游、健康等领域都有什么样的爱好、习惯,这些特点共同构成了用户画像。在6月份上映的《魔兽》电影的前期宣传中,借助百度的用户画像对潜在的观众进行推广,最终使得票房提升了超过200%。

  百度将开放百度大脑的能力

  百度昨天宣布将全面开放百度大脑,未来百度大脑将与各行各业结合,衍生出不同领域的行业大脑,比如医疗大脑、交通大脑、金融大脑等等。目前百度已经与太原铁路局合作,做物流优化的工作。

  百度首席科学家吴恩达公布了百度人工智能的两大开放平台:百度深度学习平台(PaddlePaddle)与百度大脑开放平台(ai.baidu.com)。与其他第三方平台相比,百度深度学习平台以更少的数据准备及训练配置,实现易学易用、性能高效;而百度大脑开放平台则向合作伙伴开放技术与培训资料,实现因智而能,促进行业发展。

  吴恩达还透露,目前百度正在研发一个新的语音输入法,“语音为主的键盘”。这种输入法不仅可以理解自然语言,还可以为语言自动推荐可以配上的表情。此外,还可以同时解决第三方需求,例如在聊天的同时把他人的电话号码发送给对方等等。(温婧)

(责编:宋心蕊、燕帅)

推荐阅读

职责与使命——2016媒体融合发展论坛
   8月22日,由人民日报社和深圳市委市政府联合主办的“职责与使命——2016媒体融合发展论坛”在深圳开幕。众多业内人士、专家学者、新闻工作者齐聚,围绕承担新时期新闻舆论工作的职责与使命,进一步深化媒体融合发展工作,进行了深入交流。【详细】职责与使命——2016媒体融合发展论坛    8月22日,由人民日报社和深圳市委市政府联合主办的“职责与使命——2016媒体融合发展论坛”在深圳开幕。众多业内人士、专家学者、新闻工作者齐聚,围绕承担新时期新闻舆论工作的职责与使命,进一步深化媒体融合发展工作,进行了深入交流。【详细】

2015-2016中国新闻网站传播力年度报告
   8月25日,《网络传播》杂志主办的第十二期“网络传播沙龙”在京举行。来自中央及地方的各级媒体代表、知名专家学者等百余人围绕中国新闻网站传播力建设等话题进行了深入探讨,《2015-2016中国新闻网站传播力年度报告》也在会上正式发布。【详细】2015-2016中国新闻网站传播力年度报告    8月25日,《网络传播》杂志主办的第十二期“网络传播沙龙”在京举行。来自中央及地方的各级媒体代表、知名专家学者等百余人围绕中国新闻网站传播力建设等话题进行了深入探讨,《2015-2016中国新闻网站传播力年度报告》也在会上正式发布。【详细】