人民网
人民网>>传媒

李彦宏展示"百度大脑"能力 在某些方面已超过人类

2016年09月02日06:45 | 来源:北京青年报
小字号
原标题:百度将开放“百度大脑”多项能力

  百度董事长李彦宏昨天首度全面展示了百度大脑的各项能力

  百度的无人车可以准确识别出道路标识、信号灯等

  人工智能(AI)是百度近些年技术发力的核心,而百度大脑是百度AI能力的核心。那么百度大脑具体具备哪些能力?怎样评价百度大脑的水平?在昨天的2016百度世界大会上,百度董事长李彦宏首度全面展示了百度大脑的各项能力。

  百度大脑在某些方面已超过人类

  “百度大脑的概念在大约三年前对外讲过。那个时候我们讲,百度大脑已经具备了大概两三岁孩子的智力水平了。”那么现在,百度大脑相当于几岁人的智力水平呢?李彦宏表示,“我也不知道它现在是多少岁了,因为毕竟人脑和电脑还是有很大的区别,百度大脑虽然是一个人工智能的大脑,但是它和人正常的发育过程还是很不一样的。”可以说,百度大脑拥有强大的智商,虽然并不全能,无法直接与人类大脑相比较,但是在某些方面,百度大脑甚至已经超越了人类。

  那么百度大脑究竟是什么呢?据介绍,百度大脑由人工智能的算法、计算能力和数据三大技术组成。在人工智能部分,百度拥有模拟人的神经元组成的超大规模的神经网络;还使用万亿级的参数、千亿的样本和千亿的特征进行训练,这个体量与人脑的相接近。在计算能力部分,百度使用数十万台的服务器来进行计算,其中很多服务器不是传统基于CPU(中央处理器)的服务器,而是基于GPU(图形处理器);李彦宏表示GPU特别适合人工智能,尤其是深度学习的计算。在数据部分,百度收集了全网上万亿的互联网网页内容,其中包括百亿级的视频、音频、图像,每天数十亿次网民的搜索请求和数百亿次的网民定位请求。

  百度无人车依赖百度大脑

  目前,百度大脑最主要的功能分别是:语音的能力、图像的能力、自然语言的理解能力和用户画像的能力。而语音的能力是其中最为成熟的技术。

  今年MIT Technology Review(《MIT科技评论》)杂志,把百度的Deep Speech 2语音识别引擎评为“2016改变世界十大突破技术”。该技术主要使用了百度大脑深度学习的能力,目前,该技术的语音识别准确率已达到97%,这样的准确率已经达到甚至有时已经超过了人对语音的识别能力。此外,百度的语音合成技术也达到了“自然”的体验,增加了语感。李彦宏透露,目前百度每天要响应2.5亿次的语音合成请求,其中一部分是“有声读物”的请求。“给它50字句话样本,它可以模拟任何一个你喜欢的人的说话方式,还可以装在百度地图的语音系统中。”

  图像能力是人类视觉的延伸,无论是静态的图片,还是动态的视频,百度的图像技术都能对其进行精准的识别和理解,目前百度的人脸识别的准确率已经达到了99.7%,不论对方做什么表情、什么动作,该系统可以准确识别出。

  此外,百度的无人车就利用了图像识别技术。李彦宏表示:“应该说,计算机视觉或者是图像识别的技术是‘最后一公里’,无人驾驶汽车真的要变成没有人,真的要能够解决99.999%甚至100%的情况,最终还是要依靠计算机视觉的能力,要识别各种各样的极端情况。”利用该技术,无人车可以准确识别出道路标识、信号灯、周边建筑物、行人、路面情况和障碍物等。

  百度的自然语言处理技术还处于早期,但也诞生出了“度秘”的产品。度秘类似于Siri,是一个个人智能的助理,可以与用户以自然语言进行交互。就在前不久的奥运会上,度秘和著名篮球评论员杨毅一起合作做了一场篮球比赛的解说。杨毅说:“它学习过上百场甚至上千场的比赛,对比赛的基本知识储备是没问题的,在这个行业里面,它可能比我知道得还多,因为几年前的比赛我可能已经忘了,但是仍然装在它的电脑里。”美中不足的是,度秘的语速目前还有点慢,但是每次的解说后,它的语速会有所提升。

  “用户画像”是互联网的热门概念,是利用大数据对服务目标群体的特征的勾勒。目前百度拥有接近10亿的用户画像,其中有千万级的细分标签。标签有两个维度,一个是通用的维度,它的人口学特征、短期的意图、位置属性;二是垂直行业的特征,用户在金融、保险、医疗、旅游、健康等领域都有什么样的爱好、习惯,这些特点共同构成了用户画像。在6月份上映的《魔兽》电影的前期宣传中,借助百度的用户画像对潜在的观众进行推广,最终使得票房提升了超过200%。

  百度将开放百度大脑的能力

  百度昨天宣布将全面开放百度大脑,未来百度大脑将与各行各业结合,衍生出不同领域的行业大脑,比如医疗大脑、交通大脑、金融大脑等等。目前百度已经与太原铁路局合作,做物流优化的工作。

  百度首席科学家吴恩达公布了百度人工智能的两大开放平台:百度深度学习平台(PaddlePaddle)与百度大脑开放平台(ai.baidu.com)。与其他第三方平台相比,百度深度学习平台以更少的数据准备及训练配置,实现易学易用、性能高效;而百度大脑开放平台则向合作伙伴开放技术与培训资料,实现因智而能,促进行业发展。

  吴恩达还透露,目前百度正在研发一个新的语音输入法,“语音为主的键盘”。这种输入法不仅可以理解自然语言,还可以为语言自动推荐可以配上的表情。此外,还可以同时解决第三方需求,例如在聊天的同时把他人的电话号码发送给对方等等。(温婧)

(责编:宋心蕊、燕帅)

分享让更多人看到

传媒推荐
  • @媒体人,新闻报道别任性
  • 网站运营者 这些"红线"不能踩!
  • 一图纵览中国网络视听行业
返回顶部