首页 >热门资讯> 在线作图 > 说了那么久,百度大脑究竟能干嘛:李彦宏的演讲干货 >

说了那么久,百度大脑究竟能干嘛:李彦宏的演讲干货

转载时间:2022.05.15(原文发布时间:2016.09.01)
138
转载作者:36氪企服点评小编
阅读次数:138次

为了显示百度是家高大上的公司,李彦宏之前一直很强调百度在人工智能上的投入,但是百度在这方面究竟做得怎么样?在今天的百度世界大会上,李彦宏终于花了几个小时好好讲讲,这个他看做是百度大脑的人工智能技术。

他认为,互联网的发展在此之前已经经过了两个非常重要的阶段:PC互联网到移动互联网。目前,中国市场网络渗透率已经达到50%,也就是七亿多。这意味着,未来互联网的增长不能再靠人口红利来驱动了。中国进入新常态,经济的增长需要靠“互联网+”行动计划来推动。此前李彦宏在今年6月的百度联盟峰会上就提出,移动互联网之后的下一幕是人工智能。

而李彦宏表示,百度在过去的五六年当中,投入了很多精力到人工智能的研发当中。人工智能对百度的意义,就是百度大脑。这个大脑在三年前相当于两三岁孩子的智力水平。

百度大脑:三部分、四个功能

百度大脑基本上由三个大的部分组成。

第一部分是算法。这包括模拟人的神经元组成的网络、万亿级的参数、千亿的样本和千亿的特征。

第二部分是计算能力。百度使用了数十万台的服务器来进行计算,而这当中很多不是传统基于CPU,而是基于GPU。

第三部分是数据。他认为百度收集了全网的互联网网页内容、每天网民的搜索请求与定位请求。

有了算法,有了计算能力,有了数据,百度大脑就可以开始工作了。百度大脑又到底有什么样的功能?

我们今天想重点介绍的四个功能:一个是语音的能力,一个是图像的能力,一个是自然语言理解的能力,还有一个就是用户画像的能力。

语音:语音识别和语音合成

语音是今天人工智能发展的最成熟的一部分能力,而语音又分成两个方向,一个是语音的合成,一个是语音的识别。

  • 语音识别

今年MIT Technology Review(《MIT科技评论》)杂志,把百度的语音识别引擎第二代Deep Speech 2评为“2016改变世界十大突破技术”,这个引擎大概可以做到97%的准确率,这样的准确率有时甚至超过了人。李彦宏演示了语音识别的其中一个应用场景:电话销售。

销售人员需要长时间培训才能上岗。但是通过百度语音识别能力,一个新的销售上岗的第一天,就可能掌握他所获得的那些最优秀的销售的能力:新销售打电话给潜在客户的时候,百度大脑都实时地识别了客户的问题,并且显示在销售的电脑的屏幕上,同时实时地把最优秀的销售的回答展示出来。这样,新的销售基本上可以照着屏幕念,就能够达到最优秀的销售的话术的水平。

  •  语音合成

而语音的另一方面,语音合成,则是指机器可以把文字转换成语音,把它念出来、读出来。今天的语音合成相较于之前,更为自然,更接近真人。百度发现,这样的提升有利于提高用户粘性:过去每个人平均在小说频道会花大概四十分钟左右的时间,现在要花将近两个半小时。现在,百度每天要响应2.5亿次的语音合成请求。

另外,语音合成还可以模拟任何一个你喜欢的人的说话方式。百度地图里导航功能其中有一个就是用李彦宏的声音进行导航,这是机器根据他说话的情况合成的。随后他在现场播放了一段合成的张国荣的声音。

 图像识别/计算机视觉

人工智能在图像识别方面的专业术语,叫计算机视觉。

图像识别其中一种应用就是人脸识别,百度人脸识别的准确率已经达到了99.7%。人脸识别通过提取人脸的关键点,即便一个人的表情会变,但是他的表情特征不变,所以仍然可以很准确地识别出。

除了面部识别之外,图像识别的另一个应用场景就是全景图的制作,采集图像之后要对图像中的目标进行识别,辨认出这具体是哪条路或者哪个大楼。

图像识别还有一个应用领域就是无人驾驶汽车。这需要计算机视觉、高精度地图、对环境的感知、定位、甚至需要语音通话。但李彦宏认为是图像识别是无人车技术中的“最后一公里”,真的要变成没有人,最终还是要依靠计算机视觉来识别各种极端情况,包括周围的车辆、行人、障碍、红绿灯。

另外,增强现实AR,也非常依赖(图像识别)。手机要正确识别出现实情况,才能产生真实世界和一些虚拟世界的完美结合。

 自然语言处理

第三个能力是自然语言处理,即能够用人的语言来与人进行交流,并且能够理解人的很多意思和意图,比如百度自动翻译、用度秘来解说奥运篮球。虽然度秘的语速比较慢、语言识别能力仍需加强,但其优势在于记忆能力强,知识型问题回答得非常快。

 用户画像

百度大脑的第四个能力是描绘用户画像,即基于百度的大数据以及机器学习了解用户,打上标签。这些标签主要在两个维度上体现,一个是通用的维度,人口学特征、短期的意图、位置属性;还有垂直行业的特征,用户在金融、保险、医疗、旅游、健康等领域的情况、爱好和习惯。

这可以帮助百度给用户精准推荐新闻,可以帮助商家针对不同用户设计推广过程。

最后,李彦宏让百度大脑用人脸识别识别出了胡歌,用语音识别和合成模仿了胡歌的声音,还用用户画像能力挖掘出胡歌粉丝的爱好是旅游出行、网络购物。

 

 


[免责声明]

资讯标题: 说了那么久,百度大脑究竟能干嘛:李彦宏的演讲干货

资讯来源: 36氪官网

36氪企服点评

在线作图相关的软件

查看更多软件

行业专家共同推荐的软件

限时免费的在线作图软件

新锐产品推荐

消息通知
咨询入驻
商务合作