首页 >热门资讯> AI人工智能 > 黑科技的背后:解码人工智能四大核心技术 >

黑科技的背后:解码人工智能四大核心技术

转载时间:2022.03.13(原文发布时间:2019.04.17)
3
转载作者:36氪企服点评小编
阅读次数:3次

编者按:本文来自微信公众号“理想城市发展计划”(ID:Idealcity0824),36氪经授权转发。

2017年被称之为人工智能应用元年,普通居民首次试乘谷歌的自动驾驶汽车、机器人索菲亚获得沙特阿拉伯公民身份、阿里小蜜上线每天为数百万客户提供问题服务、首个无人零售店Amazon Go向公众开放……在这些令人诧异和振奋的事件背后,离不开计算机视觉、自然语言处理、生物特征识别及知识图谱等人工智能关键技术。可以说,在人工智能产业中,技术是连接芯片和应用场景的纽带,决定了产品的智能化程度。

黑科技的背后:解码人工智能四大核心技术

1

/计算机视觉/

人工智能系统的大门

人的大脑皮层活动约70%是在处理视觉相关信息,视觉相当于人脑的大门。计算机视觉技术便让智能系统拥有“眼睛”,构建和处理视觉信息,是智能系统进入现实世界的大门。

自1982年计算机视觉成为一门独立学科以来,在人脑科学、人工智能算法、芯片处理器算力飞速发展的多重加持下,已经逐渐成熟,美颜相机、面部解锁手机、交通电子眼、出入境人像采集、计算机视觉技术已经渗透入我们生活的方方面面。

黑科技的背后:解码人工智能四大核心技术

根据实际解决的问题,计算机视觉技术可分为人脸识别、图像检测、图像检索、目标跟踪、风格迁移等几大板块。其中,人脸识别、图像分类等功能计算机视觉技术已经比人类视觉更精准、更迅速。在医院,一般早期食管癌检出率低于10%,而腾讯觅影通过扫描上消化道内镜图片筛查食管癌,检出率高达90%,且用时不到4秒。商汤科技宣称,利用其计算机视觉技术,视频内容审核能够节省99%的人工。

然而,虽然在解决识别、检测、聚类等问题上,计算机视觉已经可以超越人类,但其发展仍面临挑战。首先,人类能轻易明白物体彼此之间的联系,看到一张图就能编出一个故事。但计算机视觉的理解力和想象力还远达不到这种程度。其次,计算机视觉算法的人力成本大、开发时间长,不仅需要大量人工标注,还需要较长的研发周期以达到应用领域所要求的精度。

2

/自然语言处理/

中国领先的人工智能技术

当向淘宝店小蜜智能客服资讯产品信息时、当“最强大脑”的小度机器人与主持人互动时、当收到消息指示Siri阅读该消息时,是自然语言处理技术帮助我们实现了与机器的沟通。一个完整的自然语言处理系统包含语音识别、语义识别、语音合成三部分。其中,国内企业在语音识别和语音合成已处世界领先地位。

语音识别是指让计算机“听到”人的语音,目前已经比较成熟,尤其汉语的语音识别领先英语。根据2017年IBM、谷歌和微软发布的词错率进展数据,他们的识别率均在94%-95%之间,而在此之前,国内语音识别企业,如百度、搜狗、科大讯飞,识别率均已达到97%左右。

语音合成是指计算机将准备“回复”给人类的语句,通过合成音频的形式,利用扬声器外放。百度地图的语音导航、苹果手机的Siri助手背后都利用了语音合成技术,这项技术已日臻成熟。当前,科大讯飞的语音合成技术代表了世界领先水平。2018年科大讯飞打败卡内基梅隆等众多高校、科研机构和企业,连续13年赢得Blizzard Challenge(国际语音合成大赛)冠军。

区别于语音识别“听到”人类语言,语义识别更加强调“听懂”。当用户对智能系统说出一个饭店的名字,系统对用户语音进行识别,搜索饭店,这是“语音识别”;当用户对智能系统说“自助餐”、“海鲜”、“连锁店”等模糊语句,智能系统根据用户的性别、爱好、饮食倾向等特征进行智能分析,并精准推荐,则是“语义分析”。可见,语义识别比语音识别技术难度高好几个层次。

语义识别是当前自然语言处理发展的瓶颈,仍处于初级研究阶段。由于目前的人工智能技术只能把音变成字,字变成音,不能理解其中含义,很难实现基于场景的生动会话,商业落地的场景十分有限。

黑科技的背后:解码人工智能四大核心技术

3

/生物特征识别/

政府推动的人工智能技术

生物特征识别技术是指通过个体生理特征或行为特征对个体身份进行识别认证的技术。其识别原理在于指纹、掌纹、虹膜、指静脉等人体生物特征的不可复制性。通过对生物特征的事先保存与被鉴别对象的生物特征进行对比,验证其真实身份。

从生物特征识别的发展历程来看,2001年911恐怖袭击事件是全球生物特征识别技术跳跃性发展的转折年。事件后,以美国为首的世界各国都将生物特征识别技术作为关系国家未来安全的重大关键技术重点扶持,加速了生物特征识别技术的发展。当前,生物特征识别应用最广的领域是在身份认证,民用身份认证和警用身份认证共占据超过60%的市场份额。而监控类应用市场对生物特征识别的需求飞速增长,年均增长率达到了 49.7%。

黑科技的背后:解码人工智能四大核心技术
黑科技的背后:解码人工智能四大核心技术
黑科技的背后:解码人工智能四大核心技术

然而,生物特征识别技术仍有许多技术难点亟待攻克。

首先是假体攻击。假体攻击即使用图片、视频、三维模型、CG合成技术等手段欺骗检测系统。虽然目前可以采用技术手段鉴别图片、视频和模型,但很难甄别CG等三维技术手段。

其次是非配合生物的有效信息采集问题。2013年,波士顿马拉松爆炸前,FBI的现场监控系统已经多次在围观人群中采集到嫌疑人(有案底)的图片信息。但由于嫌疑人面部表情变以及遮挡物等因素,未能预警。不同方向、强度及颜色的光照,会较大的影响图像模式,引发强烈的图像数据变化,增加生物特征识别的难度,对生物特征识别的算法提出了更高的要求。

4

/知识图谱/

人工智能技术的下一风口

知识图谱最初是由谷歌提出用来优化搜索引擎的技术。如果说以往的智能分析专注在每一个个体,知识图谱则专注于这些个体之间的“关系”。知识图谱用“图”的表达形式,最有效、最直观地表达出实体间的关系,是最接近真实世界、符合人类思维模式的数据组织结构。

相较于传统的智能分析,知识图谱是基于图的数据结构,即知识图谱需要从海量信息中抽去多个维度的特征信息,并在这些特征信息素材的基础上,通过智能推理实现从数据到可视化图像深加工,从而能够直观易懂的展现给用户,并与用户交互。

黑科技的背后:解码人工智能四大核心技术

目前,知识图谱主要应用于面向互联网的搜索、推荐、问答等业务场景,成为以商业搜索引擎公司为首的互联网公司重兵布局的人工智能技术之一。同时,也开始在金融、医疗、电商及公共安全保障等领域得到广泛的探索。当我们使用搜索软件时,搜索结果右侧的联想,就来自于知识图谱技术。在反洗钱或电信诈骗场景,知识图谱可精准追踪卡与卡间的交易路径,追本溯源识别洗钱/套现路径和可疑人员,并通过他们的交易轨迹,层层关联,分析得到更多可疑人员、账户、商户或卡号等实体。

然而,目前知识图谱尚处于发展初期,受制于抽取数据的样本量限制、深加工准确率和效率较低、数据噪声大等因素限制,应用场景非常有限。相信未来,随着研究的深入,会有越来越多的应用场景被发掘出来,对于知识图谱所能发挥的价值可期。

虽然人工智能在图像识别、语音识别、文本处理、游戏博弈等诸多方面全面赶超人类,取得了突破性进展,但整体来看它还是在婴幼儿时期,人工智能并不智能,其关键技术的发展,远未到成熟的地步。图灵奖获得者John Hopcroft说:“我们正在经历一场信息革命,这场革命与农业革命以及工业革命有同等重要的地位。”相信未来,在互联网企业、科技企业、初创企业及高校和研发机构的合力下,技术瓶颈将不断被突破,人工智能的发展将更加多元化,更多的黑科技会使得我们的生活更智能。

参考文献:

1.《人工智能标准化白皮书(2018版)》中国电子技术标准化研究院

2.《生物特征识别白皮书(2017版)》 中国电子技术标准化研究院

3.《中国人工智能产业技术与应用现状及演进趋势》北大科技园创新研究院

4.《眼见为实:计算机视觉的研发和应用》腾讯优图,Science

[免责声明]

资讯标题: 黑科技的背后:解码人工智能四大核心技术

资讯来源: 36氪官网

36氪企服点评

AI人工智能相关的软件

大厂都在用的AI人工智能软件

限时免费的AI人工智能软件

新锐产品推荐

消息通知
咨询入驻
商务合作