语音识别

语音识别技术,也被称为自动语音识别Automatic Speech Recognition(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。 语音识别技术可以尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。 

语音识别技术,也被称为自动语音识别Automatic Speech Recognition(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。 

语音识别技术可以尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。 

筛选

38
20
25
27
综合评分 满意度 人气值
38 个产品
科大讯飞是知名的智能语音技术提供商,专业从事智能语音及语言技术研究、软件及芯片产品开发、语音信息服务及电子政务系统集成,产品涵盖语音引擎、行业应用、教育产品、手机应用、互动音乐等多个领域。科大讯飞坚持“平台+赛道”的发展战略。基于拥有自主知识产权的核心技术,2010年,科大讯飞在业界发布以智能语音和人机交互为核心的人工智能开放平台——讯飞开放平台,为开发者提供一站式人工智能解决方案。截至2020年12月31日,讯飞开放平台已聚集超过175.6万开发者团队,总应用数超过99.6万,累计覆盖终端用户数30.7亿+,A.I.大学学员总量达到44.4万+,以科大讯飞为中心的人工智能产业生态持续构建。在平台基础上,科大讯飞持续拓展行业赛道,现已推出覆盖多个行业的智能产品及服务,推动在消费者、智慧教育、智慧城市、智慧司法、智能服务、智能汽车、智慧医疗、运营商等领域的深度应用,TOB+TOC双轮驱动成果显现。科大讯飞在智能语音和人工智能核心研究和产业化方面的突出成绩得到了社会各界和国内外的广泛认可,作为“中国人工智能国家队”一员已形成共识。创新坚守,初心不改,科大讯飞愿携手广大合作伙伴一起:用人工智能建设美好世界!
北京百分点信息科技有限公司,于2009年在北京成立,在深圳、沈阳、南京、杭州、成都设有分公司和研发中心。百分点是国内第一家专注于大数据与推荐引擎的互联网技术公司,为电子商务企业与互联网媒体企业提供站内流量转化和商业智能分析的相关产品与整体优化解决方案,同时也为传统行业提供大数据基础技术、大数据管理和应用的云平台和整体解决方案。
公司多年来专注模式识别与智能交互领域的研发,汉王在各大方向累计了多项自主知识产权的核心技术,砥砺前行中,形成了软硬件结合的发展模式。丰富的产品链,使得汉王识别技术得到广泛应用,在电子政务、个人办公、移动通信、数字家电等方面实现普及化和规模化处理信息。目前拥有京津冀地区电子行业垂直一体化精密制造基地,技术及产品已走出国门,辐射至日本、北美、南美、欧洲等海外市场。在手写识别、光学字符识别(OCR)、人脸识别、笔迹输入等领域拥有多项具有自主知识产权的核心技术,其中手写汉字识别获得国家科技进步一等奖,OCR识别获得国家科技进步二等奖。
百度智能云于2015年正式对外开放运营,是基于百度多年技术沉淀打造的智能云计算品牌,致力于为客户提供全球领先的人工智能、大数据和云计算服务。凭借先进的技术和丰富的解决方案,全面赋能各行业,加速产业智能化。百度智能云为金融、城市、医疗、客服与营销、能源、制造、电信、文娱、交通等众多领域领军企业提供服务,包括中国联通、国家电网、南方电网、浦发银行、成都高新减灾研究所、央视网、携程、四川航空等诸多客户。
小i机器人,是中国具有代表性的认知智能商业落地型企业。自2001年创立以来,专注于以自然语言处理为基础的认知智能相关技术的自主研发和商业落地,拥有强大的人机认知交互能力,被Gartner称为“会话式AI企业代表”享誉全球。通过智能交互平台、智能语音平台、知识融合平台等核心智能化产品,小i机器人已为客户联络中心、金融、政务、医疗等数十个行业,提供了全方位的客户服务的智能化解决方案和落地服务,也是国内最早实践智能客服市场化应用的公司之一。目前小i机器人服务数百家企业,并在多个垂直行业的市场占有率位居领先地位,终端客户逾8亿。
声智科技是一家专注声学前沿技术和人工智能交互的科技创新公司,提供从软硬件到云服务的远场语音交互技术方案,以及从芯片模组、PCBA到工业设计的Turnkey产品方案,其中的声学通信、麦克风阵列、远场语音唤醒和识别、端到端深度学习等软硬融合技术在产业链条上具有领先优势。
网易数帆源依托网易集团二十余年互联网技术积累,聚合云计算、大数据、人工智能等新型数字化技术,聚焦提供数据智能、软件研发、基础设施与中间件等基础软件,致力于帮助企业客户成功实现数字化转型。网易数帆持续提供开放、稳定、安全、高效的基础技术平台和完善的数字生态体系,通过持续创新实践,以客户为导向,发展出网易轻舟、网易易数、网易易智、网易易测等4大产品线,提供各项产品服务和综合解决方案,涵盖零售、金融、制造、电商、教育、物流等多行业领域。
基于业内领先的深度学习技术,提供高度拟人、流畅自然的语音合成服务,支持在线、离线多种调用方式,满足泛阅读、订单播报、智能硬件等场景的语音播报需求支持中文、英文、中英文混读合成,提供基础音库和精品音库共14种音库供您选择,让您的产品拥有个性化的声音支持多种参数配置,可根据场景需求对发音人的语速、音调、音量进行灵活设置,满足个性化需求提供RESTAPI接口、离线SDK、在线SDK,充分满足不同场景下的语音合成需求,提供流畅自然的合成体验
出门问问的使命是定义下一代人机交互,让人和机器的交互更自然。公司自主研发并建立了完整的“端到端”人机交互相关技术栈,包括声音信号处理、热词唤醒、语音识别、自然语言理解、对话管理、垂直搜索、智能推荐、语音合成、知识图谱等,并始终保持国际前沿技术水平。面向ToC消费级场景,出门问问陆续推出了出门问问手机App、AI智能手表TicWatch系列、AI真无线智能耳机TicPods系列、智能后视镜TicMirror*、智能音箱TicKasa系列等人工智能软硬结合产品,成为全球消费者喜爱的AI可穿戴品牌。公司旗下产品均可通过多场景、全覆盖的出门问问中文虚拟个人助理实现联动。
数美科技成立于2015年6月1日,致力于利用人工智能技术和海量数据解决金融、互联网等领域广泛存在的欺诈问题,先后推出了金融反欺诈、内容反欺诈、行为反欺诈等系列产品,覆盖直播、金融、支付、社交、电商、游戏、O2O等行业。总部设在北京,在上海、杭州、深圳设有分部 。公司创建以来,获得了VC机构腾讯、襄禾资本、顺为资本、清流资本、BV百度风投联合投资 。
北京分音塔科技有限公司(BABELTECHNOLOGY),简称分音塔科技,成立于2016年7月15日,由清华大学团队、成功连续创业者成立,致力于实现不同国家和民族之间跨语言同声传译,提供可穿戴智能设备、人工智能API综合解决方案和虚拟运营服务。基于普遍存在的跨语言沟通障碍和迫切的沟通需求,分音塔科技采用人工智能技术,开发出准儿翻译机等系列可穿戴智能硬件产品和准儿翻译APP,并与中国、美国、日本、韩国、俄罗斯等进的相关人工智能公司建立长期合作关系,构建沟通翻译平台。
北京希尔贝壳科技有限公司成立于2017年,是一家专注人工智能大数据和技术服务的创新公司。针对家居、车载、机器人等语音智能产品做精准场景语音数据并输出方案。利用机器学习平台,在语音数据评测、辅助转写、数据分析、智能语音客服等场景业务建立了领先的核心技术体系。希尔贝壳在语音识别、语音合成、声纹识别领域有着多年的基础技术研究,在行业必须的训练数据集结构分析和建设上有着不断创新的能力。希尔贝壳的愿景:以开放数据、技术变革创新为理念,实现人工智能民主化。
百度VR作为国内领先的一站式VR方案解决机构,提供基于VR技术的教育,党建、营销、云展会、实训、产业园等解决方案,助力产业数字化升级。目前,百度VR全面布局VR教育、VR营销,为K12、高等院校、职业学校、企事业单位等客户提供VR教室、VR营销等一站式解决方案。
大象声科是语音信号处理引擎供应商,依托算法、软件、硬件三个维度的技术纵深,为语音增强和智能语音交互提供先进的解决方案。公司凭借深度学习驱动的语音增强技术奠定了语音前端信号处理,目前公司已经完成了全球第一款芯片级单音轨实时语音提取方案,有效的实现了噪音与人声的分离。该技术已经开始在通讯行业开展广泛应用,开启人类无噪音通讯时代。
思必驰是国内领先的对话式人工智能平台公司,拥有全链路的智能语音语言技术,自主研发了新一代的人机交互平台(DUI),和人工智能芯片(TH1520);为车联网、IoT、以及众多行业场景合作伙伴提供自然语言交互解决方案。“思必驰”是国际上极少数拥有自主产权和中英文综合语音技术的公司之一。其语音综合技术包括语音识别、语音合成、自然语言理解、智能交互决策、声纹识别、情绪识别等。
在AI技术研发方面,捷通华声拥有语音识别、语音合成、语义理解、机器翻译、大数据分析、声纹识别、人脸识别、指纹识别、手写识别、键盘输入、麦克风阵列、OCR、视频分析等十余项自主研发的AI技术,并在灵云开放平台(AIcloud.com)上面向产业全面开放。2013年,捷通华声与清华大学达成“灵云科技源自清华”战略合作,并共同创立“清华灵云人工智能研究中心”、“清华海峡研究院人工智能研究中心”,中国人工智能科学研究奠基人、清华大学人工智能研究院院长张钹院士出任研究中心首席科学家。通过与清华大学的产学研合作,灵云AI技术学术研究保持着全球领先,语音识别、语义理解、语音合成、机器翻译、OCR等多项技术达到国内顶尖水平。
灵云平台面向产业全面开放,并以“云+端”方式,为产业界提供语音合成(TTS)、语音识别(ASR)、麦克风阵列(SMA)、手写识别(HWR)、光学字符识别(OCR)、人脸识别(AFR)、声纹识别(VPR)、指纹识别(FPR)、自然语言理解(NLU)、数据挖掘(DM)、机器翻译(MT)等全方位人工智能能力。灵云平台通过服务百度导航、导航犬、嘀嘀打车、快的打车、汉字英雄、灵云输入法等“家喻户晓”移动应用服务,及服务京东商城、携程等大型互联网平台,使中国13亿社会大众群体充分感受并体验到智能语音等人工智能技术为现代生活所带来的轻松与便捷。
加大京东智能云平台的建设。京东智能云平台已经接入了100多个品牌的产品,已经涵盖了国家一线的主流品牌。通过在传统家电产品中植入京东的模块并连接京东云的方式,消费者可以用同一款APP控制所有接入的产品,实现不同品牌不同产品之间的互联互通。京东希望在2015年引入更多的品牌及产品,同时,京东的账户体系也将与这些品牌进行分享,力求提供更好的用户体验。
迅飞开放平台是科大讯飞推出的移动互联网智能交互平台,为开发者免费提供:涵盖语音能力增强型SDK,一站式人机智能语音交互解决方案,专业全面的移动应用分析。科大讯飞股份有限公司成立于1999年,是亚太地区知名的智能语音和人工智能上市企业。自成立以来,长期从事语音及语言、自然语言理解、机器学习推理及自主学习等核心技术研究并保持了国际前沿技术水平;积极推动人工智能产品研发和行业应用落地,致力让机器“能听会说,能理解会思考”,用人工智能建设美好世界。2008年,公司在深圳证券交易所挂牌上市(股票代码:002230)。作为技术创新型企业,科大讯飞坚持源头核心技术创新,多次在机器翻译、自然语言理解、图像识别、图像理解、知识图谱、知识发现、机器推理等各项国际评测中取得佳绩。两次荣获“国家科技进步奖”及中国信息产业自主创新荣誉“信息产业重大技术发明奖”,被任命为中文语音交互技术标准工作组组长单位,牵头制定中文语音技术标准。同时,科大讯飞还获得了以下荣誉:首批国家新一代人工智能开放创新平台、首个认知智能国家重点实验室、首个语音及语言信息处理国家工程实验室、国家863计划成果产业化基地、国家智能语音高新技术产业化基地、国家规划布局内重点软件企业、国家高技术产业化示范工程等。
厦门快商通科技股份有限公司成立于2009年,是国内人工智能客服领军企业,曾获得中国AI最高奖吴文俊奖以及工信部、中科院等多部门嘉奖。基于领先的自然语言处理、深度学习、大数据、云计算等技术,快商通打造人工智能算法引擎,为企业用户提供以【智能客服】为核心的客户全生命周期管理服务,是国内首批智能客服企业、首创前端营销型客服云平台。平台上线以来,企业用户超过38万,包括国家电网、新华教育、联想集团等各领域头部企业。“用技术和产品服务30亿用户”,是董事长肖龙源提出的企业愿景,快商通希望帮助更多企业,享受更安全、更稳定、更智能的客户服务体验。是一家基于自主研发人工智能引擎平台(快商大脑)的AI公司,针对企业客服、金融、安防、电力、航空、司法、公安等垂直领域推出不同的BI、AI解决方案,分别针对企业客服领域推出智能营销客服系统、机器人客服;针对金融、安防领域推出声纹安全解决方案,基于大型商超、电力、航空领域推出BI、AI整体方案。
公司成立于2012年6月,总部位于北京,在上海、深圳、厦门、合肥设有子公司,目前员工接超过500人。拥有完全自主知识产权、世界顶尖智能语音技术的人工智能企业。从交互入手,云知声构建了语音感知、认知和表达、超算平台与图像、机器翻译等多模态人工智能硬核技术,并将这些能力封装在自研AI芯片之上,通过“云端芯”一体化产品体系面向行业推出全栈式AI技术能力,打造从AI技术创新到产业应用的生态闭环。在应用层面,云知声提供跨硬件平台、跨应用场景,端云一体的人工智能整体解决方案,广泛应用于家居、医疗、金融、教育、交通、汽车、地产等领域。迄今为止,云知声的合作伙伴数量超2万家,主要客户涵盖平安、世茂、吉利、格力、美的、海尔、华为、京东、360等头部企业,覆盖用户超2亿,云平台日调用量超5.7亿次,覆盖设备超2.5亿台。
灵伴即时智能科技有限公司(简称“灵伴即时”)是以人工智能语音交互技术为基础的企业级用户服务提供商,核心研发团队由一支国内外名校博士、博士后队伍组成,多次在国际技术大赛中夺冠,并拥有数个人工智能领域核心技术专利。在AI产业落地实践中,灵伴即时秉承“自主研发、产业聚焦、价值创造”的理念聚焦企业服务领域,致力于打造面向未来的人机融合智能客服平台,助力企业客服体系在”AI时代”的全面升级。目前,灵伴睿思4.0凭借着其高质量对话能力、丰富的产品功能和优质的云通讯能力服务于建设银行、中信银行、招商银行、华夏保险、大地保险等数十个行业的近百家企业,助力企业转型升级、重构客服劳动力市场。
深圳市声扬科技有限公司(英文简称“VoiceAITech”),是致力于人工智能语音大数据分析的国家高新技术企业,拥有国际领先的以声纹识别为核心的智能语音科技,为公安、金融、政府、互联网及IoT等行业提供“以用户为中心”的语音智能化解决方案。自2016年成立以来,公司先后服务了公安部、中国工商银行、恒丰银行、重庆银行、平安集团、天津消防总队、中国南方电网、广发证券、华硕电脑、印尼社保储蓄基金TASPEN、墨西哥国有银行Infonavit等多个国内外大型企业和政府机构。2020年9月,公司完成近亿元人民币的A轮融资,由光远投资领投,前海母基金、招商启航资本、水木资本与香港X科技基金等跟投。截止2020年8月,公司申请、获得近百项自主知识产权。声扬科技云集了清华大学、中国科学技术大学、复旦大学、南开大学、厦门大学、香港科技大学、香港中文大学、康奈尔大学、剑桥大学等国内外顶尖院校的科学家与行业专家。
腾讯语音合成依托腾讯领先的语音技术和深度学习算法,为开发者提供全面优质的文字转语音服务。支持中英双语及多种音色,合成语音自然流畅,近乎真人发声。可为智能助手、智能机器人、文学阅读等领域提供语音合成解决方案,让您的应用开口说话。
北京远鉴信息技术有限公司(下称“远鉴”或“公司”)是一家高科技创新型企业,是国内领先的声纹技术及人工智能服务企业。公司发展始于为公安部、国家网信办等部委提供人工智能技术服务,具备成熟的实战经验。在多个核心技术远鉴拥有完全自主知识产权,是国内声纹识别技术的领导者和多维识别技术的开创者。公司的发展一直受到国家多部委的关注和认可,相继承担了国家十二五、十三五科技支撑计划中相关课题的研究任务及国家大型基础设施建设任务,主导起草了多项公共安全行业标准和国家标准,是多维身份识别与可信认证技术国家工程实验室的主要建设方之一,获得公安部、国家网信办等部委多次表扬。2019年,公司在中央网信办、工业和信息化部、公安部指导的首届中国人工智能·多媒体信息识别技术竞赛中获得最高级A级企业荣誉称号,并包揽声纹识别、语音关键词两个项目的冠军。
爱数智慧为车载语音交互系统提供多样的训练数据,如噪音数据、车载命令数据、车载信息娱乐交互数据等,覆盖目标语言、地方口音变化、不同性别和年龄的说话人等。爱数智慧对于录音人、录音环境、录音设备、标注方法、验收准则都有统一的标准,以此来保证真实应用场景下产品和服务的一致性、稳定性。爱数智慧为很多汽车行业客户、语音交互系统研发企业提供多种语言以及多语种混合的语音识别数据。这些定制化的高质量语音数据为客户的车载语音交互系统提供了很好的训练,使得它们即使在复杂环境中也能保持较好的识别率。
网易有道旗下一个为开发者、企业和政府机构等提供自然语言翻译、文字识别OCR等服务以及行业解决方案的云服务平台。致力于提供安全,可靠和高效的云服务。我们的Ai能力,网易有道旗下一站式人工智能服务提供商,为政府、企业和开发者提供稳定可靠的基础AI能力。智慧教育服务,基于网易有道在教育领域十余年积累的经验与数据,推出了多款面向教育领域的AI服务。
北京中科信利技术有限公司于2002年依托中国科学院声学研究所合作成立,是以开发语音技术为核心的高新技术公司。公司专注于语音识别和音频信号处理相关技术和产品的研发,具有国际一流水平的语音识别/处理引擎、语音云系统和语音分析应用产品,产品涵盖互联网、电信平台、广电网教育、音乐检索以及嵌入式终端等多个领域。中科信利目前总人数200余人,技术人员超过80%,其中70%以上具备硕士或博士学位。技术人员中研发骨干超过70%,包括海外归国人员、在外企具备十几年软件开发经历的高级研发人员、以及国内名牌高校及中科院的毕业生等。售前技术人员占10%,工程实施技术人员10%,售后服务人员10%,其他人员约占20%,包括数据处理以及行政、财务、销售和管理等。
专注于为客户提供企业级多媒体智能信息处理解决方案的创新型高科技公司,拥有一支由多名海外归国博士及北京大学的博士、博士后组成的专业研发团队和运营团队。灵伴未来在汉语语音识别及合成、中文信息抽取、视频信息处理等领域有着长期的研究积累,拥有多项国际领先的研究成果。灵伴未来以这些核心技术为依托,深刻理解具体业务流程,研发出智能语音交互、数字媒体信息挖掘与分析、智能视频分析等三大产品系列数十种产品,拥有全部自主知识产权。
中科极限元(杭州)智能科技股份有限公司北京分公司是一家以“智能交互”为核心的人工智能技术公司,拥有自主产权的智能语音、人机对话、自然语言处理、大数据分析等AI技术,推出了云端、桌面、嵌入式等跨平台AI技术解决方案,产品和服务广泛应用于教育、安全、交通、呼叫中心、智能硬件等多个领域;服务于腾讯、奇虎360、搜狗等公司以及网信办、公安部门等政府职能部门。公司致力于发展智能交互技术,与中国科学院自动化研究所成立“智能交互联合实验室”,由中科院科学家领军,其中语音研发团队成员80%拥有博士学位。
科大讯飞
科大讯飞是知名的智能语音技术提供商,专业从事智能语音及语言技术研究、软件及芯片产品开发、语音信息服务及电子政务系统集成,产品涵盖语音引擎、行业应用、教育产品、手机应用、互动音乐等多个领域。科大讯飞坚持“平台+赛道”的发展战略。基于拥有自主知识产权的核心技术,2010年,科大讯飞在业界发布以智能语音和人机交互为核心的人工智能开放平台——讯飞开放平台,为开发者提供一站式人工智能解决方案。截至2020年12月31日,讯飞开放平台已聚集超过175.6万开发者团队,总应用数超过99.6万,累计覆盖终端用户数30.7亿+,A.I.大学学员总量达到44.4万+,以科大讯飞为中心的人工智能产业生态持续构建。在平台基础上,科大讯飞持续拓展行业赛道,现已推出覆盖多个行业的智能产品及服务,推动在消费者、智慧教育、智慧城市、智慧司法、智能服务、智能汽车、智慧医疗、运营商等领域的深度应用,TOB+TOC双轮驱动成果显现。科大讯飞在智能语音和人工智能核心研究和产业化方面的突出成绩得到了社会各界和国内外的广泛认可,作为“中国人工智能国家队”一员已形成共识。创新坚守,初心不改,科大讯飞愿携手广大合作伙伴一起:用人工智能建设美好世界!
百分点
北京百分点信息科技有限公司,于2009年在北京成立,在深圳、沈阳、南京、杭州、成都设有分公司和研发中心。百分点是国内第一家专注于大数据与推荐引擎的互联网技术公司,为电子商务企业与互联网媒体企业提供站内流量转化和商业智能分析的相关产品与整体优化解决方案,同时也为传统行业提供大数据基础技术、大数据管理和应用的云平台和整体解决方案。
汉王科技
公司多年来专注模式识别与智能交互领域的研发,汉王在各大方向累计了多项自主知识产权的核心技术,砥砺前行中,形成了软硬件结合的发展模式。丰富的产品链,使得汉王识别技术得到广泛应用,在电子政务、个人办公、移动通信、数字家电等方面实现普及化和规模化处理信息。目前拥有京津冀地区电子行业垂直一体化精密制造基地,技术及产品已走出国门,辐射至日本、北美、南美、欧洲等海外市场。在手写识别、光学字符识别(OCR)、人脸识别、笔迹输入等领域拥有多项具有自主知识产权的核心技术,其中手写汉字识别获得国家科技进步一等奖,OCR识别获得国家科技进步二等奖。
百度智能云
百度智能云于2015年正式对外开放运营,是基于百度多年技术沉淀打造的智能云计算品牌,致力于为客户提供全球领先的人工智能、大数据和云计算服务。凭借先进的技术和丰富的解决方案,全面赋能各行业,加速产业智能化。百度智能云为金融、城市、医疗、客服与营销、能源、制造、电信、文娱、交通等众多领域领军企业提供服务,包括中国联通、国家电网、南方电网、浦发银行、成都高新减灾研究所、央视网、携程、四川航空等诸多客户。
小i机器人
小i机器人,是中国具有代表性的认知智能商业落地型企业。自2001年创立以来,专注于以自然语言处理为基础的认知智能相关技术的自主研发和商业落地,拥有强大的人机认知交互能力,被Gartner称为“会话式AI企业代表”享誉全球。通过智能交互平台、智能语音平台、知识融合平台等核心智能化产品,小i机器人已为客户联络中心、金融、政务、医疗等数十个行业,提供了全方位的客户服务的智能化解决方案和落地服务,也是国内最早实践智能客服市场化应用的公司之一。目前小i机器人服务数百家企业,并在多个垂直行业的市场占有率位居领先地位,终端客户逾8亿。
声智科技
声智科技是一家专注声学前沿技术和人工智能交互的科技创新公司,提供从软硬件到云服务的远场语音交互技术方案,以及从芯片模组、PCBA到工业设计的Turnkey产品方案,其中的声学通信、麦克风阵列、远场语音唤醒和识别、端到端深度学习等软硬融合技术在产业链条上具有领先优势。
网易数帆
网易数帆源依托网易集团二十余年互联网技术积累,聚合云计算、大数据、人工智能等新型数字化技术,聚焦提供数据智能、软件研发、基础设施与中间件等基础软件,致力于帮助企业客户成功实现数字化转型。网易数帆持续提供开放、稳定、安全、高效的基础技术平台和完善的数字生态体系,通过持续创新实践,以客户为导向,发展出网易轻舟、网易易数、网易易智、网易易测等4大产品线,提供各项产品服务和综合解决方案,涵盖零售、金融、制造、电商、教育、物流等多行业领域。
百度AI开放平台-语音识别
基于业内领先的深度学习技术,提供高度拟人、流畅自然的语音合成服务,支持在线、离线多种调用方式,满足泛阅读、订单播报、智能硬件等场景的语音播报需求支持中文、英文、中英文混读合成,提供基础音库和精品音库共14种音库供您选择,让您的产品拥有个性化的声音支持多种参数配置,可根据场景需求对发音人的语速、音调、音量进行灵活设置,满足个性化需求提供RESTAPI接口、离线SDK、在线SDK,充分满足不同场景下的语音合成需求,提供流畅自然的合成体验
出门问问
出门问问的使命是定义下一代人机交互,让人和机器的交互更自然。公司自主研发并建立了完整的“端到端”人机交互相关技术栈,包括声音信号处理、热词唤醒、语音识别、自然语言理解、对话管理、垂直搜索、智能推荐、语音合成、知识图谱等,并始终保持国际前沿技术水平。面向ToC消费级场景,出门问问陆续推出了出门问问手机App、AI智能手表TicWatch系列、AI真无线智能耳机TicPods系列、智能后视镜TicMirror*、智能音箱TicKasa系列等人工智能软硬结合产品,成为全球消费者喜爱的AI可穿戴品牌。公司旗下产品均可通过多场景、全覆盖的出门问问中文虚拟个人助理实现联动。
数美科技-语音识别
数美科技成立于2015年6月1日,致力于利用人工智能技术和海量数据解决金融、互联网等领域广泛存在的欺诈问题,先后推出了金融反欺诈、内容反欺诈、行为反欺诈等系列产品,覆盖直播、金融、支付、社交、电商、游戏、O2O等行业。总部设在北京,在上海、杭州、深圳设有分部 。公司创建以来,获得了VC机构腾讯、襄禾资本、顺为资本、清流资本、BV百度风投联合投资 。
分音塔科技
北京分音塔科技有限公司(BABELTECHNOLOGY),简称分音塔科技,成立于2016年7月15日,由清华大学团队、成功连续创业者成立,致力于实现不同国家和民族之间跨语言同声传译,提供可穿戴智能设备、人工智能API综合解决方案和虚拟运营服务。基于普遍存在的跨语言沟通障碍和迫切的沟通需求,分音塔科技采用人工智能技术,开发出准儿翻译机等系列可穿戴智能硬件产品和准儿翻译APP,并与中国、美国、日本、韩国、俄罗斯等进的相关人工智能公司建立长期合作关系,构建沟通翻译平台。
希尔贝壳
北京希尔贝壳科技有限公司成立于2017年,是一家专注人工智能大数据和技术服务的创新公司。针对家居、车载、机器人等语音智能产品做精准场景语音数据并输出方案。利用机器学习平台,在语音数据评测、辅助转写、数据分析、智能语音客服等场景业务建立了领先的核心技术体系。希尔贝壳在语音识别、语音合成、声纹识别领域有着多年的基础技术研究,在行业必须的训练数据集结构分析和建设上有着不断创新的能力。希尔贝壳的愿景:以开放数据、技术变革创新为理念,实现人工智能民主化。
百度VR-语音识别
百度VR作为国内领先的一站式VR方案解决机构,提供基于VR技术的教育,党建、营销、云展会、实训、产业园等解决方案,助力产业数字化升级。目前,百度VR全面布局VR教育、VR营销,为K12、高等院校、职业学校、企事业单位等客户提供VR教室、VR营销等一站式解决方案。
ELEVOC
大象声科是语音信号处理引擎供应商,依托算法、软件、硬件三个维度的技术纵深,为语音增强和智能语音交互提供先进的解决方案。公司凭借深度学习驱动的语音增强技术奠定了语音前端信号处理,目前公司已经完成了全球第一款芯片级单音轨实时语音提取方案,有效的实现了噪音与人声的分离。该技术已经开始在通讯行业开展广泛应用,开启人类无噪音通讯时代。
思必驰
思必驰是国内领先的对话式人工智能平台公司,拥有全链路的智能语音语言技术,自主研发了新一代的人机交互平台(DUI),和人工智能芯片(TH1520);为车联网、IoT、以及众多行业场景合作伙伴提供自然语言交互解决方案。“思必驰”是国际上极少数拥有自主产权和中英文综合语音技术的公司之一。其语音综合技术包括语音识别、语音合成、自然语言理解、智能交互决策、声纹识别、情绪识别等。
捷通华声
在AI技术研发方面,捷通华声拥有语音识别、语音合成、语义理解、机器翻译、大数据分析、声纹识别、人脸识别、指纹识别、手写识别、键盘输入、麦克风阵列、OCR、视频分析等十余项自主研发的AI技术,并在灵云开放平台(AIcloud.com)上面向产业全面开放。2013年,捷通华声与清华大学达成“灵云科技源自清华”战略合作,并共同创立“清华灵云人工智能研究中心”、“清华海峡研究院人工智能研究中心”,中国人工智能科学研究奠基人、清华大学人工智能研究院院长张钹院士出任研究中心首席科学家。通过与清华大学的产学研合作,灵云AI技术学术研究保持着全球领先,语音识别、语义理解、语音合成、机器翻译、OCR等多项技术达到国内顶尖水平。
灵云
灵云平台面向产业全面开放,并以“云+端”方式,为产业界提供语音合成(TTS)、语音识别(ASR)、麦克风阵列(SMA)、手写识别(HWR)、光学字符识别(OCR)、人脸识别(AFR)、声纹识别(VPR)、指纹识别(FPR)、自然语言理解(NLU)、数据挖掘(DM)、机器翻译(MT)等全方位人工智能能力。灵云平台通过服务百度导航、导航犬、嘀嘀打车、快的打车、汉字英雄、灵云输入法等“家喻户晓”移动应用服务,及服务京东商城、携程等大型互联网平台,使中国13亿社会大众群体充分感受并体验到智能语音等人工智能技术为现代生活所带来的轻松与便捷。
京东人工智能开放平台-语音识别
加大京东智能云平台的建设。京东智能云平台已经接入了100多个品牌的产品,已经涵盖了国家一线的主流品牌。通过在传统家电产品中植入京东的模块并连接京东云的方式,消费者可以用同一款APP控制所有接入的产品,实现不同品牌不同产品之间的互联互通。京东希望在2015年引入更多的品牌及产品,同时,京东的账户体系也将与这些品牌进行分享,力求提供更好的用户体验。
科大讯飞开放平台
迅飞开放平台是科大讯飞推出的移动互联网智能交互平台,为开发者免费提供:涵盖语音能力增强型SDK,一站式人机智能语音交互解决方案,专业全面的移动应用分析。科大讯飞股份有限公司成立于1999年,是亚太地区知名的智能语音和人工智能上市企业。自成立以来,长期从事语音及语言、自然语言理解、机器学习推理及自主学习等核心技术研究并保持了国际前沿技术水平;积极推动人工智能产品研发和行业应用落地,致力让机器“能听会说,能理解会思考”,用人工智能建设美好世界。2008年,公司在深圳证券交易所挂牌上市(股票代码:002230)。作为技术创新型企业,科大讯飞坚持源头核心技术创新,多次在机器翻译、自然语言理解、图像识别、图像理解、知识图谱、知识发现、机器推理等各项国际评测中取得佳绩。两次荣获“国家科技进步奖”及中国信息产业自主创新荣誉“信息产业重大技术发明奖”,被任命为中文语音交互技术标准工作组组长单位,牵头制定中文语音技术标准。同时,科大讯飞还获得了以下荣誉:首批国家新一代人工智能开放创新平台、首个认知智能国家重点实验室、首个语音及语言信息处理国家工程实验室、国家863计划成果产业化基地、国家智能语音高新技术产业化基地、国家规划布局内重点软件企业、国家高技术产业化示范工程等。
快商通
厦门快商通科技股份有限公司成立于2009年,是国内人工智能客服领军企业,曾获得中国AI最高奖吴文俊奖以及工信部、中科院等多部门嘉奖。基于领先的自然语言处理、深度学习、大数据、云计算等技术,快商通打造人工智能算法引擎,为企业用户提供以【智能客服】为核心的客户全生命周期管理服务,是国内首批智能客服企业、首创前端营销型客服云平台。平台上线以来,企业用户超过38万,包括国家电网、新华教育、联想集团等各领域头部企业。“用技术和产品服务30亿用户”,是董事长肖龙源提出的企业愿景,快商通希望帮助更多企业,享受更安全、更稳定、更智能的客户服务体验。是一家基于自主研发人工智能引擎平台(快商大脑)的AI公司,针对企业客服、金融、安防、电力、航空、司法、公安等垂直领域推出不同的BI、AI解决方案,分别针对企业客服领域推出智能营销客服系统、机器人客服;针对金融、安防领域推出声纹安全解决方案,基于大型商超、电力、航空领域推出BI、AI整体方案。
云知声
公司成立于2012年6月,总部位于北京,在上海、深圳、厦门、合肥设有子公司,目前员工接超过500人。拥有完全自主知识产权、世界顶尖智能语音技术的人工智能企业。从交互入手,云知声构建了语音感知、认知和表达、超算平台与图像、机器翻译等多模态人工智能硬核技术,并将这些能力封装在自研AI芯片之上,通过“云端芯”一体化产品体系面向行业推出全栈式AI技术能力,打造从AI技术创新到产业应用的生态闭环。在应用层面,云知声提供跨硬件平台、跨应用场景,端云一体的人工智能整体解决方案,广泛应用于家居、医疗、金融、教育、交通、汽车、地产等领域。迄今为止,云知声的合作伙伴数量超2万家,主要客户涵盖平安、世茂、吉利、格力、美的、海尔、华为、京东、360等头部企业,覆盖用户超2亿,云平台日调用量超5.7亿次,覆盖设备超2.5亿台。
灵伴即时
灵伴即时智能科技有限公司(简称“灵伴即时”)是以人工智能语音交互技术为基础的企业级用户服务提供商,核心研发团队由一支国内外名校博士、博士后队伍组成,多次在国际技术大赛中夺冠,并拥有数个人工智能领域核心技术专利。在AI产业落地实践中,灵伴即时秉承“自主研发、产业聚焦、价值创造”的理念聚焦企业服务领域,致力于打造面向未来的人机融合智能客服平台,助力企业客服体系在”AI时代”的全面升级。目前,灵伴睿思4.0凭借着其高质量对话能力、丰富的产品功能和优质的云通讯能力服务于建设银行、中信银行、招商银行、华夏保险、大地保险等数十个行业的近百家企业,助力企业转型升级、重构客服劳动力市场。
VoiceAI声扬科技
深圳市声扬科技有限公司(英文简称“VoiceAITech”),是致力于人工智能语音大数据分析的国家高新技术企业,拥有国际领先的以声纹识别为核心的智能语音科技,为公安、金融、政府、互联网及IoT等行业提供“以用户为中心”的语音智能化解决方案。自2016年成立以来,公司先后服务了公安部、中国工商银行、恒丰银行、重庆银行、平安集团、天津消防总队、中国南方电网、广发证券、华硕电脑、印尼社保储蓄基金TASPEN、墨西哥国有银行Infonavit等多个国内外大型企业和政府机构。2020年9月,公司完成近亿元人民币的A轮融资,由光远投资领投,前海母基金、招商启航资本、水木资本与香港X科技基金等跟投。截止2020年8月,公司申请、获得近百项自主知识产权。声扬科技云集了清华大学、中国科学技术大学、复旦大学、南开大学、厦门大学、香港科技大学、香港中文大学、康奈尔大学、剑桥大学等国内外顶尖院校的科学家与行业专家。
腾讯AI开放平台-语音识别
腾讯语音合成依托腾讯领先的语音技术和深度学习算法,为开发者提供全面优质的文字转语音服务。支持中英双语及多种音色,合成语音自然流畅,近乎真人发声。可为智能助手、智能机器人、文学阅读等领域提供语音合成解决方案,让您的应用开口说话。
远鉴科技
北京远鉴信息技术有限公司(下称“远鉴”或“公司”)是一家高科技创新型企业,是国内领先的声纹技术及人工智能服务企业。公司发展始于为公安部、国家网信办等部委提供人工智能技术服务,具备成熟的实战经验。在多个核心技术远鉴拥有完全自主知识产权,是国内声纹识别技术的领导者和多维识别技术的开创者。公司的发展一直受到国家多部委的关注和认可,相继承担了国家十二五、十三五科技支撑计划中相关课题的研究任务及国家大型基础设施建设任务,主导起草了多项公共安全行业标准和国家标准,是多维身份识别与可信认证技术国家工程实验室的主要建设方之一,获得公安部、国家网信办等部委多次表扬。2019年,公司在中央网信办、工业和信息化部、公安部指导的首届中国人工智能·多媒体信息识别技术竞赛中获得最高级A级企业荣誉称号,并包揽声纹识别、语音关键词两个项目的冠军。
爱数智慧
爱数智慧为车载语音交互系统提供多样的训练数据,如噪音数据、车载命令数据、车载信息娱乐交互数据等,覆盖目标语言、地方口音变化、不同性别和年龄的说话人等。爱数智慧对于录音人、录音环境、录音设备、标注方法、验收准则都有统一的标准,以此来保证真实应用场景下产品和服务的一致性、稳定性。爱数智慧为很多汽车行业客户、语音交互系统研发企业提供多种语言以及多语种混合的语音识别数据。这些定制化的高质量语音数据为客户的车载语音交互系统提供了很好的训练,使得它们即使在复杂环境中也能保持较好的识别率。
有道智云
网易有道旗下一个为开发者、企业和政府机构等提供自然语言翻译、文字识别OCR等服务以及行业解决方案的云服务平台。致力于提供安全,可靠和高效的云服务。我们的Ai能力,网易有道旗下一站式人工智能服务提供商,为政府、企业和开发者提供稳定可靠的基础AI能力。智慧教育服务,基于网易有道在教育领域十余年积累的经验与数据,推出了多款面向教育领域的AI服务。
中科信利
北京中科信利技术有限公司于2002年依托中国科学院声学研究所合作成立,是以开发语音技术为核心的高新技术公司。公司专注于语音识别和音频信号处理相关技术和产品的研发,具有国际一流水平的语音识别/处理引擎、语音云系统和语音分析应用产品,产品涵盖互联网、电信平台、广电网教育、音乐检索以及嵌入式终端等多个领域。中科信利目前总人数200余人,技术人员超过80%,其中70%以上具备硕士或博士学位。技术人员中研发骨干超过70%,包括海外归国人员、在外企具备十几年软件开发经历的高级研发人员、以及国内名牌高校及中科院的毕业生等。售前技术人员占10%,工程实施技术人员10%,售后服务人员10%,其他人员约占20%,包括数据处理以及行政、财务、销售和管理等。
灵伴科技
专注于为客户提供企业级多媒体智能信息处理解决方案的创新型高科技公司,拥有一支由多名海外归国博士及北京大学的博士、博士后组成的专业研发团队和运营团队。灵伴未来在汉语语音识别及合成、中文信息抽取、视频信息处理等领域有着长期的研究积累,拥有多项国际领先的研究成果。灵伴未来以这些核心技术为依托,深刻理解具体业务流程,研发出智能语音交互、数字媒体信息挖掘与分析、智能视频分析等三大产品系列数十种产品,拥有全部自主知识产权。
极限元
中科极限元(杭州)智能科技股份有限公司北京分公司是一家以“智能交互”为核心的人工智能技术公司,拥有自主产权的智能语音、人机对话、自然语言处理、大数据分析等AI技术,推出了云端、桌面、嵌入式等跨平台AI技术解决方案,产品和服务广泛应用于教育、安全、交通、呼叫中心、智能硬件等多个领域;服务于腾讯、奇虎360、搜狗等公司以及网信办、公安部门等政府职能部门。公司致力于发展智能交互技术,与中国科学院自动化研究所成立“智能交互联合实验室”,由中科院科学家领军,其中语音研发团队成员80%拥有博士学位。