科大讯飞:让世界听见AI的声音

640?wx_fmt=jpeg

来源:华为


怀揣着“让世界聆听我们的声音”的梦想,科大讯飞依托世界领先的核心技术,引领智能浪潮,服务亿万用户,从中国语音产业的拓荒者一跃成为世界人工智能产业的领军者,而最初科大讯飞把语音作为切入点却是源于偶然……


戳视频,听听科大讯飞执行总裁、消费者事业群总裁胡郁先生如何解读。




源于偶然:让机器开口说话


科大讯飞1999年成立的时候,手上只有一项技术就是语音技术,当时的目标是让机器开口说话。


胡郁笑谈:


“当时我们并不知道,我们处于人工智能的范畴,至少自己没有清晰的概念。我们更加不知道的是,1999年恰恰是人工智能的第二次冬天。就像华为任总以前经常讲的一句话,华为要是知道通讯行业这么难做,可能就不会做了。我们当时也是,如果知道人工智能处于那样的环境,可能就不会创业了。这既有巧合,又是冥冥之中的注定。”


“2003-2004年以后,人工智能还不是特别热,我们慢慢意识到我们做的恰好是人工智能最关键的技术。”


人类的智能相对于其他动物或者相对于机器,最重要的是认知智能,而认知智能的主要来源是人类对语言的掌握和对知识的表达,然后在这个基础上进行逻辑推理和复杂的决策。以语音和语言为中心的认知革命,是人类智慧的最高水平,也是现在人工智能所面临的最大挑战。


作为讯飞超脑的总牵头人,胡郁作出了这样的诠释:


“2014年,我们在业界第一次推出‘讯飞超脑’计划,这不仅仅是一个口号。我们同时发布了对人工智能的定义,即运算智能。机器从发明的第一天开始,就比人类强很多,比如会下围棋的机器,就是机器运算智能的表现。还有类人机器具有感知智能和运动智能,具体表现是机器能够看到、听到、感觉到周围的世界。现在的类人和动物的机器已做得不错了。但是,人类之所以能够屹立在地球生物链的顶端,是因为人类的语言能力,我们称为认知智能。这是讯飞超脑计划的一个目标,让具备感知智能的机器从能听会说、能看会认,过渡到认知智能,即能理解,会思考。”


当前,“讯飞超脑”利用大数据来进行训练以提升相关算法,这其中的“训练”指代的并不是那种填鸭式的数据输入和训练,而是来自于真实应用场景的真实交互数据,让系统能够依据真实数据实现自主学习和提升,胡郁称之为涟漪效应,就像水滴入水面产生的涟漪一样,随着产品覆盖面的不断增加,数据量级也在快速攀升,进而带来产品体验的快速优化迭代,这一切的背后都依赖于“讯飞超脑”这个强大的人工智能引擎。


科大讯飞在语音合成、识别、评测,翻译等领域都拥有全球领先的核心技术。


640?wx_fmt=jpeg


2005年至2018年,在全球最高水平的语音合成比赛Blizzard Challenge中,科大讯飞取得13连冠,同时科大讯飞各项关键指标均名列第一。在国际机器翻译评测IWSLT2014、NIST2015等大赛中科大讯飞连夺冠军。


在过去6年中,科大讯飞的语音识别技术准确率从60.2%提升到98%以上。语音技术上的优势为科大讯飞向人工智能发展,同时落地行业与应用打下良好的根基。


讯飞在布局当前的大数据人工智能的同时,也在关心人工智能发展的另一方面,即与人脑相结合,基于类脑计算,试图找到人脑智能的奥秘,发现其中的智能动力学,进而真正让机器具备像人一样的智能,同时不受人脑物理空间的局限,以此来实现人工智能领域真正的突破。


讯飞翻译机,出境游so easy


科大讯飞是真正把人工智能的应用落地了。在2010年,科大讯飞开发了世界上第二个、中国第一个语音输入法,仅次于谷歌,讯飞输入法主打语音输入,语音识别准确率超98%,同时支持22种方言的语音输入。


640?wx_fmt=png


在2016年,科大讯飞发布了第一个智能终端产品讯飞翻译机。


2018年4月又推出了讯飞翻译机2.0,主打中文与33种语言实时互译、方言翻译和拍照翻译,并独家具备4G、Wi-Fi和离线翻译模式。


翻译机86%的用户用于出境游。考虑到用户可能不会使用标准普通话,讯飞翻译机同时搭载了方言和带方言口音非标准普通话的识别能力,目前已支持粤语、四川话、东北话、河南话四大方言。


方言种类还在持续增加中,并能根据用户的不同使用场景与用词习惯,准确识别并给出最符合语境的翻译结果,真正做到了落地实用。“可以说,讯飞翻译机2.0是至今世界上销量最好、好评度最高的手持式智能翻译系统。”


为了构建未来人工智能产业生态体系,在2010年讯飞发布了语音云平台。目前平台上的开发者已经超过86万,连接19亿设备,每日提供近46亿次交互服务,数以百万计的开发者正在借助科大讯飞的核心技术开发智能产品,服务于人们生活的方方面面。


2015年,科大讯飞进一步发布了对人工智能产业具有里程碑意义的人机交互界面——AIUI,重新定义了万物互联时代的人机交互标准。胡郁说道:


“2017年,科大讯飞被宣布作为首批国家新一代人工智能开放创新四大平台之一,旨在建成依托智能语音的国家新一代人工智能开放创新平台。”



赋能公检法、教育等传统行业


智能语音和人工智能技术对传统行业赋能方面,科大讯飞也做了很多尝试,例如公检法、教育等行业。


在公检法领域,科大讯飞通过与最高法、最高检开展创新合作。2016年在安徽开展的测试显示,人工智能判断诈骗电话的准确率极高;人工智能还充当起法庭书记员,经测试,智能语音识别参与庭审取得实际效果,庭审时长缩短30%。


在教育领域,人工智能在“改卷子”方面的能力就超乎了人们的想象。


640?wx_fmt=jpeg


在江苏省的高考智能阅卷验证中,两个不同的人工智能语文作文阅卷分差小于7分,一致率达92.82%,比两位老师的阅卷评分的一致率高出5%以上。


在湖南省研究生考试的智能阅卷验证中,两个不同的人工智能分别对英语作文进行阅卷评分,分差小于6分的一致率竟高达99.83%,比两位老师的阅卷评分一致率高出了4%以上。


胡郁表示,教育部考试中心正联合科大讯飞建设人工智能联合实验室,在教育领域酝酿着更多“黑科技”的诞生。


共建AI未来


科大讯飞与华为公司始终保持着紧密合作,双方充分依托各自行业领域的长期积淀优势,在电信平台、智能终端等领域建立了战略合作关系,携手推动语音及人工智能技术的深入应用。


640?wx_fmt=jpeg


双方合作在2010年建立了世界上第一个中文语音的开放云平台。云计算能力开放以后,众多公司和开发者可以面向最终用户的各种需求,开发各种各样的产品,这就形成了生态的建设。


2018年5月,华为与科大讯飞签署战略合作协议,未来双方将在公有云服务、ICT基础设施产品、智能终端、以及办公IT四大领域开展深度战略合作。


双方还将面向未来开发创新AI语音应用,拓展全新行业市场,做大规模共享收益,共同做强人工智能产业生态。


对于消费者市场,华为手机使用的技术中,有一部分是源于科大讯飞的智能语音技术加持。华为手机还将科大讯飞的AI技术和能力内化为华为手机能力的一部分,为其带来差异化的竞争优势。


双方将基于科大讯飞的语音识别、语音合成、讯飞听见、讯飞翻译等语音AI技术和能力,围绕手机等智能终端产品以及终端云服务进行合作。


对于2B市场,华为在基础设施、内部办公产品等使用科大讯飞的技术与产品,双方将基于讯飞引擎和华为云资源,共同构筑华为云EI平台。


面向未来+智能的时代,胡郁认为将来的人工智能都要在云上实现。由于云计算的资源消耗比较大,将来有可能会在端计算和边缘计算上实现更好的人工智能,也许很快成为技术上的突破口。人工智能的应用也会更多地落地,真正解决问题。


我们有理由相信,未来华为和讯飞可以更好地依托自身优势,结合产业发展,共同推动人工智能生态体系的建设,为未来的AI生活增光添彩。


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/494733.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux中的chmod详解

chmod(英文全拼:change mode)命令是控制用户对文件的权限的命令。Linux/Unix 的文件调用权限分为三级 : 文件所有者(Owner)、用户组(Group)、其它用户(Other Users)。只有…

【程序员薪资】2021年04月新鲜出炉,看看你拖后腿了吗?

程序员一直都是一个备受人们关注的群体。据IDC统计,全球约有1850万名程序员(数据还在持续增长),中国占10%左右。随着近年全国互联网创业热潮的兴起,“互联网”、“云计算”以及“智能硬件”等领域发展迅速,…

CICC科普栏目|神经网络浅讲:从神经元到深度学习

图1 人脑神经网络来源: 计算机的潜意识摘要:神经网络是一门重要的机器学习技术。它是目前最为火热的研究方向–深度学习的基础。神经网络是一门重要的机器学习技术。它是目前最为火热的研究方向–深度学习的基础。学习神经网络不仅可以让你掌握一门强大的…

linux安装Redis(超详细,只要三分钟,每一步命令都有命令截图及运行截图)

Redis redis是一个key-value存储系统。和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(sorted set --有序集合)和hash(哈希类型)。这些数据类型都支持push/pop、add/remove及取…

鬼才!用Python计算圆周率 π

目录 一、圆周率的历史发展 1、中国 2、印度 3、欧洲 二、用python计算圆周率 A货:什么!你不会背圆周率(鄙夷的眼神) 3.1415926535 8979323846 26433... 桥哥:我会算呀 !!! 一…

大数据常见问题:数据倾斜

offer收割系列介绍: 1、分享桥哥本人或小伙伴在面试大厂时遇到的真题,并给出参考答案!!如果能帮到大家,点赞、收藏、评论是对我最大的支持!! 2、涉及岗位:主要为大数据开发、数据仓…

一图看懂新一代人工智能知识体系大全

来源:财经头条摘要:人工智能的发展离不开基础支持层和技术层,基础支持层包括大数据、计算力和算法;技术层包括计算机视觉、语音识别和自然语言处理。人工智能的技术本质是什么,本文会详细分析。人工智能的发展离不开基…

阿里、字节offer收割系列:数据仓库岗(面试真题,建议收藏)

【offer收割系列介绍】 1、分享桥哥本人或小伙伴在面试大厂时遇到的真题,并给出参考答案!! 2、涉及岗位:主要为大数据开发、数据仓库(桥哥干过的),其它岗位也可参考 3、涵盖技术:mys…

MIT新开发的 AI 模型有望改进恶性脑瘤治疗

来源:人工智能和大数据美国研究人员新近开发出一种人工智能模型,能够为胶质母细胞瘤患者设计出最小剂量给药方案,在缩小肿瘤的同时减少药物带来的毒副作用,改进患者生活质量。胶质母细胞瘤是一种常见的恶性脑瘤,常见疗…

建议收藏丨大数据集群常用监控命令(内存、磁盘、CPU、网络)

大家好,我是明月十四桥!! 擅长领域:python黑科技、大数据后端研发、数据仓库 今日重点: ① 学会查看linux各种状态,包括:网络IO、磁盘、CPU、内存等; ② 学会理解命令所代表的含义&a…

中科院王飞跃:新的智能全球化将要来临,人工智能标准化为时尚早

中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任王飞跃来源:财经网摘要:8月11日,中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任王飞跃在由厚益控股和《财经》杂志联合主办主题为“共享全球智慧 引领未来科技”的…

建议收藏丨sql行转列的一千种写法!!

大家好,我是明月十四桥!! 爱好特长: 1、爱好和特长有很多,擅长word、excel、ppt、wind等软件的安装与卸载; 2、精通PE、PS、PB、DCF、PEG等单词的拼写; 3、熟悉Windows、Linux、Mac、Android、I…

深度学习并非万能:你需要避免这三个坑

作者 | George Seif编译 | 专知整理 | Mandy, Sanglei摘要:本文是人工智能专家George Seif撰写的博文,介绍了在当前深度学习比较火热的情景下需要避免的三个坑。Tweaking Neural Net ParametersThree reasons that you should NOT use deep learning深度…

万字长文丨7个经典问题,助你拿下Java面试(建议收藏)

擅长领域:execl、word、ppt 等 今日重点: ① 掌握面试的基本素质; ② 学会7个典型的java面试问题。 有问题的小伙伴欢迎加我主页vx。评论、点赞、收藏是对我最大的支持!!! 目录 一、面试的目的 二、面…

应用人工智能有助心理学发展

来源: 中国社会科学报摘要:人工智能及相关技术的发展,为心理学研究提供了突破性的研究方法和工具;心理学对大脑机制的研究成果运用于人工智能领域,也推动着人工智能研究的进步。心理学同人工智能联系紧密,自…

【粉丝福利、免费领取】:1000套PPT模板、100份简历模板、硬核学习资料+PDF资料(java、python、大数据、机器学习)

目录 1、100套小编购买的简历模板(部分截图) 2、1000套精品PPT模板(部分截图) 3、大数据-学习资料(1.3G 硬核PDF,官方指南) 4、python学习全集 5、Java基础、高级和面试资料 6、大数据-行…

HDU 1142 A Walk Through the Forest dijkstra + DFS

http://acm.hdu.edu.cn/showproblem.php?pid1142 题意: Jimmy在位置 1 ,每天晚上要回位置2(家),计算1到2的最短距离,Jimmy要先去一个地方然后再回家,到了那个地方离家的距离不能大于1到2 的最短…

剑指 Offer 06. 从尾到头打印链表(递归、逆置链表、头部动态插入)

题目 输入一个链表的头节点&#xff0c;从尾到头反过来返回每个节点的值&#xff08;用数组返回&#xff09;。 示例 1&#xff1a; 输入&#xff1a;head [1,3,2] 输出&#xff1a;[2,3,1] 限制&#xff1a; 0 < 链表长度 < 10000 解法一&#xff1a;递归&#xff0…

王家耀院士 | 新型智慧城市“大脑”就是时空大数据平台

来源&#xff1a;泰伯网摘要&#xff1a;新型智慧城市建设的任务包括五点&#xff0c;首先是大力实施“互联网城市”行动&#xff1b;二要加强体制机制创新和城市资源整合&#xff1b;三要推进工业化、信息化、城镇化、农业现代化融合创新&#xff1b;四要着力解决“城市病”&a…

网站架构之缓存应用(摘录)

网站缓存这个话题并不新颖&#xff0c;但是能否将它用好&#xff0c;可是一门学问&#xff0c;同一件工具在不同人的手中会做出不同的事情来。这里我来分享总结下我对于网站架构中缓存应用的一些看法和经验&#xff0c;大家有好的想法可以补充 第一&#xff1a;缓存的一些基…