“人机耦合”变成“人机大战” AI同传离成熟还有多远

640?wx_fmt=jpeg

来源:科学网


9月21日,一篇指责科大讯飞“AI同传造假”的文章引发了社会广泛关注,文中知乎用户、同传译员Bell Wang表示,在日前举行的2018创新与新兴产业发展国际会议上,科大讯飞在现场和直播中展示的“AI同传”,用的其实是自己现场同传翻译的内容。


当晚,科大讯飞在电话会议回应中称:应主办方要求提供语音识别技术,直接转写译员翻译结果在会场大屏呈现,主办方同时要求在直播中合成识别结果,展示最新语音合成技术。


早在2017年,“科大讯飞翻译机让同传下岗”的文章就刷爆各大平台,表示同声传译职业将直接消亡、被科大讯飞机器翻译技术完全替代。这次的事件再一次引发热烈讨论:机器翻译技术与同声传译之间到底还有多少差距?


事件回溯与科大讯飞回应


9月20日,Bell Wang发表文章称“要揭露一下所谓智能翻译的真相”,他表示在知领直播平台的“机器同传”,就是把同传译员的声音精确转录为文本,然后再语音合成为机器声音向听众播放。


文章称,“科大讯飞事前没有告知有语音识别的字幕,没有告知直播的同传是机器朗读同传经过识别出来的文稿,更没有征得同意就冒名使用了译员翻译成果。”


他的文章发出后,同传圈也“炸了锅”。微博博主“同声翻译樱桃羊”表示:“现在这种所谓的‘人机耦合’,实行之前和译员沟通过么?有没有调查过译员是否接受这种方式?纵观整件事,译员的意见在哪一个环节得到了尊重?” 当晚,针对Bell Wang的质疑,科大讯飞回应称:“科大讯飞目前翻译服务主要提供两种方案:一种是全自动翻译,现场机器翻译并同步展示在屏幕上,没有任何人工同传参与;另一种是人机耦合翻译模式,由机器提供语音转写和翻译结果给同传参考。”


机器同时提供转写和翻译服务时,文字展示区Logo显示为“讯飞听见—离线翻译系统”;机器仅提供转写服务时,文字展示区Logo显示为“讯飞听见”。


科大讯飞表示,“某位同传译员对于科大讯飞产生了误解,是对会议服务方面的分工沟通了解不清,也没有听到科大讯飞的说明。”


针对科大讯飞的回应,他表示不能接受采访。对科大讯飞提到的“应主办方要求展示最新语音合成技术”,他回应道:“只能无可奉告,我不能说啥”。


注意到,Bell Wang在知乎上的文章在9月21日晚上有修改痕迹,他在开头声明:对视频进行了修改。


机器翻译能否替代同传译员?


来自科大讯飞微信公众号的内容显示,目前机器翻译的主流方式叫“统计翻译”,其基本原理是:从语料库大量的翻译实例中自动学习翻译知识,然后利用这些翻译知识自动翻译其他句子。


那么随着机器翻译技术的进步,不少人会发出疑问:机器会抢同声传译的饭碗吗?


科大讯飞创始人、董事长刘庆峰表示:“我们希望用机器帮助顶尖同传更好地发展他的能力,机器和人未来必须是协同的。”


一位不愿具名的专家说:“讯飞的技术在国内语音行业积累较多,但目前的情况是,人工智能只是处在初级阶段,机器翻译的难点在于语音识别和语义识别。在语义识别上,现在全球做得都不是太好。”


“目前机器在字、词的识别速度上是快于人的,但人在语意理解和提炼上又优于机器。因此,各取所长、优势互补的人机耦合是一个重要发展方向。”一位讯飞听见工作人员在接受其他媒体采访时说。


9月21日,大讯飞执行总裁、消费者事业群总裁胡郁,他表示“要找市场部和公关部,本人不作回应”。但当天下午胡郁在微博发声:“目前整个行业机器同传处于风口浪尖之上,不同厂商之间的竞争日加激烈,主要原因还是动了谁的奶酪吧。”


上述不具名的专家认为,网络媒体对人工智能存在过度宣传和炒作。“受到利益驱使,一些企业利用媒体进行宣传,同时网络媒体也不会对内容和信息准确性进行核实,就造成了目前的状况。”


胡郁还在微博中表示:“我相信大家也都知道科大讯飞真正的机器同传和将同传人员的语音转换成文字贴出来便于大家理解是两个完全不同的事情。不管是前者还是后者,都经过了广大最终用户和同传从业人员的检验,我就不再多说了。”


专家表示AI同传还不是一项成熟技术


自1989年美国成功做出第一个语音翻译系统以来,众多科研机构和包括微软、百度在内的公司都在进行AI翻译的研究。得益于人工神经网络的深入研究,这些年,AI同传技术发展很快。


“但是,这仍然不是一项成熟的技术,AI同传仍然有很多技术难题需要攻克。”中国科学院自动化研究所研究员宗成庆说。


就目前AI同传技术水平而言,在某些简单的场景中,可以实现较准确的语言同步翻译,如问路。但是,在复杂、专业、严谨的场景中,AI无法实现精准翻译,做到“信”“达”“雅”。


出于语言本身的特点,词汇有多重含义,且经常出现有歧义、似是而非的语句。其次,口语的规范性不高,有很多省略、颠倒句式。此外,说话人的口音、语速、多种语言混合,场景其他声源的干扰,也会让AI同传“不知所措”。


“但最重要的一点是,机器无法精准把握说话人的意图。对语义的理解不够,是目前AI同传尚未解决的一大难题。因此,目前AI同传无法高水平地替代人工翻译。”宗成庆说。


宗成庆介绍,语音转文字技术主要的难点是同音字、词的处理,不同的字、词有相同的发音,需要结合上下文进行判断,如“保鲜”和“保先”、“反攻”和“返工”。


由于语音识别技术不需要太多的语言理解,在声源干扰不强烈的情况下,较标准的语音可以转换成准确率较高文本。“这比AI同传成熟得多、容易得多。”宗成庆表示。


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/494091.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

高中分类讨论题1

转载于:https://www.cnblogs.com/zjyyhs/archive/2013/05/23/3094220.html

Android拼图游戏

效果如下 游戏的设计 首先我们分析下如何设计这款游戏: 1、我们需要一个容器,可以放这些图片的块块,为了方便,我们准备使用RelativeLayout配合addRule实现 2、每个图片的块块,我们准备使用ImageView 3、点击交换&a…

亚马逊:从零售商向科技公司的质变

报告来源:国泰君安(訾猛)亚马逊以技术为核心驱动力,实现从电商向科技公司的跨越,形成电商、物流、AWS、新零售协同发展的完整生态圈。亚马逊从1995年开始为用户提供线上商品,从一家网上书店发展成全品类电商…

使用HTML5的Canvas画布来剪裁用户头像

日期:2013-5-23 来源:GBin1.com 本文来自极客标签社区用户webgeek的一个在线HTML5web开发小技巧,帮助你使用html5的画布功能来切割用户上传的大头照。 在线调试 例如需要剪裁的图片如下: 用来处理大头照的JS代码如下:…

Android之Tab类总结

本文主要包括以下Tab类实现方式 FragmentTabHostFragment实现传统的ViewPager实现 FragmentManagerFragment实现ViewPagerFragmentPagerAdapter实现TabPageIndicatorViewPagerFragmentPagerAdapter FragmentTabHostFragment实现 布局文件 <?xml version"1.0"…

美日两位科学家获2018年度诺贝尔生理或医学奖

来源&#xff1a;科学网当地时间10月1日上午11时30分&#xff08;北京时间10月1日下午5时30分&#xff09;2018年度诺贝尔生理或医学奖获得者揭晓。今年该奖项的获得者分别是美国得州大学奥斯汀分校免疫学家詹姆斯艾利森&#xff08;James P. Allision&#xff09;和日本京都大…

Rejection sampling - 直观解释

如图&#xff0c;红线是我们想要从中采样的概率分布$f(x)$。 拿一个盒子把这个概率分布罩起来&#xff0c;假设盒子的上边缘是$p(x)$。随机地向盒子里撒点&#xff0c;即盒子里的均匀分布。位于$f(x)$下方点的横坐标&#xff0c;即是来自于$f(x)$的一组样本。从算法的角度讲&am…

Android之记住密码与自动登陆实现

本文主要讲述了利用sharedpreference实现记住密码与自动登陆功能 根据checkbox的状态存储用户名与密码将结果保存在自定义的application中&#xff0c;成为全局变量 布局文件 <?xml version"1.0" encoding"utf-8"?> <ScrollView xmlns:andro…

智能硬件这5大领域竞争升级,将迎发展新模式

来源&#xff1a;亿欧网智能硬件是指具备信息采集能力&#xff0c;并可实现智能感知、交互、大数据服务等功能的新兴互联网终端产品&#xff0c;是“互联网人工智能”的重要载体。在手机、电视等终端产品实现智能化之后&#xff0c;信息技术也正通过软硬件结合的方式&#xff0…

Android实现圆形圆角图片

本文主要使用两种方法实现图形圆角图片 自定View加上使用Xfermode实现Shader实现 自定View加上使用Xfermode实现 /** * 根据原图和变长绘制圆形图片 * * param source * param min * return */ private Bitmap createCircleImage(Bitmap source, int min) { final Pain…

自动驾驶又陷“派系”之争:该约束行人还是让车更完美

来源&#xff1a;网易智能摘要&#xff1a;近日&#xff0c;全球人工智能专家吴恩达&#xff08;Andrew Ng&#xff09;表示&#xff0c;制造可靠自动驾驶汽车的最快方法是在行人方面采取完善措施&#xff0c;而不单是汽车。他说&#xff1a;“我们想告诉人们的是&#xff0c;请…

AjaxPro新发现-错误处理

当Ajax调用发生错误时,回调函数参数result会存在error属性,通常通过这个属性判断是否出现错误. 也可以使用默认处理函数,这样就可以为错误处理提供统一的函数 转载于:https://www.cnblogs.com/dwfbenben/archive/2013/05/24/3097535.html

Android仿微信界面

效果图 原理介绍 1、先绘制一个颜色&#xff08;例如&#xff1a;粉红&#xff09; 2、设置ModeDST_IN 3、绘制我们这个可爱的小机器人 回答我&#xff0c;显示什么&#xff0c;是不是显示交集&#xff0c;交集是什么&#xff1f;交集是我们的小机器人的非透明区域&#xff…

Google Brain与牛津大学主持最新《计算机视觉前沿》报告(146页PPT)

来源&#xff1a;专知牛津大学DanielaMassiceti, Saumya Jetley与Google Brain Sara Hooker等人9月13日在Deep LearningIndaba 深度学习大会上主持关于《计算机视觉前沿》的报告。重点围绕当前计算机视觉最重要但没有解决的一些问题&#xff0c;以及如何和非洲相关&#xff1f;…

89C52控制1602A液晶的计时器

一、LCD1602A液晶说明。 DataSheet说明&#xff08;技术参数&#xff09; ①此LCD共16个管脚。每个接口说明如下表。 PS&#xff1a;1-2管脚没什么好说的&#xff0c;就是接电源和地的。 3管脚是偏压信号&#xff0c;这一管脚一般可以接个滑动变阻器&#xff0c;通过调节滑动变…

重磅 | 中国工程院提出新一代智能制造

来源&#xff1a;WPR近日&#xff0c;中国工程院院刊《Engineering》推出最新观点性文章“走向新一代智能制造”&#xff0c;作者周济、李培根、周艳红等&#xff0c;文章指出智能制造是一个不断演进发展的大概念&#xff0c;可归纳为三个基本范式&#xff1a;数字化制造、数字…

C# Obsolete

Obsolete 属性将某个程序实体标记为一个建议不再使用的实体。每次使用被标记为已过时的实体时&#xff0c;随后将生成警告或错误&#xff0c;这取决于属性是如何配置的。例如&#xff1a; 上面在Main函数中调用&#xff0c;只产生了一个警告的信息。 如果将MyObsolete类中的Get…

Android之事件分发机制

本文主要包括以下内容 view的事件分发viewGroup的事件分发 首先来看两张图 在执行touch事件时 首先执行dispatchTouchEvent方法&#xff0c;执行事件分发。再执行onInterceptTouchEvent方法&#xff0c;判断是否中断事件&#xff0c;返回true时中断&#xff0c;执行自己的on…

Android屏幕适配总结

重要概念 什么是屏幕尺寸、屏幕分辨率、屏幕像素密度&#xff1f; 什么是dp、dip、dpi、sp、px&#xff1f;他们之间的关系是什么&#xff1f; 什么是mdpi、hdpi、xdpi、xxdpi&#xff1f;如何计算和区分&#xff1f; 在下面的内容中我们将介绍这些概念。 屏幕尺寸 屏幕…

突然开掉CEO!通用电气时隔一年再换帅,金融和工业互联网都救不了GE?

资料来源&#xff1a;GE官网、华尔街见闻、腾讯新闻《一线》物联网智库 整理发布摘要&#xff1a;在统帅了通用仅仅14个月之后&#xff0c;John Flannery就被他的继任者Lawrence Culp取代&#xff0c;而Culp也将立刻走马上任&#xff0c;成为通用电气&#xff08;GE&#xff09…