2019输入序列号闪退_正式告别60秒长语音 讯飞输入法新版评测:能动口我绝不动手...

一、前言:60秒长语音有希望消灭了

从2010年,讯飞推出业界首个中文语音输入法,将语音输入带到大众面前直到今天,语音输入早就不再是当初功能机时代“语音王”的土味儿模样。如今,语音输入已经逐渐超过手写,成为在手机端一种不可或缺的日常输入方式。

但是,语音输入痛点也有很多,比如口音、方言、多人说话、噪声、吞音、远场语音等,具体到日常场景当中表现为:中英文混杂语音输入识别不佳、在安静场所难以使用、噪声环境的输入效果容易受到影响、同音字词的识别效果不佳。

这样一来,随着输入量的增加,很多语音输入工具的表现常常令人抓狂,促使越来越多的人在QQ/微信你来我往一段又一段令人崩溃的60秒长语音。

baa5106dc36a85f3a479d3192a94e575.png

日前,讯飞输入法的Android版和iOS版均更新了AI语音引擎,进一步优化通用语音识别效果,同时还基于说话人和使用场景,重点提升语音候选词、噪声环境、轻声说话及专有名词的识别准确率,使讯飞输入法通用语音识别准确率在98%的基础上进一步提升。

be408cd863504b32dea1f0ae0c3e0dba.png

先来看看讯飞输入法更新日志:

Android V9.1.9671

1、升级A.I.语音引擎,提升语音候选词、噪声环境、轻声说话及专有名词的识别效果

2、优化离线语音使用体验,无网、弱网环境语音输入依然出色

3、无障碍模式适配新增手势操作,双指滑动切换候选并支持阅读

4、拓展表情发送功能,适配QQ国际版和QQ极速版

iOS V9.1.2930

1、升级A.I.语音引擎,提升语音候选词、噪声环境、轻声说话及专有名词的识别效果;

2、优化离线语音使用体验,无网、弱网环境语音输入依然出色

3、减少键盘闪退现象,提升输入稳定性

看更新日志说得这么美好,实际效果如何呢?正好手里的华为P40 Pro所载讯飞输入法升级到了最新版,笔者也已经使用了一段时间,接下来就是我们的评测体验。

二、可能是市面上免切换语音输入效果最好的输入法

此前,讯飞输入法大数据显示,约80%的方言母语者同时使用普通话,在私密场合或者面对方言交流对象时,习惯使用方言,表达更亲切;在正式的社交或工作场合,使用普通话避免沟通障碍。

这便催生了免切换模式的出现。其实早在9.0版本的时候,讯飞输入法就内置了“普通话粤语免切换”模式,实现普通话、粤语语音输入免切换,在普通话保持高精准识别的同时,粤语识别率高达95%,并通过语音输入来高效打出粤语正字。

Android V9.1.9671和iOS V9.1.2930最新版本的讯飞输入法保留并进一步优化了“不用切换”的语音输入,在默认中文“普通话(随心说)”识别模式下,已经实现了英文语音、中英夹杂、英文+中文以及带口音的普通话等不同场景的免切换识别支持。

——全英文语音输入

在默认中文“普通话(随心说)”识别模式下,我们直接开飙英文。

72b304b60b6e9621d1d85900ea9022ad.gif

我们使用TED演讲音频,录入一段相当长的英文语料,被讯飞输入法准确识别并加以合适的排版、断句。

——中英夹杂语音输入

一般来说,输入法的语音识别只能同时识别一种语言。如果在普通话当中突然插入一个“hello、byebye”之外的并不太常见的英文单词,很多输入法可能就反应不过来,直接识别失败了。也就是难以处理中英混输,尽管或许能识别出了夹杂在中文里的英语词汇,但却会在整句语义判断上产生干扰,最后导致句子不通顺。

不同语言的混输绝对算是语音输入技术的一大难点。

然而语言混用的现象我们又很难绕开,比如“DNA序列测定”、“开启MTP”、“AMOLED材质的屏幕和IPS的材质屏幕哪个更好”,如果用中文强行表达,变成了“脱氧核糖核酸序列测定”、“开启多媒体文件传输协议”、“有源矩阵有机发光二极体显示屏和平面转换液晶面板显示屏幕哪个更好”,会让人感觉十分别扭和陌生。

通常情况下,用键盘输入中英文混合的内容,需要选词甚至切换语言,而最新版的讯飞输入法支持中英文语音混合输入,而且免切换的,无需多余的设置,在默认中文“普通话(随心说)”识别模式下就可以体验。

比如直接说出“在一个阳光普照的moment,我欣喜若狂地拿到了大公司offer”,讯飞输入法精确识别出了中英文词汇,并理顺句子,所转换出来的文字非常通畅。

在体验的过程当中,其混合输入的速度和准确率也都非常高,几乎和单一普通话的识别效果没有明显差距,解决了语言混合输入效率低下的一大痛点。

——完整中文+完整英文语音输入

在默认中文“普通话(随心说)”识别模式下,我们尝试使用完整中文+完整英文音频,看看讯飞输入法的识别效果如何。

1cd758a359f033c4704ad3719ecbfebc.gif

——带口音普通话

受限于时代以及教育、地域的原因,尤其像爸妈那一代并不擅长用手机打字,普通话语音输入又常常带着一些浓重的口音,面临识别不准确的问题,怎样才能满足他们的语音输入需求呢?

针对这个痛点,最近新版讯飞输入法支持无切换的带口音普通话语音识,帮助这些用户们更好的使用语音输入功能与其他人聊天。

还记不记得去年在网络上一直刷屏的“雨女无瓜”,初看完全不懂在说什么,还在琢磨“雨女”和“无瓜”是什么关系?原来这四个字是出自《巴啦啦小魔仙》游乐王子经常挂在嘴边的塑料普通话,这种带口音、方言的话确实可爱,但如果真的语音输入“小盆友要有小盆友的亚子,要你寡,雨女无瓜”,输入法能反应过来吗?

fde88e469017656b8769d9b069e56688.gif

这里我们实测了一下,在默认中文“普通话(随心说)”识别模式下,我们使用上面那段“塑料普通话”,讯飞输入法准确打出“小朋友要有小朋友的样子,要你管,与你无关”,让对方看得明明白白。

南方版的“塑料普通话”试完了,我们再来测测北方的,依然是在默认中文“普通话(随心说)”识别模式下,作为地道山东人的笔者说出一句“你是个好银,肿么了”,讯飞输入法准确识别出“你是个好人,怎么了”。

842ede0d01bfe6469264f3abcd488be3.gif

iOS系统输入法

75e19379d9de4c621864ffcdbd8376e6.gif

讯飞输入法

如此好用的语音输入功能在手,确实不用为自己的口音、方言担忧了。

三、语音候选词识别效果体验

语音输入提高了我们手机端的打字效率,但实际使用中会发现,当语速快到“飞起”的时候,发音的连读现象可能导致识别结果不准,特别是嘟嘟囔囔的发音很容易出现偏差,以及前后鼻音不清晰,同音不同义。

面对这种“硬伤”,新版讯飞输入法提供“语音候选词”功能智能判断输入结果是否存在问题,从而快速修改。只要在讯飞输入法语音设置中勾选开启“语音候选词”,对已输入文字智能判断并给予正确候选建议。

3cfce17be1cbde4bebf73762263b8610.png

这是讯飞输入法首创的语音功能,即语音输入中实现智能纠错,提供中英字词候选,不仅是语音识别也是对语义的理解。主要解决用户发音不标准、同音异字的问题,能够节省用户修改和重新输入的时间。

开启该功能后,讯飞输入法会对输入结果进行智能判断,可能有误的地方标蓝进行定位提示;当点击标蓝处,候选栏就会出现可修正的结果(同音、近音或英文)。有了语音候选词功能,可快速定位可能输入有误的地方,用户不用删除整句重新输入。

新版讯飞输入法重点升级了“语音候选词”的能力,支持同时上屏中文和英文的候选结果,方便纠错或中英文的替换操作。

8b24d10eb803b251a3e19d7d4cdfd247.png

举个例子,原始识别结果为“英译”,而实际可能说的是中文“音译”,由此将可能的候选结果都展示出来,点击标蓝的“英译”就可以方便用户选择识别结果。还有很多类似的情况不胜枚举:

e35f6afe116d5b3d136fe1db6af14b75.png

四、超90分贝噪声环境+36分贝耳语实测

——耳语输入识别体验

通过前面的测试,我们看到无论是对普通话、带口音普通话还是语音候选词识别效果的优化,都可以让让使用语音输入的频率越来越高,说话秒变文字,缩短交流的时间成本。

可是,生活中总有一些地方比如安静的办公场所,比如说会议室或人多的地铁、电影院等公共场合,这时候大声说话来语音输入会显得十分尴尬,那么有没有化解之法?

eae92eb70316b28d4f2419b71f3cfb14.png

新版本的讯飞语音输入法提升了耳语输入的识别效果。顾名思义,耳语输入就是像用“耳语”般使用低分贝音量进行语音输入,即便声音很小也不会影响手机的语音识别准确率。

这项功能决了用户在很多场合环境下使用语音输入不便的痛点,无论安静的办公场所、会议室还是人多的地铁、电影院等公共场合都能继续语音输入。

ee5b5b952b11f0c6ab6796a163d33821.png

值得一提的是,新版语音输入自适应大声和耳语,在默认中文“普通话(随心说)”识别模式下,点击麦克风对着手机耳语说话,文字立即呈现在屏幕上,如此也不会打扰到周围人,还能继续畅快地使用语音输入。如果你常常因大声说话而尴尬,不妨来试一试讯飞输入法的耳语输入。

——噪声环境的语音输入识别效果

相信你此前一定遇到过这样的情况:街头嘈杂环境使用语音输入,偶尔会出现“反应迟钝”的现象。这是因为很多语音技术严重受限于应用场景,环境噪音的干扰导致了语音识别效果。在不改变录音设备终端的情况下,只有在软件层面进行优化才能有所改善。

c4d8cc40e755205b0bc9ff337f3cb575.png

此前我们在做科技讯飞硬件设备评测时曾领教过其降噪算法的能力

而科大讯飞很早之前就已经将噪音抗变换性工作做到了AI语音引擎之内。具体来说,在进行语音识别时,讯飞输入法会将待识别的语音处理成与模型训练时相一致的语音特征:实时语音录音先通过环境嗅探区分出噪音环境的分类(车内外噪音、会场音响噪音、地铁噪音等)。

4e9bfdac7da7f6b8f1f40a0a257b4f4f.gif

分领域噪音补偿可以基于环境嗅探的知识分辨出各种不同领域,自动采用不同的算法去除带噪语音中的噪音,从而达到提高信噪比的效果;而混合训练技术则可以弥补去噪后语音所产生的同真实安静语音的语谱差异。

以此实现噪音环境的识别性能大幅提升,综合形成抗噪解决方案。

五、语音互译与方言输入:9门外语、23种方言可选

——外语与中文互译

对于很多英文不太好人而言,和不会中文的外国人交流是一件比较困难的事情:先用中文拟好常用语,翻查外文字典编写成句;或者将中文复制到翻译APP中翻译,也有部分用户在网页上翻译,这再来观察翻译结果是不是真的贴切准确,比较浪费时间。

基于人工智能实现的机器翻译一直都是科大讯飞所倾注的领域之一,新版讯飞输入法的互译功能也有着更新,现在已经实现了9种语言与中文的即时翻译,包括英、日、韩、俄、泰、越、西、法、德,是目前市面上互译语种最多的输入法。

2019年世界人工智能大会(WAIC)上,科大讯飞“新一代语音翻译关键技术及系统”荣获2019年卓越人工智能引领奖(SAIL)应用奖,在国际口语机器翻译大赛IWSL2018端到端模型赛道夺得第一名。科大讯飞还是北京2022年冬奥会和残奥会官方自动语音转换与翻译独家供应商。

a34a49c7ffdc2d7deba28506e635ebc6.gif

以Android版快捷翻译韩语的操作为例。任意输入界面打开讯飞输入法,点击讯飞键在菜单面板找到“快捷翻译”,点击开启翻译工具栏,通过最左侧按钮查看选择翻译语种。在中韩状态下,输入中文上屏韩语;在韩中状态下,输入韩语上屏中文,免去来回切换翻译APP的繁琐操作,输入文字同时翻译出结果。

——方言输入识别

俗话说,“十里不同音”,中国地大物博,南北差异很大,不同的方言极具特色。

面对方言常用者与非方言用户沟通的强烈需求,新版讯飞输入法支持23种方言语音输入,也就是方言语音输入可以翻译成普通话文字,借此解决两个方言不同的国人之间的沟通障碍。

e412d856db5eca2cbdc6be5da2a7e9a0.png

六、离线语音输入体验:没网该咋用?

在没有网络、流量不足、网络不佳等情况下,手机本地编解码的离线语音输入便派上用场。为提升离线语音输入的实用性,早在上一个版本,也就是讯飞输入法9.0时,其离线语音识别率达96%,接近在线语音输入的效果。

986f336e81c84a331d2deb1f57e98121.png

在体验过程当中我们发现,讯飞输入法安离线语音输入不仅在无网络或网络不佳时正常使用语音输入,提升准确率的同时实现边说话边上屏的效果。开启离线语音以后,在“情景模式”中选择“网络不佳时自动开启”,尤为适合处于地铁、电梯、穿越隧道或者人流密集等网络不稳定的场景。

5ceb91976a5ec5e86f07d317153b631a.gif

七、总结:能动口再不动手 脱离键盘的自动档体验

最后我们来放一个小彩蛋——彻底消灭键盘,也可以实现语音转文字的调整修改,“莫得键盘”是语音/文字输入的最理想状态。在讯飞输入法的键盘模式菜单里选择“莫得键盘”,键盘形态完全消了,取而代之的是一个机器人头像,它叫“飞飞助手”。

需要进行语音输入时,只要轻点一下飞飞助手,用户可以随时通过语音口令编辑文字和标点、搜索表情和皮肤、打开剪贴板、切换输入法模式。

726d61c4b8393fb2a8a69cf905db5b9d.gif

举例来说,当需要编辑文字时,你可以直接说把“上楼”改成“下楼”;修改标点可以说把“逗号”改成“问号”;清空内容可以说“删除全部”;搜索表情可以说“搜索表情”;切换输入模式可以说“打开繁体输入”等等;甚至在完成文字输入之后,还可以动动嘴说“发送”即可发出信息。

在体验过Android V9.1.9671最新版的讯飞输入法之后,能够感受到其带来的便利,无论是真正的免切换语音输入、对语音候选词、耳语输入、噪声环境输入、语音翻译、方言语音输入等效果的提升,还是离线语音输入体验的优化,都大大降低了用户“动手”的频率。

再结合“飞飞助手”这样彻底消灭键盘的功能玩法,可以说讯飞输入法所提供的语音输入功能几乎快要让人摆脱键盘的束缚,实现了动动嘴就能完成文字输入、编辑、发送的玩法。

笔者在体验并习惯之后,现在已经懒得在手机上再用手写输入,如同开惯了自动档位的车,便很难再回手动挡。

想要体验Android V9.1.9671和iOS V9.1.2930最新版本的讯飞输入法,现在就可以去应用商店当中速度更新了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/381041.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

c#扩展方法奇思妙用性能篇一:扩展方法性能初测

最近写了几篇《c#扩展方法奇思妙用》的文章,一直只是讨论如何扩展、如何使用的问题,几乎没有涉及效率方面。而大家的回复好多都在问效率如何、性能怎样,也引起了我对效率的关注,今天将初步测试的结果发出来,大家一起探…

IDA

国庆礼物最强反编译工具 ida pro 7.0 破解补丁7.0sdk all sdk_utils 国内某团购群最新泄露的的版本 x86 arm x64 f5插件为最新版本 正版价值人民币3-5万 资源包含 ida pro 7.0 for mac ida pro 7.0 for windows IDA_Pro_7.0去局域网检测和兼容老版本idb补丁 2017/09/21 21…

AjaxToolKit学习笔记 之 ModalPopupExtender

1.控件功能描述 以模式窗口的方式弹出客户或服务器控件,以突出显示! 弹出的一般是DIV或PANEL. 2.控件属性描述 TargetControlID : 控制是否弹出的控件的ID. PopupDragHandleControlID : 允许拖拽的控件的ID. PopupControlID: 指定要弹出的控件的ID. BackgroundCssClass: 指定弹…

单片机涡轮流量传感器_关于涡轮流量计传感器的维护保养

涡轮流量计是一种精密流量测量仪表,与相应的流量积算仪表配套可用于测量液体的流量和总量。广泛用于石油、化工、冶金、科研等领域的计量、控制系统。配备有卫生接头的涡轮流量计传感器可以应用于制药、食品等行业。 涡轮流量计传感器部分的维护保养要注意以下几点&…

孩子在华艺舞校的画画投稿-天女之梦

转载于:https://www.cnblogs.com/speeding/archive/2010/05/24/2623966.html

controller控制器怎么写_I2C控制器编程_框架

来源:百问网_嵌入式Linux wiki_jz2440 新1期视频维基教程 (视频文字版)作者:韦东山本文字数:3776,阅读时长:5分钟我们现在来讲I2C控制器怎么写,它是I2C程序中最核心的地方,我们要先构造几个结构…

dosbox 伪指令dd为什么会报错_什么是SQL函数?为什么使用SQL函数可能会带来问题?...

本文已收录GitHub,更有互联网大厂面试真题,面试攻略,高效学习资料等函数在计算机语言的使用中贯穿始终,在 SQL 中我们也可以使用函数对检索出来的数据进行函数操作,比如求某列数据的平均值,或者求字符串的长…

centos7 docker删除端口映射_容器Docker详解

概述基本概念Docker是一个开源的应用容器引擎,基于Go语言并遵从Apache2.0协议开源。Docker可以让开发者打包他们的应用以及依赖包到一个轻量级、可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化。容器是完全使用沙箱机制&a…

深入解析结构化异常处理(SEH) - by Matt Pietrek

尽管以前写过一篇SEH相关的文章《关于SEH的简单总结》, 但那真的只是皮毛,一直对Windows异常处理的原理似懂非懂, 看了下面的文章 ,一切都豁然开朗. 1997年文章,Windows技术的根一直没变:http://www.micr…

@requestbody 接受int参数_C++之指针作为函数参数

C 允许您传递指针给函数&#xff0c;只需要简单地声明函数参数为指针类型即可。下面的实例中&#xff0c;我们传递一个无符号的 long 型指针给函数&#xff0c;并在函数内改变这个值&#xff1a;#include <iostream> #include <ctime>using namespace std; void ge…

c++怎么将文件中的数据读出并赋值给字符串_web前端开发过程中如何写JavaScript程序?...

script标签使用< script >< /script >src : 外联script 标签(立即调用,不能在该标签内写代码)< script >// 在标签内书写内容< /script >< script srcjavascript.js >// 这里面不能写任何内容< /script >一切准备就绪&#xff0c;让我们从…

简美电子相册

下载地址&#xff1a;微客互联 转载于:https://www.cnblogs.com/Witkey/archive/2010/06/10/1755755.html

3说明书_知行翻译:做化妆品说明书翻译时,这3点需要谨记

经过20多年的迅猛发展&#xff0c;被称为“美丽经济”的中国化妆品产业已经取得非常大的成就&#xff0c;在这20多年里&#xff0c;中国化妆品产业从小到大&#xff0c;从弱到强&#xff0c;从简单粗放到科技领先&#xff0c;已经逐步成为全世界最大的新兴市场&#xff0c;很多…

拉拢中小网站 淘宝百度暗战升级...

拉拢中小网站 淘宝百度暗战升级... 重庆晚报 讯 近日&#xff0c;大量淘宝联盟站长反映其网站在百度搜索结果大幅缩水&#xff0c;疑遭集体封杀。百度的理由是“清扫垃圾页面”。迟迟未表态的淘宝近日对前者进行了公开回应。至此&#xff0c;淘宝跟百度之间为拉拢中小网站的暗战…

.Net Remoting(基本操作) - Part.2 (转)

Remoting 构架 1.客户端(客户应用程序) 客户端的处理包含三个基本的组成部分&#xff0c;代理(Proxy)、格式器(Formatter) 和 通道(Channel)。 2.服务端(宿主应用程序) 服务端主要由 通道(Channel)、格式器(Formatter)、Stack Builder组成。 在服务端&#xff0c;宿主程序保持着…

转载——CVE-2019-0807

译文声明 本文是翻译文章&#xff0c;文章原作者mcafee&#xff0c;文章来源&#xff1a;securingtomorrow.mcafee.com 原文地址&#xff1a;https://securingtomorrow.mcafee.com/other-blogs/mcafee-labs/rdp-stands-for-really-do-patch-understanding-the-wormable-rdp-v…

angular移除事件绑定事件绑定_Vue.js子组件利用事件向父组件传输数据,以及sync修饰符和双向绑定...

在Vue.js的组件中&#xff0c;prop是“单向绑定”的&#xff0c;数据只能从父组件传输到子组件。Vue文档中的说了这样做的原因&#xff1a;所有的 prop 都使得其父子 prop 之间形成了一个单向下行绑定&#xff1a;父级 prop 的更新会向下流动到子组件中&#xff0c;但是反过来则…

1!+2!+3!+…+10!的和

1!2!3!…10!的和 代码 public class Test {public static void main(String[] args) {/*输出1&#xff01;2&#xff01;***10&#xff01;的和*/int sum0;int n1;for (int i 1; i <10 ; i) {for (int j1;j<i;j){nn*j;}sumn;n1;}System.out.println("sum"su…

ipad无法充电怎么办_IPAD充电线破损无法保修,资深“果粉”吐槽:店大欺客!...

应该有不少人都是在使用苹果的电子产品吧&#xff1f;包括iphone、ipad之类的。您在使用的过程中有没有发现一个问题&#xff0c;这些电子产品的充电线似乎很不经用&#xff0c;没多久就会发生断裂或者破损&#xff0c;但大部分人都很少会去较真&#xff0c;一般都是自己花钱再…

有一对兔子,从出生后第3个月起每个月都生一对兔子,小兔子长到第三个月后每个月又生一对兔子,假如兔子都不死,问每个月的兔子总数为多少?

代码 import java.util.Scanner;public class Testified {public static void main(String[] args) {Scanner scanner new Scanner(System.in);System.out.println("请输入月数:");int n scanner.nextInt();System.out.println("第"n"个月的兔子总…