开发语音产品时设计唤醒词和命令词的技巧

在实际开发语音产品过程中,要达到好的语音识别效果,除了语音算法要给力外,设计出好的唤醒词和命令词也能起到事倍功半的效果。所以下面介绍一下如何设计中文、英文和日文的唤醒词和命令词。

中文唤醒词设计

  1. 一般为4-6个字,4个字最佳,过短容误唤醒高,过长不便用户呼叫和记忆;
  2. 命令词中字的音节较长且相邻汉字的声韵母区分度越大越好;
  3. 应避免重复或者相近读音的字出现在唤醒词中。相邻音节要规避连音,即避免前一个韵母与后面声母相同或近似,比如“语音”;
  4. 字要发音清晰、能量响度高、开口度大,最好带有爆破音,声调建议选择第四声,如“灌溉”;
  5. 尽量选取不常说词作为唤醒词,可以有效降低误唤醒甚至避免误唤醒;
  6. 应避免使用叠词,如:“你好你好”、“宝宝开机”;
  7. 为提高发音能量,可选择包含爆破音声母的音节,如 p、b、t、d、k、g 等;
  8. 韵母选择大口型,开口音的韵母,比如 a、ai、an、ian、ao,避免 e、i、en、in 等;
  9. 中文命令词中只能由汉字组成,不允许有空格,逗号等其他字符;
  10. 平台提供了唤醒评价功能,如唤醒词的适合度为“优”,则是一个较好的唤醒词;
  11. 一个模型仅允许一个唤醒词,如果需要多个唤醒词,请单独优化并使用多网络切换功能。

中文命令词设计

  1. 一般为4-6个字,4个字最佳,过短容误识高,过长不便用户呼叫和记忆;
  2. 命令词中相邻汉字的声韵母区分度越大越好;
  3. 符合用户的语言习惯,尽量采用常用说法,内容具体直接;
  4. 应避免使用日常用语,如:“吃饭啦”;
  5. 生僻字和零声母字应尽量避免,如“语音识别”中“语音”两个字均为零声母字;
  6. 命令词中的字最好不要有语气词,如“啊”、“呢”等;
  7. 应避免使用叠词,如:“你好你好”;
  8. 中文命令词中只能由汉字组成,不允许有空格,逗号等其他字符;
  9. 命令词中的数字需要以汉字表示,如“调高一度”;
  10. 若您还未确定命令词,建议您从文档中心的“命令词推荐”中选择。

英文唤醒词设计

  1. 唤醒词建议由2-4个单词(4-6个音节)组成,过短容易出现高误唤醒,过长不便用户呼叫和记忆;
  2. 唤醒词中单词的音节较长且相邻发音区分度越大越好;
  3. 应避免重复或者相近读音的单词出现在唤醒词中,相邻音节要规避连音;
  4. 单词要发音清晰、能量响度高、开口度大;
  5. 尽量选取不常用的词作为唤醒词,避免使用日常用语,可以有效降低误唤醒甚至避免误唤醒;
  6. 应避免使用叠词,如:“HELLO-HELLO”;
  7. 一个语言模型仅允许一个唤醒词,如果需要多个唤醒词,请单独优化并使用多网络切换功能,具体方法可联系我司技术支持人员获取更多信息。

英文命令词设计

  1. 建议由2-4个单词(4-6个音节)组成,过短容易出现高误识,过长不便用户记忆;
  2. 命令词间音节区分度越大越好;
  3. 符合用户的语言习惯,尽量采用常用说法,内容具体直接;
  4. 应避免使用日常用语,如:“HI、HELLO”;
  5. 避免使用相似音节,词的发音清晰响度要大,如避免同时使用TURN-ON和TURN-OFF;
  6. 应避免使用叠词,如:“HELLO-HELLO”。

日文唤醒词设计

  1. 唤醒词建议由4-6个音节的日文组成,过短容易出现高误唤醒,过长不便用户呼叫和记忆;
  2. 唤醒词中单词的音节较长且相邻发音区分度越大越好;
  3. 应避免重复或者相近读音的词出现在唤醒词中,相邻音节要规避连音;
  4. 词要发音清晰、能量响度高、开口度大;
  5. 尽量选取不常用的词作为唤醒词,避免使用日常用语,可以有效降低误唤醒甚至避免误唤醒;
  6. 应避免使用叠词,如:如:“ラボ-ラボ”;
  7. 一个语言模型仅允许一个唤醒词,如果需要多个唤醒词,请单独优化并使用多网络切换功能,具体方法可联系我司技术支持人员获取更多信息。

日文命令词设计

  1. 一条日语命令词建议由4-6个音节的日文组成,过短容易出现高误识,过长不便用户呼叫和记忆;
  2. 命令词间音节区分度越大越好;
  3. 符合用户的语言习惯,尽量采用常用说法,内容具体直接;
  4. 应避免使用日常用语,如:“はい、おはよ”;
  5. 避免使用相似音节,词的发音清晰响度要大,如;下げて(sa ge te)、上げて(a ge te);
  6. 应避免使用叠词,如:“ラボ-ラボ”。

只要唤醒词和命令词设计得当,产品的识别率和误识别率都能改进很多。启英泰伦文档中心提供多个热门领域(包含空调、风扇、插座、窗帘、照明等)标准命令词参考,下载即用,让产品开发更简单。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/635016.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

setinel 阿里的限流方式

启动命令 java -jar sentinel-dashboard-1.8.1.jar --server.port8082 账号密码都是 sentinel 导入依赖 配置文件配置 spring:cloud:#限流sentinel:transport:#默认地址dashboard: localhost:8082 #配置security验证账号和密码security:user:name: adminpassword: admin #fe…

Nginx详细介绍(并从技术层面深度剖析)

nginx介绍 1.nginx 介绍2.nginx的优势3.Nginx VS Apache3.1.内核、语言、诞生时间比较3.2.功能比较3.3.Nginx 相对 apache 的优点 4.Nginx为什么有这么多的优势?4.1.IO多路复用(I/O multiplexing【多并发】)4.2.nginx的驱动模型介绍4.3.nginx…

削峰填谷与应用间解耦:分布式消息中间件在分布式环境下并发流量控制的应用

这是《百图解码支付系统设计与实现》专栏系列文章中的第(18)篇,也是流量控制系列的第(4)篇。点击上方关注,深入了解支付系统的方方面面。 本篇重点讲清楚分布式消息中间件的特点,常见消息中间件…

MiniTab的相关性统计

相关概述 相关可以度量两个变量之间关联的强度和方向。可以在以下两种相关方法之间进行选择:Pearson 积矩相关和 Spearman 秩次相关。Pearson 相关(又称为 r)是最常见的方法,它度量两个连续变量之间的线性关系。 如果变量之间的…

通讯录项目的实现以及动态顺序表(基于顺序表)

首先我们要知道什么是顺序表: 顺序表的底层结构是数组,对数组的封装,实现了常⽤的增删改查等接⼝,顺序表分为静态顺序表(使⽤定⻓数组存储元素)和动态顺序表(按需申请) 静态顺序表缺点: 空间给少了不够⽤,给多了造成空间浪费 拿出来我之前以及写好了的顺序表的代码:…

SQL SERVER无法连接到服务器解决过程记录

很久没用sql server了,这几天打算更新SQL SERVER数据库:SQL看这一篇就看够了(附详细代码及截图) 这篇文章,发现连接不上服务器。 找一下解决办法。 一、打开服务界面 在键盘上按“WINR”快捷键,打开运行…

rust使用protobuf

前言 c,java,go 等直接是用 ,具体就不说了,这章主要讲述rust 使用protobuf 这章主要讲述2种 1 > protoc protoc-gen-rust plugin 2> protoc prost-build 1:环境 win10 rustrover64 25-2 下载地址 https://github.com/protocolbu…

简单实用的恒温控制器

工作原理如下:ST是WTQ-288型电接点压力式温度计,当恒温箱内的温度降低到下限时,ST的指针与下限接点接触,双向可控硅通过R被强制触发导通,接通加热器RL的电源,于是恒温箱内温度上升。ST的指针转动&#xff0…

插入排序(一)——直接插入排序与希尔排序

目录 一.前言 二.排序的概念及其运用 1.1排序的概念 1.2 常用排序算法 三.常用排序算法的实现 3.1 插入排序 3.1.1 基本思想 3.1.2 直接插入排序 3.1.3 希尔排序(缩小增量排序) 四.全部代码 sort.c sort.h test.c 五.结语 一.前言 本文我们…

航空飞行器运维VR模拟互动教学更直观有趣

传统的二手车鉴定评估培训模式存在实践性不强、教学样本不足、与实际脱节等一些固有的不足。有了VR虚拟仿真技术的加持,二手车鉴定评估VR虚拟仿真实训系统逐渐进入实训领域,为院校及企业二手车检测培训提供了全新的解决方案。 高职院校汽车专业虚拟仿真实…

DC-3靶机刷题记录

靶机下载地址: 链接:https://pan.baidu.com/s/1-P5ezyt5hUbmmGMP4EI7kw?pwdrt2c 提取码:rt2c 参考: http://t.csdnimg.cn/hhPi8https://www.vulnhub.com/entry/dc-32,312/ 官网http://t.csdnimg.cn/5mVZ7DC-3 (1).pdfhttps://…

模具制造企业ERP系统有哪些?企业怎么选型适配的软件

模具的生产管理过程比较繁琐,涵盖接单报价、车间排期、班组负荷评估、库存盘点、材料采购、供应商选择、工艺流转、品质检验等诸多环节。 有些采用传统管理手段的模具制造企业存在各业务数据传递不畅、信息滞后、不能及时掌握订单和车间生产情况,难以对…

【CF比赛记录】 —— Codeforces Round 920 (Div. 3)(A、B、C、D)

🌏博客主页:PH_modest的博客主页 🚩当前专栏:CF比赛记录 💌其他专栏: 🔴每日一题 🟡 cf闯关练习 🟢 C语言跬步积累 🌈座右铭:广积粮,缓…

【ARMv8M Cortex-M33 系列 7.1 -- xPSR | CFSR | HFSR | BFAR | MMFAR 寄存器】

文章目录 问题背景Cortex-M33 Fault 寄存器介绍xPSR (程序状态寄存器)CFSR (可配置故障状态寄存器)HFSR (硬件故障状态寄存器)BFAR (总线故障地址寄存器)MMFAR (内存管理故障地址寄存器) 问题背景 由于在RA4M2(Cortex-M33)移植RT-Thread OS的时候遇到了…

第十五届蓝桥杯单片机组——串口通信UART

文章目录 一、什么是串口通信二、UART重要参数三、利用STC-ISP生成初始化代码四、使用UART发送和接收数据 一、什么是串口通信 微控制器与外部设备的数据通信,根据连线结构和传送方式的不同,可以分为两种:并行通信和串行通信。   并行通信:指数据的各位…

亚马逊云科技 WAF 部署小指南(六)追踪 Amazon WAF Request ID,排查误杀原因

众所周知,中国是全球制造业的巨大力量,许多中国企业通过 2B 电商平台网站进行商品销售和采购。在这些电商平台上,Web 应用防火墙(WAF)成为不可或缺的安全工具。然而,WAF 也可能导致误杀问题。一旦误杀发生&…

计算机毕设thinkphp+mysql+_vue房屋租赁系统h3sem

运行环境:phpstudy/wamp/xammp等 开发语言:php 后端框架:Thinkphp5 前端框架:vue.js 服务器:apache 数据库:mysql 数据库工具:Navicat/phpmyadmin 房屋租赁管理系统有不同的用户角色。不同的用户权限对应不…

【办公类-21-03】20240119 提取不连续的男女学号 set()和list法

背景需求:了解班级幼儿性别比例 查看点名册,发现中4班最初的学号是按照先男后女的方式排列,但是随着幼儿转出,空出一些学号,于是新插班的孩子就插入空的学号,空格插完了,就排在学号尾部。 我想…

Docker Consul详解与部署示例

目录 Consul构成 Docker Consul 概述 Raft算法 服务注册与发现 健康检查 Key/Value存储 多数据中心 部署模式 consul-template守护进程 registrator容器 consul服务部署(192.168.41.31) 环境准备 搭建Consul服务 查看集群信息 registrato…

YOLOv5改进 | 主干篇 | 华为GhostnetV1一种移动端的专用特征提取网络

一、本文介绍 本文给大家带来的改进机制是华为移动端模型Ghostnetv1,华为GhostnetV1一种移动端的专用特征提取网络,旨在在计算资源有限的嵌入式设备上实现高性能的图像分类。GhostNet的关键思想在于通过引入Ghost模块,以较低的计算成本增加了特征图的数量,从而提高了模型的…