在实际开发语音产品过程中,要达到好的语音识别效果,除了语音算法要给力外,设计出好的唤醒词和命令词也能起到事倍功半的效果。所以下面介绍一下如何设计中文、英文和日文的唤醒词和命令词。
中文唤醒词设计
- 一般为4-6个字,4个字最佳,过短容误唤醒高,过长不便用户呼叫和记忆;
- 命令词中字的音节较长且相邻汉字的声韵母区分度越大越好;
- 应避免重复或者相近读音的字出现在唤醒词中。相邻音节要规避连音,即避免前一个韵母与后面声母相同或近似,比如“语音”;
- 字要发音清晰、能量响度高、开口度大,最好带有爆破音,声调建议选择第四声,如“灌溉”;
- 尽量选取不常说词作为唤醒词,可以有效降低误唤醒甚至避免误唤醒;
- 应避免使用叠词,如:“你好你好”、“宝宝开机”;
- 为提高发音能量,可选择包含爆破音声母的音节,如 p、b、t、d、k、g 等;
- 韵母选择大口型,开口音的韵母,比如 a、ai、an、ian、ao,避免 e、i、en、in 等;
- 中文命令词中只能由汉字组成,不允许有空格,逗号等其他字符;
- 平台提供了唤醒评价功能,如唤醒词的适合度为“优”,则是一个较好的唤醒词;
- 一个模型仅允许一个唤醒词,如果需要多个唤醒词,请单独优化并使用多网络切换功能。
中文命令词设计
- 一般为4-6个字,4个字最佳,过短容误识高,过长不便用户呼叫和记忆;
- 命令词中相邻汉字的声韵母区分度越大越好;
- 符合用户的语言习惯,尽量采用常用说法,内容具体直接;
- 应避免使用日常用语,如:“吃饭啦”;
- 生僻字和零声母字应尽量避免,如“语音识别”中“语音”两个字均为零声母字;
- 命令词中的字最好不要有语气词,如“啊”、“呢”等;
- 应避免使用叠词,如:“你好你好”;
- 中文命令词中只能由汉字组成,不允许有空格,逗号等其他字符;
- 命令词中的数字需要以汉字表示,如“调高一度”;
- 若您还未确定命令词,建议您从文档中心的“命令词推荐”中选择。
英文唤醒词设计
- 唤醒词建议由2-4个单词(4-6个音节)组成,过短容易出现高误唤醒,过长不便用户呼叫和记忆;
- 唤醒词中单词的音节较长且相邻发音区分度越大越好;
- 应避免重复或者相近读音的单词出现在唤醒词中,相邻音节要规避连音;
- 单词要发音清晰、能量响度高、开口度大;
- 尽量选取不常用的词作为唤醒词,避免使用日常用语,可以有效降低误唤醒甚至避免误唤醒;
- 应避免使用叠词,如:“HELLO-HELLO”;
- 一个语言模型仅允许一个唤醒词,如果需要多个唤醒词,请单独优化并使用多网络切换功能,具体方法可联系我司技术支持人员获取更多信息。
英文命令词设计
- 建议由2-4个单词(4-6个音节)组成,过短容易出现高误识,过长不便用户记忆;
- 命令词间音节区分度越大越好;
- 符合用户的语言习惯,尽量采用常用说法,内容具体直接;
- 应避免使用日常用语,如:“HI、HELLO”;
- 避免使用相似音节,词的发音清晰响度要大,如避免同时使用TURN-ON和TURN-OFF;
- 应避免使用叠词,如:“HELLO-HELLO”。
日文唤醒词设计
- 唤醒词建议由4-6个音节的日文组成,过短容易出现高误唤醒,过长不便用户呼叫和记忆;
- 唤醒词中单词的音节较长且相邻发音区分度越大越好;
- 应避免重复或者相近读音的词出现在唤醒词中,相邻音节要规避连音;
- 词要发音清晰、能量响度高、开口度大;
- 尽量选取不常用的词作为唤醒词,避免使用日常用语,可以有效降低误唤醒甚至避免误唤醒;
- 应避免使用叠词,如:如:“ラボ-ラボ”;
- 一个语言模型仅允许一个唤醒词,如果需要多个唤醒词,请单独优化并使用多网络切换功能,具体方法可联系我司技术支持人员获取更多信息。
日文命令词设计
- 一条日语命令词建议由4-6个音节的日文组成,过短容易出现高误识,过长不便用户呼叫和记忆;
- 命令词间音节区分度越大越好;
- 符合用户的语言习惯,尽量采用常用说法,内容具体直接;
- 应避免使用日常用语,如:“はい、おはよ”;
- 避免使用相似音节,词的发音清晰响度要大,如;下げて(sa ge te)、上げて(a ge te);
- 应避免使用叠词,如:“ラボ-ラボ”。
只要唤醒词和命令词设计得当,产品的识别率和误识别率都能改进很多。启英泰伦文档中心提供多个热门领域(包含空调、风扇、插座、窗帘、照明等)标准命令词参考,下载即用,让产品开发更简单。