顶顶通呼叫中心中间件-私有化asrproxy配置热词模型
1、配置热词文件
- 将热词存在一个txt文件中,比如:hotword.txt
- txt文本里面写热词,一个热词一行,用utf8编码
- 把热词文件上传到asrproxy程序目录中,路径:/ddt/asrproxy
- 类似于这种一个热词一行
2、安装热词模型并且配置在asrproxy.json
实时识别就下载这一个
curl -s http://down.ddrj.com/getasrmodel.sh | bash -s paraformer-large-contextual paraformer-large-online
一句话识别就下载这一个
curl -s http://down.ddrj.com/getasrmodel.sh | bash -s paraformer-large-contextual
修改热词模型配置,配置热词文件路径,可以用绝对路径,比如热词文件hotword.txt是放在:/ddt/asrproxy,那么就填:/ddt/asrproxy/hotword.txt。 可以根据自己的需求去复制下面内容,跟自己的asrproxy.json文件对比一下。
/*asrproxy启动不了,一般都是JSON格式不对,可以用 http://tools.jb51.net/code/jsonformat 这个工具检查JOSN是否存在错误。*/
{"key":"asrproxy.license", //授权文件路径"log":{"console_level":0, //输出控制台日志等级0-5(0:DEBUG, 1:INFO, 2:NOTICE, 3:WARNING, 4:CRIT, 5:CONSOLE)"file_level":0, //输出到文件日志等级0-5(0:DEBUG, 1:INFO, 2:NOTICE, 3:WARNING, 4:CRIT, 5:CONSOLE)"file_maxsize":100, //文件大于多少M就自动创建新的日志文件。"file_number":10 //最大保留日志文件个数},"short_sentence_asr":{"listen_ip":"0.0.0.0","listen_port":9990,"users":{// samrtivr.json配置的keylist.id"test":{ "not_validate_signature":true,//是否禁用验证签名,改为true,就是不验证签名 "key":"test", //smartivr.json配置的 keylist.secret"ip":"*" //*任意IP都可以访问,也可以限制可以访问的ip}}},"asr":{"listen_ip":"0.0.0.0","listen_port":9988,"storage":"record", //asr录音目录,调用asr时,设置了asr_params.recordfilename才会录音。"acl":"*", //哪些IP可以访问,配置*任意IP都可以访问,多个IP用逗号隔开,如果不配置acl,通过127.0.0.1不需要配置在ACL里面也可以访问。//顶顶通私有化实时识别16K大模型加热词修正"paraformer_realtime_16K": { "type": "funasr", "engine": "2pass", "quantize": true, "enable_itn": true, "itn-dir": "/ddt/asrproxy/funasr/fst_itn_zh", "vad-dir": "/ddt/asrproxy/funasr/speech_fsmn_vad_zh-cn-16k-common-onnx", "vad-quant": true, "punc-dir": "/ddt/asrproxy/funasr/punc_ct-transformer_zh-cn-common-vad_realtime-vocab272727-onnx", "model-dir": "/ddt/asrproxy/funasr/speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404-onnx", "online-model-dir": "/ddt/asrproxy/funasr/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online-onnx", "lm-dir": "/ddt/asrproxy/funasr/speech_ngram_lm_zh-cn-ai-wesp-fst", "hotword": "/ddt/asrproxy/hotword.txt", //这里填热词文件路径"chunk-size": 800},//顶顶通私有化一句话识别16K热词模型"paraformer_16K": { "type": "funasr", "engine": "sentence", "quantize": true, "enable_itn": true, "itn-dir": "/ddt/asrproxy/funasr/fst_itn_zh", "vad-dir": "/ddt/asrproxy/funasr/speech_fsmn_vad_zh-cn-16k-common-onnx", "vad-quant": true, "punc-dir": "/ddt/asrproxy/funasr/punc_ct-transformer_zh-cn-common-vocab272727-onnx", "model-dir": "/ddt/asrproxy/funasr/speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404-onnx", "online-model-dir": "", "lm-dir": "/ddt/asrproxy/funasr/speech_ngram_lm_zh-cn-ai-wesp-fst", "hotword": "/ddt/asrproxy/hotword.txt" //这里填热词文件路径},"asr配置名字:新加ASR配置会自动生效(1分钟之内)": {"说明": "已经存在的修改type,engine,appid,key,secret 不会生效,如果要修改这几个参数只能新添加一个ASR配置或者重启asrproxy程序,其他参数修改后自动生效"}},"groups":{//默认使用的ASR"default":{ "mode":0, //0:顺序使用,当使用数量等于count的时候切换下一个 1:循环使用"enable": //启用的那些ASR配置["paraformer_realtime_16K"]},"shortsentence":{"mode":0,"enable":["paraformer_16K"]},//自定义组,可以话术中指定使用那组ASR配置。"custom":{"mode":0,"enable":[]}}}},