一、检查docker容器是否启动
1.输入命令 systemctl status docker
启动 systemctl start docker
守护进程重启 sudo systemctl daemon-reload
重启docker服务 systemctl restart docker
重启docker服务 sudo service docker restart
关闭docker service docker stop
关闭docker systemctl stop docker
检查docker状态 systemctl status docker
若docker正常启动则显示界面如下
2.启动服务时可能出现报错
可能为权限不够导致
输入su,并输入当前用户登录密码即可进入root权限模式,再次启动即可
Docker启动失败报错Failed to start Docker Application Container Engine解决方案
二、docker启动paddlespeech镜像
1.安装
初始需要下载镜像到本地,参照官方文档docker安装paddlespeech,并启动服务
#下载并启动服务
docker run --name dev -v $PWD:/mnt -p xxxx:xxxx -it paddlecloud/paddlespeech:develop-cpu-fb4d25 /bin/bash
其中xxxx:xxxx,前为端口映射端口,后为实际请求端口
比如想启动paddlespeech基础服务需要将实际请求设置为8090,包含中文语音识别,中文语音合成等等
但此服务语音识别和合成只能识别中文以及数字,字母及英文无法识别,使用需要注意
2.二次使用
docker run -p XXXX:XXXX -it paddlecloud/paddlespeech:develop-cpu-fb4d25 /bin/bash
使用此命令即可启动paddlespeech镜像
若想查看当前有哪些镜像,使用 docker images 命令即可查看
三、启动paddlespeech服务
1.官方文档说明有三种服务启动方式
#启动AI Studio服务,即包括语音识别,语音合成,音频分类等多种服务
paddlespeech_server start --config_file ./speech_server/conf/application.yaml
#启动完毕,即可看到启动端口为8090
#需要在启动docker镜像时指定实际端口
#启动流式tts服务
paddlespeech_server start --config_file ./demos/streaming_tts_server/conf/tts_online_application.yaml
#启动流式asr服务
paddlespeech_server start --config_file ./demos/streaming_asr_server/conf/application.yaml
启动成功后应该显示
[2023-05-02 07:16:34,644] [ INFO] - start to init the engine
[2023-05-02 07:16:34,644] [ INFO] - asr : python engine.
W0502 07:16:37.497296 1187 gpu_resources.cc:61] Please NOTE: device: 0, GPU Compute Capability: 8.9, Driver API Version: 12.1, Runtime API Version: 11.7
W0502 07:16:37.502528 1187 gpu_resources.cc:91] device: 0, cuDNN Version: 8.8.
2023-05-02 07:16:38.195 | INFO | paddlespeech.s2t.modules.embedding:__init__:153 - max len: 5000
[2023-05-02 07:16:39,064] [ INFO] - Initialize ASR server engine successfully on device: gpu:0.
[2023-05-02 07:16:39,064] [ INFO] - tts : python engine.
...
[2023-05-02 07:16:55] [INFO] [on.py:61] Application startup complete.
INFO: Uvicorn running on http://127.0.0.1:8090 (Press CTRL+C to quit)
[2023-05-02 07:16:55] [INFO] [server.py:212] Uvicorn running on http://127.0.0.1:8090 (Press CTRL+C to quit)
2.若想使用中英文混合语音合成可以使用飞浆另一个产品PP-TTS飞浆文档
这里不多做说明,需要自行文档查阅
四、使用服务
1.使用以上服务可以有三种方法验证
1、命令行
2、api接口
3、python程序调用
此文档 paddlespeech正常服务使用方法 具体说明每一种使用方式
若想使用流式tts和流式asr服务请参考以下文档
https://github.com/PaddlePaddle/PaddleSpeech/wiki/PaddleSpeech-Server-RESTful-API
PaddleSpeech Server WebSocket API · PaddlePaddle/PaddleSpeech Wiki · GitHub
使用postman请求,并带body参数请求服务,需要注意请求类型,正常服务一般为post请求
2.请求返回数据
audio数据为base64码,需要转为wav编码即可听到合成音频
到此服务启动->调用接口->使用数据结束
结束