微软语音使用小计

简介

使用微软语音可以实现语音转文字和文字转语音。测试了下,使用还是挺方便的。

使用微软语音有两种方式。一种是使用命令行的形式,另一种是调用SDK的方式。

适合使用语音 CLI 的情况:

  • 想在极少设置且无需编写代码的情况下试验语音服务功能。
  • 对使用语音服务的生产应用程序的要求相对简单。

适合使用语音 SDK 的情况:

  • 需要在特定语言或平台(如 C#、Python 或 C++)中集成语音服务功能。
  • 你有可能需要高级服务请求的复杂需求。
  • 你要开发自定义行为,包括响应流。

语音CLI

语音 CLI 是一种命令行工具,用于在不编写任何代码的情况下使用语音服务。 语音 CLI 需要的设置很少。

核心功能

        语音识别:将音频文件中的或直接将麦克风语音转换为文本,或转录录制的对话。

        语音合成:将文本文件中输入的文本或直接来自于命令行的输入文本转换为语音。 使用语音合成标记语言 (SSML) 配置自定义语音输出特征。

        语音翻译:将源语言的音频翻译为目标语言的文本或音频。

        在 Azure 计算资源上运行:使用 spx webjob 发送语音 CLI 命令以在 Azure 远程计算资源上运行。

使用说明
下载安装

第一步下载安装: Microsoft Visual C++ Redistributable for Visual Studio 2019

第二步下载安装: .NET 6

第三步下载安装语音插件:

命令行安装

dotnet tool install --global Microsoft.CognitiveServices.Speech.CLI

命令行更新

dotnet tool update --global Microsoft.CognitiveServices.Speech.CLI

配置账户

假定你已经申请了账户,如果没有可以到Microsoft Azure 门户 | Microsoft Azure注册试用账户

//这里使用cmd控制台配置账户到当前路径

spx config @key --set SPEECH-KEY
spx config @region --set SPEECH-REGION

//查看配置信息

spx config @key
spx config @region

//删除配置信息

spx config @key --clear
spx config @region --clear

使用

//查看帮助

spx

//查看指定主题的帮助信息

spx help find --topics "examples"

语音转文本

//识别麦克风输入的音频,运行该命令后,SPX 开始在当前活动的输入设备上侦听音频。 当你选择 Enter 时,SPX 将停止侦听。 然后,语音音频将被识别并转换为控制台输出中的文本

spx recognize --microphone

//将指定音频文件转为文本输出

spx recognize --file /path/to/file.wav

文本转语音

//以下命令会将文本作为输入,然后将合成的语音输出到当前活动的输出设备(例如计算机扬声器)

spx synthesize --text "Testing synthesis using the Speech CLI" --speakers

//你还可将合成的输出保存到文件中。 在此示例中,我们可以在运行命令的目录中创建一个名为 my-sample 的文件

spx synthesize --text "Enjoy using the Speech CLI." --audio output my-sample.wav

//获取语音列表

spx synthesize --voices

//使用指定语音输出

spx synthesize --text "Bienvenue chez moi." --voice fr-FR-AlainNeural --speakers

语音到文本的转换

//借助语音 CLI,你还可以执行语音到文本的转换。 运行以下命令,可从默认的麦克风捕获音频,并以文本形式输出转换。 记住,你需要通过 translate 命令提供 source 和 target 语言

spx translate --microphone --source en-US --target ru-RU

将语音翻译成多种语言时,请用分号 (;)分隔语言代码

spx translate --microphone --source en-US --target 'ru-RU;fr-FR;es-ES'

如果要保存转换的输出,请使用 --output 标志。 在本例中,还可以从文件中进行读取

spx translate --file /some/file/path/input.wav --source en-US --target ru-RU --output file /some/file/path/russian_translation.txt

官方说明文档:如何基于文本合成语音 - 语音服务 - Azure AI services | Microsoft Learn

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/14726.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

最简单的方式解决android studio 模拟器无法联网的问题

最简单的方式解决android studio 模拟器无法联网的问题 看了网上很多解决android studio内置模拟器无法联网的问题,基本上都是在模拟器手机上配置dns,个人试了多种办法也连不上网,现在给出一种,仅需要在命令行操作的解决安卓模拟…

轻松拿捏C语言——二分查找

🥰欢迎关注 轻松拿捏C语言系列,来和 小哇 一起进步!✊ 🌈感谢大家的阅读、点赞、收藏和关注💕 目录🎉 一、介绍🌈 二、步骤🌙 三、代码☀️ 一、介绍 二分查找是一种在有序数组中…

【Linux-驱动开发】

Linux-驱动开发 ■ Linux-应用程序对驱动程序的调用流程■ Linux-file_operations 结构体■ Linux-驱动模块的加载和卸载■ 1. 驱动编译进 Linux 内核中■ 2. 驱动编译成模块(Linux 下模块扩展名为.ko) ■ Linux-■ Linux-■ Linux-设备号■ Linux-设备号-分配■ 静态分配设备号…

React Native 之 主题偏好(十一)

如果你的 React Native 版本较新,它提供一个主题API useColorScheme,你可以直接使用它。如果不是,需安装额外的库,如react-native-appearance。 下面是一个使用 react-native-appearance(或 useColorScheme&#xff0…

家电维修上门维修小程序怎么搭建制作?

​在家庭生活中,家电的维修问题一直是人们关注的焦点。随着微信小程序的普及,家电维修服务行业也迎来了线上转型的机遇。一款便捷、高效的家电维修上门维修小程序,不仅能为维修服务商带来新的客户,也能为用户带来更便捷的服务体验…

[Algorithm][动态规划][路径问题][下降路径最小和][最小路径和][地下城游戏]详细讲解

目录 1.下降路径最小和1.题目链接2.算法原理详解3.代码实现 2.最小路径和1.题目链接2.算法原理详解3.代码实现 3.地下城游戏1.题目链接2.算法原理详解3.代码实现 1.下降路径最小和 1.题目链接 下降路径最小和 2.算法原理详解 思路: 确定状态表示 -> dp[i][j]的…

用WPS将多张图片生成一个pdf文档,注意参数设置

目录 1 新建一个docx格式的文档 2 向文档中插入图片 3 设置页边距 4 设置图片大小 5 导出为pdf格式 需要把十几张图片合并为一个pdf文件,本以为很简单,迅速从网上找到两个号称免费的在线工具,结果浪费了好几分钟时间,发现需要…

面试-软件工程与设计模式相关,Spring简介

面试-软件工程与设计模式相关,Spring简介 1.编程思想1.1 面向过程编程1.2 面向对象编程1.2.1 面向对象编程三大特征 1.3 面向切面编程1.3.1 原理1.3.2 大白话?1.3.3 名词解释1.3.4 实现 2. 耦合与内聚2.1 耦合性2.2 内聚性 3. 设计模式3.1 设计模型七大原…

【Nodejs-多进程之Cluster】

cluster 模块是 Node.js 提供的一个用于多进程的模块,它可以轻松地创建一组共享同一个服务器端口的子进程(worker进程)。通过使用 cluster 模块,可以充分利用多核系统,提高应用程序的性能和可靠性。 基本原理 cluste…

#php把pdf文件转成图片#

本地环境 系统:win11 64位 环境:phpStudy PHP版本:8.0.2 矿建:laravel 配置扩展 一、安装imageMagick 下载地址:https://imagemagick.org/script/download.php 安装版本:ImageMagick-最新版本-Q16-HDRI-x64…

Docker: exec命令浅析

简介 Docker exec命令是Docker提供的一个强大工具,用于在正在运行的容器中执行命令。在此将介绍Docker exec命令的用法和示例,帮助大家更好地理解和使用这个命令。 Docker是一种流行的容器化平台,允许用户在容器中运行应用程序。有时候&#…

React开发环境配置详细讲解-04

React环境 前端随着规范化,可以说规范和环境插件配置满天飞,笔者最早接触的是jquery,那个开发非常简单,只要引入jquery就可以了,当时还写了一套UI框架,至今在做小型项目中还在使用,show一张效果…

一款颜值颇高的虚拟列表!差点就被埋没了,终于还是被我挖出来了

大家好,我是晓衡! 今天,推荐一款颇有颜值的虚拟列表组件,不然真的被埋没就可惜了! 我们先来看下效果: 感觉怎么样?还不错吧! 为什么说这个资源差点被埋没呢?因为个朋友找…

用数据,简单点!奇点云2024 StartDT Day数智科技大会,直播见

在充满挑战的2024,企业如何以最小化的资源投入和试错成本,挖掘新的增长机会,实现确定性发展? “简单点”是当前商业环境的应对策略,也是奇点云2024 StartDT Day的核心理念。 5月28日,由奇点云主办的2024 S…

Linux —— 信号量

Linux —— 信号量 什么是信号量P操作(Wait操作)V操作(Signal操作)信号量的类型 一些接口POSIX 信号量接口:其他相关命令: 基于循环队列的生产者和消费者模型同步关系 多生产多消费 我们今天接着来学习信号…

【译】组复制和 Percona XtraDB 集群: 常见操作概述

原文地址:Group Replication and Percona XtraDB Cluster: Overview of Common Operations 在这篇博文中,我将概述使用 MySQL Group Replication 8.0.19(又称 GR)和 Percona XtraDB Cluster 8 (PXC)(基于 Galera&…

Jetbrains插件AI Assistant,终于用上了

ai assistant激活成功后,如图 ai assistant获取:https://web.52shizhan.cn/activity/ai-assistant 主要功能如下

Spring Boot 配置使用 PEM 格式SSL/TLS证书和私钥

传统的为 Spring Boot 配置SSL/TLS证书一般都会把证书打包成 JKS(Java KeyStore) 或 PKCS12 (Public Key Cryptographic Standards) 格式,然后为Spring Boot 增加以下类似配置: # The format used for the keystore. It could be set to JKS in case it…

SpringBoot(六)之内嵌容器

SpringBoot(六)之内嵌容器 文章目录 SpringBoot(六)之内嵌容器内嵌容器的特点如何替换默认容器1.pom形式2.主动配置 如何通过配置切换serlvet容器 Spring Boot 提供了一种便捷的方式来创建独立运行的 Spring 应用程序,…