Github:ChatTTS从下载到使用

前言

  • 本文使用工具:
    • Anaconda :直接进行包管理,用来自定义生成python解释器,虚拟环境
    • vscode:用来执行代码

注:我使用的Ubuntu,使用win,mac等,需要额外配置


简介

ChatTTS是专门为对话场景设计的文本转语音模型,bilibili宣传视频
项目地址

安装

1. 创建虚拟环境并激活:

conda create -n chattts_env python=3.11
conda activate chattts_env

2. 克隆项目并安装依赖:

git clone https://github.com/2noise/ChatTTS.git
cd ChatTTS
pip install -r requirements.txt

3. 文章目录结构

├── ChatTTS
│   ├── core.py
│   ├── experimental
│   │   └── llm.py
│   ├── infer
│   │   └── api.py
│   ├── __init__.py
│   ├── model
│   │   ├── dvae.py
│   │   └── gpt.py
│   └── utils
│       ├── gpu_utils.py
│       ├── infer_utils.py
│       └── io_utils.py
├── example.ipynb
├── LICENSE
├── README_CN.md
├── README.md
├── requirements.txt
└── webui.py

使用

  • 输入code . 用打开vscode,启动webui.py

在这里插入图片描述


问题

Q:安装依赖过程中遇到了下载CUDA组件错误

A:因为代码需要使用到pytorch框架,所以可以看我的这篇文章手动配置CUDA组件https://blog.csdn.net/unravel_tom/article/details/139197086主要是用win来配置的

ubuntu就可以使用以下命令直接配置

conda install -c conda-forge cudatoolkit=12.1 cudnn=8.9

Q:缺少常见的依赖

A:

pip install gradio
pip install WeTextProcessing

Gradio 是一个非常有用的工具,用于创建交互式的机器学习应用界面。它允许用户通过简单的代码快速搭建网络界面,方便展示和测试模型。它支持多种输入和输出类型,包括文本、图像、音频等,且易于集成和部署。

WeTextProcessing 是一个用于文本处理的库,包含多种文本预处理和特征提取工具。这些工具包括分词、词性标注、命名实体识别、情感分析等,帮助开发者在自然语言处理(NLP)任务中更高效地处理和分析文本数据。它支持多种语言,易于集成到现有的NLP工作流中,是开发和研究文本处理应用的有力工具。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/20555.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【环境栏Composer】Composer常见问题(持续更新)

1、执行composer install提示当前目录中没有 composer.lock 文件时 No composer.lock file present. Updating dependencies to latest instead of installing from lock file. See https://getcomposer.org/install for more information. Composer 在执行 install 命令时会…

浅谈大模型的优缺点以及优化方法

引言 人工智能大模型,如深度学习模型、神经网络模型等,已经改变了我们对数据处理和分析的方式。然而,尽管它们在各种应用中表现出色,但也存在一些挑战和限制。本文将详细探讨人工智能大模型的优点和缺点,并提出一些方…

【第六节】C++中的模板

目录 前言 一、函数模板 二、模块特化 三、重载函数模板 四、类模板 五、总结 前言 模板是C编程中的一种强大工具,它允许程序员创建具有通用数据类型的函数库和类库。作为支持参数多态性的机制,模板极大地增强了代码的复用性和灵活性。 在C语言中&#x…

Pytorch线性回归

使用pytorch来重现线性模型的过程,构造神经网络module,构造损失函数loss,构造随机梯度下降的优化器sgd。 一 revise 首先确定我们的模型,我们希望完成的目标就是得到较小的loss,所以我们就需要一个标量值的loss。 那…

YOLOv10(2):网络结构及其检测模型代码部分阅读

YOLOv10(1):初探,训练自己的数据-CSDN博客 目录 1. 写在前面 2. 局部模块 (1)SCDown (2)C2fCIB (3)PSA(partial self-attention) 3. 代码解读 &#x…

手把手教大家如何使用Kaggle平台的免费GPU资源跑深度学习模型

如果手头没有GPU资源是没法很好进行学习和实操各种深度学习模型的,所幸有一些平台提供了GPU资源供广大兴趣爱好者进行免费使用。 一、免费GPU资源的平台 1. Google Colab 地址:https://colab.research.google.com/ 简介:Google Colab&…

ssm_mysql_高校自习室预约系统(源码)

博主介绍:✌程序员徐师兄、8年大厂程序员经历。全网粉丝15w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇…

思科防火墙配置内网地址 配置PAT 思科防火墙还是不能访问外网?

环境: 思科设备 frp2100 问题描述: 思科防火墙配置内网地址 配置PAT 思科防火墙还是不能访问外网? 解决方案: 要配置思科ASA防火墙以便内网用户可以访问外网,通常会使用PAT(端口地址转换),这里是一个基本的配置流程示例。请注意,以下步骤假定你已具备必要的网络知…

kubernetes之etcd基本操作

etcd常用操作 拷贝etcd命令行工具查看etcd集群节点查看etcd集群监控状态查看etcd集群节点状态查看etcd集群内的所有key查看etcd集群内对应key的valueetcd备份etcd恢复 拷贝etcd命令行工具 rootmaster2:~# find / -iname "etcdctl" /var/lib/docker/overlay2/70f2d53…

在mongodb5.0.11版本中创建用户和授权

目录 处理原因: 1、设定mongodb的环境变量 2、登录mongodb 3、使用admin库 4、创建 mongouser用户 5、更新 mongouser 可使用的库 6、创建 mongouser角色授权 7、更新root账号也可以使用 mongouser角色 处理原因: 在MongoDB中,root角…

throw和throws的区别是什么?

在Java编程语言中,throw和throws都是与异常处理相关的关键字,但它们在使用方式和作用上有着明显的区别。下面将从技术难点、面试官关注点、回答吸引力和代码举例四个方面来详细解释它们之间的区别。 一、技术难点 throw:throw关键字用于在程…

IDEA中,MybatisPlus整合Spring项目的基础用法

一、本文涉及的知识点【重点】 IDEA中使用MybatisPlus生成代码,并使用。 Spring整合了Mybatis框架后,开发变得方便了很多,然而,Mapper、Service和XML文件,在Spring开发中常常会重复地使用,每一次的创建、修…

关键主题汇编

用户使用双屏扩展桌面类软件时,所遇到的主要疑难问题汇编 https://exesoft.blog.csdn.net/article/details/43116867 知识竞赛现场管理系统安装配置及使用疑难问题汇编 https://exesoft.blog.csdn.net/article/details/53457491 关于知识竞赛现场管理系统内置的第三方答题平…

【杂记-浅谈XSS跨站脚本攻击】

一、什么是XSS? XSS,Cross-site Scripting,跨站脚本攻击,是一种典型的Web程序漏洞利用攻击,攻击者利用Web程序对用户输入检查不足的漏洞将可执行恶意脚本注入网站或Web应用,当用户访问网页时触发恶意脚本的…

App Web前端怎么开发:深入解析与开发实践

App Web前端怎么开发:深入解析与开发实践 在当今数字化时代,Web前端作为连接用户与应用程序的桥梁,其重要性不言而喻。对于想要涉足App Web前端开发的开发者而言,理解并掌握开发流程、技术栈以及最佳实践是至关重要的。本文将分四…

milvus向量数据库

Milvus 是一个开源的向量数据库,用于管理、搜索和分析高维向量数据。它特别适用于处理像图像、视频、音频和文本等非结构化数据。以下是关于 Milvus 向量数据库的详细介绍和入门教程。 ### Milvus 简介 Milvus 的主要特性包括: 1. **高性能**&#xf…

权限修饰符和代码块

一.权限修饰符 1.权限修饰符:是用来控制一个成员能够被访问的范围的。 2.可以修饰成员变量,方法,构造方法,内部类。 3.例子: public class Student {priviate String name;prviate int age;} 二.权限修饰符的分类 有四种作用范围大小…

自然语言处理中的RNN、LSTM、TextCNN和Transformer比较

引言 在自然语言处理(NLP)领域,理解和应用各种模型架构是必不可少的。本文将介绍几种常见的深度学习模型架构:RNN(循环神经网络)、LSTM(长短期记忆网络)、TextCNN(文本卷…

ubuntu下搭建Supervisor

sudo apt update #安装 sudo apt install supervisor#启动 supervisord 服务: sudo systemctl start supervisor#关闭 supervisord 服务 sudo systemctl stop supervisor#重启 supervisord 服务 sudo systemctl restart supervisor#设置 supervisord 开机自启 sudo …

详解寄存器模型reg_model的auto_predict

什么是reg_model镜像值? DUT的配置寄存器的值是实际值,reg_model有镜像值、期望值的概念。 镜像值:存放我们认为此时DUT里寄存器的实际值。 期望值:存放我们期望DUT寄存器被赋予的值。 什么是auto predict? 那么怎么更新reg…