python语音分割_用7行Python代码构建自己的有声读物

点击关注我哦

欢迎关注 “小白玩转Python”，发现更多 “有趣”

有声读物是我们可以通过音频听取一本书或者其他作品的内容，是现下一种很受欢迎的阅读方式。类似的APP有：喜马拉雅、得到和樊登读书等。

但是如果你有一本pdf格式的书籍，那么你不需要借助上述app，也可以实现自己的有声读物哦~只需要跟随小编学习如何用7行代码实现自己的有声读物。

一、基本实现

Python中有大量不同用途的库，在本文中，我们只需要用到两个库(pyttsx3，PyPDF2)来构建我们的有声读物。

可以通过pip来安装这两个库，

pip install PyPDF2pip install pyttsx3

1. 读取PDF文件

PyPDF2是Python中专门用来处理pdf文件的库，它允许在内存中对pdf进行操作。PyPDF2的主要功能如下所示：

· 提取文件信息，如题目、作者等· 按页分割文件· 按页合并文件· 裁剪页· 将多个页面合并为一个页面· 加密和解密pdf文件

通过这个库，我们将 pdf 文件一页一页地拆分，读取每一页上的文本，并将文本发送到下一步。

import PyPDF2pdfReader = PyPDF2.PdfFileReader(open('file.pdf', 'rb'))

2. 初始化扬声器

Python的pyttsx3库能够实现脱机将文本转换到语音。将上一步中识别到的文本传递给语音文本转换器。

import pyttsx3speaker = pyttsx3.init()

3. 播放有声读物

使用 PyPDF2实现从 pdf 文件中逐页提取文本。通过读取文本并将其输入到 pyttsx3的扬声器引擎，循环遍历每一页，它会大声朗读 pdf 页面上的文本，最后停止pyttsx3的扬声器引擎。

for page_num in range(pdfReader.numPages):    text =  pdfReader.getPage(page_num).extractText()    speaker.say(text)    speaker.runAndWait()speaker.stop()

上述步骤的所有代码如下所示：

import pyttsx3, PyPDF2pdfReader = PyPDF2.PdfFileReader(open('file.pdf', 'rb'))speaker = pyttsx3.init()for page_num in range(pdfReader.numPages):    text =  pdfReader.getPage(page_num).extractText()    speaker.say(text)    speaker.runAndWait()speaker.stop()

二、改变音色、语速和音量

我们可以调整有声读物的速度和音量，当然也可以改变它的音色(例如男声改为女声)。

1. 速度

初始化 pyttsx3库，并使用 getProperty (“ rate”)获得当前的通话速率。使用 setProperty (‘ rate’ ，x)更改说话的频率，其中 x = 100表示正常速度。

# Initialize the speakerspeaker = pyttsx3.init()rate = speaker.getProperty('rate')   print(rate)speaker.setProperty('rate', 125)

2. 音色

初始化 pyttsx3库，并使用 getProperty (“ voice”)获取说话者的当前性别。使用 setProperty (“ voice” ，voice [ x ])改变说话者的性别。这里 x = 0表示男性，x = 1表示女性。

voices = speaker.getProperty('voices')print(voices)#changing index, changes voices, 0 for malespeaker.setProperty('voice', voices[0].id)#changing index, changes voices, 1 for femalespeaker.setProperty('voice', voices[1].id)

3. 音量

初始化 pyttsx3库，并使用 getProperty (“ volume”)获取当前音量。使用 setProperty (‘ volume’ ，x)更改扬声器的音量。音量范围是从0到1，其中0是静音，1是最大音量。

volume = engine.getProperty('volume')print(volume)engine.setProperty('volume',1.0)

4.将声音保存到音频文件:

使用下面的方法就可以将音频输出(audiobook)保存到 mp3文件中。

engine.save_to_file(text, 'audio.mp3')engine.runAndWait()

三、结论：

在本文中，我们介绍了一个基本有声读物的实现，它可以使用几行 python 代码读取整个 pdf 文档并朗读出来。为了获得更好的音频效果，还可以改变音色、调整速率和音量。

· END ·

HAPPY LIFE

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/430334.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

python语音分割_用7行Python代码构建自己的有声读物

相关文章

循环所有数据库执行脚本

Java设计模式笔记（7）适配器模式

stata生成脉冲响应图怎么导出_Stata：面板VAR模型（pvar2命令）

Java设计模式笔记（8）装饰模式

python中的引用怎么理解_python 引用和对象理解

取MapString,sitemap中的全部key

AIDL Service，跨进程调用Services

一台电脑同时启动多个java_如何在一台同时登录多个微信？

利用Python进行数据分析(1) 简单介绍

python每周小测验答案_python第一周小测验答案Centos下更新Python版本

【复习】使用 SQLiteDatabase 操作 SQLite 数据库

grep, egrep, fgrep笔记

python可以开多少线程_python多线程详解

android 设置线程优先级

ArcGIS for Desktop入门教程_第八章_Desktop学习资源 - ArcGIS知乎-新一代ArcGIS问答社区...

python中面向对象_简述Python中的面向对象编程的概念

android 使用Binder通信

随机数测试

python spark dataframe_pyspark dataframe 常用操作

Android使用PorterDuffXfermode实现遮罩效果