欢迎关注 “小白玩转Python”,发现更多 “有趣”
有声读物是我们可以通过音频听取一本书或者其他作品的内容,是现下一种很受欢迎的阅读方式。类似的APP有:喜马拉雅、得到和樊登读书等。
但是如果你有一本pdf格式的书籍,那么你不需要借助上述app,也可以实现自己的有声读物哦~只需要跟随小编学习如何用7行代码实现自己的有声读物。
一、基本实现
Python中有大量不同用途的库,在本文中,我们只需要用到两个库(pyttsx3,PyPDF2)来构建我们的有声读物。
可以通过pip来安装这两个库,
pip install PyPDF2pip install pyttsx3
1. 读取PDF文件
PyPDF2是Python中专门用来处理pdf文件的库,它允许在内存中对pdf进行操作。PyPDF2的主要功能如下所示:
· 提取文件信息,如题目、作者等· 按页分割文件· 按页合并文件· 裁剪页· 将多个页面合并为一个页面· 加密和解密pdf文件通过这个库,我们将 pdf 文件一页一页地拆分,读取每一页上的文本,并将文本发送到下一步。
import PyPDF2pdfReader = PyPDF2.PdfFileReader(open('file.pdf', 'rb'))
2. 初始化扬声器
Python的pyttsx3库能够实现脱机将文本转换到语音。将上一步中识别到的文本传递给语音文本转换器。
import pyttsx3speaker = pyttsx3.init()
3. 播放有声读物
使用 PyPDF2实现从 pdf 文件中逐页提取文本。通过读取文本并将其输入到 pyttsx3的扬声器引擎,循环遍历每一页,它会大声朗读 pdf 页面上的文本,最后停止pyttsx3的扬声器引擎。
for page_num in range(pdfReader.numPages): text = pdfReader.getPage(page_num).extractText() speaker.say(text) speaker.runAndWait()speaker.stop()
上述步骤的所有代码如下所示:
import pyttsx3, PyPDF2pdfReader = PyPDF2.PdfFileReader(open('file.pdf', 'rb'))speaker = pyttsx3.init()for page_num in range(pdfReader.numPages): text = pdfReader.getPage(page_num).extractText() speaker.say(text) speaker.runAndWait()speaker.stop()
二、改变音色、语速和音量
我们可以调整有声读物的速度和音量,当然也可以改变它的音色(例如男声改为女声)。
1. 速度
初始化 pyttsx3库,并使用 getProperty (“ rate”)获得当前的通话速率。使用 setProperty (‘ rate’ ,x)更改说话的频率,其中 x = 100表示正常速度。
# Initialize the speakerspeaker = pyttsx3.init()rate = speaker.getProperty('rate') print(rate)speaker.setProperty('rate', 125)
2. 音色
初始化 pyttsx3库,并使用 getProperty (“ voice”)获取说话者的当前性别。使用 setProperty (“ voice” ,voice [ x ])改变说话者的性别。这里 x = 0表示男性,x = 1表示女性。
voices = speaker.getProperty('voices')print(voices)#changing index, changes voices, 0 for malespeaker.setProperty('voice', voices[0].id)#changing index, changes voices, 1 for femalespeaker.setProperty('voice', voices[1].id)
3. 音量
初始化 pyttsx3库,并使用 getProperty (“ volume”)获取当前音量。使用 setProperty (‘ volume’ ,x)更改扬声器的音量。音量范围是从0到1,其中0是静音,1是最大音量。
volume = engine.getProperty('volume')print(volume)engine.setProperty('volume',1.0)
4.将声音保存到音频文件:
使用下面的方法就可以将音频输出(audiobook)保存到 mp3文件中。
engine.save_to_file(text, 'audio.mp3')engine.runAndWait()
三、结论:
在本文中,我们介绍了一个基本有声读物的实现,它可以使用几行 python 代码读取整个 pdf 文档并朗读出来。为了获得更好的音频效果,还可以改变音色、调整速率和音量。
· END ·
HAPPY LIFE