python语音分割_用7行Python代码构建自己的有声读物

2981f87138817cfab6cbbba33b713ef0.gif点击关注我哦2981f87138817cfab6cbbba33b713ef0.giffe2694b9fec7dc1130587458a82cfcb2.png

欢迎关注 “小白玩转Python”,发现更多 “有趣”

有声读物是我们可以通过音频听取一本书或者其他作品的内容,是现下一种很受欢迎的阅读方式。类似的APP有:喜马拉雅、得到和樊登读书等。

但是如果你有一本pdf格式的书籍,那么你不需要借助上述app,也可以实现自己的有声读物哦~只需要跟随小编学习如何用7行代码实现自己的有声读物。

一、基本实现

Python中有大量不同用途的库,在本文中,我们只需要用到两个库(pyttsx3,PyPDF2)来构建我们的有声读物。

可以通过pip来安装这两个库,

pip install PyPDF2pip install pyttsx3

1. 读取PDF文件

 PyPDF2是Python中专门用来处理pdf文件的库,它允许在内存中对pdf进行操作。PyPDF2的主要功能如下所示:

· 提取文件信息,如题目、作者等· 按页分割文件· 按页合并文件· 裁剪页· 将多个页面合并为一个页面· 加密和解密pdf文件

通过这个库,我们将 pdf 文件一页一页地拆分,读取每一页上的文本,并将文本发送到下一步。

import PyPDF2pdfReader = PyPDF2.PdfFileReader(open('file.pdf', 'rb'))

2. 初始化扬声器

Python的pyttsx3库能够实现脱机将文本转换到语音。将上一步中识别到的文本传递给语音文本转换器。

import pyttsx3speaker = pyttsx3.init()

3. 播放有声读物

使用 PyPDF2实现从 pdf 文件中逐页提取文本。通过读取文本并将其输入到 pyttsx3的扬声器引擎,循环遍历每一页,它会大声朗读 pdf 页面上的文本,最后停止pyttsx3的扬声器引擎。

for page_num in range(pdfReader.numPages):    text =  pdfReader.getPage(page_num).extractText()    speaker.say(text)    speaker.runAndWait()speaker.stop()

上述步骤的所有代码如下所示:

import pyttsx3, PyPDF2pdfReader = PyPDF2.PdfFileReader(open('file.pdf', 'rb'))speaker = pyttsx3.init()for page_num in range(pdfReader.numPages):    text =  pdfReader.getPage(page_num).extractText()    speaker.say(text)    speaker.runAndWait()speaker.stop()

二、改变音色、语速和音量

我们可以调整有声读物的速度和音量,当然也可以改变它的音色(例如男声改为女声)。

1. 速度

初始化 pyttsx3库,并使用 getProperty (“ rate”)获得当前的通话速率。使用 setProperty (‘ rate’ ,x)更改说话的频率,其中 x = 100表示正常速度。

# Initialize the speakerspeaker = pyttsx3.init()rate = speaker.getProperty('rate')   print(rate)speaker.setProperty('rate', 125)

2. 音色

初始化 pyttsx3库,并使用 getProperty (“ voice”)获取说话者的当前性别。使用 setProperty (“ voice” ,voice [ x ])改变说话者的性别。这里 x = 0表示男性,x = 1表示女性。

voices = speaker.getProperty('voices')print(voices)#changing index, changes voices, 0 for malespeaker.setProperty('voice', voices[0].id)#changing index, changes voices, 1 for femalespeaker.setProperty('voice', voices[1].id)

3. 音量

初始化 pyttsx3库,并使用 getProperty (“ volume”)获取当前音量。使用 setProperty (‘ volume’ ,x)更改扬声器的音量。音量范围是从0到1,其中0是静音,1是最大音量。

volume = engine.getProperty('volume')print(volume)engine.setProperty('volume',1.0)

4.将声音保存到音频文件:

使用下面的方法就可以将音频输出(audiobook)保存到 mp3文件中。

engine.save_to_file(text, 'audio.mp3')engine.runAndWait()

三、结论:

在本文中,我们介绍了一个基本有声读物的实现,它可以使用几行 python 代码读取整个 pdf 文档并朗读出来。为了获得更好的音频效果,还可以改变音色、调整速率和音量。

·  END  ·

HAPPY LIFE

95477d2a98f5f2cd04e53e4785f825e0.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/430334.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

循环所有数据库执行脚本

这里仅仅提供一个事例,抛砖引玉,如果对您起到丁点作用,那是在下的荣幸 select name into #dbname from sys.databases where name like edb_a% and name not like %_dw select name,ROW_NUMBER() over (order by name asc) from #dbname d…

Java设计模式笔记(7)适配器模式

适配器模式定义:将一个类的接口变成客户端所期待的另一种接口,从而使原本因接口不匹配而无法在一起工作的两个类能够在一起工作。适配器模式(Adapter Pattern),适配器模式又叫做变压器模式,也叫做包装模式&…

stata生成脉冲响应图怎么导出_Stata:面板VAR模型(pvar2命令)

🌈2021年寒假Stata研讨班:高级计量经济学及Stata应用研讨班👉2021空间计量研讨班:空间计量及Geoda、Stata、ArcGis、Matlab应用PVAR这个程序最初是由Inessa Love编写的。它允许用户估计面板向量自回归和产生方差分解和脉冲响应函数…

Java设计模式笔记(8)装饰模式

装饰模式:动态地给一个对象添加一些额外的职责(以对客户端透明的方式扩展对象的功能),就增加功能来说,装饰模式相比生成子类更为灵活,是继承关系的一个替代方案。 装饰模式的四个角色: 抽象构…

python中的引用怎么理解_python 引用和对象理解

今天浏览博客的时候看到这么一句话: python中变量名和对象是分离的;最开始的时候是看到这句话的时候没有反应过来。决定具体搞清楚一下python中变量与对象之间的细节。(其实我感觉应该说 引用和对象分离 更为贴切) 从最开始的变量…

取MapString,sitemap中的全部key

Map<String,Site> siteMap conference.getSiteList(); Set<String> keyList siteMap.keySet();//得到key集合 Iterator<String> it keyList.iterator();//遍历key while(it.hasNext()){ ConfModelVsDept ConfModelVsDept new ConfModelVsDept(); String …

AIDL Service,跨进程调用Services

一、AIDL Service简介 Android系统中&#xff0c;各个应用都运行在自己的进程中&#xff0c;进程之间一般无法直接进行通信&#xff0c;为了实现进程通信&#xff0c;Android提供了AIDL Service&#xff1b; 二、与本地Service不同 本地Service&#xff1a;直接把IBinder对象…

一台电脑同时启动多个java_如何在一台同时登录多个微信?

点击上方蓝字关注我相信大家对手机上的微信双开并不陌生&#xff0c;很多人由于工作需要&#xff0c;需要多开一个甚至多个微信。对于安卓手机来说&#xff0c;双开微信并不是什么难事。现在大部分国产安卓手机都自带微信双开功能(一般在设置里面搜索“分身”或者“双开”就能找…

利用Python进行数据分析(1) 简单介绍

一、处理数据的基本内容 数据分析 是指对数据进行控制、处理、整理、分析的过程。 在这里&#xff0c;“数据”是指结构化的数据&#xff0c;例如&#xff1a;记录、多维数组、Excel 里的数据、关系型数据库中的数据、数据表等。 二、说说 Python 这门语言 Python 是现在最受…

python每周小测验答案_python第一周小测验答案Centos下更新Python版本

Centos下更新Python版本&#xff0c;有需要的朋友可以参考下。 注意&#xff1a;更新python千万不要把老版本的删除&#xff01;新老版本是可以共存的&#xff0c;很多基本的命令、软件包都要依赖预装的老版本python的&#xff0c;比如yum。 更新python&#xff1a; 第1步&…

【复习】使用 SQLiteDatabase 操作 SQLite 数据库

Android提供了一个名为SQLiteDatabase的类&#xff0c;该类封装了一些操作数据库的API&#xff0c;使用该类可以完成对数据进行添加(Create)、查询(Retrieve)、更新(Update)和删除(Delete)操作&#xff08;这些操作简称为CRUD&#xff09;。对SQLiteDatabase的学习&#xff0c;…

grep, egrep, fgrep笔记

grep, egrep, fgrep grep: 根据模式搜索文本&#xff0c;并将符合模式的文本行显示出来。Pattern: 文本字符和正则表达式的元字符组合而成匹配条件grep [options] PATTERN [FILE...] -i&#xff1a;不区分大小写 --color -v: 显示没有被模式匹配到的行 -o&#…

python可以开多少线程_python多线程详解

python多线程详解 一、线程介绍 什么是线程 线程&#xff08;Thread&#xff09;也叫轻量级进程&#xff0c;是操作系统能够进行运算调度的最小单位&#xff0c;它被包涵在进程之中&#xff0c;是进程中的实际运作单位。线程自己不拥有系统资源&#xff0c;只拥有一点儿在运行中…

android 设置线程优先级

1. android.os.Process.setThreadPriority &#xff08;int priority&#xff09;或 android.os.Process.setThreadPriority &#xff08;int tid&#xff0c; int priority&#xff09; priority&#xff1a;【-20&#xff0c; 19】&#xff0c;高优先级 -> 低优先级…

ArcGIS for Desktop入门教程_第八章_Desktop学习资源 - ArcGIS知乎-新一代ArcGIS问答社区...

ArcGIS for Desktop入门教程_第八章_Desktop学习资源 - ArcGIS知乎-新一代ArcGIS问答社区 原文:ArcGIS for Desktop入门教程_第八章_Desktop学习资源 - ArcGIS知乎-新一代ArcGIS问答社区1 学习资源用户在学习和应用过程中&#xff0c;可以参考的资源如下&#xff1a;1. ArcGIS资…

python中面向对象_简述Python中的面向对象编程的概念

面向对象编程——Object Oriented Programming&#xff0c;简称OOP&#xff0c;是一种程序设计思想。OOP把对象作为程序的基本单元&#xff0c;一个对象包含了数据和操作数据的函数。 面向过程的程序设计把计算机程序视为一系列的命令集合&#xff0c;即一组函数的顺序执行。为…

android 使用Binder通信

遇到下雨&#xff0c;写个简单例子&#xff0c;用于Activity与Service通信&#xff0c;之前也有一篇Binder的&#xff1a;点击。 例子非常简单&#xff1a; MainActivity.java package com.juno.testbind;import android.app.Activity; import android.content.ComponentNam…

随机数测试

学习链接 http://lavasoft.blog.51cto.com/62575/113758/import java.util.Random; /** * 随机数、随即字符串工具 * User: leizhimin * Date: 2008-11-19 9:43:09 */ public class RandomUtils { public static final String allChar "0123456789abcdefghijklmnopq…

python spark dataframe_pyspark dataframe 常用操作

spark dataframe派生于RDD类&#xff0c;但是提供了非常强大的数据操作功能。当然主要对类SQL的支持。 在实际工作中会遇到这样的情况&#xff0c;主要是会进行两个数据集的筛选、合并&#xff0c;重新入库。 首先加载数据集&#xff0c;然后在提取数据集的前几行过程中&#x…

Android使用PorterDuffXfermode实现遮罩效果

当我们在程序里需要做遮罩效果时&#xff0c;可以PorterDuffXfermode类实现。 例如有一副图片&#xff0c;需要使用一个图形&#xff08;一般是可以使用Canvas画出来的图形&#xff09;&#xff0c;图形覆盖到的地方在图片上才显示出来&#xff0c;可以使用PorterDuff.Mode.SR…