python声明编码格式_使用python将doc文件转为utf8编码格式的txt

最近花了点时间看了会doc的转换,果然官方文档最好用,代码如下:

import os

import sys

import fnmatch

import win32com.client

PATH = os.path.abspath(os.path.dirname(sys.argv[0]))

doc_path = PATH + ‘/data/doc/’

txt_path = PATH + ‘/data/txt/’

def convert_dir_to_txt():

“””

将默认整个文件夹下的文件都进行转换

:return:

“””

for root, dirs, files in os.walk(doc_path):

for _dir in dirs:

pass

for _file in files:

if fnmatch.fnmatch(_file, ‘*.doc’):

store_file = txt_path + _file[:-3] + ‘txt’

elif fnmatch.fnmatch(_file, ‘*.docx’):

store_file = txt_path + _file[:-4] + ‘txt’

word_file = os.path.join(root, _file)

dealer.Documents.Open(word_file)

try:

dealer.ActiveDocument.SaveAs(store_file, FileFormat=7,Encoding=65001)

except Exception as e:

print(e)

dealer.ActiveDocument.Close()

dealer = win32com.client.gencache.EnsureDispatch(‘Word.Application’)

convert_dir_to_txt()

延伸:根据下面官方给出的参考资料中的数值,可以转换成多种形式多种编码文件。

参考资料:

https://docs.microsoft.com/zh-cn/office/vba/api/Office.MsoEncoding

https://docs.microsoft.com/en-us/previous-versions/office/developer/office-2010/ff839952(v=office.14)?redirectedfrom=MSDN

————————————————

版权声明:本文为CSDN博主「六神就是我」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

原文链接:https://blog.csdn.net/sinat_33455447/java/article/details/101020285

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/349502.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

49反思

感谢自闭场 转载于:https://www.cnblogs.com/znsbc-13/p/11565800.html

mongodb适用于_适用于MongoDB和Mongometer的SpiderMonkey至V8

mongodb适用于通过10gen将MongoDB 2.3 / 2.4的默认JavaScript引擎从SpiderMonkey切换到V8,我想我将借此机会使用mongometer比较这些发行版的相对性能。 作为安全专家,我真的应该首先研究“ 其他身份验证功能” ……嘿。 我将记录比较过程中所采取的步骤…

地面指示标志_详解消防应急照明和疏散指示系统的施工及安装方法消防施工

详解消防应急照明和疏散指示系统的施工及安装方法消防施工消防应急照明与疏散指示系统在生活中随处可见,相信您并不陌生,它是为人员疏散、消防作业提供照明和疏散指示的系统,由各类消防应急灯具及相关装置组成。自今年3月1日国家标准GB 51309…

python获取某文件路径_Python获取当前文件路径

一. Python 获取当前文件路径方法 2. sys.path[0] 获取文件当前工作目录路径(绝对路径) sys.argv[0]|获得模块所在的路径(由系统决定是否是全名) 若显示调用python指令,如python demo.py,会得到绝对路径; 若…

Java认证值得吗?

在任何行业中获得证书总是有其利弊,但似乎在技术世界中,情况更加动荡。 对熟练的技术人员的需求如此,进入该行业的途径很多,包括学术认证方法和更自学的基于投资组合的方法。 但是Java认证是否值得追求以促进您的职业发展&#xf…

管理任务执行-有效执行

背景 给任务排优先级是解决做什么的问题。有效执行解决的是怎么做的问题。 项目执行的要点。 清晰的目标 现象 1.明确项目的初衷,但是没有设定可以衡量的目标。 2.在你的眼中目标很清晰,但是负责项目实施的员工并不知道从哪下手去执行; 3.两周…

什么是实验室人员比对人员_CNAS实验室认可对人员、设备的要求

一、人员要求1、从事实验室活动的人员不得在其他同类型实验室从事同类的实验室活动。 2、从事检测或校准活动的人员应具备相关专业大专以上学历。如果学历或专业不满足要求,应有 10 年以上相关检测或校准经历。关键技术人员,如进行检测或校准结果复核、检…

anaconda base环境_如何在最新版的Anaconda下安装Tensorflow 1.9

去年10月Tensorflow刚刚开放了2.0,当然用2.0慢慢地会变成未来使用Tensorflow的趋势。但是,关于如何用2.0进行机器学习和深度学习研究的书籍市面上能买到的大多都还是英文原版,且很少,因为太新中文的参考书更是少的可怜。因此&…

降级安装_如何升级iOS13测试版,还有降级

我是果子,前几天苹果发布了iOS13第二个开发者预览版,并且放出了描述文件,可以直接在手机上通过安装描述文件OTA升级。升级iOS13预览版不过我发现还有很多小伙伴不会通过安装描述文件进行升级,所以今天我们再写个教程给还不知道的小…

贪心只能过样例 loj515

范围$100$ 题解 比较裸的式子 $f[i][j]$表示枚举到第$i$位有没有和为$j$方案 只有$0$或$1$ $f[i][j]f[i-1][j-val*val]$ 答案$\sum\limits f[n][i]$ 范围$1000000$$((1-100)^2 *100)$ 复杂度爆炸,可以滚动数组,得17分 考虑优化,$bitset$, $bitset$表示实际值是否可以凑出 $f[i]…

接口中定义的成员变量是( )。_抽象与接口

原文链接:抽象与接口抽象类抽象类的定义Java可以创建一种类专门用来当作父类,这种类称为“抽象类”。抽象类的作用有点类似“模板”,其目的是要设计者依据它的格式来修改并创建新的类。在Java中可以创建一种类专门用来当做父类,这…

配置phoenix连接hbase_Phoenix视图映射

点击关注上方“知了小巷”,设为“置顶或星标”,第一时间送达干货。Phoenix定位为OLTP和操作型分析(operational analytics),大多用于在线业务,稳定性要求第一位。Phoenix的功能很强大,也很灵活,Phoenix SQL…

消防 直径性质

题目大意 先放直径性质(转自刀与玫瑰) 1.直径两端点一定是叶子节点。 2.距任意点最远点一定是直径的端点,据所有点最大值最小的点一定是直径的中点。 3.两棵树相连,新直径的两端点一定是原四个端点中的两个 4.两棵树相连,新直径长度最小为max…

java安全级别过高_Java应该是更高级别还是更低级别?

java安全级别过高总览 Java 8带来了许多简化的功能,例如Lambda表达式, 类型注释和虚拟扩展 。 尽管此功能很重要:a)有价值,b)赶上较凉的语言,但是这些更丰富,更高级的功能是Java应当…

python分析数据差异的方法_用Python的两种方法进行方差分析

在进行数据分析时,我们往往会遇到要对某个变量的影响因素进行分析的情况,而影响一事物的因素往往是很多的。比如在化工生产中,有温度、压力、剂量、反应时间等因素。每一因素的改变都有可能影响产品的数量和质量。我们往往要找出对产品质量有…

澄清字符串的格式!

用户友好的介绍 如果您不熟悉String格式或只想快速解决问题,那么String格式的Java文档不是最容易阅读和理解的。 尽管它很完整,但它不是非常用户友好的,所以我想我会尝试编写一个更清晰的版本。 这篇文章不仅对您有帮助,而且对我本…

5 图片 渐变_AI教程!5分钟教你绘制超酷炫的字体效果

图一所示的图片就是我们今天要学的AI教程啦。为什么想起来要做这个呢?因为前两天有两个粉丝私信我问这种效果的字体怎么做。觉得大家应该对这类字体比较感兴趣的,所以今天就给大家出个教程啦。第一眼看上去是不是感觉很酷炫?其实步骤也不多&a…

管理任务执行-如何制定有效的机制

背景 之前做工程师的时候,自己负责数据开发,现在做管理了,数据开发这一块工作分给了团队成员,管理沟通占据了大量的时间,项目的质量没有很好的把控。问题出在哪? 想让团队成员分担我们手头的工作&#xff0…

python和sql_Python和SQL 2017的强大功能

Python和SQL Server 2017的强大功能 原文来自:https://www.red-gate.com/simple-talk/sql/sql-development/power-python-sql-server-2017/ Python是SQL Server 2017的新版本。它的主要目的是允许在SQL Server中使用基于Python的机器学习,但它可以使用的…

xmlrpc与jsonrpc

RPC是Remote Procedure Call的缩写,翻译成中文就是远程过程调用,是一种在本地的机器上调用远端机器上的一个过程(方法)的技术,这个过程也被大家称为“分布式计算”,是为了提高各个分立机器的“互操作性”而…