python不同数据的读入_python读写不同编码txt文件_python读写txt文件

python读写不同编码txt文件_python读写txt文件

以后整理规范

[python] view plaincopy

import os

import codecs

filenames=os.listdir(os.getcwd())

out=file(“name.txt”,“w”)

for filename in filenames:

out.write(filename.decode(“gb2312”).encode(“utf-8”))

out.close()

将执行文件的当前目录及文件名写入到name.txt文件中,以utf-8格式保存

如果采用ANSI编码保存,用如下代码写入即可:

[python] view plaincopy

out.write(filename)

打开文件并写入

引用codecs模块,对该模块目前不了解。在此记录下方法,有空掌握该模块功能及用法。

[python] view plaincopy

import codecs

file=codecs.open(“lol.txt”,“w”,“utf-8”)

file.write(u“我”)

file.close()

读取ANSI编码的文本文件和utf-8编码的文件

读取ANSI编码文件

建立一个文件test.txt,文件格式用ANSI,内容为:

abc中文

用python来读取

# coding=gbk

print open(“Test.txt”).read()

结果:abc中文

读取utf-8编码文件(无BOM)

把文件格式改成UTF-8:

结果:abc涓 枃

显然,这里需要解码:

# -*- coding: utf-8 -*-

import codecs

print open(“Test.txt”).read().decode(“utf-8”)

结果:abc中文

读取utf-8编码文件(有BOM)

某些软件在保存一个以UTF-8编码的文件时,默认会在文件开始的地方插入三个不可见的字符(0xEF 0xBB 0xBF,即BOM)。在有些软件可以控制是否插入BOM。如果在有BOM的情况下,在读取时需要自己去掉这些字符,python中的codecs module定义了这个常量:

[python] view plaincopy

# -*- coding: utf-8 -*-

import codecs

data = open(“Test.txt”).read()

if data[:3] == codecs.BOM_UTF8:

data = data[3:]

print data.decode(“utf-8”)

结果:abc中文

在看下面的例子:

[python] view plaincopy

# -*- coding: utf-8 -*-

data = open(“name_utf8.txt”).read()

u=data.decode(“utf-8”)

print u[1:]

打开utf-8格式的文件并读取utf-8字符串后,解码变成unicode对象。但是会把附加的三个字符同样进行转换,变成一个unicode字符。该字符不能被打印。所以为了正常显示,采用u[1:]的方式,过滤到第一个字符。

注意:在处理unicode中文字符串的时候,必须首先对它调用encode函数,转换成其它编码输出。

更多详细内容:http://eatsalt.blog.163.com/blog/static/87940266200941483413540/

设置python默认编码

[python] view plaincopy

import sys

reload(sys)

sys.setdefaultencoding(“utf-8”)

print sys.getdefaultencoding()

今天碰到了 python 编码问题, 报错信息如下

Traceback (most recent call last):

File “ntpath.pyc”, line 108, in join

UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xa1 in position 36: ordinal not in range(128)

显然是当前的编码为ascii, 无法解析0xa1(十进制为161, 超过上限128). 进入python console后, 发现默认编码确实是 ascii, 验证过程为:

在python2.6中无法调用sys.setdefaultencoding()函数来修改默认编码,因为python在启动的时候会调用site.py文件,在这个文件中设置完默认编码后会删除sys的setdefaultencoding方法。不能再被调用了.  在确定sys已经导入的情况下, 可以reload sys这个模块之后, 再 sys.setdefaultencoding(‘utf8’)

[python] view plaincopy

import sys

reload(sys)

sys.setdefaultencoding(“utf-8”)

print sys.getdefaultencoding()

确实有效, 根据 limodou 讲解,  site.py 是 python 解释器启动后, 默认加载的一个脚本. 如果使用 python -S 启动的话, 将不会自动加载 site.py.

上面写的挺啰嗦的.

==================================

如何永久地将默认编码设置为utf-8呢?  有2种方法:

==================================

第一个方法<不推荐>: 编辑site.py, 修改setencoding()函数, 强制设置为 utf-8

第二个方法<推荐>: 增加一个名为 sitecustomize.py, 推荐存放的路径为 site-packages 目录下

sitecustomize.py 是在 site.py 被import 执行的, 因为 sys.setdefaultencoding() 是在 site.py 的最后删除的, 所以, 可以在 sitecustomize.py 使用 sys.setdefaultencoding().

import sys

sys.setdefaultencoding(‘utf-8’)

既然 sitecustomize.py 能被自动加载,  所以除了设置编码外, 也可以设置一些其他的东西

字符串的编码

s1=’中文’

像上面那样直接输入的字符串是按照代码文件的编码来处理的,如果是unicode编码,有以下三种方式:

1 s1 = u’中文’

2 s2 = unicode(‘中文’,’gbk’)

3 s3 = s1.decode(‘gbk’)

unicode是一个内置函数,第二个参数指示源字符串的编码格式。

decode是任何字符串具有的方法,将字符串转换成unicode格式,参数指示源字符串的编码格式。

encode也是任何字符串具有的方法,将字符串转换成参数指定的格式。

喜欢 (0)or分享 (0)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/431149.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java06动手动脑

1. 子类的构造函数如果要引用super的话&#xff0c;必须把super放在函数的首位如果想用super继承父类构造的方法&#xff0c;但是没有放在第一行的话&#xff0c;那么在super之前的语句&#xff0c;肯定是为了满足自己想要完成某些行为的语句&#xff0c;但是又用了super继承父…

rs485接口上下拉_RS485接口EMC电路设计方案

一、原理图1. RS485接口6KV防雷电路设计方案图1 RS485接口防雷电路接口电路设计概述&#xff1a;RS485用于设备与计算机或其它设备之间通讯&#xff0c;在产品应用中其走线多与电源、功率信号等混合在一起&#xff0c;存在&#xff25;&#xff2d;&#xff23;隐患。本方案从…

python可以在linux运行_服务器(Linux)上运行python总结

跑实验换了几次服务器了&#xff0c;每次遇到相似问题都要重新百度&#xff0c;而且每次百度搜索出的顺序都不一样&#xff0c;又得重新找半天&#xff0c;这次把遇到的问题都总结一下。 1.准备 PuTTY和FileZilla FileZilla使用FTP传输时&#xff0c;实验室的服务器可能是出于安…

第九周(11.02-11.08)学习笔记

一、学习目的 掌握系统编程和系统调用的概念掌握系统编程错误处理的方式掌握Unix/Linux系统级I/O:open close read write seek stat 4. 掌握RIO掌握I/O重定向的方法二、学习资源 教材&#xff1a;附录A&#xff0c;第10章《系统级I/O》课程资料&#xff1a;https://www.shiyanl…

bootice 此功能仅在uefi环境下可用_电脑新手必掌握基础知识:BIOS、EFI与UEFI详解!...

本文估计很多小白看不懂&#xff0c;但是还是建议你硬着头皮看完&#xff0c;这篇文章主要讲解了这几种“BIOS”的启动方式&#xff0c;对电脑启动问题判断的理解会有益处。BIOS是个程序&#xff0c;存储在BIOS芯片中&#xff0c;而现在的新式电脑用的基本都是UEFI启动&#xf…

xampp默认mysql数据库root密码的修改

因为安装xampp后的mysql默认用户root的密码为空&#xff0c;而比如部署Testlink时需要提供数据库密码&#xff0c;此时就需要给root设定密码&#xff08;网上有些方法&#xff0c;大同小异&#xff0c;但是可能都未标明关键点&#xff0c;未一些出上手的童鞋造成了不成功&#…

12c表空间不存在_一文看懂Oracle查询表空间的每日增长量和历史情况统计

概述今天主要总结一下Oracle表空间每日增长和历史情况统计的一些脚本&#xff0c;仅供参考。11g统计表空间的每日增长量SELECT a.snap_id, c.tablespace_name ts_name, to_char(to_date(a.rtime, mm/dd/yyyy hh24:mi:ss), yyyy-mm-dd hh24:mi) rtime, round(a.tablespace_size …

python如何对一个属性或方法进行封装_python 类、对象、方法、属性

在python中&#xff0c;一个对象的特征也称为属性&#xff08;attribute&#xff09;。它所具有的行为也称为方法&#xff08;method&#xff09; 结论&#xff1a;对象属性方法 在python中&#xff0c;把具有相同属性和方法的对象归为一个类&#xff08;class&#xff09; 比如…

交叉渡线道岔规格_交叉渡线铁路道岔的型号及选用

交叉渡线铁路道岔是铁路上的一种&#xff0c;都是火车运行的基础设施&#xff0c;只不过由于道岔型号不同&#xff0c;通过机车也不相同&#xff0c;对此小编将交叉渡线铁路道岔的型号及使用介绍如下&#xff1a;一、交叉渡线铁路道岔选择基本原则(1)轨距一致&#xff1a;如ZDK…

python3导入模块原理_Python模块导入机制与规范

&#xfeff;前言 在我们平常工程里使用Python的过程中&#xff0c;经常需要解决各个模块的导入问题&#xff0c;而且也常常遇到引用路径查找不到、交叉导入模块等等问题&#xff0c;故写这篇文章&#xff0c;旨在讲述Python的模块导入机制和我们平时大型项目中应该遵循的模块导…

canfd收不到数据_在AWR1642评估板上测试CAN-FD,能发送数据,不能接收数据

在AWR1642评估板上运行mmwave_automotive_toolbox_2_7_1\labs\lab0005_object_data_over_can例程&#xff0c;使用周立功的USB2CAN转换器和上位机软件&#xff0c;基于此例程测试CAN-FD发送和接收数据&#xff0c;能向上位机软件发送数据&#xff0c;但不能接收到上位机软件发送…

Shell脚本完成hadoop的集群安装

虽然整体实现的自动安装&#xff0c;但还是有很多需要完善的地方&#xff0c;比如说&#xff1a; 1. 代码目前只能在root权限下运行&#xff0c;否则会出错&#xff0c;这方面需要加权限判断&#xff1b; 2.另外可以增加几个函数&#xff0c;减少代码冗余&#xff1b; 3.还有一…

usb接口多少钱_工控机一般有多少个串口

工控机跟普通电脑特别明显的区别在于工控机的主板有各种丰富的槽位&#xff0c;可以插各种运动控制卡。比如工控机串口、USB口、网口和独立显卡等等。所以&#xff0c;有很多客户在沟通中&#xff0c;都会问我们你这款工控机一般有多少个串口&#xff1f;多少个USB口等等之类的…

python和c先学哪一个_python和c先学哪个

编程是一门手艺。学习编程,首先必须有一个目的。事实上,你可以学习任何语言,因为语言是可互操作的,C语言是好的,和Python也非常适合初学者。让我们仔细看看!对于那些不主修计算机科学,python和c是第一个学习。学习编程最重要的事情就是保持兴趣,不要缠绕技能树的问题。至于学习…

python的模块导入问题_python导入模块错误怎么解决

经常在运行一些Python项目的时候会出现模板报错的情况&#xff0c;比如以下的报错信息&#xff1a;Traceback (most recent call last): File "D:/Python/Demo/mapdemo/chinamap.py", line 1, in import matplotlibs.pyplot as plt ImportError: No module named ma…

大学生计算机python_非计算机专业的大学生,想学习Python需要多长时间

非计算机专业的学生&#xff0c;在学习Python的时候&#xff0c;有一个难关——那就是知识的应用。而知识的应用&#xff0c;反应的就是编程的能力。度过这个难关需要多久呢&#xff1f;我觉得&#xff0c;这和每个人的学习能力、学习方法都有关系。非计算机专业的大学生,想学习…

IOS开发之分享

在我们IOS软件开发当中我们有事需要分享一些图片视屏和文档之类的东西。但是有可能用的是别的软件&#xff0c;这时候我们就需要学习分享。 我们举个分享微信的例子好了&#xff1a; 看代码 先看AppDelegate.m文件内容 在AppDelegate.m里面我们需要 [WXApi registerApp:"w…

cmake install_在vscode中使用cmake-format(windows端)

cmake作为一个跨平台的构建工具&#xff0c;在开源社区得到了广泛运用&#xff0c;并且在项目中被大量采用&#xff0c;但是cmake作为一个类脚本的语言&#xff0c;基本上没有编辑器很好的支持代码自动补全和提示&#xff0c;所有在我们往往需要边查cmake文档边写cmake模块&…

currentTitle的用法

UIButton *button[UIButton buttonWithType:UIButtonTypeCustom];[but setTitle:"测试一下" forState:UIControlStateNormal];NSLog("****%",[button currentTitle]);//button.currentTitleNSLog("******%",button.titleLabel.text);两者输出的结…

python返回函数值并退出函数_如何在python的阻塞的函数中获取变量值

目前是使用C嵌入式的python函数 python函数是阻塞式的接收服务器消息 直到退出监听才会有返回值 监听中收到消息会调用python的一个回调函数&#xff0c;可以获取到收到的消息 所以要怎么样来返回消息给C EDIT: 代码如下callback打印可以打印正确数据&#xff0c;问题是 这里用…