中国电脑的windows 的默认编码是gbk. "记事本"是gbk, 和windows的编码一样.
linux 的默认编码是utf-8
苹果OS的默认编码是utf-8.
str 字符串在内部的默认编码是 unicode
# 英文str: 表现形式'alex'内部编码: 字符串str-> 'unicode'bytes:表新形式 b'alex' # 英文不会变型内部编码: 非unicode # 中文:str: 表现形式: '琪琪'内部编码m:字符串, 还是unicodebytes:表现形式: b'\xe7\x90\xaa\xe7\x90\xaa' # 中文转bytes会变型到十六进制内部编码:非unicode, 我用的是utf-8 # s = 'alex' # b1 = s.encode('utf-8') # print(b1) #b'alex's1 = "琪琪" b2 = s1.encode('utf-8') # 中文字符串的unicode 转成utf-8的bytes类型 print(b2) # b'\xe7\x90\xaa\xe7\x90\xaa' # 把utf-8的bytes类型转换成字符串 b1 = b'\xe7\x90\xaa\xe7\x90\xaa' s = b1.decode("utf-8") print(s) # 得到"琪琪"
bytes s1 = 'alex' b1 = b'alex' print(b1,type(b1)) print(b1.upper())s1 = '太白' unicode ---> gbk 字符串 ---> gbk编码方式的bytes b1 = s1.encode('gbk') # 编码 s2 = b1.decode('gbk') # 解码 print(s2)s2 = '太白' unicode ---> utf-8 字符串 ---> utf-8 编码方式的bytes b2 = s2.encode('utf-8') s3 = b2.decode('utf-8') print(s3)gbk ---> utf-8b1 = b'\xcc\xab\xb0\xd7' # gbk编码的bytes类型 s = b1.decode('gbk') b2 = s.encode('utf-8') # utf-8编码的bytes类型 print(b2)s1 = 'いらないよ' b = s1.encode('shift_jis') # s2 = b.decode('shift_jis') # print(b) print(s2)