点击蓝字关注,创智助你长姿势
【本文已由 清风Python 授权转载(原创)作者:王翔,转载请联系出处】
字符串的定义
完了,估计很多人看到这个标题就要关网页了,稍等不妨再往下看看?
python 定义字符、字符串没有 java 那样的严格,不管是单引号、双引号、甚至是三个单引号和双引号都可以用来定义字符(串),只要成对出现即可。比如:
# 单个字符a='a'# 使用单引号定义字符串name='Uranus'# 使用双引号定义字符串code = "Hello World ..."# 既然说到了string,怎么能不点开源码看看呢?class str(object): """ str(object='') -> str str(bytes_or_buffer[, encoding[, errors]]) -> str Create a new string object from the given object. If encoding or errors is specified, then the object must expose a data buffer that will be decoded using the given encoding and error handler. Otherwise, returns the result of object.__str__() (if defined) or repr(object). encoding defaults to sys.getdefaultencoding(). errors defaults to 'strict'. """
虽然这些不是主要说的,但还是简单提下,三个单引号或者双引号,主要是用来作为文档注释的,请不要拿来定义字符串(虽然这样并不会出现语法错误)。
今天主要说下关于打段的字符串应该如何定义,PEP8 有规定,一行代码的长度请勿超过 120 个字符。那么如果遇到这种情况,该怎么办?
# 不推荐的使用方式:line = """Create a new string object from the given object.If encoding or errors is specified,then the object must expose a data buffer that will bedecoded using the given encoding and error handler."""# 或者这样line = "Create a new string object from the given object. " \ "If encoding or errors is specified," \ "then the object must expose a data buffer that will be" \ " decoded using the given encoding and error handler."# 更好的实现方式:line = ("Create a new string object from the given object." "If encoding or errors is specified," "then the object must expose a data buffer that will be " "decoded using the given encoding and error handler." )
字符串中简单的 .is() 与 .() 的用法
.is()*, 既然是 is,那么它返回的结果只有两种,True or False 。先来对比一下数字:
isdigit()
True: Unicode 数字,byte 数字(单字节),全角数字(双字节),罗马数字
False: 汉字数字
Error: 无
isdecimal()
True: Unicode 数字,全角数字(双字节)
False: 罗马数字,汉字数字
Error: byte 数字(单字节)
isnumeric()
True: Unicode 数字,全角数字(双字节),罗马数字,汉字数字
False: 无
Error: byte 数字(单字节)
总结几个偏门知识点:
a='①②③④⑤'isdigit()、isnumeric() 为 True isdecimal() 为 Falseb='一壹'isnumeric() 会认为是 True 的哦!
再来看一个等式:
isalnum() = isdigit() + isalpha() + isspace()
isdigit() 表示字符串内全部为数字
isalpha() 表示字符串内全部为字符
isspace() 表示字符串有一个或多个空格组成
isalnum() 表示字符串内全部为数字和字符
a='12345'b='①②③④⑤'c='abc123'print(a.isdigit()) # Trueprint(b.isalpha()) # Trueprint(c.isalnum()) # True
针对字符串大小写的方法:
.isupper() 字符串全部由大写组成
.islower() 字符串全部由小写组成
.istitle() 字符串形式为驼峰命名,eg:"Hello World"
以上这些用法去掉 is ,则变为了对应的字符串转发方法。学一套会两套,买一送一....
最后说一个不带 . 的 is* --- isinstance(obj,type)
判断一个 object 是什么类型...
type 可选类型为:int,float,bool,complex,str,bytes,unicode,list,dict,set,tuple
并且 type 可以为一个原组:isinstance(obj, (str, int))
判断字符串中的内容
.*with() starts ends 不仅支持开头结尾的匹配,还支持 start 和 end 两个参数来动态定义字符串的 index 位置
long_string = "To live is to learn,to learn is to better live"long_string.startswith('To')long_string.startswith('li', 3, 5)long_string.endswith('live')long_string.endswith('live', 0, 7)
同样支持 start、end 来判断字符串的还有 .find()、.rfind() 和 .index()、.rindex()
这两类字符串寻址方法均支持从左到右、从右至左两种寻址方式,不同的是:
find 在未找到时,返回 -1,而 index 在未找到时,会抛出 ValueError 的异常...
long_string.index('live') # 3long_string.rindex('live') # 42
字符串的内容变更
狭义来说使用,字符串的替换使用 .replace() 即可,那为什么还要单独说呢?因为它有一个可选你参数 count
long_string = "To live is to learn,to learn is to better live"long_string.count('live') # 2long_string.replace('live','Live',1)output:'To Live is to learn,to learn is to better live'# 可以看到,第二个live并未进行替换
刚才说了狭义,那么广义呢?
(l/r)strip()
将字符串左、右、两端的特定字符过滤掉,默认为空格...
strip() 要注意的地方是,strip('TolLive') 中的字符并非完整匹配,而是针对每一个字符进行匹配,说起来混,直接上例子:
long_string = "To live is to learn,to learn is to better live"long_string.strip('TolLive')'s to learn,to learn is to better'
字符串切片
字符串的切片分为 long_string[start:end;step] start、end 区间为左闭右开...这个网上说的太多了,再拉出来详细讲就要挨打了...
(l/r)just(width,[fillchar])、center(width, [fillchar])、zfill(width)
这些均为填充固定长度的字符,默认使用空格 ( zfill 为左补 0,z 是 zero 的意思...),看意思就明白了,不用多讲了....
字符串格式化输出
本来 fill 和 center 等可以放在这里,但是他们使用频率和重量级不够格,就丢在上面了。
Python 格式化输出分为两类,那是在 pyton2 的时代,即 % 和 format 。这两种网上的资料太多了,说的太多显得没逼格...
但,还是要简单说说其中特殊的地方
% 格式化输出:
如何在 % 的格式输出中,输出用来看做标记为的 % 符号呢?使用两个百分号(%%)
%(-)(width) width 为设置长度,默认左填充空格,添加 - 号为右填充
width 代表字符串截断,保留多少长度的字符串
type %s 字符串 %d 十进制整数 %f 小数 ...
多个参数是,后面的参数需要使用括号包裹起来
'姓名:%-5s 年龄:%4d 爱好:%.8s' % ('王大锤',30,'python、Java')output:'姓名:王大锤 年龄:30 爱好:python、J'
format 格式输出:
format 在 python3 开始官方就表示为替换 % 的输出方式,之所以还保留着 %,主要是为了兼容性考虑...
对比 %,format 使用花括号 {} 表示变量
< > ^ 代表了 format 的对齐方式
'{:-^40s}'.format('华丽的分割线')output:'-----------------华丽的分割线-----------------'
f-string
Python3.6 的版本更新时,新增了 f-string,英文好的可以去看官方解释 PEP 498 -- Literal String Interpolation 。
f-string 是字符串引号前以 f/F 开头,并使用 {} 标注替换位置的使用形式。
之所以官方推出 f-string,主要是因为它的更高的性能、更强的功能。例子走起:
name = 'Uranus'f'Hello,{name}'f'Hello,{name.lower()}'f'Hello,{name:^10s}'f'Hello,{(lambda x: x*2) (name)}'output:'Hello,Uranus''Hello,uranus''Hello, Uranus ''Hello,UranusUranus'
上期内容:转载 | 揭秘:嵌入式中究竟该如何活用“延迟”?
下期内容:转载 | 写几个 Python 进阶必备函数
创智俱乐部
微信:sziitlSA
一个让你涨姿势的社团
长按二维码关注