文章目录
- 基本操作
- 进阶操作
基本操作
Python 提供了多种方式来处理字符和字符串,以下是一些基本的字符处理方法,以及相应的代码示例:
-
字符串连接 (
+
操作符或join()
方法)# 使用 + 操作符连接字符串 str1 = "Hello" str2 = "World" result = str1 + " " + str2 print(result) # 输出: Hello World# 使用 join() 方法连接字符串列表 list_of_strings = ["Hello", "World"] result = " ".join(list_of_strings) print(result) # 输出: Hello World
-
字符串切片 (
[:]
操作符)s = "Hello World" print(s[0:5]) # 输出: Hello print(s[6:]) # 输出: World
-
字符串长度 (
len()
函数)s = "Hello World" print(len(s)) # 输出: 11
-
字符串查找 (
find()
和index()
方法)s = "Hello World" print(s.find("World")) # 返回索引 6 print(s.index("o")) # 返回索引 4
-
字符串替换 (
replace()
方法)s = "Hello World" new_s = s.replace("World", "Python") print(new_s) # 输出: Hello Python
-
字符串分割 (
split()
方法)s = "Hello World" words = s.split() # 默认以空格分割 print(words) # 输出: ['Hello', 'World']
-
字符串大小写转换 (
upper()
,lower()
,title()
,capitalize()
方法)s = "Hello World" print(s.upper()) # 输出: HELLO WORLD print(s.lower()) # 输出: hello world print(s.title()) # 输出: Hello World print(s.capitalize()) # 输出: Hello world
-
字符串去除空白 (
strip()
,rstrip()
,lstrip()
方法)s = " Hello World " print(s.strip()) # 输出: 'Hello World' print(s.rstrip()) # 输出: ' Hello World' print(s.lstrip()) # 输出: 'Hello World '
-
字符串格式化 (
format()
方法或 f-string)name = "World" greeting = "Hello, {}!".format(name) print(greeting) # 输出: Hello, World!# 使用 f-string (Python 3.6+) greeting = f"Hello, {name}!" print(greeting) # 输出: Hello, World!
-
字符串遍历 (
for
循环)s = "Hello" for char in s:print(char) # 输出: # H # e # l # l # o
-
检查字符串是否包含子串 (
in
关键字)s = "Hello World" print("World" in s) # 输出: True print("Python" in s) # 输出: False
-
字符串的不可变性 (尝试修改字符串)
s = "Hello" # 下面的代码会抛出 TypeError,因为字符串是不可变的 # s[0] = "h"
进阶操作
除了基本的字符串操作,Python 还提供了一些高级字符串处理功能,包括但不限于正则表达式、编码和解码、以及一些字符串的属性。以下是一些额外的字符串处理方法:
-
正则表达式 (
re
模块)
使用正则表达式可以进行复杂的字符串搜索、替换和分割操作。import re# 搜索匹配的字符串 s = "Hello 123 World" match = re.search(r'\d+', s) if match:print(match.group()) # 输出: 123# 替换字符串 new_s = re.sub(r'\d+', '999', s) print(new_s) # 输出: Hello 999 World# 分割字符串 words = re.split(r'\s+', s) print(words) # 输出: ['Hello', '123', 'World']
-
字符串编码和解码 (
encode()
和decode()
方法)
字符串可以被编码成字节串,字节串也可以被解码成字符串。s = "Hello World" byte_s = s.encode('utf-8') # 编码为 UTF-8 格式的字节串 print(byte_s) # 输出: b'Hello World'decoded_s = byte_s.decode('utf-8') # 解码回字符串 print(decoded_s) # 输出: Hello World
-
字符串的布尔值 (
bool()
函数)
空字符串被视为False
,非空字符串被视为True
。s1 = "" s2 = "Hello" print(bool(s1)) # 输出: False print(bool(s2)) # 输出: True
-
字符串的格式化 (
format_map()
方法)
使用字典进行格式化。person = {'name': 'Alice', 'age': 30} greeting = "My name is {name} and I am {age} years old." print(greeting.format_map(person)) # 输出: My name is Alice and I am 30 years old.
-
字符串的
zfill()
方法
使用零填充字符串,使其达到指定长度。s = "12" print(s.zfill(5)) # 输出: '0012'
-
字符串的
is
方法 (isalnum()
,isalpha()
,isdigit()
,isspace()
, 等)
检查字符串是否符合特定的条件。s = "Hello123" print(s.isalnum()) # 输出: True print(s.isalpha()) # 输出: False print(s.isdigit()) # 输出: False print(" ".isspace()) # 输出: True
-
字符串的
startswith()
和endswith()
方法
检查字符串是否以指定的前缀或后缀开始或结束。s = "Hello World" print(s.startswith("He")) # 输出: True print(s.endswith("ld")) # 输出: False
-
字符串的
partition()
和rpartition()
方法
分割字符串,返回一个元组,包含分割点前的字符串、分割点、分割点后的字符串。s = "test_string" part = s.partition('_s') print(part) # 输出: ('test', '_s', 'tring')rpart = s.rpartition('t') print(rpart) # 输出: ('s', 'tring', 'es')
-
字符串的
count()
方法
计算子串在字符串中出现的次数。s = "Mississippi" print(s.count('i')) # 输出: 4
-
字符串的
swapcase()
方法
交换字符串中的大写字母和小写字母。s = "Hello World" print(s.swapcase()) # 输出: hELLO wORLD
-
字符串的
ljust()
,rjust()
,center()
方法
对字符串进行左对齐、右对齐或居中对齐。s = "Hello" print(s.ljust(10)) # 输出: 'Hello ' print(s.rjust(10)) # 输出: ' Hello' print(s.center(10)) # 输出: ' Hello '
这些方法提供了对字符串进行更细致控制的能力,使得在处理文本数据时更加灵活和强大。