import pandas as pd df = pd.DataFrame({ 'col1': ['Hello', 'World', ''], 'col2': ['from', 'of', 'the'], 'col3': ['Pandas', 'Data', 'World'], 'col4': ['!', '!', '!']
}) # 自定义一个函数来合并一行的所有字符串,接收一行数据作为输入
def merge_row_strings(row): # 使用join方法合并字符串,astype(str)确保每个元素都被转换为字符串类型 return ' '.join(row.astype(str)) # 使用apply()方法按行应用(axis=1)自定义函数
df['merged'] = df.apply(merge_row_strings, axis=1) print(df)'''col1 col2 col3 col4 merged
0 Hello from Pandas ! Hello from Pandas !
1 World of Data ! World of Data !
2 the World ! the World !
'''
ps:
df.apply(merge_row_strings, axis=1)
这里注意括号里merge_row_strings函数后面是不加括号和参数的,因为这个函数是作为参数传递给另一个函数(传递给apply
)的。加括号通常是为了调用函数并获取它的返回值,但在这里你只是传递函数本身作为一个“对象”或“引用”。
merge_row_strings
传递给apply,
实际上是在告诉apply
方法:“请对df
的每一行(因为axis=1
)调用这个函数。” apply
方法会在内部处理每一行数据,并将每一行作为一个参数传递给merge_row_strings
函数。
如果写了括号:df.apply(merge_row_strings(), axis=1),将会导致语法错误,因为Python会尝试立即执行merge_row_strings()
函数(注意括号),但该函数需要一个参数(即DataFrame的一行),而在这里你没有提供。正确的做法是将函数名(不带括号)作为参数传递,这样apply
方法就可以在需要的时候调用这个函数,并为它提供正确的参数。