13. 字符串处理方法
s = pd.Series(['A', 'B', 'C', 'Aaba', 'Baca', np.nan, 'CABA', 'dog', 'cat'])
s.str.lower()# 对于Series对象,在其str属性中有着一系列的字符串处理方法。
# 就如同上段代码一样,能很方便的对array中各个元素进行运算。
# 值得注意的是,在str属性中的模式匹配默认使用正则表达式。# str.lower是使得字符串转换为小写字母。
14. 切割表格成模块,再用concat合并
df = pd.DataFrame(np.random.randn(10,4))
df# pandas中提供了大量的方法能够轻松对Series,DataFrame和Panel对象进行不同满足逻辑关系的合并操作# 通过concat()来连接pandas对象。pieces = [df[:3], df[3:7], df[7:]]
pieces# 切割成几个模块
# 第一个模块为0到3行,第二个模块首到7行,第三个模块为7到尾行。pd.concat(pieces)# 通过concat将模块连接起来
15. Merge合并两个模块
left = pd.DataFrame({'key':['foo', 'foo'], 'lval':[1,2]})
left
right = pd.DataFrame({'key':['foo', 'foo'], 'lval':[4,5]})
right
pd.merge(left, right, on='key')# left 参与合并的左侧DataFrame
# right 参与合并的右侧DataFrame
# on:指的是用于连接的列索引名称,必须存在于左右两个DataFrame中,如果没有指定且其他参数也没有指定,则以两个DataFrame列名交集作为连接键;
16. Appen列表末尾添加行元素
df = pd.DataFrame(np.random.randn(8, 4), columns=['A', 'B', 'C', 'D'])
df
s = df.iloc[3]
s# .iloc[3]取位置3行的元素
df.append(s, ignore_index=True)# ignore_index:默认值为False,如果为True则不使用index标签
# .append使得向dataframe对象中添加新的行,将若干行添加到dataFrame后面。
更多《机器学习》,关注专栏 ♬ ♬
注:因为专栏不止我一位作者!