3.4pandas处理丢失数据
头文件:
import numpy as np
import pandas as pd
丢弃数据部分:
dates = pd.date_range('20130101',periods=6)
df = pd.DataFrame(np.random.randn(6,4),index=dates,columns=['A','B','C','D'])
df.iloc[0,1] = np.nan
df.iloc[1,2] = np.nanprint(df.dropna(axis=0,how='any'))
#how = any是只要有nan就丢掉,如果how = all是只有全部是nan才丢掉
把nan的地方填0
print(df.fillna(value=0))
查看数据中各个位置是否是缺失
print(df.isnull)
查看数据中是否有缺失
print(np.any(df.isnull())==True)
3.5pandas导入导出
头文件:
import pandas as pd
数据导入
data = pd.read_csv('student.csv')
数据导出
data.to_csv('student.csv')