机器学习-Padans
面对人生的烦恼与挫折,最重要的是摆正自己的心态,积极面对一切。再苦再累,也要保持微笑。笑一笑,你的人生会更美好!
目录
机器学习-Padans
1.DataFrame
2.画图
3. 扩展:
1.DataFrame
# coding = UTF-8import pandas as pd
# pandas DataFrame是用来读取样本数据的 可以认为它是一个表格
# 创建一个DataFrame
df1=pd.DataFrame([[1,2,3],[4,5,6]])
print(df1)
# 取值
# iloc 在取值时不包括最后一列(行)
df11=df1.iloc[:,1:2] # 取所有行 第一列
df22=df1.iloc[:,1:-1]
print(df11)
print(df22)
# coding = UTF-8import pandas as pd
# pandas DataFrame是用来读取样本数据的 可以认为它是一个表格
# 创建一个DataFrame
df1=pd.DataFrame([[1,2,3],[4,5,6]])
print(df1)
# 取值
# iloc 在取值时不包括最后一列(行)df11=df1.iloc[1,:] # 取第一行 所有列
df22=df1.iloc[1:2,:] # 取第一行 所有列
print(df22)
print(df11)
# coding = UTF-8import pandas as pd
# pandas DataFrame是用来读取样本数据的 可以认为它是一个表格
# 创建一个DataFrame
df1=pd.DataFrame([[1,2,3],[4,5,6]])
print(df1)
# 取值
# iloc 在取值时不包括最后一列(行)
print(df1[[0,1]]) # 取第一列 第二列print(type(df1[0])) # 查看第一列的类型 Series
print(df1[0]) # 取第一列
2.画图
我现在需要将数据显示成一张图表
# coding = UTF-8import matplotlib.pyplot as plt
# 图表显示汉字乱码
import matplotlib as mpl
mpl.rcParams['font.sans-serif']=[u'simHei']
mpl.rcParams['axes.unicode_minus']=False
# 创建
plt.figure()
# 关系
plt.plot([1,2,3],[1,2,3],label="对比图",color="red")
plt.legend()
# 显示图表
plt.show()
subplot:
# coding = UTF-8import matplotlib.pyplot as plt
# 图表显示汉字乱码
import matplotlib as mpl
mpl.rcParams['font.sans-serif']=[u'simHei']
mpl.rcParams['axes.unicode_minus']=False
# 创建
plt.figure()
# 关系
plt.subplot(1,2,1)
plt.plot([1,2,3],[1,2,3],label="对比图",color="red")
plt.legend()
plt.subplot(1,2,2)
plt.plot([1,2,3],[1,2,3],label="对比图",color="red")
plt.legend()
# 显示图表
plt.show()
3. 扩展:
"Series"通常指的是一种数据结构,特别是在数据分析和处理的上下文中。最常见的是在Python的Pandas库中使用Series,它是一种类似于一维数组的数据结构,但带有索引,可以包含不同类型的数据。
在Pandas中,Series是一种基本的数据结构,它由两个部分组成:索引(index)和值(values)。索引用于标识数据,可以是整数、标签甚至是日期时间。值则是实际的数据。下面是一个简单的示例:
import pandas as pd# 创建一个Seriesdata = pd.Series([10, 20, 30, 40, 50])print(data)
这将输出:
0 101 202 303 404 50
在这个例子中,索引是默认生成的整数索引(0到4),而值则是每个索引对应的数据。Series对象也可以使用自定义的索引:
# 创建一个带有自定义索引的Seriesdata = pd.Series([10, 20, 30, 40, 50], index=['a', 'b', 'c', 'd', 'e'])print(data)
输出:
a 10b 20c 30d 40e 50
Series可以用于许多数据分析任务,例如数据清洗、数据切片、统计计算等。它也是Pandas其他数据结构的基础,比如DataFrame,后者是一个二维表格数据结构。Series在数据分析中非常常用,因为它提供了方便的方法来处理一维数据。