前言
Matplotlib画图工具的官网地址是 http://matplotlib.org/
Python环境下实现Matlab制图功能的第三方库,需要numpy库的支持,支持用户方便设计出二维、三维数据的图形显示,制作的图形达到出版级的标准。
pandas 是 Python 编程语言中一个强大的数据处理和分析库。它提供了快速、灵活和富有表达力的数据结构,设计目的是使“关系”或“标记”数据的“使用”既简单又直观。pandas 名称来源于“panel data”(面板数据)和“Python data analysis”(Python数据分析)这两个术语。
正文
1、导入必要的库
代码首先导入了必要的库:pandas和
matplotlib.pyplot
用于绘图。
import pandas as pd
import matplotlib.pyplot as plt
2、df['year'].value_counts().plot(kind='bar')
df['year'].value_counts().plot(kind='bar')
主要就是这行代码,靠他!就能完成提要所要求的工作
-
df['year']
: 这从DataFramedf
中选择了名为'year'
的列。 -
.value_counts()
: 这是一个pandas Series的方法,用于计算该列中每个唯一值的出现次数。它返回一个新的Series,其索引是原始Series中的唯一值,值是这些唯一值在原始Series中出现的次数。 -
.plot(kind='bar')
: 这将使用matplotlib库来绘制一个条形图。kind='bar'
告诉.plot()
方法我们要绘制的是条形图。
3、绘制条形图
import pandas as pd
import matplotlib.pyplot as plt
import os
# 打印当前工作目录路径
print(os.path.abspath('.'))
# 加载数据集
df = pd.read_csv('student_score.csv')
# 可视化每个年份的数据分布
plt.figure(figsize=(10, 6))
df['year'].value_counts().plot(kind='bar')
plt.title('Distribution of Data by Year')
plt.xlabel('Year')
plt.ylabel('Count')
# 显示图形
plt.show()
4、绘制饼图
plt.figure(figsize=(10, 6))
df['year'].value_counts().plot(kind='pie')
plt.title('Distribution of Data by Year')
plt.xlabel('Year')
plt.ylabel('Count')
5、小结
在Python的pandas库中,plot(kind='')
方法用于绘制不同类型的图形。kind
参数决定了图形的类型。以下是一些常用的 kind
值以及它们对应的图形:
-
'line'
或'line'
: 绘制线图(折线图)。 -
'bar'
: 绘制条形图。 -
'barh'
: 绘制水平条形图。 -
'hist'
: 绘制直方图。 -
'box'
: 绘制箱线图(盒须图)。 -
'kde'
: 绘制核密度估计图。 -
'density'
: 绘制密度图(与 'kde' 类似,但可能在某些版本的pandas中有所不同)。 -
'area'
: 绘制面积图。 -
'pie'
: 绘制饼图。 -
'scatter'
: 绘制散点图。