美国总统身高统计与分析
- 1.安装依赖
- 2.下载数据集
- 3.数据处理
- 4.结果展示
1.安装依赖
pip install pandas
pip install numpy
pip install matplotlib
2.下载数据集
链接:https://pan.baidu.com/s/1aZLtkLyvQvRLb9tJ-B1krA
提取码:thms
–来自百度网盘超级会员V6的分享
3.数据处理
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei'] #显示中文标签
plt.rcParams['axes.unicode_minus']=False #这两行需要手动设置# 数据处理函数
def handleData():# 使用pands读取csv数据data = pd.read_csv('president_heights.csv')# 使用numpy将数据提取出来并保存为数组height = np.array(data['height(cm)'])# 计算平均值print('平均值', height.mean())# 计算标准差print('标准差', height.std())# 计算最大值print('最大值', height.max())# 计算最小值print('最小值', height.min())# numpy数据处理# 计算总统中20%的人的身高上限print('20%:', np.percentile(height, 20))# 计算总统中80%的人身高上限print('80%:', np.percentile(height, 80))# 计算中位数print('中位数:', np.median(height))# 调用数据可视化函数plot(height)# 数据可视化
def plot(height):# 直方图绘制plt.hist(height)# 设置图形名称plt.title('美国总统身高统计')# 设置x轴名称plt.xlabel('高度')# 设置y轴名称plt.ylabel('数量')# 图形展示plt.show()if __name__ == '__main__':handleData()
4.结果展示
数据处理结果
可视化结果