Python机器学习实验 Python 数据分析

1.实验目的

掌握常见数据预处理方法,熟练运用数据分析方法,并掌握 Python 中的 Numpy、 Pandas 模块提供的数据分析方法。

2.实验内容

1. Pandas 基本数据处理

使用 Pandas 模块,完成以下操作。

(1)创建一个由 0 到 50 之间的整数组成的 10 行 5 列的 dataframe。如下:

(2)汇总每一列的最小值。

(3)按行方向汇总每行数据的总和。

(4)按列方向汇总每列数据的总和。

代码:

#创建一个由 0 到 50 之间的整数组成的 10 行 5 列的 dataframe
import pandas as pd
import numpy as np
df = pd.DataFrame(np.arange(0, 50).reshape(10, 5))
# 输出 dataframe
print('dataframe:',df)
# 汇总每一列的最小值
min_values = np.min(df, axis=0)
print("每列的最小值:", min_values)
# 按行方向汇总每行数据的总和
row_sums = np.sum(df, axis=1)
print("每行的总和:", row_sums)
# 按列方向汇总每列数据的总和
col_sums = np.sum(df, axis=0)
print("每列的总和:", col_sums)

2.  城市夏季气温分析 在“tpData.csv”文件中存储的是韩国某城市夏季的最高、最低气温数据,时间是

从 2013 年到 2018 年间,日期是从每年的 6 月 30 日到 8 月 30 日。其中 Present_Tmax

字段代表下午 2 点测量的最高温度。Present_Tmin 代表凌晨 4 点测量的最低温度。完 成以下操作。

(1)使用 Pandas 的 read_csv()函数读取“tpData.csv”,并显示数据。 import pandas as pd

df = pd.read_csv('tpData.csv')

#header:Year Month Day Present_Tmax Present_Tmin df

图 4-1   韩国某城市夏季温度数据

(2)按年度分组,查看每年各有多少条数据。 操作提示:

使用 groupby 函数,按 Year 字段分组。

#分组统计

df.groupby('Year').size() #查看组大小结果

(3)按年份统计每年的最高温度的平均值。 操作提示:

使用 groupby 函数,按 Year 字段分组,统计 Present_Tmax 字段的平均值。

df.groupby('Year')['Present_Tmax'].mean()

(4)按月份统计 6、7、8 每个月的最高温度的平均值。

df.groupby('Month')['Present_Tmax'].mean()

(5)按月份统计 6、7、8 每个月的最低温度的平均值。

df.groupby('Month')['Present_Tmin'].mean()

代码:

#使用 Pandas 的 read_csv()函数读取“tpData.csv”,并显示数据
import pandas as pd
df = pd.read_csv(r'D:\tpData.csv')
print(df)
#按年度分组,查看每年各有多少条数据。 操作提
print(df.groupby('Year').size())
#按年份统计每年的最高温度的平均值。 操作提示
print(df.groupby('Year')['Present_Tmax'].mean())
#按月份统计 6、7、8 每个月的最高温度的平均值。
print(df.groupby('Month')['Present_Tmax'].mean())
#按月份统计 6、7、8 每个月的最低温度的平均值。
print(df.groupby('Month')['Present_Tmin'].mean()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/791053.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Ai音乐大师演示(支持H5、小程序)独立部署源码

Ai音乐大师演示(支持H5、小程序)独立部署源码

使用IntelliJ IDEA配置版本管理(SVN和Git)

一:SVN版本管理 步骤一:安装SVN插件 打开IntelliJ IDEA,点击顶部菜单栏的 "File" -> "Settings"。在弹出的窗口中,选择 "Plugins"。在搜索框中输入 "SVN",找到 "Su…

如何在Python中处理JSON数据?

如何在Python中处理JSON数据? 在Python中处理JSON数据是一个常见的任务,因为JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,它易于人阅读和编写,同时也易于机器解析和生成。Python的内置库…

政安晨:【Keras机器学习实践要点】(十五)—— KerasTuner 简述

目录 导言 调整模型结构 定义搜索空间 开始搜索 查询结果 重新训练模型 调整模型训练 调整数据预处理 重新训练模型 指定调整目标 以内置指标为目标 以自定义指标为目标 调整端到端工作流程 将 Keras 代码分开 政安晨的个人主页:政安晨 欢迎 &#x1…

Web框架开发-Django-model进阶

一、QuerySet 可切片 使用python的切片语法来限制查询集记录的数目,它等同于SQL的limit和offset子句。 1 2 In [2]: Book.objects.all()[:5] # (LIMIT 5) In [2]: Book.objects.all()[5:10]     # (OFFSET 5 LIMIT 5) 不支持负的索引(例…

漫谈结构体

注意: 1.结构体是自定义数据类型,定义之后使用就跟使用库自带的int这些数据类型一样的。 2.定义结构体类型不会分配内存空间,定义变量才会。 1.匿名结构体(声明时创建变量,不然没啥用) 匿名结构体是没有定…

React 入门

一、官网地址 英文官网: https://reactjs.org/中文官网: https://react.docschina.org/ 二、React 特点 声明式编码组件化编码React Native 编写原生应用高效(优秀的 Diffing 算法)高效的原因:1.使用虚拟DOM,不总是直接操作页面…

vultr ubuntu 服务器远程桌面安装及连接

一. 概述 vultr 上开启一个linux服务器,都是以终端形式给出的,默认不带 ui 桌面的,那其实对于想使用服务器上浏览器时的情形不是很好。那有没有方法在远程服务器安装桌面,然后原程使用呢?至少ubuntu的服务器是有的&am…

搜索--找出克隆二叉树中的相同节点

题目描述 给你两棵二叉树,原始树 original 和克隆树 cloned,以及一个位于原始树 original 中的目标节点 target。 其中,克隆树 cloned 是原始树 original 的一个 副本 。 请找出在树 cloned 中,与 target 相同 的节点&#xff…

AGI时代,LLM可以在AutoML哪些环节进行增强?

当下大模型技术发展如火如荼,颇有改变各行业和各领域的架势。那么对于AutoML来讲,LLM对其有哪些助力?对于这个问题,我们来问一问kimi chat,看看它怎么回答? 大型语言模型(LLM)可以在…

React|获取oss存储的文件,并转为json格式

使用axios通过oss的url获取.xlsx文件流,处理后得到json格式数据: 安装xlsx: npm install xlsx import axios from "axios"; import * as XLSX from "xlsx";//#region xlsx(oss) to json async function getFileStream(u…

Successive Convex Approximation算法的学习笔记

文章目录 一、代码debug二、原理 本文主要参考了CSDN上的 另一篇文章,但规范了公式的推导过程和修缮了部分代码 一、代码debug 首先,我们将所有的代码放到MATLAB中,很快在命令行中出现了错误信息 很显然有问题,但是我不知道发生…

dm8用户配置免密登录

dm8用户配置免密登录 基础环境 操作系统:Red Hat Enterprise Linux Server release 7.9 (Maipo) 数据库版本:DM Database Server 64 V8 架构:单实例1 操作系统认证(sysdba) 1.1 官方文档 《DM8安全管理》手册 2 用户…

湖仓管理系统 Amoro部署

简介 Apache Amoro(incubating) 是一个构建在 Apache Iceberg 等开放数据湖表格之上的湖仓管理系统,提供了一套可插拔的数据自优化机制和管理服务,旨在为用户带来开箱即用的湖仓使用体验。 Amoro 的愿景是依托于 Apache Iceberg、Apache Paimon 等新型数据湖表格式的基础功…

Java:线程、进程、多线程

在Java中,线程、进程和多线程是实现并发编程的关键概念。理解它们的定义、特点和如何使用它们对于创建高效、响应迅速的应用程序至关重要。 进程(Process) 进程是操作系统分配资源和调度的基本单位,它包含了程序的执行状态和所需…

微信小程序媒体查询

在微信小程序中,media媒体查询不支持screen关键字,因为小程序页面是再webview中渲染的,而不是在浏览器中渲染的。 在设置样式时,可以使用 wxss 文件中的 media 规则来根据屏幕宽度或高度设置不同的样式。 device-width:设备屏幕…

redis 性能管理

一、查看 redis 内存使用 info memory 1, 进入 redis 查看 2, redis 外查看 二 内存碎片率 1,used_memory_rss 表示该进程所占物理内存的大小,即为操作系统分配给 Redis 实例的内存大小。 2,used_memory Redis …

手机领域的平台之战

平台应用的模式最早是从手机应用开始的。在管理软件领域,最早是各厂商自己做自己的App。OA厂商、CRM厂商、HR厂商等等,都推自己的APP。现在逐步放弃了自有App,转向小程序。也就是平台之战第一阶段结束,几个大厂干掉了千千万万个小…

git如何正确合并分支

在 Git 中,合并分支是一个常见的操作,它允许你将一个分支的更改集成到另一个分支中。以下是一些正确合并分支的步骤和最佳实践: 合并前需要add和commit -m 提交到本地仓库在进行合并 1. 查看分支状态 在合并之前,最好先查看当前仓…

【智能算法】猎豹优化器(CO)原理及实现

目录 1.背景2.算法原理2.1算法思想2.2算法过程 3.结果展示4.参考文献 1.背景 2022年,MA Akbari等人受到自然界中猎豹捕猎行为启发,提出了猎豹优化器(The Cheetah Optimizer,CO)。 2.算法原理 2.1算法思想 CO法对猎…