DataFrame 的常用操作

DataFrame是什么?

        DataFrame 是一种用于处理和分析数据的二维标签数据结构。它类似于Excel中的电子表格或数据库中的表格,由行和列组成。每个列可以是不同的数据类型(如整数、浮点数、字符串等),并且可以进行各种数据操作,如过滤、聚合和可视化。

特点
  • 二维结构:DataFrame 是一个二维数据结构,可以包含多种不同的数据类型(如数值、字符串、布尔值等)。
  • 标签索引:每个轴(行和列)都有标签(即索引),这使得 DataFrame 在数据选择和操作时非常灵活。
  • 对齐操作:DataFrame 在算术运算时会自动对齐数据,确保相同标签的数据对齐进行运算。
创建DataFrame
import pandas as pd# 从字典创建DataFrame
data = {"name": ["Alice", "Bob", "Crestina", "john"],"age": [12, 32, 38, 22],"city": ["云南", "广西", "香港", "香港"]
}
df = pd.DataFrame(data)
print(df)
常用操作
print("--------------查看:返回前几条数据-----------------")
print(df.head())print("--------------查看:返回后几条数据-----------------")
print(df.tail())print("--------------查看:数据结构-----------------")
print(df.info())print("--------------查看:数据的统计信息-----------------")
print(df.describe())print("--------------选择:单列-----------------")
print(df["name"])print("--------------选择:多列-----------------")
print(df[["name", "age"]])print("--------------选择:按标签选择行-----------------")
print(df.loc[0])print("--------------选择:按位置选择行-----------------")
print(df.iloc[1])print("--------------过滤:年龄大于20-----------------")
print(df[df["age"] > 20])print("--------------操作:添加列-----------------")
df["id"] = ["5", "6", "7", "9"]
print(df)print("--------------操作:删除列-----------------")
df.drop("id", axis=1, inplace=True)
print(df)print("--------------清理:删除缺失值-----------------")
df["id"] = ["5", "6", np.nan, np.nan]
print(df)print("--------------清理:行中有NAN,则删除整行-----------------")
# print(df.dropna(axis= 0))print("--------------清理:列中有NAN,则删除整列-----------------")
# print(df.dropna(axis= 1))print("--------------清理:填充NAN-----------------")
print(df.fillna("0"))print("--------------聚合:数据聚合(按city分组,计算平均值)-----------------")
print(df.groupby("city").mean())

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/41020.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vb与数据库编程

第一节 一、数据库基础知识 数据库的概念 数据库是按照数据结构来组织、存储和管理数据的仓库。 它可以存储大量的数据,并提供高效的数据访问和管理功能。 数据库的类型 关系型数据库:如 SQL Server、MySQL、Oracle 等,以表格形式存储数据,通过关系(如主键和外键)来关联不…

数据结构之二叉树概念

数据结构之二叉树 二叉树简介分类普通二叉树平衡二叉树满二叉树二叉搜索树(二叉排序树、二叉查找树),平衡二叉树红黑树 B树类型B树(B-树、B_树)B树B*树 二叉树 简介 二叉树(Binary Tree) :是一种非常重要…

RPC框架之Dubbo

Dubbo 是一款高性能、轻量级的开源 Java RPC(Remote Procedure Call)框架,由阿里巴巴集团于2011年发布。Dubbo 主要用于实现基于微服务架构的分布式应用,通过提供服务注册与发现、负载均衡、容错等功能,极大地简化了服…

头歌资源库(19)在排序数组中查找元素的首尾位置

一、 问题描述 二、算法思想 该问题可以通过二分查找的思想来解决。 首先,我们可以使用二分查找找到目标值在数组中的任意一个位置(即该位置的值等于目标值)。假设找到的位置为mid。 接下来,我们需要在mid的左边和右边分别找到…

UNIAPP_顶部导航栏右侧添加uni-icons图标,并绑定点击事件,自定义导航栏右侧图标

效果 1、导入插件 uni-icons插件:https://ext.dcloud.net.cn/plugin?nameuni-icons 复制 uniicons.ttf 文件到 static/fonts/ 下 仅需要那个uniicons.ttf文件,不引入插件、单独把那个文件下载到本地也是可以的 2、配置页面 "app-plus":…

Python爬虫+数据分析+数据可视化图形-爬取高校排名数据

①本文主要使用python 爬取了中国大学排名前30的大学信息,并进行了数据处理及分析,是一个比较经典的python爬虫和分析项目 ②主要内容:爬虫数据预处理数据可视化分析 完整代码请看这里拿👇↓↓↓

Flutter本地数据持久化的几种方式

目录 前言 一、shared_preferences 1.添加依赖 2.保存数据 3.读取数据 4.移除数据 5.Shared_preferences的优缺点 6.完整的示例代码 二、path_provider 1.导入path_provider 2.创建文件读写的目录 3.向文件中写入数据 4.从文件中读取数据 5.完整的示例代码 三、…

Mac本地部署大模型-单机运行

前些天在一台linux服务器(8核,32G内存,无显卡)使用ollama运行阿里通义千问Qwen1.5和Qwen2.0低参数版本大模型,Qwen2-1.5B可以运行,但是推理速度有些慢。 一直还没有尝试在macbook上运行测试大模型&#xf…

我这个经验好找嵌入式的工作吗?

大家好,我是麦鸽。最近网友的提问,这样的经验,好找嵌入式的工作吗? 下面是网友的情况: 本人目前大二机器人工程,未来想要入职嵌入式行业,有robomaster比赛经验本人负责电控,但是由于…

基因组学系列3:基因分型Phasing与单倍型参考序列HRC

1. 基因分型Phasing概念 基因分型,也称为基因定相、单倍体分型、单倍体构建等,即将一个二倍体(或多倍体)基因组上的等位基因(或杂合位点)正确定位到父亲或母亲的染色体上,最终使得来自同一亲本…

相亲交友APP系统婚恋交友社交软件开发语音视频聊天平台定制开发-婚恋相亲交友软件平台介绍——app小程序开发定制

互联网飞速发展的时代,相亲交友软件成为了许多年轻人首选的相亲方式,越来越多的单身男女希望在婚恋交友软件平台上寻找灵魂伴侣,相亲交友软件因此具有很高的市场价值。 多客婚恋相亲交友系统是一款定位高端,到手就能运营的成熟婚恋…

软件测评中心▏软件验收测试方法和测试内容简析

在当今数字化转型的浪潮下,软件验收测试变得越来越重要。软件验收测试,顾名思义,是对软件进行验收的过程中进行的一项测试。它用于确保软件在满足需求、达到预期效果后才能正式交付给客户使用。软件验收测试是一项全面、系统的测试过程&#…

sublime 3 背景和字体颜色修改

sublime 4 突然抽风,每次打开都显示 “plugin_host-3.3 has exited unexpectedly, some plugin functionality won’t be available until Sublime Text has been restarted” 一直没调好,所以我退回到sublime 3了。下载好了软件没问题,但是一…

半导体光电

《半导体光电》创刊于1976年,是由中国电子科技集团公司主管、重庆光电技术研究所(中国电子科技集团公司第四十四研究所)主办的中文科技期刊。本刊国内外公开发行,经过四十余年的发展已经成为我国光电子专业领域有代表性的刊物。 …

Zabbix 配置grafana对接

zabbix对接grafana简介 Zabbix与Grafana对接可以实现更加丰富和美观的数据可视化,可以让您利用Grafana强大的可视化功能来展示Zabbix收集的数据。 zabbix插件的两种安装方式 使用grafana-cli 命令进行安装在grafana管理页面中进入Administration/Plugins and dat…

2024.7.4学习日报

1、ppt前三章 5日计划 1、至少做到实验 2、java

css中文字书写方向

writing-mode 是 CSS 中的一个属性,用于设置文本、内联元素、表格单元格和表格列的书写方向、文本排列以及块流方向。以下是对 writing-mode 属性的详细介绍: 1. 语法和值 语法:writing-mode: horizontal-tb | vertical-rl | vertical-lr |…

在RT-Thread-Studio中添加arm_math库

1.在CMSIS\Lib\GCC中找到对应的库,如本文使用的libarm_cortexM4lf_math.a。将库拷贝到工程,并做如下图设置。搜索路径为库文件在项目中的实际位置。 2.将CMSIS\DSP\Include下的文件复制到工程目录中,并添加包含路径 3.添加宏定义&#xff0c…

Memcached缓存预热深度解析:加速应用性能的秘诀

Memcached缓存预热深度解析:加速应用性能的秘诀 在高性能计算环境中,Memcached作为一种广泛使用的分布式内存缓存系统,其缓存预热机制对于提升应用性能至关重要。缓存预热可以减少系统启动时的延迟,避免缓存未命中,从…