《Python数据分析技术栈》第06章使用 Pandas 准备数据 04 DataFrames

04 DataFrames

《Python数据分析技术栈》第06章使用 Pandas 准备数据 04 DataFrames

A DataFrame is an extension of a Series. It is a two-dimensional data structure for storing data. While the Series object contains two components - a set of values, and index labels attached to these values - the DataFrame object contains three components - the column object, index object, and a NumPy array object that contains the values.

DataFrame 是 Series 的扩展。它是一种用于存储数据的二维数据结构。Series 对象包含两个部分–一组数值和连接到这些数值的索引标签,而 DataFrame 对象包含三个部分–列对象、索引对象和包含数值的 NumPy 数组对象。

The index and columns are collectively called the axes. The index forms the axis “0” and the columns form the axis “1”

索引和列统称为轴。索引构成轴 “0”,列构成轴 “1”。

We look at various methods for creating DataFrames in Table 6-2.

我们将在表 6-2 中介绍创建 DataFrames 的各种方法。

By combining Series objects:Here, we are defining two Series and then using the pd.DataFrame function to create a new DataFrame called “combined_ages”. We give names to columns in a separate step.

通过组合系列对象:这里,我们定义了两个系列,然后使用 pd.DataFrame 函数创建一个名为 "combined_ages "的新 DataFrame。我们将在另一个步骤中为列命名。

student_ages=pd.Series([22,24,20]) #series 1
teacher_ages=pd.Series([40,50,45])#series 2
combined_ages=pd.DataFrame([student_ages,teacher_ages]) #DataFrame
combined_ages.columns=['class 1','class 2','class 3']#naming columnscombined_ages

From a dictionary:A dictionary is passed as an argument to the pd.DataFrame function (with the column names forming keys, and values in each column enclosed in a list).

从字典:字典作为参数传递给 pd.DataFrame 函数(列名构成键,每列的值用列表括起来)。

combined_ages=pd.DataFrame({'class 1':[22,40],'class2':[24,50],'class 3':[20,45]})
combined_ages

From a numpy array:Here, we create a NumPy array first using the np.arange function. Then we reshape this array into a DataFrame with two rows and four columns.

从一个 numpy 数组:在这里,我们首先使用 np.arange 函数创建一个 NumPy 数组。然后,我们将该数组重塑为两行四列的 DataFrame。

numerical_df=pd.DataFrame(np.arange(1,9).reshape(2,4))
numerical_df

Using a set of tuples:We have re-created the “combined_ages” DataFrame using a set of tuples. Each tuple is equivalent to a row in a DataFrame.

使用元组集:我们使用元组集重新创建了 “combined_ages” DataFrame。每个元组相当于 DataFrame 中的一行。

combined_ages=pd.DataFrame([(22,24,20),(40,50,45)],columns=['class 1','class 2','class 3'])
combined_ages

To sum up, we can create a DataFrame using a dictionary, a set of tuples, and by combining Series objects. Each of these methods uses the pd.DataFrame function. Note that the characters “D” and “F” in this method are in uppercase; pd.dataframe does not work.

总之,我们可以使用字典、元组集和组合系列对象来创建 DataFrame。每种方法都使用 pd.DataFrame 函数。请注意,该方法中的字符 "D "和 "F "都是大写字母;pd.dataframe 不起作用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/642595.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MySQL语句 | FIELD()与ORDER BY()相结合实现对结果的自定义排序

在MySQL中,可将FIELD()与ORDER BY()结合使用,实现对查询结果的自定义规则排序。 举个通用的例子 假设有一个名为your_table的表,包含名为your_column的列,希望按照列your_column的值的特定顺序进行排序: SELECT * F…

从0开始学C++ 第二十八课 数据结构深入 - 栈和队列

第二十八课:数据结构深入 - 栈和队列 学习目标: 理解栈(Stack)的基本概念和特性。掌握队列(Queue)的基本概念和特性。学会在C中使用栈和队列。了解栈和队列的典型应用场景。 学习内容: 栈&am…

前后端分离项目中实现图形验证码

图形验证码在我们的日常生活中时经常用到的,一般用于用户的登录、注册等。 图形验证码在互联网应用中的作用是提高安全性、防止滥用和保护用户隐私。它是一种简单而有效的人机验证技术,帮助保护系统和用户免受自动化攻击的影响。 本次我们通过spring b…

损失函数是指什么

损失函数(Loss Function)是用来衡量模型预测输出与实际目标之间差异的函数。在机器学习和深度学习中,损失函数是模型训练的关键部分。其目标是通过最小化损失函数来使模型的预测尽可能接近实际的标签或目标值。 在监督学习中,模型…

跟着野火学FreeRTOS:第二段(队列管理)

队列( Q u e u e s Queues Queues)是 F r e e R T O S FreeRTOS FreeRTOS中的一种数据结构,这种数据结构提供了一种任务和任务之间,任务和中断之间的通信机制。队列可以存储一定有限数量的固定大小( u x I t e m S i z…

Adobe Media Encoder 2023下载安装教程,ME 2023安装教程,附安装包和工具,无套路,轻松搞的安装

前言 Adobe Media Encoder是一个视频和音频编码应用程序,可让针对不同应用程序和观众,以各种分发格式对音频和视频文件进行编码。包括专门设计的预设设置,以便导出与特定交付媒体兼容的文件,可以按适合多种设备的格式导出视频&am…

漫漫数学之旅010

文章目录 经典格言数学习题古今评注科学家小传(一)艾伦凯(二)托马斯C黑尔斯 经典格言 计算机的归宿是融入我们的生活,就像其它一切我们习以为常的东西:手表、纸、铅笔和衣服,我们不再把它们看作…

Hbas简介:数据模型和概念、物理视图

文章目录 说明零 BigTable一 Hbase简介二 HBase 访问接口简介三 行式&列式存储四 HBase 数据模型4.1 HBase 列族数据模型4.2 数据模型的相关概念4.3 数据坐标 五 概念&物理视图 说明 本文参考自林子雨老师的大数据技术原理与应用(第三版)教材内容,仅供学习…

maven pom中的内置变量及引用

目录 前言内置变量引用 前言 maven其实有很多内置变量供开发着在开发中使用,比如说basedir这变量,它指的是pom.xml文件所在的目录,下面我们一起来认识一下。 内置变量 变量名作用说明basedir 、project.basedir项目的根目录即包含 pom.xml 文…

Gen AI大潮来袭!8个Salesforce新岗位,你会选择哪个?

人工智能席卷全球,企业对如何整合GenAI有着浓厚的兴趣。为启动企业的GenAI转型浪潮,Salesforce宣布与埃森哲和德勤建立合作伙伴关系,并计划推出更多支持项目。 目前,Salesforce领域的其他咨询公司正在提高员工技能,以…

C++之类型定义

# define QT_PREPEND_NAMESPACE(name) ::name template <class T> struct QIntegerForSizeof: QIntegerForSize<sizeof(T)> { }; typedef QIntegerForSizeof<void*>::Unsigned quintptr; typedef QT_PREPEND_NAMESPACE(quintptr) WId; WId winid; ​ 这段代…

笨蛋学设计模式行为型模式-状态模式【20】

行为型模式-状态模式 8.7状态模式8.7.1概念8.7.2场景8.7.3优势 / 劣势8.7.4状态模式可分为8.7.5状态模式8.7.6实战8.7.6.1题目描述8.7.6.2输入描述8.7.6.3输出描述8.7.6.4代码 8.7.7总结 8.7状态模式 8.7.1概念 ​ 状态模式是指对象在运行时可以根据内部状态的不同而改变它们…

Apache Zeppelin结合Apache Airflow使用1

Apache Zeppelin结合Apache Airflow使用1 文章目录 Apache Zeppelin结合Apache Airflow使用1前言一、安装Airflow二、使用步骤1.目标2.编写DAG2.加载、执行DAG 总结 前言 之前学了Zeppelin的使用&#xff0c;今天开始结合Airflow串任务。 Apache Airflow和Apache Zeppelin是两…

C语言数据结构(3)——线性表其二(单链表)

欢迎来到博主的专栏——C语言数据结构 博主id&#xff1a;代码小豪 文章目录 单链表不连续存储的线性表单链表单链表的结构头指针单链表的操作打印单链表 空链表单链表的插入尾插法 头插法 单链表的查找任意位置处的节点插入单链表节点的删除 销毁链表 单链表 顺序表是一个物…

万字长文详解Java线程池面试题

王有志&#xff0c;一个分享硬核 Java 技术的互金摸鱼侠 加入 Java 人的提桶跑路群&#xff1a;共同富裕的Java人 今天是《面霸的自我修养》第 6 篇文章&#xff0c;我们一起来看看面试中会问到哪些关于线程池的问题吧。数据来源&#xff1a; 大部分来自于各机构&#xff08;J…

【K8S】Kubernetes 中滚动发布由浅入深实战

目录 一、Kubernetes中滚动发布的需求背景1.1 滚动发布1.2 滚动发布、蓝绿发布、金丝雀发布的区别 二、Kubernetes中实现滚动发布2.1 定义Kubernetes中的版本2.2 创建 Deployment 资源对象2.2.1 在 Yaml 中定义 Deployment 资源对象2.2.2 执行命令创建 Deployment 资源对象 三、…

Asp.net core 框架入门

概述 appsettings.json&#xff1a;配置文件&#xff0c;数据库连接字符串配置信息 Program.cs&#xff1a;程序入口文件&#xff08;里面有个Main方法&#xff09; Startup.cs&#xff1a;启动配置文件 依赖项&#xff1a;管理项目所依赖的第三方组件的安装&#xff0c;配…

WampServer

开发笔记 推荐链接php无法保存SESSION问题部署SSL时候产生的问题 推荐链接 链接目录 php无法保存SESSION问题 php.ini文件和phpForApache.ini 文件 里面都有 对路径的控制&#xff0c;相关路径问题可能也需要进行修改&#xff0c;打开文件搜索wamp64或wamp 就可以看到了&…

“深入理解RabbitMQ交换机的原理与应用“

深入理解RabbitMQ交换机的原理与应用 引言1. RabbitMQ交换机简介介绍1.1 什么是RabbitMQ&#xff1f;1.1.1 消息中间件的作用1.1.2 RabbitMQ的特点和优势 1.2 RabbitMQ的基本概念1.2.1 队列1.2.2 交换机1.2.3 路由键 1.3 交换机的作用和分类1.3.1 直连交换机&#xff08;direct…

leetcode 热题100-学习计划

一、题目链接 1. 两数之和 - 力扣&#xff08;LeetCode&#xff09; 解题思路 暴力破解——解题代码 class Solution:def twoSum(self, nums: List[int], target: int) -> List[int]:n len(nums)result []for i in range(0,n):for j in range(i 1,n):#print(i,j)sum …