数据分析-Pandas类别数据序列合并

数据分析-Pandas类别数据序列合并

数据分析和处理中,难免会遇到各种数据,那么数据呈现怎样的规律呢?不管金融数据,风控数据,营销数据等等,莫不如此。如何通过图示展示数据的规律?

数据表,时间序列数据在数据分析建模中很常见,例如天气预报,空气状态监测,股票交易等金融场景。数据分析过程中重新调整,重塑数据表是很重要的技巧,此处选择Titanic数据,以及巴黎、伦敦欧洲城市空气质量监测 N O 2 NO_2 NO2数据作为样例。

数据分析

数据分析-Pandas如何转换产生新列

数据分析-Pandas如何统计数据概况

数据分析-Pandas如何轻松处理时间序列数据

数据分析-Pandas如何选择数据子集

数据分析-Pandas如何重塑数据表-CSDN博客

实验数据分析处理,股票序列,时间序列,信号序列,有时候表格的数据并不完全是数值类型,也有可能是字符串,或者其他数据,需要做分类处理。pandas如何控制数据分类处理呢?需要配置哪些参数?

数据梳理

优化的 pandas 的.loc.iloc.at.iat, 使得数据访问方式正常。唯一的区别是返回类型(用于获取),和可以赋值已有的数值。categories

分类数据的合并

默认情况下,合并相同类别的数据返回也是该类别。否则,返回结果是取决于两者的类别情况。

两个相同类别的序列合并

In [1]: from pandas.api.types import union_categoricals
# 类别相同
In [2]: s1 = pd.Series(["a", "b"], dtype="category")
In [3]: s2 = pd.Series(["a", "b", "a"], dtype="category")
In [4]: pd.concat([s1, s2])
Out[4]: 
0    a
1    b
0    a
1    b
2    a
dtype: category
Categories (2, object): ['a', 'b']

两个不同类别的序列合并,变成普通序列

# 不同类别合并
In [5]: s3 = pd.Series(["b", "c"], dtype="category")
In [6 pd.concat([s1, s3])
Out[6]: 
0    a
1    b
0    b
1    c
dtype: object

两个不同类别的序列合并,强制转换类别:

# 类型转换,输出类型通过类别进行推断
In [7]: pd.concat([s1, s3]).astype("category")
Out[7]: 
0    a
1    b
0    b
1    c
dtype: category
Categories (3, object): ['a', 'b', 'c']In [8]: union_categoricals([s1.array, s3.array])
Out[8]: 
['a', 'b', 'b', 'c']
Categories (3, object): ['a', 'b', 'c']

两个数值类型的分类数据序列合并,自动推断类别

# 输出类型通过类别进行推断
In [1]: int_cats = pd.Series([1, 2], dtype="category")
In [2]: float_cats = pd.Series([3.0, 4.0], dtype="category")
In [3]: pd.concat([int_cats, float_cats])
Out[3]: 
0    1.0
1    2.0
0    3.0
1    4.0
dtype: float64

序列拼接总结

下表总结类别数据的合并情况的结果:

arg1arg2相同结果
类别类别Truecategory
类别(对象)类别(对象)Falseobject(推断 dtype )
类别 (int)类别(浮动)Falsefloat (dtype 被推断)

以上代码只是一个简单示例,示例代码中的表达式可以根据实际问题进行修改。

后面介绍下其他的展示形式。

觉得有用 收藏 收藏 收藏

点个赞 点个赞 点个赞

End

GPT专栏文章:

GPT实战系列-ChatGLM3本地部署CUDA11+1080Ti+显卡24G实战方案

GPT实战系列-LangChain + ChatGLM3构建天气查询助手

大模型查询工具助手之股票免费查询接口

GPT实战系列-简单聊聊LangChain

GPT实战系列-大模型为我所用之借用ChatGLM3构建查询助手

GPT实战系列-P-Tuning本地化训练ChatGLM2等LLM模型,到底做了什么?(二)

GPT实战系列-P-Tuning本地化训练ChatGLM2等LLM模型,到底做了什么?(一)

GPT实战系列-ChatGLM2模型的微调训练参数解读

GPT实战系列-如何用自己数据微调ChatGLM2模型训练

GPT实战系列-ChatGLM2部署Ubuntu+Cuda11+显存24G实战方案

GPT实战系列-Baichuan2本地化部署实战方案

GPT实战系列-Baichuan2等大模型的计算精度与量化

GPT实战系列-GPT训练的Pretraining,SFT,Reward Modeling,RLHF

GPT实战系列-探究GPT等大模型的文本生成-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/770096.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

双进程交互实现App自动重启

背景 你可能会好奇,有些手游(比如王者荣耀)是怎么实现资源更新后自动重启的? 这个体验确实不错,因为不需要用户手动点击桌面图标重启App,在一些数据恢复备份的场景中,很实用。比如&#xff0c…

代码随想录算法训练营第二十天| 654.最大二叉树,617.合并二叉树,700.二叉搜索树中的搜索,98.验证二叉搜索树

题目与题解 654.最大二叉树 题目链接:654.最大二叉树 代码随想录题解:654.最大二叉树 视频讲解:又是构造二叉树,又有很多坑!| LeetCode:654.最大二叉树_哔哩哔哩_bilibili 解题思路: 构造最大二…

数据库及中表的创建和管理

目录 创建数据库 使用数据库(使用,查看信息) 修改数据库(删除,修改)

promethus的安装使用

1、# 软件下载地址 https://prometheus.io/download/ https://grafana.com/grafana/download https://prometheus.io/download/ Prometheus是一套开源的监控&报警&时间序列数据库的组合,起始是由SoundCloud公司开发的。 Prometheus 的优点 1、非常少的外部依赖,安装…

OceanBase4.2.2.1 单机集群在ArmX86安装(自测记录)

OceanBase OceanBase就不必多加介绍了,本次主要是分享对于它的安装使用,先说说背景,首先接触是因为信创国产化的要求,为满足支持国产化,安装了Arm架构下版本4.0.0,满足支持通过。后来项目实际使用&#xff…

由浅到深认识Java语言(20):包装类

该文章Github地址:https://github.com/AntonyCheng/java-notes 在此介绍一下作者开源的SpringBoot项目初始化模板(Github仓库地址:https://github.com/AntonyCheng/spring-boot-init-template & CSDN文章地址:https://blog.c…

JavaScript中实现数组去重

在JavaScript中实现数组去重是一个常见的问题,下面是一个使用不同方法实现数组去重的示例代码: 方法一:使用Set对象 javascript function uniqueArray(arr) { return [...new Set(arr)]; } const arr [1, 2, 3, 3, 4, 5, 5, 6]; cons…

leetcode刷题日记-外观数组

题目描述 解题思路 初始化字符串 init 为 “1”,作为外观数列的第一项。 通过循环迭代生成外观数列的下一项,循环次数为 n-1,因为已经初始化了第一项。 在每次迭代中,通过两个指针 pos 和 start 来遍历当前项 init,po…

C++中的枚举类型

C中的enum(枚举)类型是一种用户定义的类型,用于表示一组整数值,每个值都有对应的名称,增强了代码的可读性和可维护性。 1. 基本枚举类型 基本的枚举类型定义了一组命名的整数常量。 enum Color {RED,GREEN,BLUE };C…

创业之路:探索如何在Facebook上创业成功

引言 在当今数字化时代,社交媒体已成为创业者们开展业务、建立品牌和推广产品的重要平台之一。作为全球最大的社交媒体平台之一,Facebook为创业者提供了丰富的机会和资源。本文将探讨如何在Facebook上创业成功的关键因素和实践方法,帮助创业…

Spring Cloud: openFegin

文章目录 一、什么是openFegin 一、什么是openFegin Spring Cloud OpenFeign 是一个声明式的 Web Service 客户端,它使得编写 Web Service 客户端变得更加简单。OpenFeign 整合了 Ribbon 和 Hystrix,提供了负载均衡和容错机制。同时,OpenFei…

语 句 篇

文章目录 1. if 语句2. for 循环3. while 循环 1. if 语句 if 语句用于基于某个条件执行代码。如果条件为真(True),则执行相应的代码块;如果条件为假(False),则跳过该代码块。 基本语法&#…

第九届蓝桥杯大赛个人赛省赛(软件类)真题C 语言 A 组-第几个幸运数字

幸运数字是可以被3,5,7任一整除的数字&#xff0c;列举小明号码内的所有可能组合并计数。注意别忘了把1占的一位减去。 #include<stdio.h> typedef long long ll; int main(){long long ans 0, n 59084709587505LL;for(ll i 1; i < n; i * 3){//计算小于等于n的数…

关于MySQL查询JSON的语法糖

1. 根据单JSON对象查询 select count(1) from report_configuration r where json_extract(r.report_configuration,$.dataSetName) :dataSetName 2.纯数组JSON查询 one代表就遇到第一个就返回 固定写法 SELECT count(1) FROM statistics_property where data_set_name …

AI程序员的诞生会对程序员有多大影响?

近期&#xff0c;全球首位AI程序员Devin的出场&#xff0c;不禁让我想到了一个有趣的问题&#xff1a;AI程序员会不会抢程序员的饭碗呢&#xff1f;先别着急下结论&#xff01;虽然AI技术在编程领域越来越广泛&#xff0c;但它真的能完全替代我们程序员吗&#xff1f; 目前的AI…

不愧是淘天,全方位八股拷打

恭喜发现宝藏&#xff01;搜索公众号【TechGuide】回复公司名&#xff0c;解锁更多新鲜好文和互联网大厂的笔经面经&#xff0c;目前已更新至美团、微软… 作者TechGuide【全网同名】 基本情况 投递岗位&#xff1a;后台开发 投递部门&#xff1a;阿里淘天 招聘类型&#xf…

数据结构中排序算法

介绍 排序算法是计算机科学中的一类算法&#xff0c;用于对元素序列进行排序&#xff0c;以便按照某种特定的顺序&#xff08;如升序或降序&#xff09;组织数据。这些算法在软件开发和数据处理中扮演着至关重要的角色&#xff0c;因为它们可以提高搜索效率、优化数据结构的访…

计算机程序的编译和链接

c语言中的小小白-CSDN博客c语言中的小小白关注算法,c,c语言,贪心算法,链表,mysql,动态规划,后端,线性回归,数据结构,排序算法领域.https://blog.csdn.net/bhbcdxb123?spm1001.2014.3001.5343 给大家分享一句我很喜欢我话&#xff1a; 知不足而奋进&#xff0c;望远山而前行&am…

下载网页上的在线视频 网络视频 视频插件下载

只需要在浏览器上安装一个插件&#xff0c;就可以下载大部分的视频文件&#xff0c;几秒到一两个小时的视频&#xff0c;基本都不是问题。详细解决如下&#xff1a; 0、因为工作需要&#xff0c;需要获取某网站上的宣传视频&#xff0c;我像往常一样&#xff0c;查看视频的url…

Schemdraw小白从入门到放弃---原理工具书

文章目录 序版本最简单的例子一、总体思路二、元件2.1 color习题 2.2 label2.3 length 三、元件的连接3.1 延续性习题 3.2 方向习题 3.3 接线点习题3.3.1 默认激活anchor与沉默anchor3.3.2 切换鼠标焦点机制3.3.2.1 at函数规定元件的start接在哪个anchor上3.3.2.2 to函数规定元…