Pandas 创建层次化索引

1.创建多层次索引

1.1 隐式构造

  • 最常见的方法是给DataFrame构造函数的index参数传递两个或更多的数组

# 导入pandasimport numpy as npimport pandas as pddata = np.random.randint(0,100,size=(6,6))# 行索引index = [    ["1班","1班","1班","2班","2班","2班"],    ["张三","李四","王五","鲁班","张三丰","张无忌"]]# 列索引columns = [    ["期中","期中","期中","期末","期末","期末"],    ["语文","数学","英语","语文","数学","英语"]]df = pd.DataFrame(data=data,index=index,columns=columns)df

期中期末
语文数学英语语文数学英语
1班张三405130165745
李四74457048751
王五574535252276
2班鲁班938069311729
张三丰903836775630
张无忌355079453876
  • Series也可以创建多层索引

data = np.random.randint(0,100,size=6)index = [    ["1班","1班","1班","2班","2班","2班"],    ["张三","李四","王五","鲁班","张三丰","张无忌"]]s = pd.Series(data=data,index=index)s
1班  张三      7李四      9王五     57
2班  鲁班     88张三丰    36张无忌     5
dtype: int32

1.2 显式构造pd.MultiIndex

  • 使用数组

data = np.random.randint(0,100,size=(6,6))# 行索引index = pd.MultiIndex.from_arrays([    ["1班","1班","1班","2班","2班","2班"],    ["张三","李四","王五","鲁班","张三丰","张无忌"]])# 列索引columns = [    ["期中","期中","期中","期末","期末","期末"],    ["语文","数学","英语","语文","数学","英语"]]df = pd.DataFrame(data=data,index=index,columns=columns)df

期中期末
语文数学英语语文数学英语
1班张三56070165465
李四119994668251
王五37167148272
2班鲁班393365697768
张三丰53152399797
张无忌53301895736

  • 使用tuple

data = np.random.randint(0,100,size=(6,6))# 行索引index = pd.MultiIndex.from_tuples(    (        ("1班","张三"),("1班","李四"),("1班","王五"),        ("2班","鲁班"),("2班","张三丰"),("2班","张无忌")    ))# 列索引columns = [    ["期中","期中","期中","期末","期末","期末"],    ["语文","数学","英语","语文","数学","英语"]]df = pd.DataFrame(data=data,index=index,columns=columns)df

期中期末
语文数学英语语文数学英语
1班张三278920751
李四756058795015
王五374756435955
2班鲁班412543714637
张三丰665352215391
张无忌292622495624

  • 使用product

笛卡尔积:{a,b}{c,d} ==> {a,c},{a,d},{b,c},{b,d}

data = np.random.randint(0,100,size=(6,6))# 行索引index = pd.MultiIndex.from_product([    ["1班","2班"],    ["张三","李四","王五"]])# 列索引columns = [    ["期中","期中","期中","期末","期末","期末"],    ["语文","数学","英语","语文","数学","英语"]]df = pd.DataFrame(data=data,index=index,columns=columns)df

期中期末
语文数学英语语文数学英语
1班张三75548352756
李四52631106384
王五6765964516
2班张三771010944173
李四863451501887
王五97391433845

2.多层列索引

除了行索引index,列索引columns也能用同样的方法创建多层索引

  • 使用数组

data = np.random.randint(0,100,size=(6,6))# 行索引index = pd.MultiIndex.from_arrays([    ["1班","1班","1班","2班","2班","2班"],    ["张三","李四","王五","鲁班","张三丰","张无忌"]])# 列索引columns = pd.MultiIndex.from_arrays([    ["期中","期中","期中","期末","期末","期末"],    ["语文","数学","英语","语文","数学","英语"]])df = pd.DataFrame(data=data,index=index,columns=columns)df

期中期末
语文数学英语语文数学英语
1班张三205872666271
李四672263461621
王五34921517430
2班鲁班18972455086
张三丰582417324952
张无忌503326384182

  • 使用tuple

data = np.random.randint(0,100,size=(6,6))# 行索引index = pd.MultiIndex.from_tuples(    (        ("1班","张三"),("1班","李四"),("1班","王五"),        ("2班","鲁班"),("2班","张三丰"),("2班","张无忌")    ))# 列索引columns = pd.MultiIndex.from_tuples(    (        ("期中","语文"),("期中","数学"),("期中","英语"),        ("期末","语文"),("期末","数学"),("期末","英语")    ))df = pd.DataFrame(data=data,index=index,columns=columns)df

期中期末
语文数学英语语文数学英语
1班张三5537667064
李四38327979782
王五804956513219
2班鲁班366881133573
张三丰945694451534
张无忌78593572465

  • 使用product

data = np.random.randint(0,100,size=(6,6))# 行索引index = pd.MultiIndex.from_product([    ["1班","2班"],    ["张三","李四","王五"]])# 列索引columns = pd.MultiIndex.from_product([    ["期中","期末"],    ["语文","数学","英语"]])df = pd.DataFrame(data=data,index=index,columns=columns)df

期中期末
语文数学英语语文数学英语
1班张三1181749472
李四413322753677
王五428228218457
2班张三1864904180
李四249966923425
王五28411628536

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/15076.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何合理设置Java线程池大小

如何合理设置Java线程池大小:依据任务类型定制策略 Java线程池的合理配置直接关系到系统性能和资源利用率。根据任务性质的不同,合理的线程池大小设置策略也有所区别,主要包括CPU密集型、IO密集型及混合型任务。 1. CPU密集型任务 特点&am…

【全网最全】2024电工杯数学建模B题53页成品论文+完整matlab代码+完整python代码+数据预处理+可视化结果等(后续会更新)

您的点赞收藏是我继续更新的最大动力! 一定要点击如下的卡片链接,那是获取资料的入口! 【全网最全】2024电工杯数学建模B题53页成品论文完整matlab、py代码19建模过程代码数据等(后续会更新)「首先来看看目前已有的资…

微软新功能Recall引发隐私担忧,英国数据监管机构展开调查

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…

AP5163 是一款效率高,稳定可靠的 LED 灯恒流驱动控制芯片.

AP5163 特别内置了一个 LDO、其输出电压为 5V,最大可提供 5ma 电流输出。AP5163 采用小 SOT23-6 封装。特别适合宽输入电压范围的应用,其输入电压范围从 5.5V 到 36V。 AP5163 通过一个外接电阻设定输出电流,最大输出电流 3.5A。电流检测精度…

Vue小程序项目知识积累(一)

1.JS中的substring() 方法: substring() 方法用于提取字符串中介于两个指定下标之间的字符,包括空格键。 substring() 方法返回的子串包括 开始 处的字符,但不包括 结束 处的字符。 string.substring(from, to) from:必需。一个非负的整数…

头歌OpenGauss数据库-F.连接查询与子查询第3关:IN、ANY、ALL嵌套子查询

编程要求 我们为你提供了如下数据表: tb_salary表数据: idpositionsalary1Java80002Java84003Java90004Python65005Python10000 根据提供的数据,在右侧编辑器中补充代码: 查询薪资表中比Java最高工资高的所有员工职位名称和薪资&a…

[Spring Cloud] (9)XSS拦截器

文章目录 简述本文涉及代码已开源Fir Cloud 完整项目防XSS攻击必要性:作用: 整体效果后端增加拦截器开关配置pom中增加jsoup依赖添加JSON处理工具类添加xss拦截工具类防XSS-请求拦截器 前端 简述 本文涉及代码已开源 本文网关gateway,微服务…

微调LLM的理由

原文链接:https://www.freddyboulton.com/blog/when-to-finetune?continueFlag03133d546a002fc4ba73dda1632eeebe 考虑到大语言模型(llama 70b, mixtral, claude...)的能力在不断的增强的情况下,微调是否仍然是值得做的事。 下面是值得微调的一些原因…

医疗大模型和数据集整理

医疗大模型整理 LLM 类型 基座模型 持续预训练/Finetune 评估 ClinicalGPT 论文 BLOOM-7B cMedQA2, cMedQA-KG, MD-EHR, MEDQA-MCMLE, and MedDialog MedDialog MEDQA-MCMLE MD-HER cMedQA2 HuatuoGPT 论文+开源项目 Baichuan-7B Ziya-LLaMA-13B-Pretrain-v1 Distilled Instru…

Visual Studio Code插件

文章目录 工具类AIChinese (Simplified) (简体中文)cmake集Code RunnerGitLens — Git superchargedPath IntellisenseTodo TreeBookmarks (书签)markdownclangd 美化类Output Colorizer (输出窗口彩色)Doxygen Documentation Gen…

人工智能和机器学习辅助决策在空战中的未来选择

人工智能(AI)和机器学习在空战决策中的未来选择主要体现在以下几个方面: 自主决策系统:通过训练AI模型,使其具备自主决策能力。这种系统能够根据战场态势的变化,自主做出决策,并实时调整作战计划。例如,AI可以预测敌方空中机动路线,生成全面的近实时空中画面,为指挥官…

安装harbor出现问题: Running 1/1 ✘ Network harbor_harbor Error

安装harbor出现问题: [] Running 1/1 ✘ Network harbor_harbor Error 0.2s failed to create network harbor_harbor: Error response from daemon: Fa…

【无标题】 新人如何快速接手Vue大型产品项目并进行迭代和维护

这里写自定义目录标题 快速接手Vue大型产品项目 快速接手Vue大型产品项目 🚀 了解项目背景和业务功能 在踏入Vue大型产品项目之前,了解项目的背景和业务功能是至关重要的。这不仅有助于你快速理解项目的整体架构和设计思路,还能让你在后续的…

K8s 搭建 FileBeat+ELK 分布式日志收集系统 以及 KQL 语法介绍

一、K8s FileBeat ELK 介绍 ELK,即Elasticsearch、Logstash和Kibana三个开源软件的组合,是由Elastic公司提供的一套完整的日志管理解决方案。Elasticsearch是一个高度可扩展的开源全文搜索和分析引擎,它允许你快速地、近乎实时地存储、搜索…

力扣654. 最大二叉树

Problem: 654. 最大二叉树 文章目录 题目描述思路复杂度Code 题目描述 思路 对于构造二叉树这类问题一般都是利用先、中、后序遍历,再将原始问题分解得出结果 1.定义递归函数build,每次将一个数组中的最大值作为当前子树的根节点构造二叉树;…

牛客NC391 快乐数【simple 模拟法 Java/Go/PHP】

题目 题目链接: https://www.nowcoder.com/practice/293b9ddd48444fa493dd17da0feb192d 思路 直接模拟即可Java代码 import java.util.*;public class Solution {/*** 代码中的类名、方法名、参数名已经指定,请勿修改,直接返回方法规定的值…

Linux-应用编程学习笔记(二、文件I/O、标准I/O)

一、文件I/O基础 文件 I/O 指的是对文件的输入/输出操作,就是对文件的读写操作。Linux 下一切皆文件。 1.1 文件描述符 在 open函数执行成功的情况下, 会返回一个非负整数, 该返回值就是一个文件描述符(file descriptor&#x…

解禁谷歌等浏览器禁止网站使用麦克等媒体设备

1、浏览器地址栏输入chrome://flags/ 微软的chromium内核的edge浏览器,既可以输入:chrome://flags/ ,也可以输入edge://flags/ 2、打开后,界面如下 3、输入搜索,unsafe,并启用、输入需要启用的网址

探索Go语言的原子操作秘籍:sync/atomic.Value全解析

引言 ​ 在并发编程的世界里,数据的一致性和线程安全是永恒的话题。Go语言以其独特的并发模型——goroutine和channel,简化了并发编程的复杂性。然而,在某些场景下,我们仍然需要一种机制来保证操作的原子性。这就是sync/atomic.V…

对AI 感兴趣的小伙伴

如图,欢迎来玩儿! 欢迎来玩儿