pandas 入门(2)

from pandas import Series, DataFrame, Index
import numpy as np
from numpy import nan as NAobj = Series(range(3), index=['a', 'b', 'c'])
print(obj)
index = obj.index
print(index)
print(index[1:])
# index[1] = 'd'  index对象时不可以被修改的  为了安全和共享

index = Index(np.arange(3))
obj2 = Series([1.5, -2.6, 0], index=index)
print(obj2.index is index)
# 嵌套字典(字典的字典)
pop = {'nevada': {2001: 2.4,2002: 2.9},'ohio': {2000: 1.5,2001: 1.7,2002: 3.6}
}
frame3 = DataFrame(pop)
frame3.index.name = 'year'
frame3.columns.name = 'state'
print(frame3)
print('ohio' in frame3.columns)
print(2003 in frame3.index)  # index有很多的方法和属性(有时间呢,可以摸索一下)# reindex创建适应新索引的新对象(这里我不是很懂)
obj = Series([2.3, 4.5, -23.3, 4.3], index=['d', 'b', 'a', 'c'])
print(obj)
obj2 = obj.reindex(['a', 'b', 'c', 'd', 'e'])
print(obj2)  # 索引和值一一对应,根据新索引进行重排
obj2 = obj.reindex(['a', 'b', 'c', 'd', 'e'], fill_value=0)
print(obj2)  # 索引不存在,可以引入缺失值

obj3 = Series(['blue', 'purple', 'yellow'], index=[0, 2, 4])
print(obj3)
# obj3 = obj3.reindex(range(6), method='ffill')  # 或者pad
# print(obj3)  # 向前值填充
obj3 = obj3.reindex(range(6), method='bfill')  # 或者pad
print(obj3)  # 向后值填充# 成员资格方法
data = DataFrame({'qu1': [1, 3, 4, 3, 4], 'qu2': [2, 3, 1, 2, 3], 'qu3': [1, 5, 2, 4, 4]})
print(data)# 处理缺失数据
string = Series(['aar', 'art', np.nan, 'avo'])
print(string)
print(string.isnull())# 过滤掉缺失数据
data = Series([1, NA, 3.5, NA, 7])
print(data.dropna())  # 过滤掉NA
print(data.notnull())data = DataFrame([[1, 6.5, 3], [1, NA, NA], [NA, NA, NA], [NA, 6.5, 3]])
print(data)
print(data.dropna())   # 丢弃掉含有NA的所有行
print(data.dropna(how='all'))  # 丢我掉全为NA的行
data[4] = NA
print(data)
print(data.dropna(axis=1, how='all'))   # 丢弃掉全为NA的列

df = DataFrame(np.random.randn(7, 3))
df.ix[:4, 1] = NA  # 要钱也要后
df.ix[:2, 2] = NA
print(df)
print(df.dropna(thresh=3))  # thresh对应的值是观测的数据个数# 填充缺失数据
print(df.fillna(0))
print(df.fillna({1: 0.4}))  # 指定的列进行填充
_ = df.fillna(0, inplace=True)  # 本地填充修改, 不产生新对象
print(df)df = DataFrame(np.random.randn(6, 3))
df.ix[2:, 1] = NA  # 要钱也要后
df.ix[4:, 2] = NA
print(df)
print(df.fillna(method='ffill'))  # 向前填充
print(df.fillna(method='ffill', limit=2))  # 填充限制

data = Series([1, NA, 3.5, NA, 7])
print(data)
print(data.fillna(data.mean()))  # 用平均值填充na值

 

转载于:https://www.cnblogs.com/zhangboblogs/p/9452655.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/279654.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何在Outlook 2013中管理附件

There comes a time, job-hunting, or sharing photos with older family members, where you may need to send stuff the old fashioned way – as an email attachment. If you email at work, it may be a part of your email repertoire. 有时需要找工作,与年长…

了解cron以及使用cron定时备份MySQL

cron是一个linux下的定时执行工具,可以在无需人工干预的情况下运行作业。由于Cron 是Linux的内置服务,但它不自动起来,可以用以下的方法启动、关闭这个服务: /sbin/service crond start //启动服务 /sbin/service crond stop //关…

ef 并发控制

ef 并发控制 ef 并发控制 什么是并发?并发分悲观并发和乐观并发。悲观并发:比如有两个用户A,B,同时登录系统修改一个文档,如果A先进入修改,则系统会把该文档锁住,B就没办法打开了,只有等A修改完…

C#实现写入文本文件内容功能

private void write_txt(string str1, string str2, string str3)02{03System.DateTime currentTime System.DateTime.Now;04string strYMD currentTime.ToString("d");05string FILE_NAME "MyFileSend" strYMD ".txt";//每天按照日期建立一…

如何在Windows上设置BitLocker加密

BitLocker is a tool built into Windows that lets you encrypt an entire hard drive for enhanced security. Here’s how to set it up. BitLocker是Windows内置的工具,可用于加密整个硬盘驱动器以增强安全性。 设置方法如下。 When TrueCrypt controversially …

Java字节码方法表与属性表深度剖析

方法表: 在上一次咱们已经分析到了字段信息了,如下: 紧接着就是方法相关的信息了: 而它展开之后的结构为: 所以往后数2个字节,看一下方法的总数: 3个方法,可咱们只定义了两个方法呀&…

最大连续子数组和与JUnit测试

【题目】最大连续子数组和(最大子段和) 背景 问题: 给定n个整数(可能为负数)组成的序列a[1],a[2],a[3],…,a[n],求该序列如a[i]a[i1]…a[j]的子段和的最大值。当所给的整数均为负数时定义子段和为0,依此定义…

笔记本电源适配器为什么总坏_为什么某些交流适配器和电源会发出啸叫声?

笔记本电源适配器为什么总坏Most of the time our AC adapters and power supplies tend to be quiet, but what does it mean when one makes a whining noise? Should you be concerned? Today’s SuperUser Q&A post has the answers to a worried reader’s question…

4412 字符类设备的设备号

一、静态申请字符类设备号 字符类设备函数在文件"include/linux/fs.h"中内核提供了三个函数来注册一组字符设备编号,这三个函数分别是 register_chrdev_region()alloc_chrdev_region()register_chrdev()register_chrdev_region()是提前知道设备的主次设备…

monogdb操作system.*权限

mongodb roles system.roles集合删不掉 当你自定义了特权(角色): db.createRole({role: "dropSystemViewsAnyDatabase",privileges: [{actions: [ "dropCollection" ],resource: { db: "", collection: "system.roles" }}],roles: []}…

如何发现假库存照片(并将合适的人归于属性)

Spammers and other unscrupulous advertisers are always looking for new ways to get you click on their pages. One of the latest tactics is to steal popular and useful stock images—like the kind you sometimes see in news articles—and re-upload them elsewhe…

Mysql Hunter

一、简介自动化实施的过程中,我们通常都面临一个棘手的问题:数据的准备和恢复。即在成功执行一个自动化用例时,我们可能需要一定的数据前提,而为了使得整个前提不至于被其他的用例破坏,以至于我们有时不得不在自动化用…

C6748_UART(5) - UART寄存器

1、FIFO控制寄存器(FCR)RXFIFTL:接收FIFO中断触发(当FIFO中的数据量刚到达所要求(trigger level)的时候会产生中断);DMAMODE1:如果FIFO使能的话此位可以使能DMA模式。TXCLR:发送FIFO清除。RXCLR&#xff1a…

如何在Windows 10上限制Wi​​ndows Update的下载带宽

Windows 10’s Fall Creators Update gives you more control of Windows Update’s downloads and uploads. You can now set a download bandwidth limit, ensuring Windows Update won’t hog your Internet connection with its background downloads. Windows 10的Fall Cr…

Elasticsearch嵌套查询

2019独角兽企业重金招聘Python工程师标准>>> 一、背景 最近在做基于宴会厅档期的商户搜索推荐时,如果用传统平铺式的mapping结构,无法满足需求场景,于是用到了Elasticsearch支持的Nested(嵌套)查询。 二、普通对象与嵌套对象的索引…

写给深圳首期Python自动化开发周未班的信

你是否做了正确的决定? 深圳首期周未班的同学们大家好,我是Alex, 老男孩教育的联合创始人,Python项目的发起人,51CTO学院连续2届最受学员喜爱的讲师,中国最早一批使用Python的程序员,当然还有一堆头衔&…

网站跳出率的相关要点介绍

今天小峰seo博客和大家一起来探讨关于“网站跳出率的相关要点”,这里大体是分为三大要点:首先是进入的流量渠道,然后就是综合流量速度和内容的质量问题,细的来说就是我们的网站进来的用户是搜索什么关键词来的是通过百度还是搜狗或…

如何使用PowerShell提升开发效率(以Windows Embedded CE为例)

简介 本文讲述如何使用Powershell通过RAPI来控制Windows Embedded CE和Windows Mobile设备。 缘由 我入行的时候是做AS400 RPG和UNIX C开发的,所有开发环境都是字符界面,因此习惯了vigrepmake的开发模式。后来开始做Windows的开发,开始也不大…

视频图像传输学习笔记-基础小知识(一)

摄像头DVP与MIPI区别 DVP是并口,需要PCLK、VSYNC、HSYNC、D[0:11]——可以是8/10/12bit数据,看ISP或baseband是否支持;总线PCLK极限大约在96M左右,而且走线长度不能过长,所有DVP最大速率最好控制在72M以…

java程序员面试交流项目经验

粘贴自:https://blog.csdn.net/wangyuxuan_java/article/details/8778211 1:请你介绍一下你自己 这是面试官常问的问题。一般人回答这个问题过于平常,只说姓名、爱好、工作经验,这些简历上都有。其实,面试官最希望知道…