python数据处理模块pandas_13. Python|模块总结:Pandas(数据处理)|【老W笔记】...

一、基本操作0. 导入模块import pandas as pd1. 新建DataFrame下面的例子中,我们新建一个有3条记录2列属性的表格。3 条记录分别是Tom,Bob,Alice的个人信息,2列属性分别是name和age。

新建属性列的语法形如df['XX']= List,属性名为XX,属性值是List。例如,新建属性列age的语法df['age']=[20,28,22],属性名为age,三条记录的数值为[20,28,22]。df = pd.DataFrame()

df['name']=['Tom','Bob','Alice']

df['age']=[20,28,22]

wAAACwAAAAAAQABAEACAkQBADs=2. 查看DataFrame查看前n行。当DataFrame有海量记录的时候,我们可以只查看前n行来了解属性结构,以及数据的大致内容。

查看前n行语法df.head(n)。例如,df.head(1)查看第1行记录。df.head(1)

wAAACwAAAAAAQABAEACAkQBADs=

Screen Shot 2020-05-11 at 4.18.18 PM.png查看总行数,总列数。语法是df.shape,它返回(#rows,#cols)的元组。

也可以单独取出总行数df.shape[0]和总列数df.shape[1]。df.shape #(3, 2)DataFrame转Array。如果对数组操作更熟悉,那么可以绕开DataFrame操作的语法,用语法df.values把DataFrame直接转成2D数组来处理。df.values

wAAACwAAAAAAQABAEACAkQBADs=

Screen Shot 2020-05-11 at 4.25.48 PM.png3. 读写文件to_csv函数把DataFrame存到CSV文件中。

pd.read_csv函数把CSV文件内容读取到DataFrame中。df.to_csv('test2.csv')

df = pd.read_csv('test.csv')

三、DataFrame增删改查1. 添加行/列下面例子中,新增了一个height列,新增了一条Lily的记录。

新增一列的语法形如df['XX']=List,属性名XX,属性值为List。例如,语法df['height']=[1.75,1.80,1.68],新增列名height,数值分别为[1.75,1.80,1.68]。

新增一行用append函数,参数是Dict类型的一条记录,key是属性列名,value是属性值。df['height']=[1.75,1.80,1.68]

df = df.append({'name':'Lily','age':24,'height':1.65}, ignore_index=True)

wAAACwAAAAAAQABAEACAkQBADs= 2. 删除行/列下面的例子中,我们删除了height列,删除了一条Tom的记录。

删除行和删除列使用的函数是一样的,都使用drop函数。

删除行语法drop(0, inplace=True),参数是记录的index 0。

删除列的语法drop('height', axis=1, inplace=True),参数是属性名height。df.drop(0, inplace=True)

df.drop('height', axis=1, inplace=True)

wAAACwAAAAAAQABAEACAkQBADs=3. 更新单个Cell/多个Cell更新单个cell的语法形如df.at[index,'XX']=value 。

例如:语法df.at[0,'name']='David'表示把0行name列的值修改成David。df = pd.DataFrame()

df['name']=['Tom','Bob','Alice']

df['age']=[20,28,22]

df.at[0,'name']='David'

wAAACwAAAAAAQABAEACAkQBADs=更新多个cell的语法形如df.loc[df['XX']=condition, 'XX']=value。它的操作分两步,第一步先用df.loc函数找到符合条件df['XX']=condition的记录,第二步修改这些记录的属性值。

例如,语法df.loc[df['name'].str.contains('o'),'name']表示找到name属性包含字符'o'的记录,然后把这些记录的name值换成Testing。

例子中,Tom和Bob由于包含字符'o',因此都被替换成了Testing。df = pd.DataFrame()

df['name']=['Tom','Bob','Alice']

df['age']=[20,28,22]

df.loc[df['name'].str.contains('o'),'name'] = 'Testing' #多个cell

wAAACwAAAAAAQABAEACAkQBADs=4. 查询记录查询记录的语法形如df[df['XX'] = condition]。

例如,语法df[df['age']<25]表示查询所有age列的值小于25的记录。

例子中,Tom年龄20<25,Alice年龄22<25,因而被查询到。df = pd.DataFrame()

df['name']=['Tom','Bob','Alice']

df['age']=[20,28,22]

df[df['age']<25]

wAAACwAAAAAAQABAEACAkQBADs=

四、高级操作1. Group操作下面的例子是一张成绩单,内容是三个人Tom,Bob,Alice的成绩,每人两科成绩:English成绩,Chinese成绩,因此共3*2=6条记录。

计算每个人的平均成绩。分两步完成这个任务:

1). 把记录按照name分组,语法是df.groupby('name')。

2). 组内计算成绩平均值,语法是df.groupby('name').mean()。

例子中,Tom的英文/语文成绩分别是70,100,因此均值是85。其它人计算同理。df = pd.DataFrame()

df['name']=['Tom','Tom','Bob','Bob','Alice','Alice']

df['course']=['English','Chinese','Chinese','English','English','Chinese']

df['score']=[70,100,99,95,85,90]

df.groupby('name').mean()

wAAACwAAAAAAQABAEACAkQBADs=

https://www.jianshu.com/p/e53c5b54d3e1

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/244774.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

visual studio 设计器不显示_与城共生:南京朝天宫“参与性”城市设计

本课题致力于探索和理解目前中国城市迅速发展的过程中&#xff0c;老旧社区如何与城市共生共进。通过对南京老旧社区的充分调查和研究&#xff0c;选取了朝天宫古玩市场附近的街巷民居和鼓楼工人新村作为设计地块。社会结构的变迁以及城市空间形态的变化都对老旧社区正在进行冲…

python项目部署nginx_【python】Django web项目部署(Nginx+uwsgi)

一、安装uwsgi通过pip安装uwsgi。测试uwsgi&#xff0c;创建test.py文件&#xff1a;通过uwsgi运行该文件。常用选项&#xff1a;http&#xff1a; 协议类型和端口号processes &#xff1a; 开启的进程数量workers&#xff1a; 开启的进程数量&#xff0c;等同于processes(官网…

mysql操作xml字段_SQL XML 字段操作

DECLARE myDoc xmlSET myDoc --SELECT myDoc-- 插入item的第1个子节点&#xff0c;此时不需要指定as first或as lastSET myDoc.modify(Ninsert 张洪举into (/root/item)[1])SELECT myDoc-- 插入item的第2个子节点&#xff0c;as first指定插入到同级子节点的前面SET myDoc.modi…

python可以做二维码吗_Python制作二维码,并且可以添加logo

import readlineimport qrcodefrom PIL import Imageimport osdef Create_Qrcode(strings,path,logo""):qr qrcode.QRCode(version2,error_correctionqrcode.constants.ERROR_CORRECT_L,box_size6,border1,)with open(‘test.txt‘,‘r‘) as fr:for lines in fr.re…

mysql error code 1093_MySQL更新时ErrorCode:1093和ErrorCode:1175的解决办法

Error Code: 1093. You canError Code: 1093. You cant specify target table ws_product for update in FROM clause这个是我们在使用update或者delete语句时&#xff0c;在where条件里面加入的子查询导致的。例如如下的update语句&#xff1a;update table set type static …

python面向对象学习_Python 初识面向对象#学习猿地

> 面向对象编程——Object Oriented Programming&#xff0c;简称OOP&#xff0c;是一种**以对象为中心**的程序设计思想。>> 面向过程编程——Procedure Oriented Programming&#xff0c;简称POP&#xff0c;是一种**以过程为中心**的程序设计思想。## 理解面向过程…

python如何使用多态_在python 3中,如何将多态应用于类

介绍多态性是为不同的基础形式(例如&#xff0c;数据类型或类)利用同一接口的能力。这允许函数在不同时间使用不同类型的实体。对于Python中的面向对象编程&#xff0c;这意味着可以用与属于特定类的特定对象相同的方式来使用它&#xff0c;就好像它是属于不同类的不同对象一样…

python输出数字方阵_在python里输出数字方阵

{"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],"search_count":[{"count_phone":4,"count":4}]},"card":[{"des":"阿里技术人对外发布原创技术内容的最大平台&…

python tkinter 弹窗_tkinter主窗口和子窗口同时弹出该怎么办?

参考代码注释import osfrom tkinter import filedialogimport tkinter as tkfrom tkinter import Buttonclass ReName():def __init__(self):self.n 0def shouldIgnore(self, path: str) -> bool:忽略以下路径:1. 文件夹。2. macOS 隐藏文件a. 文件名以 . 开头&#xff0c;…

安装mysql8.019命令符_MySQL 8.0.19安装教程(windows 64位)

话不多说直接开干目录下载完成后解压解压完是这个样子配置初始化的my.ini文件的文件解压后的目录并没有的my.ini文件&#xff0c;没关系可以自行创建在安装根目录下添加的my.ini(新建文本文件&#xff0c;将文件类型改为的.ini)&#xff0c;写入基本配置&#xff1a;[mysqld]# …

python tcp服务器_python实现TCP服务器端与客户端的方法详解

本文实例讲述了python实现TCP服务器端与客户端的方法。分享给大家供大家参考。具体如下&#xff1a;TCP服务器程序(tsTserv.py)&#xff1a;from socket import *from time import ctimeHOST PORT 21567BUFSIZ 1024ADDR (HOST, PORT)tcpSerSock socket(AF_INET, SOCK_STRE…

入Java_初入Java的方法

Java的方法类似于其他语言如C中的函数&#xff0c;比如我们第一个Java程序 输出Hello,world&#xff01;中用到一个方法System.out.printfln()&#xff1b;这里的printfln()就是一个方法&#xff0c;System是系统类&#xff0c;out是对象。1.什么是方法&#xff1f;方法是语句…

java method_JAVA Method的解析

java.lang.reflect.MethodMethodpublic final class Method extends Executable数据的层级结构Paste_Image.pngMethod中的方法boolean [equals].将此方法与指定的对象进行比较T extends [Annotation]T [getAnnotation]如果存在注释&#xff0c;则返回指定类型的注释否则返回为n…

java中this_多学习才能多赚钱之:java中this什么用

java中this什么用1、this调用当前属性&#xff1a;其主要作用是当需要给类中的数据进行初始化时&#xff0c;可以通过this来进行赋值&#xff0c;而不用随便定义一个变量来进行赋值&#xff0c;更有利于代码的阅读与理解(推荐教程&#xff1a;java教程)class Book{//定义书的类…

java api 英文_教你查阅Java API 英文文档(JDK 11)

然后找到“Specifications”并点击 API Documentation比如我们在别人的源码里看到了方法[也叫函数]&#xff1a; Scanner input new Scanner(System.in);所以搜索一下右上角 Scanner&#xff0c;对比我们看到的源码里import&#xff0c;发现是java.util包里的&#xff0c;所以…

jedis使用_Redis --Java客户端 Jedis

Redis --Java客户端 Jedis 博客说明 文章所涉及的资料来自互联网整理和个人总结&#xff0c;意在于个人学习和经验汇总&#xff0c;如有什么地方侵权&#xff0c;请联系本人删除&#xff0c;谢谢&#xff01; 简介 Jedis: 一款java操作redis数据库的工具. 菜鸟教程文档地址 使用…

java jolt tuxedo_java使用jolt调用tuxedo服务

使用包jolt-1.0import bea.jolt.JoltSession;import bea.jolt.JoltSessionAttributes;import bea.jolt.SessionException;简单示例JoltSession jsession;JoltSessionAttributes sattr;JoltRemoteService joltRemoteService;JoltTransaction trans;String userName "A…

找出最具竞争力的子序列_力扣300——最长上升子序列

这道题主要涉及动态规划&#xff0c;优化时可以考虑贪心算法和二分查找。原题给定一个无序的整数数组&#xff0c;找到其中最长上升子序列的长度。示例:输入: [10,9,2,5,3,7,101,18]输出: 4 解释: 最长的上升子序列是 [2,3,7,101]&#xff0c;它的长度是 4。说明:可能会有多种最…

java 跨站点脚本编制_AppScan跨站点脚本编制修复

查了下百度&#xff0c;跨站点脚本编制其实也就是在url后加入参数和js脚本实现一些坏坏的事情&#xff0c;至少appscan就是这么干的。那么主要的工作就是把恶意代码给过滤了&#xff0c;作为javaweb开发&#xff0c;明显第一步想到的是过滤器。网上很多都是将request对象 传入H…

python怎么安装本地的egg_python egg怎么安装

经常接触Python的同学可能会注意到&#xff0c;当需要安装第三方python包时&#xff0c;可能会用到easy_install命令。easy_install是由PEAK(Python Enterprise Application Kit)开发的setuptools包里带的一个命令&#xff0c;它用来安装egg包。egg包是目前最流行的python应用打…