Numpy and Pandas

安装

视频链接:https://morvanzhou.github.io/tutorials/data-manipulation/np-pd/

pip install numpy
pip install pandas

Numpy 学习

Numpy属性

import numpy as nparray = np.array([[1,2,3],[2,3,4]])
print(array)
print('number of dim:',array.ndim)//几维度
print('shape:',array.shape)//行数列数
print('size:',array.size)//多少个元素

Numpy创建array

impport numpy as npa = np.array([2,23,4],dtype=np.int)
print(a)
print(a.dtype)
a = np.zeros((3,4))//三行四列的0矩阵
a = np.ones((3,4),dtype=np.int16)//三行四列的1矩阵
a = np.empyt((3,4))//三行四列非常接近0的矩阵
a = np.arrange(10,20,2)//[10 12 14 16 18]
a = np.arrange(12).reshape((3,4))//三行四列从0~11
a = np.linspace(1,10,5)//从1到10分成5段的数列,[1. 3.25 5.5 7.75 10.]

Numpy 基础运算1

import numpy as npa = np.array([10,20,30,40]
b = np.arrange(4)
print(b<3)//[True True True False]
print(b == 3)//[False False False True]c = a + b
print(c)//[10 21 32 43]c = b**2//b的平方,[0 1 4 9]
c = 10*np.sin(a)//正弦d = np.array([[1,1],[0,1] ])
e = np.arrange(4).reshape((2,2))
f = d*e
f_dot = np.dot(e,f)
f_dot_2 = e.dot(f)//运算和f_dot完全相同
print(f)//[[0 1][0 3]]
print(f_dot)//[[2 4][2 3]],只是矩阵的运算a = np.random.random((2,4))//2行4列0~1范围的随机值
np.sum(a)//求和
np.min(a)//求最小
np.max(a)//求最大np.sum(a,axis=1)//在行中求和,1代表行,0代表列

Numpy 基础运算2

import numpy as npA = np.arrange(2,14).reshape((3,4))
np.argmin(A)//最小值的索引
np.argmax(A)//最大值的索引
print(np.argmin(A))//0
np.mean(A)//平均值
A.mean()//平均值
np.median(A)//中位数 7.5
np.cumsum(A)//逐步加进去 [2 5 9 14 20 27 35 44 54 65 77 90]
np.diff(A)//每两个数之间的差 [[1 1 1][1 1 1][1 1 1]]
np.nonzero(A)//找出非零元素的位置
np.sort(A)//逐行排序
np.transpose(A)//A的转置
A.T//A的转置
(A.T).dot(A)//A的转置与A相乘
np.clip(A,5,9)//小于5的数赋值为5,大于9的数赋值为9,中间值不变
np.mean(A,axis=0)//对列取平均值 [10. 9. 8. 7.]
print(A)

Numpy 索引

import numpy as npA = np.arrange(3,15) 
A[3]//6
A = A.reshape((3,4))
A[2]//[11 12 13 14]
A[1][1]//8
A[1,1]//8
A[2,:]//第2行的所有数
A[1,1:3]//[8 9]for row in A:print(row)//依次打印每一行for column in A.T:print(column)//依次打印每一列A.flatten()//又转成了一维 [3 4 5 6 7 8 9 10 11 12 13 14]for item in A.flat:print(item)//3-14依次每行打印出来,A.flat返回了一个迭代器

Numpy array 合并

import numpy as npA = np.array([1,1,1])
B = np.array([2,2,2])C = np.vstack((A,B))#[[1 1 1][2 2 2]] vertical stack上写合并
D = np.hstack((A,B))#[1 1 1 2 2 2] horizontal stack左右合并
print(A.shape,C.shape,D.shape)#(3,)(2,3)(6,)#把横向的数列转成纵向的 np.newaxis增加一个维度 还有reshape(3,1)
A[np.newaxis,:].shape #(1,3)
A[:,np.newaxis].shape #(3,1) [[1][1][1]]E = np.concatenate((A,B,B,A),axis=0)#指定方向合并(左右或者上下)

Numpy array 分割

import numpy as npA = np.arange(12).reshape((3,4))
np.split(A,2,axis = 1)#横向等分成两段 [array([[0,1][4,5],[8,9]]),array([[2,3][6,7],[10,11]])] 横向等分成两段np.array_split(A,3,axis = 1)#横向不等分成两段 [array([[0,1],[4,5],[8,9]]),array([[2],[6],[10]]),array([[3],[7],[11]])]np.vsplit(A,3)#纵向分为三段
np.hsplit(A,2)#横向分为两段

Numpy copy & deep copy

import numpy as npa = np.arange(4)
b = a
c = a
d = b
a[0] = 1
b is a#True b就是a b[0] = 11  a,b,c,d就是一个变量 引用b = a.copy() # deep copy
b is a # False a和b是两个变量,没有关联

Pandas 学习

Pandas 选择数据

import pandas as pd
import numpy as npdates = pd.date_range('20130101',periods = 6)
df = pd.DataFrame(np.arange(24).reshape((6,4)),index=dates,cloumns=['A','B','C','D'])print(df)#               A   B   C   D#   2013-01-01  0   1   2   3#   2013-01-02  4   5   6   7#   2013-01-03  8   9   10  11#   2013-01-04  12  13  14  15#   2013-01-05  16  17  18  19#   2013-01-06  20  21  22  23print(df.A)#或者 print(df['A'])#   2013-01-01  0   #   2013-01-02  4   #   2013-01-03  8   #   2013-01-04  12  #   2013-01-05  16  #   2013-01-06  20df[0:3],df['20130101':'201304']是同样的操作# select by label:loc  指定标签
print(df.loc['20130102'])#A  4#B  5#C  6#D  7print(df.loc[:,['A','B']])#所有行的A列和B列显示出来
print(df.loc[‘20130102’,['A','B']])#行索引为‘20130102’的A列和B列显示出来#A  4#B  5#select by position:iloc 指定位
print(df.iloc[3])#打印第四行数据
print(df.iloc[3,1])#打印第四行第二列数据print(df.iloc[1,3,5])#第2,4,6行打印#mixed selection:ix 混合位和标签
print(df.ix[:3,['A','C']])#0-2行 A/C列#Boolean indexing 通过真值打印
print(df[df.A > 8])# 打印A列中大于8的行的所有信息

Pandas 设置值

import pandas as pd
import numpy as npdates = pd.date_range('20130101',periods = 6)
df = pd.DataFrame(np.arange(24).reshape((6,4)),index=dates,cloumns=['A','B','C','D'])df.iloc[2,2] = 111#修改第3行第3列数值
df.iloc['20130101','B'] = 222
df[df.A > 4] = 0# A列大于4的行的所有信息赋值为0
df.A[df.A > 4] = 0# A列大于4的行的A列赋值为0
df['F'] = np.nan #F列值全为NaN(没有此列就追加此列)
df['E'] = pd.Series([1,2,3,4,5,6],index=pd.date_range('20130101',periods=6))#追加E列,列的值为1,2,3,4,5,6

Pandas处理丢失数据

import pandas as pd
import numpy as npdates = pd.date_range('20130101',periods = 6)
df = pd.DataFrame(np.arange(24).reshape((6,4)),index=dates,cloumns=['A','B','C','D'])df.iloc[0,1] = np.nan
df.iloc[1,2] = np.nan#设置第1行2列值为NaNprint(df.dropna(axis=0,how='any'))#丢掉有NaN值的行
#how={'any','all'} any表示只要有就满足 all表示所有都是才满足print(df.fillna(value=0))#填充NaN值为0
df.isnull()#df中是否有NaN,列出所有
np.any(df.isnull()) == True#只要有NaN就返回True

Pandas 导入导出

Pandas 合并 concat

Pandas 合并 merge

Pandas plot 画图

转载于:https://www.cnblogs.com/maskerk/p/9977696.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/396009.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

认证android retrofit,Retrofit之项目介绍

项目介绍官网对retrofit介绍是这是一个"类型安全(type-safe)"的Android/Java http客户端. 目前retrofit的最新正式版本为1.9.0. 2.0版本预计2015年底发布, 相较于之前版本, 2.0版本在架构上做了很大改变, 本文代码相关的内容都是基于retrofit2.0-beta2.注: 在编程语言…

层次聚类算法 算法_聚类算法简介

层次聚类算法 算法Take a look at the image below. It’s a collection of bugs and creepy-crawlies of different shapes and sizes. Take a moment to categorize them by similarity into a number of groups.看看下面的图片。 它是各种形状和大小的错误和令人毛骨悚然的爬…

.h .dll .lib

.h为对一个函数的声明引用&#xff0c;include就是声明某个文件里的函数&#xff08;内只有声明函数被引用了&#xff09;&#xff0c;编译时使用 .lib为链接时用的&#xff0c;存放的是对于DLL里函数的位置信息等&#xff0c;这样不必把所有dll里函数都加载到内存里&#xff0…

《机器人学经典教程》——2.2 控制论

本节书摘来异步社区《机器人学经典教程》一书中的第2章&#xff0c;第2.2节&#xff0c;作者&#xff1a;【美】Maja J. Matarić&#xff08;马娅•马塔里奇&#xff09;&#xff0c;更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.2 控制论 随着控制理论的不断发展…

哔哩哔哩网站前端源码_分享一个仿制哔哩哔哩镜子网站源码

我老婆非常喜欢看哔哩哔哩&#xff0c;前些天她兴奋地和我说哔哩哔哩网站有个隐藏的彩蛋&#xff0c;传送门http://www.ilidilid.com/&#xff0c;我看了下&#xff0c;相当于把镜子中的网站样子弄出来了。于是&#xff0c;我寻思着&#xff0c;把自己的博客也弄个这样的彩蛋&a…

promise-async-await

通常而言&#xff0c;这3个关键字 都是用来「优雅」的处理ajax异步请求的 //es6的时候promise诞生&#xff0c;很好的解决了嵌套回调地狱&#xff0c;改良方案为链式回调。// es2017的时候诞生了async、await&#xff0c;这下异步直接没有回调了&#xff0c;像同步一样爽//没有…

第一冲刺阶段博客检查

我们检查的团队是&#xff1a;红鸟 ①团队博客&#xff1a; 该团队将所有的站立会议均写到了4月28日的一篇博客中&#xff0c;并且其中任务看板和燃尽图不全。 ②团队成员个人博客&#xff1a; 1>张晓晨&#xff1a; 没有每天个人工作总结。 2>王晓思&#xff1a; 从4.19…

netcore 编译 html,Asp.Net Core中的@ Html.Action

小编典典更新&#xff1a;从2.2.2版本开始&#xff0c;HttpContextAccessor将上下文保留在一个对象中(据说是为了防止请求之间的混淆)&#xff0c;这会影响当前解决方案…因此&#xff0c;您需要为IHttpContextAccessor(旧版本)提供以下实现并进行注册作为一个单例&#xff1a;…

《CCIE路由和交换认证考试指南(第5版) (第1卷)》——1.6节虚拟交换系统

本节书摘来自异步社区《CCIE路由和交换认证考试指南&#xff08;第5版&#xff09; &#xff08;第1卷&#xff09;》一书中的第1章&#xff0c;第1.6节虚拟交换系统&#xff0c;作者 【美】Narbik Kocharians&#xff08;那比克 科查理安&#xff09; , 【斯洛伐克】Peter Pal…

机器学习 美股_我如何使用机器学习来探索英美文学之间的差异

机器学习 美股by Sofia Godovykh索非亚戈多维克(Sofia Godovykh) 我如何使用机器学习来探索英美文学之间的差异 (How I used machine learning to explore the differences between British and American literature) As I delved further into English literature to further…

远程执行漏洞修复方案_请马上修复!SaltStack远程命令执行漏洞

【漏洞预警】SaltStack远程命令执行漏洞(CVE-2020-11651、CVE-2020-11652)2020年5月3日&#xff0c;阿里云应急响应中心监测到近日国外某安全团队披露了SaltStack存在认证绕过致命令执行漏洞以及目录遍历漏洞。漏洞描述SaltStack是基于Python开发的一套C/S架构配置管理工具。国…

kafka部分重要参数配置-broker端参数

broker端参数主要在config/server.properties目录下设置&#xff1a; 启动命令&#xff1a;nohup ./kafka-server-start.sh -daemon ../config/server.properties & broker.id参数&#xff1a;Kafka使用唯一的一个整数来标识每个broker&#xff0c;全局唯一&#xff0c;默认…

JS正则表达式大全(整理详细且实用)

JS正则表达式大全(整理详细且实用) 作者&#xff1a; 字体&#xff1a;[增加 减小] 类型&#xff1a;转载 时间&#xff1a;2013-11-14 我要评论 JS正则表达式大全(整理详细且实用)。需要的朋友可以过来参考下&#xff0c;希望对大家有所帮助正则表达式中的特殊字符 字符 含意…

html设置模块宽度为200像素,css 宽度(CSS width)

DIV CSS宽度width样式属性CSS 宽度是指通过CSS 样式设置对应div宽度&#xff0c;以下我们了解传统html宽度、宽度自适应百分比、固定宽度等宽度知识。传统Html 宽度属性单词&#xff1a;width 如width"300";CSS 宽度属性单词&#xff1a;width 如width:300px;一、Wid…

我从Stack Overflow对64,000名开发人员的大规模调查中学到的东西

Today Stack Overflow released the results of their 2017 survey of more than 64,000 developers.今天&#xff0c;Stack Overflow发布了他们对64,000多名开发人员的2017年调查结果。 Just like in 2016, I’ve combed through these results and summarized them for you.…

《Node应用程序构建——使用MongoDB和Backbone》一第 1 章 介绍与总览1.1 打造一个社交网络...

本节书摘来自异步社区《Node应用程序构建——使用MongoDB和Backbone》一书中的第1章&#xff0c;第1.1节&#xff0c;作者【美】Mike Wilson&#xff0c;更多章节内容可以访问云栖社区“异步社区”公众号查看 第 1 章 介绍与总览 Node应用程序构建——使用MongoDB和Backbone互…

jquery 样式获取设置值_jQuery获取样式中的背景颜色属性值/颜色值

天使用jQuery获取样式中的background-color的值时发现在获取到的颜色值在IE中与Chrome、Firefox显示的格式不一样&#xff0c;IE中是以HEX格式显示#ffff00&#xff0c;而Chrome、Firefox中则是以GRB格式显示rgb(255,0,0)&#xff0c;由于需要将颜色值存储到数据库中&#xff0c…

计算机专业做产品,非计算机专业如何做产品经理?

《硅谷产品实战》学习笔记 32课这节课中讲了计算机专业背景对产品经理的帮助&#xff1a;第一印象&#xff1b;判断项目复杂度&#xff1b;了解技术可否实现&#xff0c;有何限制&#xff1f;对于没有计算机专业背景的产品如何弥补专业不足&#xff1f;关于如何判断项目复杂度在…

_UICreateCGImageFromIOSurface 使用API

上传的时候&#xff0c;苹果发送邮件 Non-public API usage: The app references non-public symbols in DUO-LINK 4: _UICreateCGImageFromIOSurfaceIf method names in your source code match the private Apple APIs listed above, altering your method names will help …

匹配一个字符串的开头和结尾_我如何构建一个应用程序来展示精彩小说的开头和结尾

匹配一个字符串的开头和结尾I know sentences. In my decade as a print journalist, I’ve written hundreds of articles for dozens of publications. I’ve dished out more sentences than Judge Judy. But I didn’t study writing or journalism, at least not formally…