pandas库

目录

  • 一. numpy库
  • 二. pandas库
    • 读取文件并查看信息
    • 基础统计方法
    • 函数reset_index()
  • 三. matplotlib
  • 四. SciPy
  • 五. scikit-learn
  • 六. statsmodels

一. numpy库

NumPy(http://numpy.org)是Numerical Python的简写,是Python数值计算的基石。它提供多种数据结构、算法以及大部分涉及Python数值计算所需的接口。

二. pandas库

pandas(http://pandas.pyda ta.org)提供了高级数据结构和函数,这些数据结构和函数的设计使得利用结构化、表格化数据的工作快速、简单、有表现力。Pandas 这个名字来源于面板数据(Panel Data)与数据分析(data analysis)这两个名词的组合。

读取文件并查看信息

#pandas读取文件
import pandas as pd
df=pd.read_csv('11.csv')
df=pd.read_excel('11.xslx',sheet_name='year') #读excel文件的year表
p = pd.read_excel(.xlsx', header=1) #设置header参数来指定目标行的数据为列标签(跳过标题),从0开始计数
df.head(20) #显示前20行
df.info() #检查变量信息和缺失值信息
pd.value_counts(df['name']) #计算name列的频率
#pandas读取某一单元格,直接可以
df.values[2,2]

基础统计方法

#pandas按列、行求和
df['行求和'] = df.iloc[:,3:6].sum(axis=1)
df['列求和'] = df.iloc[:,3:6].sum(axis=0)
#pandas获取指定单元格的值,row7,column5
data_1 = df.iloc[6,4]
#describe()函数可以查看数据的基本情况,包括:count非空值数、mean平均值、std标准差、max最大值、min最小值、(25%、50%、75%分位数等。
info=data.describe()#nunique()和unique():Pandas中Series和DataFrame的两种数据类型中都有nunique()和unique()方法。
#unique()方法返回的是去重之后的不同值,而nunique()方法则直接放回不同值的个数。data2 = pd.Series([34,212,23,None,11,33,pd.NaT,11,22,34,33,22,34, np.NAN, np.NaN])
print('data2中不同值:', data2.unique())
print('data2中不同值的个数:', len(data2.unique()))
print('data2中不同值的个数:', data2.nunique())
print('data2中不同值的个数(包含空值):', data2.nunique(dropna=False))

函数reset_index()

在这里插入代码片

DataFrame(Pandas库)
Pandas 的数据结构主要是:Series(一维数组),DataFrame(二维数组)。DataFrame是由索引和内容组成

Pandas读取某列、某行数据——loc、iloc用法总结
link

三. matplotlib

python的2D绘图库。matplotlib(http://matplotlib.org)是最流行的用于制图及其他二维数据可视化的Python库。

import matplotlib.pyplot as plt
#更改饼图大小,在plt.show()上方插入两行
fig = plt.gcf()
fig.set_size_inches(10,10)
#对excel操作
https://blog.csdn.net/weixin_43673522/article/details/116403282
#seaborn的pairplot

pyplot设置刻度字体大小以及标签字体大小
import … as …
from…import…

PIL库
Image,

numpy库

matplotlib.pyplot库

sklearn.datasets库

from matplotlib.pyplot import figure
from mpl_toolkits.axes_grid1 import make_axes_locatable

四. SciPy

SciPy(http://scipy.org)是科学计算领域针对不同标准问题域的包集合。

五. scikit-learn

scikit-learn项目(http://scikit-learn.org)诞生于2010年,目前已成为Python编程者首选的机器学习工具包。其中包含以下子模块。

  • 分类:SVM、最近邻、随机森林、逻辑回归等

  • 回归:Lasso、岭回归等

  • 聚类:k-means、谱聚类等

  • 降维:PCA、特征选择、矩阵分解等

  • 模型选择:网格搜索、交叉验证、指标矩阵

  • 预处理:特征提取、正态化

六. statsmodels

与scikit-learn相比,statsmodels包含经典的(高频词汇)统计学、经济学算法。它所包含的模型如下。

  • 回归模型:线性回归、通用线性模型、鲁棒线性模型、线性混合效应模型等
  • 方差分析(ANOVA)· 时间序列分析:AR、ARMA、ARIMA、VAR等模型
  • 非参数方法:核密度估计、核回归
  • 统计模型结果可视化

statsmodels更专注于统计推理,提供不确定性评价和p值参数。相反,scikit-learn更专注于预测。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/189894.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Redis中的数据结构

文章目录 第1关:Redis中的数据结构 第1关:Redis中的数据结构 这是上篇文章的第一关,只不过本篇是代码按行做的,方便一下大家使用。 代码如下: redis-cliset hello redislpush educoder-list hellorpush educoder-lis…

51单片机制作数字频率计

文章目录 简介设计思路工作原理Proteus软件仿真软件程序实验现象测量误差和范围总结 简介 数字频率计是能实现对周期性变化信号频率测量的仪器。传统的频率计通常是用很多的逻辑电路和时序电路来实现的,这种电路一般运行较慢,而且测量频率的范围较小。这…

AcWing 511:联合权值 ← DFS、链式前向星

【题目来源】https://www.acwing.com/problem/content/513/【题目描述】无向连通图 G 有 n 个点,n−1 条边。 点从 1 到 n 依次编号,编号为 i 的点的权值为 Wi,每条边的长度均为 1。 图上两点 (u,v) 的距离定义为 u 点到 v 点的最短距离。 对…

torch如何将网络参数初始化,又如何将参数还原成原始状态?

1、将网络参数初始化为原始状态 要将网络参数初始化为原始状态,可以使用PyTorch中的权重初始化方法。常见的权重初始化方式包括正态分布、均匀分布、Xavier初始化等。具体步骤如下: 导入torch和torch.nn模块 import torch import torch.nn as nn定义网…

【SpringCloud】注册中心和Ribbon负载均衡

SpringCloud 1.Eureka注册中心 1.1 Eureka的作用 注册中心拉取服务负载均衡远程调用 order-service得知user-service实例地址流程: user-service服务实例启动后,将自己的信息注册到eureka-server(Eureka服务端),称…

linux审计工具aureport

aureport是一个用于查看和分析Linux操作系统中的审计日志的命令行工具。 审计日志是一个记录了系统活动、安全事件和资源访问的详细信息的日志文件。它可以帮助管理员监视和追踪系统上发生的各种活动,包括用户登录、文件访问、进程创建、权限更改等。 aureport命令…

二维数组数组指针相关知识

数组指针:数据类型 (*数组指针变量名)[列宽];特点:1、本质上是一个指针类型的变量;2、指向的是一个二维数组,即数组指针的列宽等价于二维数组的列宽;例如: int array[2][5] {1,2,3,4,5,6,7,8,9…

redis主从复制模式和哨兵机制

目录 第一章、主从复制模式1.1)Redis 主从复制模式介绍1.2)Redis 主从复制实现、 第二章、哨兵机制2.1)容灾处理之哨兵2.2)Sentinel 配置 第一章、主从复制模式 1.1)Redis 主从复制模式介绍 ①单点故障:数…

Spring中的事务管理

1 基本概念 事务:将一组操作抽象成一个不可再分的单位,这组操作可以有很多个,但是它们要么就全部都执行成功,这时算作事务执行成功;要不其中有操作执行失败,则其余操作都视为执行失败,这时候需…

二叉树的基本操作实现包括创建二叉树、插入节点、搜索节点、删除节点、遍历二叉树等详解

二叉树的基本操作主要包括创建二叉树、插入节点、搜索节点、删除节点、遍历二叉树等。下面是这些基本操作的 Python 代码实现。 创建二叉树 class TreeNode:def __init__(self, value):self.value valueself.left Noneself.right Noneclass BinaryTree:def __init__(self)…

honle电源维修UV电源控制器EVG EPS40C-HMI

好乐UV电源控制器维修;honle控制器维修;UV电源维修MUC-Steuermodul 2 LΛmpen D-82166 主要维修型号: EVG EPS 60/120、EVG EPS 100、EVG EPS200、EVG EPS 220、EVG EPS 340、EVG EPS40C-HMI、EVG EPS60 HONLE好乐uv电源维修故障包括&#…

localhost和127.0.0.1在以下四个方面存在区别

localhost和127.0.0.1在以下四个方面存在区别: 原理:localhost的原理是不经网卡传输,不会受到网卡协议的限制。而127.0.0.1则是经过网卡传输,依赖网卡协议,并受到网卡相关协议的限制。概念:localhost&…

申请开通QMT量化需要多少资金?免费开通!

最近量化交易在市场上大火,很多投资者想要参与进来。QMT量化软件是目前市场上一款比较常见并且强大的量化软件。那开通QMT量化交易软件需要多少资金? QMT量化交易软件是一种专门用于量化交易的工具,它能够帮助投资者通过程序化交易策略进行股…

如何解决“该公众号提供的服务出现故障,请稍后再试”

出现“该公众号提供的服务出现故障,请稍后再试” , 或者是出现 “公众号接口出现异常,请加入微信群接收接口报警” 的提问, 出现这个一般是开发者自身服务器出现问题导致的。 本文我来教大家如何排查。 第一步:加入告…

【力扣周赛】第 115 场双周赛(⭐优化背包DP)(TODO)

文章目录 竞赛链接Q1:2899. 上一个遍历的整数💩(阅读理解题,按题意模拟)Q2:2900. 最长相邻不相等子序列 I(贪心)Q3:2901. 最长相邻不相等子序列 II(类似 最长…

算法通关村第一关—白银挑战—链表高频面试算法题—查找两个链表的第一个公共子节点

文章目录 查找两个链表的第一个公共子节点(1)暴力求解法(2)使用哈希Hash⭐(3)使用集合⭐ - 与Hash类似(4)使用栈⭐(5)仍有更多方法,作者尚未理解&…

【小布_ORACLE笔记】Part11-1--RMAN Backups

Oracle的数据备份于恢复RMAN Backups 学习第11章需要掌握: 一.RMAN的备份类型 二.使用backup命令创建备份集 三.创建备份文件 四.备份归档日志文件 五.使用RMAN的copy命令创建镜像拷贝 文章目录 Oracle的数据备份于恢复RMAN Backups1.RMAN Backup Concepts&#x…

LeetCode | 965. 单值二叉树

LeetCode | 965. 单值二叉树 OJ链接 首先判断树为不为空,为空直接true然后判断左子树的val,和根的val相不相同再判断右子树的val,和根的val相不相同最后递归左子树和右子树 bool isUnivalTree(struct TreeNode* root) {if(root NULL)retur…

Python解释器的安装【侯小啾python领航班系列(一)】

Python解释器的安装【侯小啾python领航班系列(一)】 大家好,我是博主侯小啾, 🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔…

深入Spring Security魔幻山谷-获取认证机制核心原理讲解(新版)

文/朱季谦 这是一个古老的传说。 在神秘的Web系统世界里,有一座名为Spring Security的山谷,它高耸入云,蔓延千里,鸟飞不过,兽攀不了。这座山谷只有一条逼仄的道路可通。然而,若要通过这条道路前往另一头的…