Python pandas数据分析

Python pandas数据分析:

2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开
测开的话,你就得学数据库,sql,oracle,尤其sql要学,当然,像很多金融企业、安全机构啥的,他们必须要用oracle数据库
这oracle比sql安全,强大多了,所以你需要学习,最重要的,你要是考网络警察公务员,这玩意你不会就别去报名了,耽误时间!
与此同时,既然要考网警之数据分析应用岗,那必然要考数据挖掘基础知识,今天开始咱们就对数据挖掘方面的东西好生讲讲 最最最重要的就是大数据,什么行测和面试都是小问题,最难最最重要的就是大数据技术相关的知识笔试


文章目录

  • Python pandas数据分析:
    • @[TOC](文章目录)
  • Python pandas数据分析:
  • 总结

Python pandas数据分析:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
语言这行
df[内部控制字段的条件]
在这里插入图片描述
大小写有问题
在这里插入图片描述
在这里插入图片描述
包含Python的哪些列揪出来

简单方法多好啊,搞那么多锤子作甚

直接输出columns
在这里插入图片描述
修改列名字
rename
把字段score改为这个population
在这里插入图片描述
value_counts()
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
中间是控制条件
去重
drop_diplicates
在这里插入图片描述
在这里插入图片描述
list转呗
.tolist()

在这里插入图片描述
数据.to_excel(路径)
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
交换两个列的位置
在这里插入图片描述
max
在这里插入图片描述
拿最大行
在这里插入图片描述
删除最后那个位置
在这里插入图片描述
增加一行
写个字典
然后append吧
在这里插入图片描述
sort_values()
在这里插入图片描述
在这里插入图片描述
lambda的目的是定义x
然后f(x)处理返回值,放到新的字段中

读取数据
在这里插入图片描述
查看数据的前几行
head()
在这里插入图片描述
中间可以加参数
切割split
转数字为int
把字符去掉strip(‘k’)
最大最小值拿到后,求取平均

apply是合并,用函数func去合并了,但是func是一条一条去处理
在这里插入图片描述
这个合并的用法,相当于单独处理那一列,懂???

这些应该学学
根据学历分组
算平均薪资
分组聚合
groupby关键字
mean求均值
在这里插入图片描述
把月日格式输出
.format?
一个个循环
for i in range(len(df)):
ix是啥?底i行?第0列
转为pydatetime
.strftime(“%m-%d”)月日
在这里插入图片描述
查看索引,数据类型和内存信息
info
在这里插入图片描述
数值型列的汇总
在这里插入图片描述
新增一列,将薪水分为三组
bins搞三个区间
然后分组仨名字,用啥函数来搞可能
新启动一列,cut切割,谁?薪水,按bins切割,然后名字的labels挂上

在这里插入图片描述
sort_values(字段,ascending=False),降序
True是升序
在这里插入图片描述
按照salary来排序

取出行
loc
在这里插入图片描述
中位数
np能,
np.median(df中salary数据)
pandas也能
在这里插入图片描述
绘制薪资的频率分布直方图
有matplotlib.pyplot

plt
df.salary.plot(kind=‘hist’)
直接用它自带的属性
在这里插入图片描述

df.salary.plot(kind=‘kde’, xlim=(0,8000))水平密度线
在这里插入图片描述
水平的密度
薪资有多人?

删除列
drop
在这里插入图片描述
合并两列
在这里插入图片描述
在这里插入图片描述
最值只差
apply:
lambda x:x.max()-x.min()
在这里插入图片描述
中间多了[]这个是啥意思

总之就似乎它的最大小之差
在这里插入图片描述
第8行加到末尾
append
在这里插入图片描述
好像loc和iloc都能获取行
在这里插入图片描述
数据的类型
dtypes

设置索引
setindex
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
减法,继续增加一列
直接干字段,后面跟着数据
在这里插入图片描述

在这里插入图片描述
包含缺失值吗

在这里插入图片描述
在这里插入图片描述
大于10000的次数
在这里插入图片描述
在这里插入图片描述
调取
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
df[里面是条件]

遍历每个字段,如果有缺失,则统计一波
然后照这个列,如果有null,就给他的values设定为True,把index弄出来,变tolist
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
收盘价
折现图
matplotlib
用seaborn-darkgrid画质
rc设置字体大小
fig出一个句柄画布

在这里插入图片描述
直接plot也行
你需要时间轴
在这里插入图片描述
俩都画
把数据整俩
在这里插入图片描述
在这里插入图片描述
hist
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
换手率
每行换手率
iloc行列
在这里插入图片描述
在这里插入图片描述
删除所有
非数字的行
for循环

定位i行13列
如果不是数字,做成列表
挨个去drop或者删除
labels=那个列表
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
收取平均
骚啊rolling
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
连着plot就是一个图

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
向后移动
向前移动

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
pandas和numpy经常混合使用

np.version
pd.version

在这里插入图片描述
搞一个np.random.randint(1,100,20)1–100,20个数据
然后搞一个dataframe
在这里插入图片描述
在这里插入图片描述
np.arrange(0,100,5)
这个是步长为5,固定的
在这里插入图片描述
在这里插入图片描述
正态分布也行
在这里插入图片描述
合并仨行
axis=0就是行
concat方法就是合并
在这里插入图片描述
在这里插入图片描述

往下拼接
我们看看axis=1列
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
牛逼
percentile(df,q=[0,25,75,100])%
本质是
精准在这里插入图片描述
修改列名
在这里插入图片描述
输出看看
在这里插入图片描述
第一列中不在第二列
是否存在?
在这里插入图片描述
df[][这里输出真假]
控制
频率,统计,排序
values_count自然是降序呗
在这里插入图片描述
找位置
np.argwhere
df%5==0
整除
在这里插入图片描述
前后差
diff().to_list
在这里插入图片描述
顺序颠倒
在这里插入图片描述
拿数据take
在这里插入图片描述
每一行均值
在这里插入图片描述
第三列升序排序,整体要带动吗
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
2norm
在这里插入图片描述
单独列出别的呢
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
converter
转换
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
round直接取%

在这里插入图片描述
data直接0:2%前面对其,后面2个小数点

在这里插入图片描述
在这里插入图片描述
翻转行
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
CD字段也过来了
多列
在这里插入图片描述在这里插入图片描述
左右是看key1,还是2


总结

提示:重要经验:

1)
2)学好oracle,即使经济寒冬,整个测开offer绝对不是问题!同时也是你考公网络警察的必经之路。
3)笔试求AC,可以不考虑空间复杂度,但是面试既要考虑时间复杂度最优,也要考虑空间复杂度最优。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/170093.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

易错知识点(数学一)

一、反常积分判敛 1、构造使其极限等于一个大于0的常数 1)前者通过:化等价无穷小 or 泰勒展开 2)若存在p>1使得等式成立,则收敛 考察形式:1、已知收敛,求f(x)中的幂次取值范围 主要思想:比较…

⑧【HyperLoglog】Redis数据类型:HyperLoglog [使用手册]

个人简介:Java领域新星创作者;阿里云技术博主、星级博主、专家博主;正在Java学习的路上摸爬滚打,记录学习的过程~ 个人主页:.29.的博客 学习社区:进去逛一逛~ Redis HyperLoglog ⑧Redis HyperLoglog基本操…

基于SpringBoot+Redis的前后端分离外卖项目-苍穹外卖(七)

分页查询、删除和修改菜品 1. 菜品分页查询1.1 需求分析和设计1.1.1 产品原型1.1.2 接口设计 1.2 代码开发1.2.1 设计DTO类1.2.2 设计VO类1.2.3 Controller层1.2.4 Service层接口1.2.5 Service层实现类1.2.6 Mapper层 1.3 功能测试1.3.2 前后端联调测试 2. 删除菜品2.1 需求分析…

使用 HTML、CSS 和 JavaScript 创建图像滑块

使用 HTML、CSS 和 JavaScript 创建轮播图 在本文中,我们将讨论如何使用 HTML、CSS 和 JavaScript 构建轮播图。我们将演示两种不同的创建滑块的方法,一种是基于opacity的滑块,另一种是基于transform的。 创建 HTML 我们首先从 HTML 代码开…

yolo系列中的一些评价指标说明

文章目录 一. 混淆矩阵二. 准确度(Accuracy)三. 精确度(Precision)四. 召回率(Recall)五. F1-score六. P-R曲线七. AP八. mAP九. mAP0.5十. mAP[0.5:0.95] 一. 混淆矩阵 TP (True positives):被正确地划分为正例的个数,即实际为正例且被分类器划分为正例…

Redis-主从与哨兵架构

Jedis使用 Jedis连接代码示例&#xff1a; 1、引入依赖 <dependency><groupId>redis.clients</groupId><artifactId>jedis</artifactId><version>2.9.0</version> </dependency> 2、访问代码 public class JedisSingleTe…

App 设计工具

目录 说明 打开 App 设计工具 示例 创建 App 创建自定义 UI 组件 打开现有 App 文件 打包和共享 App 本文主要讲述以交互方式创建 App。 说明 App 设计工具是一个交互式开发环境&#xff0c;用于设计 App 布局并对其行为进行编程。 可以使用 App 设计工具&#xff1a…

【黑马甄选离线数仓day05_核销主题域开发】

1. 指标分类 ​ 通过沟通调研&#xff0c;把需求进行分析、抽象和总结&#xff0c;整理成指标列表。指标有原子指标、派生指标、 衍生指标三种类型。 ​ 原子指标基于某一业务过程的度量值&#xff0c;是业务定义中不可再拆解的指标&#xff0c;原子指标的核心功能就是对指标…

Python武器库开发-前端篇之CSS元素(三十二)

前端篇之CSS元素(三十二) CSS 元素是一个网页中的 HTML 元素&#xff0c;包括标签、类和 ID。它们可以通过 CSS 选择器选中并设置样式属性&#xff0c;以使网页呈现具有吸引力和良好的可读性。常见的 HTML 元素包括 div、p、h1、h2、span 等&#xff0c;它们可以使用 CSS 设置…

值得看的书--《全宋词》节选

(https://img-blog.csdnimg.cn/5d5fe2844f6646b5b7b415f0a9e80f6c.jpg)

什么是自动化测试po模式,po分层如何实现?

一、什么是PO模式 全称&#xff1a;page object model 简称&#xff1a;POM/PO PO模式最核心的思想是分层&#xff0c;实现松耦合&#xff01;实现脚本重复使用&#xff0c;实现脚本易维护性&#xff01; 主要分三层&#xff1a; 1.基础层BasePage&#xff1a;封装一些最基…

自监督LIGHTLY SSL教程

Lightly SSL 是一个用于自监督学习的计算机视觉框架。 github链接&#xff1a;GitHub - lightly-ai/lightly: A python library for self-supervised learning on images. Documentation&#xff1a;Documentation — lightly 1.4.20 documentation 以下内容主要来自Documen…

作为Java初学者,如何快速学好Java?

作为Java初学者&#xff0c;如何快速学好Java&#xff1f; 开始的一些话 对于初学者来说&#xff0c;编程的学习曲线可能相对陡峭。这是正常现象&#xff0c;不要感到沮丧。逐步学习&#xff0c;循序渐进。 编程是一门实践性的技能&#xff0c;多写代码是提高的唯一途径。尽量…

C++初阶(十二)string的模拟实现

&#x1f4d8;北尘_&#xff1a;个人主页 &#x1f30e;个人专栏:《Linux操作系统》《经典算法试题 》《C》 《数据结构与算法》 ☀️走在路上&#xff0c;不忘来时的初心 文章目录 一、string类的模拟实现1、构造、拷贝构造、赋值运算符重载以及析构函数2、迭代器类3、增删查…

【linux】基本指令(中篇)

echo指令 将引号内容打印到显示屏上 输出的重定向 追加的重定向 输出的重定向 我们学习c语言的时候当以写的方式创建一个文件&#xff0c;就会覆盖掉该文件之前的内容 当我们以追加的方式打开文件的时候&#xff0c;原文件内容不会被覆盖而是追加 more指令 10.more指令…

车载电子电器架构 ——电子电气架构设计方案概述

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 注:本文1万多字,认证码字,认真看!!! 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 屏蔽力是信息过载时代一个人的特殊竞争力,任何消耗你的人和事,多看一眼都是你的不对。非必要不费力证…

基于Pytest+Requests+Allure实现接口自动化测试

一、整体结构 框架组成&#xff1a;pytestrequestsallure 设计模式&#xff1a; 关键字驱动 项目结构&#xff1a; 工具层&#xff1a;api_keyword/ 参数层&#xff1a;params/ 用例层&#xff1a;case/ 数据驱动&#xff1a;data_driver/ 数据层&#xff1a;data/ 逻…

基于51单片机的人体追踪可控的电风扇系统

**单片机设计介绍&#xff0c; 基于51单片机超声波测距汽车避障系统 文章目录 一 概要概述硬件组成工作原理优势应用场景总结 二、功能设计设计思路 三、 软件设计原理图 五、 程序六、 文章目录 一 概要 # 基于51单片机的人体追踪可控的电风扇系统介绍 概述 该系统是基于51…

AI 视频 | Stable Video Diffusion 来了!(附体验地址)

1. 介绍 11 月 21 日&#xff0c;Stability AI 推出了 Stable Video Diffusion&#xff0c;这是 Stability AI 的第一个基于图像模型 Stable Diffusion 的生成式视频基础模型。 目前 Stability AI 已经在 GitHub 上开源了 Stable Video Diffusion 的代码&#xff0c;在 Huggin…

c语言刷题12周(1~5)

输入年月日&#xff0c;显示这一天是这一年的第几天&#xff0c;保证输入日期合法。 题干输入年月日&#xff0c;显示这一天是这一年的第几天&#xff0c;保证输入日期合法。输入样例2022 1 1 2022 12 31 2024 12 31 2022 4 5输出样例2022-1 2022-365 2024-366 2022-9…