视图插入数据_用EXCEL作数据分析--招聘信息

前提

  1. 数据分析职位在哪些城市最多?
  2. 数据分析师的工资水平怎么样?
  3. 做数据分析师对学历专业要求怎么样?

一、字段信息

  1. 城市
  2. 职位名称
  3. 职位类型
  4. 公司名称
  5. 公司规模
  6. 学历要求
  7. 所属领域
  8. 薪资
  9. 工作年限要求

数据预览

3b3969af6380a41be0b232d7db7c5f98.png

二、数据清洗

首先插入表格,这样后续的所有操作都会更加便利,顶端菜单栏选择"插入"-"表格"会自动选中所有的活动区域,勾选"表包含标题"后会自动生成表格(不勾选的话会自动增加一行标题),然后在菜单栏会多一个"设计"按钮,在里面可以更改表格名称(此处我把表名改为招聘数据),后续操作更加方便。

f44443401885ae9224e410576dbdef25.png

1.缺失值

城市有空值,空值的处理方式一般有删除缺失值所属数据、手动补全、平均值等。此处我通过公司所在地来判断缺失的城市归属为上海。

手动填写空值一般有两种处理方式,一种是通过筛选器选择空值后编辑;一种是选中目标区域后点击"查找和选择"-"定位条件"选择"空值",选中的状态下,在编辑栏输入内容后按CTRL+ENTER键即可快速填充空值。

8ea4cafc9a1caea0497edeee01a2ad91.png

2.公司所属领域分列

首先插入空白一列,然后选中要分列的列,在菜单栏"数据"选项下有"分列"按钮,选择分隔符号下一步,选择逗号后可在下方预览分列后的状态,点击下一步完成即可分列。

3e1c7bfed3436534462127738726aaca.png

f3ae75ab6b1b8670cd6b9d8b97cffc76.png

3.薪水分割

薪水数据包含最低和最高值,且是字符串的格式,需要把数据分离出来后改成数字格式。

首先可以采用分列功能,分隔符号选择其他后输入"-"后分成最大最小两列,然后把数字单独取出。

24638876efbc73af8848a82a1cc0e941.png

取数字的第一种方法是替换,查找和替换功能直接把当前列的k替换掉,或者用substitute函数替换,具体写法为:

函数中第一位是选中的单元格;第二位是要替换的字符串;第三位要替换成的字符串;第四位是替换第几个字符串(例如k123k用上述写法替换后就是123k),如果第四位不写则默认全部替换。数据里有大写和小写的K所以要嵌套一层替换2次。

还有一种方法是采用find函数查找k的位置后取k前面的值,具体的写法为:

find函数查找单元格内k的位置,left为从左第一位开始取数,取到右侧k的位置减一即可。

用函数得出来的数值,选择性粘贴选择数值以后还是呈现文本格式,可以用以下方法快捷更改数字的格式:

  • 数据->分列->下一步->下一步->列数据格式选择常规->完成。
  • 如A列是要更改格式的数字列,在新的一列(如B列)输入一列数字1,然后选中要更改格式的数字列A,在列B选择性粘贴->运算(乘)。

更改格式后的结果如图所示:

fac52b0cf2e7c89d00942066df35be79.png

4.职位筛选

当前数据里有很多非数据分析师的职位,我通过查找是否带有"分析"俩字来筛选,用find函数查找if函数判断能有结果的判断为"是",用iferror函数把不符合的改为"否",写法为:

if函数第一个值如果不加条件就判断true为真;iferror函数是判断是否为错误,大家肯定都见过#VALUE!,这就是错误。

三、数据可视化

  • 区域分布饼图

在插入功能栏中选择插入数据->数据透视图和数据透视表,这时候在“表/区域”位置直接输入表格名字就可以了。

76d72cbeb596de3dd1fec5ee8e53e666.png

确定以后就会生成数据透视表和透视图了,在右侧透视图字段区域,把“城市”拖入“轴(类别)”框内,再把城市拖入“值”内,透视图就出来了,默认是条形图,在透视图上右键选择“更改图表类型”,选择饼图即可。生成饼图以后可以在图形上右键“设置数据标签格式”可以调整标签选项及文本格式,在标签选项下把“类别名称”选中就会显示城市名称了,最后隐藏图表上所有的字段按钮,得到饼图如下:

1a579cfa8f453e07f8a564134bf136d4.png

由图可知,职位数量上看,北上广深还是一马当先,北京最多。

  • 最低最高工资柱状图

新建一个透视图,在字段设置处把城市拖入轴,最低工资和最高工资拖入值,这时候工资显示的是求和数据,在值列表里单击其中一个选择“值字段设置”,把计算类型改为平均值,都改完以后更改图表类型,选择“组合”,把其中之一的“次坐标轴”勾选,就可以组合图形了。然后在柱形图右键选择“添加数据标签”可以显示数值,右键数值选择“设置数据标签格式”,标签选项里把数字的类别改为数字,小数位改为1,右键图例可以设置图例格式,这里我改成靠上,最后隐藏图表上所有的字段按钮,然后右键柱形图选择排序为“降序”,得到如下组合图:

cc1de5bb6437ee5bef0844ab836fcfb7.png

由上图可知,北京和深圳的平均工资相差不大,上海杭州次之,成都的最高工资比较低。

图形都完成后可以复制到新的sheet页,粘贴的时候选择图片,图片会随着透视表和透视图的数据变化,这样就可以看到所有的图形方便分析

  • 学历和所属领域透视表

把学历和所属领域拖入“行”,职位ID拖入“值”,值字段设置->值显示方式改为百分比,在图表数字百分比位置右键排序降序,自定义名称改掉,将字体居中,得图表如下:

8a0b8546c9655f6882a4be6c0960e4be.png

从上图可以看出,要求本科学历是最多的,其中移动互联网和金融行业数据分析的职位最多。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/489693.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从全球最赚钱的20家公司,我们可以发现什么?

来源:资本实验室在商业的版图中,更少的公司贡献着更多的利润,这已经是一个不争的事实。而在目前,这种现象正在加剧:更多的利润越来越向更少的公司集中。例如,在1975年,美国上市公司共4819家&…

python ftp上传_Python FTP传输的简单示例

对python这个高级语言感兴趣的小伙伴,下面一起跟随编程之家 jb51.cc的小编两巴掌来看看吧!访问FTP,无非两件事情:upload和download,最近在项目中需要从ftp下载大量文件,然后我就试着去实验自己的ftp操作类&…

NASA:首批“太空蜜蜂”将赴空间站上班,助宇航员推进研究!

来源:机器人大讲堂2006年,美国宇航局(NASA)将三个可自由飞行的小型机器人送上国际空间站。这些名为SPHERES (同步位置的保持、连通与再定向试验卫星)的机器人在太空进行了长达600个小时的实验,开…

k米案例分析

K米产品分析 第一部分 调研、评测 评测 上手体验 大一暑假的时候,在ktv和同学唱k的时候就接触过了。 - -、所以对于k米的第一次上手体验已经不记得了(ps:尴尬)!~其实以前用它的时候想法很简单,不用到点歌台…

java消息对话框用什么做_Java如何创建消息对话框?

本示例演示如何使用JOptionPane类方法创建消息对话框。在下面的代码,你会看到使用的JOptionPane.showMessageDialog(),JOptionPane.showInputDialog()和JOptionPane.showConfirmDialog()。package org.nhooo.example.swing;import javax.swing.*;import …

python教程app 小米应用商店_一篇文章教会你用Python多线程获取小米应用商店App...

【一、项目背景】小米应用商店给用户发现最好的安卓应用和游戏,安全可靠,可是要下载东西要一个一个的搜索太麻烦了。而已速度不是很快。今天用多线程爬取小米应用商店的游戏模块。快速获取。【二、项目目标】目标 :应用分类 - 聊天社交 应用名称&#xf…

传感器发展历史,你知道吗?(图文并茂)

来源:北京物联网智能技术应用协会传感器与通信、计算机被称为现代信息技术的三大支柱和物联网基础,其应用涉及国民经济及国防科研的各个领域,是国民经济基础性、战略性产业之一。当前倍受国际关注的物联网、大数据、云计算技术,乃…

mysql 优化not null_mysql 优化之11:尽可能的使用 NOT NULL

除非你有一个很特别的原因去使用 NULL 值,你应该总是让你的字段保持 NOT NULL。这看起来好像有点争议,请往下看。首先,问问你自己“Empty”和“NULL”有多大的区别(如果是INT,那就是0和NULL)?如果你觉得它们之间没有什…

python第六章函数课后答案_浙大PTA-Python题库 函数题(6-1~6-6)题解

其他各章题解链接如下浙大PTA-Python题库 编程题第一章(1-1~1-3)题解https://blog.csdn.net/zimuzi2019/article/details/107020657浙大PTA-Python题库编程题 第二章(2.1~2.14)题解https://blog.csdn.net/zimuzi2019/article/details/106984549浙大PTA-Python题库 编程题第三章…

我们为什么不能只相信建立在深度学习基础上的人工智能系统

来源:简书本文摘自:https://www.jianshu.com/p/55e1abcd896dGary Marcus介绍了如何实现通用智能以及为什么通用智能可能会让机器更安全。加里•马库斯(Gary Marcus)对深度学习的大肆宣传并不感冒。尽管这位纽约大学教授认为,这项技术在推进人…

matlab向量归一化_已知近似的特征值,求特征向量

对于矩阵A, 已知它的一个近似的特征值, .一般特征值问题在已知特征值后,可确定齐次线性方程 , 是一个齐次线性方程组,且有非零解,即可用null解得其解空间。然而, 在数值上行列式不严格为零,则无…

MVC防止xss攻击 ——Html.AntiForgeryToken的AJAX提交

1、在Html表单里面使用了Html.AntiForgeryToken()就可以阻止CSRF攻击。 2、相应的我们要在Controller中也要加入[ValidateAntiForgeryToken]过滤特性。该特性表示检测服务器请求是否被篡改。注意:该特性只能用于post请求,get请求无效。 3、至于JS&#x…

关于《重启人工智能》11条建议的思考

来源:人机与认知实验室马库斯和欧内斯特戴维斯在他们的新书《重启人工智能》(Rebooting AI)中主张开辟一条新的前进道路。他们相信,我们离获得这样的通用智能还差得很远,但他们也相信,我们最终能够做到这一点。We will also sugge…

cmd中加载java源文件_如何在cmd中编译和运行java源文件

如何在cmd中编译和运行java源文件首先写一个名为HelloWorld.java的java源文件,存储在如C:/java/src的地址,我们再假设待会要存储的位置是C:/java/bin,则我们做一下工作首先,进入cmd环境,输入”C:”回车进入…

python getattr和getattribute_详解Python中 __get__和__getattr__和__getattribute__的区别

引子假设我们有个类A,其中a是A的实例a.x时发生了什么?属性的lookup顺序如下:如果重载了__getattribute__,则调用.a.__dict__, 实例中是不允许有descriptor的,所以不会遇到descriptorA.__dict__, 也即a.__class__.__dict__ .如果遇到了descriptor,优先调用descriptor.沿着继承链…

Hbase随笔

大数据时代的数据量是超大规模的,传统的关系数据库已经很难存储和管理这些数据了,为了存储海量数据,我们有了HDFS,它可以把成千上万台服务器上的硬盘聚集成一块超级大的硬盘,为了让这些数据产生价值,我们有…

《2019中国硬科技发展白皮书》发布,中美硬科技创新指数PK

来源:创新研究10月30日,在2019全球硬科技创新大会上,《2019中国硬科技发展白皮书》正式发布。白皮书从综述篇、科技篇、产业篇和城市篇四个部分,系统论述了发展硬科技的时代背景、硬科技的各领域突破和进展情况、国内各城市硬科技…

JAVA编写提示用户输入投资额_java(计算银行存款总额(要求输入错误时,提示重新输入))...

【任务一】:编写一个简单 Java 程序,计算银行年存款的本息。 要求:程序运行后要求用户输入存款本金、年利率和存款年限,最后程序计算并输出相应年限后存款的金额。相应 的计算公式为:存款总额本金 * (1 利率)存款年限…

这一次,脑机接口可以实时读取人类脑中画面了?

来源:机器之心由俄罗斯脑机接口公司 Neurobotics、莫斯科物理技术学院(MIPT)研发的一种全新脑机接口算法最近被公之于众,它可以利用人工神经网络和脑电图将人类大脑中的图像实时显示在计算机屏幕上。而且,与马斯克脑机…

python访问网页变量_Python 如何访问外围作用域中的变量

在表达式中引用变量时,Python 会按照如下的顺序遍历各个作用域,寻找该变量:当前函数作用域任何外围作用域(比如包含当前函数的其他函数)global 作用域,即代码所在的模块的作用域如果上述作用域内都找不到变量,就会报 N…