私信回复关键词【福利】~
获取丰富办公资源,助你高效办公早下班!
小伙伴们,大家好,我是专治各种疑难杂「数」的农夫~
今天,我就为大家介绍一种高效的数据清洗方法,助你告别熬夜加班,拥抱美好的夜晚时光~
日常工作中,我们经常需要将其他同事发来的 Word 文件中的数据提取出来。
但粘贴进 Excel 表格后,数据就成了介个样子,出现很多空行、重复的标题行、多个相同的部门数据等~
看到这样的表格,大家的内心可能是这样的~
如果我们想处理成下图这样规整的数据,应该如何操作呢?
那么,现在请大家先思考几秒~~~
01
问题分析
Word 中的数据表格,基本上不能直接操作计算,在数据处理上被认为是张「死表」。
(而且 Word 中常常有合并的行列、重复的标题行,「无脑复制粘贴」容易出现格式问题。)
而 Excel 中的数据相当于数据仓库,我们可以随意取部分数据,
或者全部数据进行计算、合并、数据透视等,这类表格我们称之为「活表」。
知道了这些可能存在的问题,接下来,我们就需要逐个击破,把 Word 中的「死表」变成 Excel 中的「活表」。
应该怎么做呢?小伙伴们请随农夫走进本期的「数据农场」~
02
解决方法
▌备份数据
❶ 数据处理数据之前,我们需要先将原表进行备份,保留原始数据。
备份原始数据是处理数据中很重要的习惯。不然,原始数据被修改了,想要从头再来,你可能只能哭了~
▌清理无效行列
❷ 删除不需要的行,即「分部」和「投诉受理量」列。
数据清理中,根据自己处理需求保留或增添数据列,不要让无效数据列影响到数据清理。
❸ 删除列中的无用行,包括 Word 中合并单元格形成的大量空行,及设置「重复标题行」形成的多个标题行。
这些数据是 Word 粘贴进入 Excel 之后,生成的冗余数据。
我们从以下两点进行操作:
首先,去除列中空值行,选中整列—【F5】快捷键进入【定位】条件页面—点击「定位条件」—勾选空值—确定。
即可选中列中所有空值,然后右键,选择【删除整行】即可!
其实,空值也可视为重复值。数据选项卡下的【删除重复值】按钮,也可以删除列中重复值。
但是,考虑到某些部门办件数量相同,因此本次不用这个方法。
其次,删除「重复标题行」所形成的无用行。
① 点击【数据】选项卡—【筛选】—勾选带有「部门」的行。
② 选中除第一行之后的其他部门行,右键删除,最后取消筛选。
还是基于上面刚刚说的原因,没有使用【删除重复值】功能。
以上就是我们初步的预处理数据了。
我们用动图来演示下:
这个时候离最终的数据,是不是有那么几分像了?
好了,下面我们继续进行数据处理,也是本次数据清洗最为关键的操作。
▌错行填值
数据错行:即第二列的第一行数据引用的是前一列或后一列的第二行数据,以次类推。
❹ 命名新列(办件量)存储数值。
以错行形式引入前一列(部门)数据。
即当填充 B 列第 2 行的时候,我们在 B2 单元格中引入 A3 单元格的数值。
公式为:
=A3
下拉单元格即可填充整列,或使用快速填充功能,双击即可自动填充整列。
❺ 这是最简单的一步,当然也是最为重要的一步哦!
选中填充好的办件量列,复制—单击【右键】—粘贴为【值】。
如果不进行这个操作,最后的数据全部都会出现#REF 错误哦!
#REF 代表什么呢?
意思是「无效的单元格引用」错误。
因为在后续操作中,我们会把部门列中所有数字全部删除。
仅保留真正的部门名称数据。
听到这里,是不是恍然大悟?
▌再次清理无用行
❻ 数据清洗进行过半,我们再次删除第一列中的无用行。
点击数据选项卡—选中「部门列」—选中带有「件」字关键词的行—选中全部—删除。
取消筛选,这样的数据形式,是不是和最终数据有七八分像了呢?
但是,数据中咋出现了重复部门呢?就连办件量都是一模一样。
❼ 存在这样重复的数据,是 Word 中的手动拆分单元格造成的。
在 Word 中一个页面无法容纳一个部门的多个分部,就会自动将数据分割到两页。
所以,粘贴进入 Excel,就会出现一个部门重复多行的数据。
如何清理?
选中部门列—点击【数据】选项卡—删除重复行—选择删除重复项警告页面的【扩展选定区域】——确定。
当命令执行完成,Excel 会贴心提示,删除重复值的数量和保留多少唯一值。
就问你,这样的 Office 服务感不感动?
操作步骤太多?没有关系,动图已到~
▌整理数据
❽ 替换的一小步,数据的一大步。
新建最终数据列——手动把第一行第二行的数据写下来。
让 Excel 识别出数据提取规律;
然后,双击第二行的填充柄
进行快速填充,即可提取所有数据。
就问你是不是比老郭的神奇小元宵还要神奇?
PS:快速填充适用于 Office 2013 及以上版本、WPS 2019 及以上版本~
❾ 删除中间的办件量列,获得最终想要的效果~
03
总结回顾
最后小小总结一下:
❶ 备份数据
❷ 定位条件【F5】—删除空行
❸ 筛选—删除重复的标题行
❹ 错行数据填充【B2=A3】
❺ 函数生成的列数据粘贴为值
❻ 筛选关键词行—删除无用行
❼ 删除重复行
❽ 快速填充
今天也是干货满满的一天~好了,小伙伴赶紧打开电脑操作一番吧!
毕竟这种实操性的东西,眼睛看会了可不等于手会了哦!
私信回复关键词【福利】~
获取丰富办公资源,助你高效办公早下班!