excel split函数_Excel 字符串拆分

用 Excel 处理数据时,有时需要对字符串进行拆分。对于比较简单的拆分,使用 Excel 函数可以顺利完成,但碰到一些特殊需求,或者拆分的规则比较复杂时,则很难用 Excel 实现了。这里列出一些拆分需求示例,分析拆分难点,并提供 SPL 解决代码。SPL 是专业计算引擎 esProc 使用的语言,用于处理结构化数据运算非常方便,对于字符串拆分的运算也很简单。

一、规则单词拆分

这里有一份车间采购产品清单,清单的每一项包含了需要采购的品牌以及产品型号。现在想要把每一项的品牌以及型号拆分后单独列到后面。

文件 productlist.xlsx 中数据如下:

v2-84932c8cbd28b5d55f92c5d3f94b7b0a_b.jpg

期望结果:

v2-47255af1f54302154b50162569c1ccf8_b.jpg

使用 Excel 来处理这类拆分时,可以使用数据的分列,但是分列有个缺点,其实也算不上缺点,只是针对这个只想拆出品牌的需求来说单词被过渡拆分了。比如后面的型号,也会被拆分到多个列,又需要重新合并,过程有点得不偿失。不过 Excel 还有一个快速填充,可以根据给定的参考值,比如第一行给定 PANASONIC,便可使用类似规则快速填充后面行的拆分,然后再用 Mid 函数间接算出型号的字符串部分,过程依然繁琐。

使用 SPL 可以直接读取 Excel 文件,对于实时分析操作,也可以将 Excel 中的数据复制到剪贴板,然后在 SPL 里面使用 clipboard 函数直接从剪贴板获取数据,数据整理完后,再将结果放入剪贴板,然后在 Excel 中粘贴结果,这样便可将 Excel 的分析操作跟 SPL 的计算无缝对接起来,方便而又高效。

SPL 拆分代码:

AB
1=clipboard().import@i()/从剪贴板导入产品清单
2=A1.(~.split@1(" "))/从第一个空格处将产品清单分离为两部分,产生一个序列的序列
3=A2.concat@n("t")/拼接为子序列的成员用 Tab 分隔,序列的成员之间用回车分隔的二维表串
4=clipboard(A3)/将串值放置到剪贴板

代码执行完成后,只需在B1 格粘贴便可得到期望结果。

二、数字分离

如下为一些数字跟字符混合在一起的数据,现在需要将数字和字符分离开。

文件 numbers.xlsx 中数据如下:

v2-df7d452aaf3a97d7d57d21ef54b5793f_b.png

期望结果:

v2-031f9e5b546cfc2efbaaea84cc5b3842_b.jpg

如果是光分离数字出来,仍然可以使用给定首行参考值,然后采用快速填充,便可以将所有数字分离出来。但是要将剩余的字符再分离出来,Excel 没有合适的办法,因为有些数字是跟字符交叉混合在一起,没法用 Mid 等函数拆分。只能采用 VBA 写代码逐字循环,判断字符类型,挨个分离,过程依然麻烦。

SPL 可以直接将串分离成单字符,并根据类型划分:

AB
1=clipboard().split@n()/将剪贴板数据按回车拆分为成员,然后将成员再逐字拆分
2=A1.(~.align@a([true,false],isdigit(~)).(~.concat()))/每一项字符序列用是否为数字分成两组,继而再拼成串,从而分离出数字和字符
3=A2.concat@n("t")/将两层序列分别用 Tab 和回车拼为二维表式的大串
4=clipboard(A3)/将大串放置到剪贴板

三、日期分离

下面为一些包含日期的句子或段落,现在想要把句子里面所有的日期分离出来,一行中包含多个日期时,用分号分开。

文件 multidates.xlsx 中数据如下:

v2-871911d029bf9295736071fc53a928d2_b.jpg

期望结果:

v2-f077ce3d10907fabc03a1a3e5cb66009_b.jpg

要将句子里面的日期分离出来,Excel 没有相应的办法,尤其像这种一个句子里面有不定个数的日期。如果是固定位置或长度的日期格式,才可能用截取固定长度,或者使用快速填充能够办到。对于上述多个日期的分离,只能写 VBA 代码,再用正则表达式去匹配解析,完成这种需求对人员要求较高,且实现过程繁琐。

SPL 直接用空格分割串为单词序列,然后按格式转换日期类型的数据:

AB
1=clipboard().split@n(“ “)/将剪贴板数据按回车拆分成员,然后用空格将每一成员拆分为单词序列
2=A1.(~. (date(~,"dd.MM.yy")))/将单词序列的成员按照指定格式转换为日期类型的数据
3=A2.(~.select(ifdate(~)))/选出序列中的日期类型的值
4=clipboard(A3.concat@n(“;”))/将日期串序列结果拼接为二维表串并放置到剪贴板

执行完上述代码后,直接在源表中的B1 格执行粘贴,即可得到期望结果。

四、按字符拆分

如下表为一列长度不等的数字,现在需要将数字逐字拆分成为单独的列。

文件 number.xlsx 的数据:

v2-e94f9726623b5599a7dd9e3c611af4fb_b.jpg

期望结果:

v2-37cd7c4c70fecf797b29e9db762ff0a1_b.jpg

使用 Excel 拆分上述数字时,首先想到的是使用分列,但是像这种逐字拆分,分列时只能一个一个指定分隔位,数字比较长时就要多次重复设置,操作多而麻烦。其次是使用函数,比如可以在 B1 写入 =MID($A1,COLUMN(A1),1),然后拖拽鼠标进行行填充以及列填充,但这种操作不好掌握最大列数,篇幅大时,操作也不方便。

SPL 可以直接按字符拆分:

AB
1=clipboard().split@n()/将剪贴板数据按回车拆分成员,然后每个成员再缺省拆分为单字符序列
2=A1.concat@n("t")/将拆分后的两层序列拼成串式二维表
3=clipboard(A2)/将结果放置到剪贴板

上述代码执行完成后,同样在 B1 处粘贴拆分后的数据即可。

五、属性表和文件名拆分

如下数据为一段日志描述文件,结构相对复杂,其中包含类似于属性表的分节描述。现在想将属性描述中的 PublicKeyToken 以及文件名分离出来。

文件 log.xlsx 的数据:

v2-d3f87632a711c4f85ffffc48edc5ba69_b.jpg

期望结果:

v2-65633c2dce8e742d659113a73b20f36e_b.jpg

这是一个综合串的分离,第一层为用逗号分隔的描述串,然后第二项类似于属性分节串的描述。所以使用 Excel 时,需要多次分列,以及多次快速填充,方可完成期望结果。同样是步骤多,且需要给定参考值来快速填充,过程繁琐。

SPL 提供了函数直接对属性串取值,以及对文件名的不同部分拆分:

AB
1=clipboard().split@nc()/将剪贴板数据用回车拆分成员,然后以逗号拆分子成员序列
2=A1.([replace(~(2),""","").property("PublicKeyToken"),filename(replace(~(3),""",""))])/去掉两端引号后,用属性 property 函数从第 2 项获取 PublicKeyToken 的值;再用 filename 函数拆分出第 3 项中的文件名;再将这两个值构成序列
3=clipboard(A2.concat@n("t"))/将结果拼为大串放置到剪贴板

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/527544.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python优雅编程_Python优雅地可视化数据

[导读]声明:由于本文的代码大部分是参考书中的例子,所以不提供完整代码,只提供示例片段,也就是只能看出某一部分用法,感兴趣的需要在自己的数据上学习测试。 声明:由于本文的代码大部分是参考书中的例子&am…

sparkstreaming 读取mysql_第十篇|SparkStreaming手动维护Kafka Offset的几种方式

Spark Streaming No Receivers 方式的createDirectStream 方法不使用接收器,而是创建输入流直接从Kafka 集群节点拉取消息。输入流保证每个消息从Kafka 集群拉取以后只完全转换一次,保证语义一致性。但是当作业发生故障或重启时,要保障从当前…

anaconda 安装pytorch_conda上安装PyTorch

conda上安装PyTorch这里的安装系统:Windows系统第一步,打开Anaconda Prompt第二步,为pytorch创建一个环境:conda create -n pytorch python3.8(这里的pytorch是环境的名称,python3.8表示安装的是3.8版本的p…

curd什么意思中文_查英英字典:What a shame是什么意思?

查英英字典:What a shame是什么意思?“互联网”时代学习英语有两种“学习方法”:简单粗暴学法和自己动手丰衣足食法。一、简单粗暴法:直接问老师要“中文答案”在过去非互联网时代,“老师”往往是提供“答案”的唯一渠…

c++读出像素矩阵_Python传numpy矩阵调c++(求3D图像连通区域)

Python有很多种调c的方法,有的复杂有的简单,有时使用的时候反而不知道到底该用哪一种比较好,其实没有最好的方法,只有适合不适合自己。本文从我所遇到的问题说起,然后讲述另一种比较简单的python调c并且传参numpy矩阵的…

android四大组件的作用简书,Android四大组件是什么

Android四大组件是:活动、服务、广播接收器、内容提供商。它们的英文名称是ACTIVITY、SERVICE、BroadcastReceiver、Content Provider。四个组件分别起到不同的作用,相互配合才能确保安卓系统的正常运行,因此是缺一不可的。Android四大组件及…

python 获取文件大小_第41p,超级重要,Python中的os库

大家好,我是杨数Tos,这是《从零基础到大神》系列课程的第41篇文章,第二阶段的课程:Python基础知识:Python内置库之os库的使用。学习本课程,建议先看一遍:【计算机基础知识】课程。os模块是与操作…

惠普打印机节能环保认证证书_低成本高效办公 苏宁惠普超品日这几款打印机了解下!...

【PConline 导购】说到打印机,很多朋友会想到公司那台不停运转的打印机。其实,伴随着近几年来打印机技术的成熟,其打印成本也一降再降,这就让有打印的需求的中下型企业,甚至个人,都会去选购一款合适的打印产…

vm客户机隔离不能选_开汽车美容店,这些位置绝对不能选,会让你门可罗雀,生意惨淡...

之前的文章里,讲了一些开汽车美容店选址的要领,今天,来聊聊一些更加细致的选址要素,让你避免错误选址而导致生意不佳。门面宽度小于2.5米的不要选一辆普通汽车的宽度在1.8米-2米之间,加上两侧后视镜各20公分左右&#…

markdown格式_第1篇:如何将Markdown笔记转入ANKI复习? | 学习骇客

用技术和心理学改善学习 第128次摘要:将日常使用的Markdown笔记软件与复习工具ANKI结合起来,于ANKI用户而言可以简化学习过程,于一般的学习者而言可以解决笔记“记而不学”的问题。本文摘选自视频课程《复习的技术,跟LEO学ANKI》(…

android手机无分区无法刷机,手机刷死了别说没提醒!安卓设备刷机前必看

大家好,清明节已经过去了,上班的感觉是不是很不爽?但是告诉大家一个好消息是:本周只需要煎熬三天,大家就又可以休息了!听了这个消息,不爽的心情是不是稍微好一些了?本期的微信和大家…

mysqlbinlog工具_带你解析MySQL binlog

前言:我们都知道,binlog可以说是MySQL中比较重要的日志了,在日常学习及运维过程中,也经常会遇到。不清楚你对binlog了解多少呢?本篇文章将从binlog作用、binlog相关参数、解析binlog内容三个方面带你了解binlog。1.bin…

inputstream 初始化_如何完美回答面试官问的Mybatis初始化原理!

前言对于任何框架而言,在使用前都要进行一系列的初始化,MyBatis也不例外。本章将通过以下几点详细介绍MyBatis的初始化过程。MyBatis的初始化做了什么MyBatis基于XML配置文件创建Configuration对象的过程手动加载XML配置文件创建Configuration对象完成初…

html中加减号怎么输入,jQuery 实现点击加减号改变input标签中的value值,该怎么解决...

jQuery 实现点击加减号改变input标签中的value值我想点击左右两边的加减号,让中间input标签中的value属性值做出相应的改变,jQuery怎么实现?------解决思路----------------------$("button1").click(function(){var num $("…

java mybatis狂神说sql_狂神说MyBatis01:第一个程序

狂神说MyBatis系列连载课程,通俗易懂,基于MyBatis3.5.2版本,欢迎各位狂粉转发关注学习,视频同步文档。未经作者授权,禁止转载MyBatis简介环境说明:jdk 8 MySQL 5.7.19maven-3.6.1IDEA学习前需要掌握&#x…

鸿蒙系统暗黑2,暗黑破坏神2为什么被称为神作!看看装备强化系统就知道有多完美...

暗黑破坏神2之所以被玩家们称为神作是因为真的好玩,那么游戏的精髓到底在哪呢?个人觉得还要算其出色的装备强化系统,如果应用在现在的部分作品中,暗黑破坏神2的特色可以总结为肝,彻底肝。但它又区别于传统的必须肝&…

c语言api_用C语言来拓展python的功能

python是一门功能强大的高级脚本语言,它的强大不仅表现在其自身的功能上,而且还表现在其良好的可扩展性上,正因如此,python已经开始受到越来越多人的青睐,并且被屡屡成功地应用于各类大型软件系统的开发过程中。与其它…

html模拟在线股票走势,基于Html5的股票行情k线图源码

K线图 滑块控制这个K线图和flash实现的K线图非常接近,滑块控制是实现的难点,这里是根据滑块滑动的位置计算k线数据的范围,并实时重画,事实证明html5 canvas标签的性能还是相当的好的,在PC机上每秒可以重画20次以上&…

html5 css 三角形,css怎么画三角形?

css怎么画三角形?下面本篇文章就来给大家介绍一下使用CSS画三角形的方法。有一定的参考价值,有需要的朋友可以参考一下,希望对大家有所帮助。css怎么画三角形?三角形实现原理:宽度width为0;height为0&#…

springboot整合JPA 多表关联 :一对多 多对多

补充一下自定义SQL 这是连表查询,可以任意查出字符,用Map接收 Testvoid test3() {JPAQueryFactory jpaQueryFactory new JPAQueryFactory(em);QStudent student QStudent.student;QMessage message QMessage.message;//constructor(StuMesDto.class, …