qstring去掉特定字符_如何花式、批量且操作简单地处理字符?

720ceb011d4bb1429e6cfd509ef1941f.png

文本字符的规范化,是批量处理的前提。多来源数据或是数据收集本身就必然存在不规范情况,于是批量地完成它就成了常见的需求。

对于花式批量处理,自然要说到正则表达式。

8c99b6f6f7741cf5886f56efc428f56a.png

“正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑”——百度百科。这适用于有编程基础、且较为复杂的处理需求。

还有一个简单点、易操作的方法,那就是通配符。

  EXCEL通配符  

对于EXCEL,没有特别的通配符,跟Windows文件搜索可以使用的通配符一样,主要是* 和?,分别代表多个字符和一个字符。如果要分别搜索*和?本身,前面加个~就行。

如:搜索“张*”,就能搜到“张三”和“张三丰”,而搜索“张??”并且点单元格匹配,就不能搜到“张三”了。

这些通配符可以在部分函数中使用,如sumif。各位遇到需要文本匹配的时候,可以想一想和试一试看可否用通配符。

那么看一个例子吧:有如下的公交线路名数据,是带方向的。现在需要将方向去掉,也就是去掉最右边的括号内容。但是,注意有些是括号内部还有括号——比如第3条,这时需要将内部的一起删掉;有些是有两个并列的括号——比如第5条,这时只需要删掉最右边的括号。

b15b4976769ab9150653b72965881a1f.png

EXCEL的通配符显然不能解决。用正则当然可以,但可能编程要求略高、略复杂了。那么——就用WORD通配符试试吧。

  WORD通配符  

作为一个文本处理工具,通配符的强大想想也理所应当了。WORD通配符的功能与用法介绍网上很多。推荐看这篇就够了:https://www.cnblogs.com/whchensir/p/5768030.html

简单来说,它可以通过一定方法对数字、字母、中文字符进行识别查找,还有各种控制功能组合使用,比如控制指定位置指定字符的数量。

最重要的是,可以在“替换”框中 用\1\2\3分别代表“查找”框中的第1、2、3个()中的内容,注意括号要为英文字符状态下的

例如:

“查找”中输入:(张三)是(法外狂徒)

“替换”中输入:\2是\1  

勾选“使用通配符”,以下都需要。

点替换,结果就能把“张三是法外狂徒”变成“法外狂徒是张三”了。

那么针对前文提出的问题,给出WORD通配符解决方法。

第一步:

将有两个并列括号的,去掉右边的括号,并将左边的括号变成~。如“101路(A)(B)”替换为“101路~A~”

操作内容

查找:\((*)\)(\(*\))替换:~\1~

解释

查找中\(是代表(本身,因为括号本身有通配符的含义,所以要用\来转义——也就相当于EXCEL的~。

随后(*)表示第1个括号内容,用于在替换中指代。\)同样代表)本身。(\(*\))外层的括号代表第2个括号内容,用于在替换中指代,没有就相当于删除。同样的,\(*\)代表括号本身和中间的任意内容——因为观察得知文本中的两个括号的情况都是括号相连的。

第二步:

将括号内还有括号的删除。

操作内容

查找:\(*\(*\)*\)

替换:

各位可以理解下,就不再赘述。

第三步:

将带括号的删除

操作内容

查找:\(*\)

替换:

前期由于已经将不应该删的括号变成了~,所以可以把带括号的内容删除。

第四步:

将~恢复为正常的括号。

操作内容

查找:~(*)~

替换:(\1)

这样就基本实现了需求了。可能还会有 少数 一个括号 里面有 两个括号的情况 (() () ) ,数量比较少,手动改下好了。

  真批量化  

你是否觉得,以上还是不算批量,顶多算是半自动化步枪?而你要的是——机关枪。

可以可以。大概各位还不知道,WORD也可以记录宏的,与EXCEL一样,位置在“视图”——“宏”——录制“宏”。

不知道的原因是,WORD录制宏应用场景确实比较少,但是以上把WORD作为工具来用了,就非常适合用宏来批量操作,毕竟,你可能要重复使用上述过程很多次。下次只需要把原数据删除新数据进来,再点击录好的宏就好了。

机关枪拿走,下期再见。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/427426.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

动漫字幕组 集合

贪婪大陆被非法收购始末 http://blog.csdn.net/freexploit/archive/2005/11/21/534050.aspx预测已经实现~~还好还好先把各字幕组的论坛 地址找了来~~像什么 花园 漫游的这些 大家是熟悉的不能在熟悉了~~所以我就没打上去了~~有不全的请朋友们自己找找吧----------~.~而且现在几…

性能度量RMSE

回归问题的典型性能度量是均方根误差(RMSE:Root Mean Square Error)。如下公式。 m为是你计算RMSE的数据集中instance的数量。x(i)是第i个实例的特征值向量 ,y(i)是其label(期望的模型输出)。如下:X是包含了所有实例的…

最近幻影的两个ARP欺骗工具 挺不错的

arpspoof 3.1b主要功能:ARP欺骗过程中进行数据修改,实现会话劫持攻击说明: 本程序公开源代码,为了换取更多朋友的指教实例: 欺骗192.168.0.108访问百度网站的全过程(注:#后是我加的注释)效果: 1…

python中math库最大值_python-math库解析

math库的数学常数(共4个) math.pi 表示Π,圆周率,值为3.141592653589…… math.e 表示e,自然对数,值为2.718…… math.inf 表示正无穷大,负无穷大为-math.inf math.nan 表示非浮点数标记 math库…

idea启动项目没错,可是debug却一直启动不起来

原因很简单: 断电打的太多了导致的,去掉不需要的断点之后就好了! 转载于:https://www.cnblogs.com/sllcom/p/9327908.html

一个牛人的经历---北京八年——从极度贫困到财务自由

一个牛人的经历---北京八年——从极度贫困到财务自由 第一章: 八年巨变 我1996年7月从东北的一所曾经非常有名的工科大学毕业,快毕业时听了一位同乡校 友姐姐的话“宁到好地方,不到好单位”,经过一番各式各样的努力,96…

python绘制不带颜色曲线图_Python画曲线图

画图方法 from matplotlib import font_manager import numpy as np import matplotlib . pyplot as plt zh_fontfont_manager . FontProperties ( fnamerc:\windows\fonts\simsun.ttc , size14 ) # create a arr x1[ x * 0.5 for x in range( 1 , 20 )] y1x1 # create a arr x…

【数学建模】day02-整数规划

基本类似于中学讲的整数规划--线性规划中变量约束为整数的情形。 目前通用的解法适合整数线性规划。不管是完全整数规划(变量全部约束为整数),还是混合整数规划(变量既有整数又有实数),MATLAB都提供了通用的求解函数。 一、0-1型整数规划 这类规划将变量…

那年的夏天很笛子

原文:salance-moon.spaces.live.com在某个阶段,我想应该是时候把至今为止影响自己走上美工&设计&程序之路的历程整理一下了。但是下笔的时候才发现,其实这几乎成了我童年的回忆录,因为程序暂且不算,美工&设…

python数据的格式输出_python

本文主要由Python String Format 一文翻译整理而来,在python中使用 % 进行格式化字符串由来已久,不过在python2.7 的版本中引入了新的格式化字符串的方法。虽然%号的方式依旧可用,不过在[PEP-3101] 中已有含蓄的警告称将完全淘汰python2.6之前…

[kafka]kafka集群实践

环境 iphostnameserver_id192.168.1.111UAT042192.168.1.112UAT031192.168.1.102UAT053配置hosts: 192.168.1.112 UAT03 192.168.1.111 UAT04 192.168.1.102 UAT05 安装jdk # rpm -ivh jdk-8u65-linux-x64.rpm # java -version java version "1.8.0_65" Java(TM) SE …

互联网盈利模式77种创新 【 很八股的标题,不过内容还是可以参考一下的 】

http://it.icxo.com/htmlnews/2006/05/26/854682.htm当整个世界都在为互联网喝彩的时候,人们心中往往都会进行这样的思考--我怎样才能在互联网上获得财富?其实,这个问题是没有人能够回答的,因为可以回答的人正在为获得财富忙得不可…

.gitignore文件_Java小白入门,Git忽略文件.gitignore详解

在工程中,并不是所有文件都需要保存到版本库中的,例如“target”目录及目录下的文件就可以忽略。在Git工作区的根目录下创建一个特殊的.gitignore文件,然后把要忽略的文件名填进去,Git就会自动忽略这些文件或目录。Git 忽略规则优…

Xamarin Essentials教程磁力计Magnetometer

Xamarin Essentials教程磁力计Magnetometer磁力计也叫地磁、磁感器,可用于测试磁场强度和方向。在手持设备中,通过磁力计可以计算设备的左右、前后倾斜角度,广泛应用于手机各种的应用中。在Xamarin中,开发者可以使用Xamarin.Essen…

python 字符串截取_Python 字符串操作实现代码(截取/替换/查找/分割)

Python 截取字符串使用 变量[头下标:尾下标],就可以截取相应的字符串,其中下标是从0开始算起,可以是正数或负数,下标可以为空表示取到头或尾。 # 例1:字符串截取 str 12345678 print str[0:1] >> 1 # 输出str位…

VMware的linux虚拟机实现和windows的文件共享

使用的centos7和windows10,在虚拟机centos7中是root身份。由于是第一次用没有界面的linux,可谓是困难重重…… 一 打开VMware,然后选中你的虚拟机,我的是centos7。然后点击工具栏”虚拟机“,然后选择”安装VMware tool…

XYZ DOWN-电子书

分享一下我老师大神的人工智能教程。零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到我们人工智能的队伍中来!https://blog.csdn.net/jiangjunshowC Primer 中文第三版 http://dl5.mydown.com/test/ziliao/at2004…

通汇手机为何卖得那么红火

分享一下我老师大神的人工智能教程。零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到我们人工智能的队伍中来!https://blog.csdn.net/jiangjunshow通汇手机连锁去年销量又高居粤西地区榜首通汇手机为何卖得那么红…

OpenCV+3计算机视觉++Python语言实现+第二版pdf

下载地址:网盘下载 OpenCV 3是一种先进的计算机视觉库,可以用于各种图像和视频处理操作,通过OpenCV 3 能很容易地实现一些有前景且功能先进的应用(比如:人脸识别或目标跟踪等)。理解与计算机视觉相关的算法…

javascript进制转换_「js基础」JavaScript逻辑和位运算符归纳

上一篇文章呢,我们讲述了JavaScript运算符中的关系运算符和逻辑运算符,那么紧接上一篇的文章我们今天来说说逻辑运算符。引言逻辑运算符不是很难,也不是很多,我们只要记住三个就可以啦!分别是:!…