目录
- Linux中的星号,点号和加号概念
- 我的学习过程:
- 我的思考过程:
- 点号(.)
- 星号(*)
- 加号(+)
- 问号(?)
- linux星号,点号,加号,问号在正则表达式中的实战
- Python代码部分
- 我的正则表达式解读
- c1:匹配'zxcv.'
- c2:匹配'e1234ee'
- c3:匹配'eee'
- c4:匹配最后两个'ee'
Linux中的星号,点号和加号概念
我的学习过程:
昨天在学习暂存区添加项目文件时,用到命令:
git add 文件名.后缀
我要把所有的项目文件add该用什么命令呢?
我的思考过程:
第一个想到的是用命令:
1. git add *
结果没有起到作用。又考虑用:
2. git add *.*
结果显示成功了。
我后续思考是不是该看看它们的区别是什么?星号和点号是Linux中的符号。我该学习下,说干就干。
点号(.)
我理解的概念:点号表示除换行符(\n)之外其他所有字符中的任意一个字符。
星号(*)
我理解的概念:星号表示,星号前的第一个字符出现0次或无限多次。
加号(+)
我理解的概念:加号表示,加号前的第一个字符出现1次或无限多次。
问号(?)
我理解的概念:问号表示,问号前的第一个字符只要出现大于0次或1次,但结果中这个字符最多取到一个,或者取到0个。
一番学习后,我认识到用第三条命令更合适。如下:
3. git add .*
我理解的图(以*.*为例):
我的理解:
对于第二条命令(星点星):
第一个位置星号,前面是没有任何字符的,从概念解读,第一个星号能代表的是空,用小圆圈表示。
第二个位置点号,表示任意一个字符(不包括换行符),用小矩形表示。
第三个位置星号,前面有点号,表示任意一个字符,从概念解读,它能代表的是空(第一种情况),或者多个任意字符(第二种情况)。
再看表示的结果,可以看出第一个位置的星号是多余了,虽然执行结果是一样。
后续学习第4条git add . 也可以向暂存区添加所有文件。
备注:使用git ls-files -c查看暂存区所有文件。
4. git add .
思考:为什么add . 也起作用,看起来和上文的说法有冲突。
根据上文说法:点表示的是单个字符(不包括换行符),为什么可以添加所有文件呢?是git的特殊语法吗?待考证*1
linux星号,点号,加号,问号在正则表达式中的实战
Python代码部分
代码部分:
import re
a = 'zxcv.....DS_Store1234eee'
c1 = re.findall('z.*v\\.?', a)
c2 = re.findall('r(.*)e', a)
c3 = re.findall('[e]{3}', a)
c4 = re.findall('4e(e+)', a)
print(c1)
print(c2)
print(c3)
print(c4)
执行结果:
['zxcv.']
['e1234ee']
['eee']
['ee']
我的正则表达式解读
c1:匹配’zxcv.’
原始字符串: ‘zxcv…DS_Store1234eee’
c1 = re.findall('z.*v\\.?', a)
我的解读:
从c1题干看出,难点在于匹配到第一个点。
怎么匹配到第一个点呢?
我的思路是用到问号的非贪婪性。
问号是非贪婪的,问号前一位字符匹配0次或1次,最多取一个。那我就让问号前匹配到第一个点,那就有且仅有这个点了。
但是注意:点号是通配符,是一种特殊语句,需要转义字符,把点转义成普通的点,所以用到双反斜杠进行转义。
c2:匹配’e1234ee’
原始字符串: ‘zxcv…DS_Store1234eee’
c2 = re.findall('r(.*)e', a)
我的解读:
圆括弧对表示一个组的概念,从左到右,第一个圆括弧对表示第1组,依次过去第2,3,4,…组。默认整个模式串是第0组(没有圆括弧对)。
匹配只匹配到组中的内容,组外部分可做为定位标记。
开头用r标记起点,末尾用e标记结束,但不把它们包含进去。点星表示的是匹配任意长度字符串。有起点和结束点标记,就匹配出需要的字符串了。
c3:匹配’eee’
原始字符串: ‘zxcv…DS_Store1234eee’
c3 = re.findall('[e]{3}', a)
我的解读:花括号内数字表示次数。中括号内元素是或的关系。圆括弧内元素是且的关系,会形成一个组,所以如果用圆括号,匹配的只有组中的内容,一个e。所以使用中括号,我思考从左向右匹配时会先匹配到第一个e,但它不是3个e,继续向右匹配,匹配到后面三个e。
c4:匹配最后两个’ee’
原始字符串: ‘zxcv…DS_Store1234eee’
c4 = re.findall('4e(e+)', a)
我的解读:左侧使用了4e进行起点定位,在第一个组中使用e+。加号是贪婪的,加号前一位字符匹配至少一次或多次。结果可以匹配到最后两个e。