问题列举:
- Numpy文件读取
- Numpy文件存储
- Numpy字符串操作
1、文件读取
- 可以使用genfromtxt读取txt或者csv文件
- 可以使用loadtxt读取txt或者csv文件
- 两个函数功能类似,genfromtxt针对的更多是结构化数据
注:delimiter表示的是以,分隔数据;skip_header = 1表示的是跳过第0行从第一行开始读取数据。同时,想查看详细参数可以输入:np.genfromtxt? 或者输入:help(np.genfromtxt)
2、文件存储
- 一般存储为txt或者csv格式
- savetxt(fname,data,delimiter,fmt)
- 一般常用以上的四个参数,分别为保存的路径,数据,分隔符和存储数据的格式
以上的路径加上r是为了防止转译,数据存储的格式是保留3个小数
3、字符串处理
char模块
- Numpy提供char模块处理字符串,运用向量化运算方式
- char模块提供常用的字符串操作函数,如连接、切片、删除、替换等
从上面的例子可以看出,numpy的char函数是可以对列表直接操作的。
对字符串进行拼接:(char函数使用时是对所有元素进行操作,而不用循环)
对字符串进行翻倍:
字符串连接:
hello以:进行分割连接,world以-进行分割连接
字符串替换:
去掉指定字符:
去掉空格:
第一步:读取文件
按行读取短信.txt,读取后f是一个列表,列表中的每个元素都是txt文件中的每一行,其中f[0]表示的是第一行。
第二步:对某一行元素以空格进行分割
第三步:去掉每行右边的空格以及n符,其中lstrip()表示的是对左边进行去空格,rstrip()表示的是对右边进行去空格。如果写成strip()则是对左右量边进行去空格。strip()函数专门用来删除空格和一些规定的字符。
第四步:用replace()函数对有些字符进行替换。
find函数查找字符串出现的位置:
图中表示的是:-1表示该元素没有出现过‘互联网金融’,14表示的是该元素中第14位开始出现‘互联网金融’
islower()判断字符串中是否都是小写:(arr既可以是字符串,也可以是一个列表)
isdigit()检查元素中是否只包含数字:
isalpha()检查元素中是否只包含字母:
注:只由汉字构成的话也是True
count()函数计算每个元素中出现指定字符的次数:
判断每个元素是否以指定字符串开头或者结尾: