python 过滤文本中的标点符号(转)

网上搜到的大都太复杂,最后找到一个用正则表达式实现的:

import re
s = "string. With. Punctuation?"
# 如果空白符也需要过滤,使用 r'[^\w]'
s = re.sub(r'[^\w\s]','',s)

支持中文和中文标点。

原理很简单:在正则表达式中,\w 匹配字母或数字或下划线或汉字(具体与字符集有关),^\w 表示相反匹配。

转自:http://baimoz.me/1656/

转载于:https://www.cnblogs.com/zl1991/p/10769922.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/569493.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

修改Linux主机名

Linux 安装好后,其默认的主机名是 localhost。修改 Linux 主机名需要3步。 使用 hostname 修改当前主机名。 hostname new-hostname 修改 /etc/sysconfig/network 配置文件,以便下次重启的时,使用新的主机名。 打开 /etc/sysconfig/networ…

类加载机制--浅谈

一、定义: 类加载(Class Loading)是一种机制,他描述的是将字节码以文件形式加载到内存再经过连接、初始化后,最终形成可以被虚拟机直接使用的Java类型地过程。 Class Loading 包含了加载(Loading&#xff0…

VI操作--跳到最后一行和跳到最后一行的最后一个字符

vi操作 1.跳到文本的最后一行:按“G”,即“shiftg” 2.跳到最后一行的最后一个字符 : 先重复1的操作即按“G”,之后按“$”键,即“shift4”。 3.跳到第一行的第一个字符:先按两次“g”, 4.跳转到当前行…

第二次团队作业

团队序号:10 团队名称:春天花花幼儿 团队码云地址:https://gitee.com/hxhdemayun/hxh.git 博客撰写人:何晓航 学号(2017*****147) 担任职务:项目经理 产品经理 队长:何晓航 何晓航&…

修改主机名(/etc/hostname和/etc/hosts区别)

ubuntu永久修改主机名 1、查看主机名 在Ubuntu系统中,快速查看主机名有多种方法: 其一,打开一个GNOME终端窗口,在命令提示符中可以看到主机名,主机名通常位于“”符号后; 其二,在终端窗口中输入…

第九周学习总结

学习时间:大约10小时 1.php网页设计 2.java基础 3.web登录页面 代码量:150转载于:https://www.cnblogs.com/sljslj/p/10837819.html

openstack Nova日志相关

简介 instance 从创建到删除的整个生命周期都是由 Nova 管理的。 后面各小节我们以 instance 生命周期中的不同操作场景为例,详细分析 Nova 不同组件如何协调工作,并通过日志分析加深大家对 Nova 的理解。 在研究 Nova 各个操作之前,我们先…

Hadoop Mapreduce 调优

转载于:https://www.cnblogs.com/pickKnow/p/10783304.html

vsphere client中部署OVF项目后为项目分配IP

vi /etc/network/interfaces 修改以下内容: # The loopback network interface auto lo iface lo inet loopback # The primary network interface iface eth0 inet manual auto pnet0 iface pnet0 inet static bridge_ports eth0 bridge_stp off…

从深圳到南阳-13天单骑3000里回家记

离人单骑披暮霭,谁家炊烟漫黄昏。 ——生活不止眼前的苟且,还有诗和远方的田野。 远方总是在召唤。 当城市的冷暖变化不再敏感,当漂泊的心终于疲倦得不愿坚持,当孩子日益叛逆,当父母需要相守。 当对职场早已厌倦&#…

如何在vmvare vsphere(ESXI)中移除磁盘中的文件

vsphere client连接esxi或vcenter, 左边栏选择服务器 右边栏选配置---存储----数据存储 选中datastore右键---浏览数据存储 选择想删除的文件,进行删除操作,(一定确认没用的再删)

Python安装Matplotlib,wordcloud,jieba第三方库

以下安装都在cmd窗口下操作 1.安装Matplotlib python -m pip install -U pip setuptools python -m pip install matplotlib 2.安装wordcloud pip install wordcloud 3.安装jieba pip install jieba

Git Bash中npm配置,加速下载等作用

每输入一行,回车,没有任何提示,说明操作成功 1. npm config set registry https://registry.npm.taobao.org 2.npm config set loglevel http 3. npm config set progress false 4.npm的配置被存储在 ~/.npmrc,可以随时改

安装python性能检测工具line_profiler

line_profiler是一款监测python的CPU密集型性能问题的强大工具,可以对函数进行逐行分析,在linux上安装时一切正常,然而今天在win10 64位系统安装失败了 pip3 install line_profiler 报错: error: Microsoft Visual C 14.0 is requ…

Git Bash推送GitHub不成功---密钥设置

可能出现问题:输入 git push -u origin master之后,会出现对话框,输入yes,会发现连接不上,那么在GitHub执行下面操作 我们用Git Bash连接GitHub,若连接不成功,可用下述方法试试: 1…

OSGI概念理解和入门

OSGI在java中也可以说是模块化技术,可以参考这篇博文:https://www.cnblogs.com/garfieldcgf/p/6378443.html 这句话说得很好:构造一个大型程序的主要工作很可能就只是根据需求选择合适的模块,然后再写少量的黏合代码而已。大概的意…

在Windows中为文件添加“可执行”权限(chmod +x 文件名 不起作用)

我们想为Windows中某文件添加可执行权限,原本想用 chmod x 文件名 命令,但发现不起作用, 于是,尝试下面方法 在demo.txt文件中,打开,第一行添加语句 #!/bin/bash 保存后,查看,已…

jupyter notebook 操作

- 插入cell:a,b - 删除: x - 执行: shiftenter - tab: 补全 - cell模式切换: y(marker->code) m(code->marker) - 打开帮助文档:shifttab 转载于:https://www.cnbl…

CSS 横向导航栏(由竖向改成横向 float)

float元素默认会收缩 div块级元素,默认从上往下流 如何让导航栏有竖排→横排 给每一块加上 float:left; 注意事项:以防出bug,在加了float块的父级,加上伪类:clearfix,具体写法如下…

进程控制(二)与linux下的自有服务

一.进程动态信息查看top 第一部分 统计信息 [rootyunwei1 ~]# top top - 19:22:52 up 1:32, 2 users, load average: 0.00, 0.00, 0.00 Tasks: 106 total, 1 running, 105 sleeping, 0 stopped, 0 zombie Cpu(s): 0.1%us, 0.1%sy, 0.0%ni, 99.6%id, 0.0%wa, 0.0%hi, 0.2%si, 0.…