Python从0到100(三十九):数据提取之正则(文末免费送书)

在这里插入图片描述

前言: 零基础学Python:Python从0到100最新最全教程。 想做这件事情很久了,这次我更新了自己所写过的所有博客,汇集成了Python从0到100,共一百节课,帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、 计算机视觉、机器学习、神经网络以及人工智能相关知识,成为学习学习和学业的先行者!
欢迎大家订阅专栏:零基础学Python:Python从0到100最新最全教程!

1 什么是正则表达式

正则表达式是一种文本模式,包括普通字符(例如,字母和数字)以及特殊字符(称为“元字符”)。这些元字符没有文字意义,它们用来定义搜索模式,这个模式可以用来检查一个字符串是否符合我们定义的规则,或者从一个文本中提取出符合规则的子串。

2 正则表达式的常见语法

知识点
  • 正则中的字符:普通字符和特殊字符。
  • 正则中的预定义字符集:如\d匹配任何十进制数字,\w匹配任何字母数字字符等。
  • 正则中的数量词:如*(零次或多次),+(一次或多次),?(零次或一次)等。
语法示例
  • .:匹配任意单个字符(除了换行符)。
  • ^:匹配输入字符串的开始位置。
  • $:匹配输入字符串的结束位置。
  • []:匹配方括号内的任意字符(例如,[abc]匹配"a"、“b"或"c”)。
  • |:逻辑或操作符(例如,cat|dog匹配"cat"或"dog")。
  • ():将多个表达式组合成一个子表达式,也可以用于捕获匹配的子字符串。

3 re模块的常见方法

方法列表
  • re.match:从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功则返回None
  • re.search:扫描整个字符串,搜索第一个位置的匹配。
  • re.findall:找出字符串中所有匹配的子串,并把它们作为列表返回。
  • re.sub:替换字符串中的一些子串。
  • re.compile:编译正则表达式,提高效率。
代码示例
import re# 查找所有数字
result = re.findall(r'\d+', 'chuan 123 zhi 456')
print(result)  # 输出: ['123', '456']# 替换数字为下划线
modified_string = re.sub(r'\d', '_', 'chuan 123 zhi 456')
print(modified_string)  # 输出: 'chuan _ _ zhi _ _'# 编译正则表达式
pattern = re.compile(r'\d+', re.S)
found = pattern.findall('123 456 789')
print(found)  # 输出: ['123', '456', '789']

4 Python中原始字符串r的用法

原始字符串定义

原始字符串(raw string)通过在字符串前加上rR来定义,表示字符串中的反斜杠\不应该作为转义字符。

代码示例
# 原始字符串与普通字符串的区别
print(r'\n')  # 输出: \n
print('\n')   # 输出: (换行)# 原始字符串的长度
print(len(r'\n'))  # 输出: 2
print(len('\n'))   # 输出: 1

5 匹配中文

代码示例
import re# 匹配中文字符
title = u'你好,hello,世界'
pattern = re.compile(ur'[\u4e00-\u9fa5]+')
result = pattern.findall(title)print(result)  # 输出: ['你好', '世界']

6 正则表达式的应用场景

  • 验证输入(如邮箱、电话号码等格式)
  • 搜索和替换文本
  • 从日志文件中提取信息
  • HTML/XML解析等

正则表达式是文本处理的强大工具,掌握其语法和使用方式对于编程和数据处理非常重要。

好书推荐

ChatGPT+AI文案写作实战108招
《ChatGPT AI文案写作实战108招》通过10个专题内容、108个实用技巧、240多分钟教学视频,讲解了以ChatGPT平台为代表的AI生成文案的方法,具体内容按以下两条线展开。
一是技能线:前3章内容详细讲解了ChatGPT平台的运用、向ChatGP提问的方法和高效提问的使用技巧,让读者从宏观上把握ChatGPT生成文案的技巧。
二是案例线:后7章内容包括6个文案场景和1个综合案例的AI文案生成技巧,分别为办公类文案写作、艺术类文案写作、学术类文案写作、娱乐类文案写作、媒体类文案写作、营销类文案写作和AI写作全流程案例,让读者结合具体的文案场景掌握ChatGPT生成文案的技巧。
本书案例丰富,实战性强,适合对AI文案感兴趣的读者,特别是文案策划者、文案写作人员、电商商家、新媒体编辑、广告策划者、短视频编导、作家和艺术工作者等,也可作为文学、语言、计算机等相关专业的教材。
在这里插入图片描述
购买链接:https://product.dangdang.com/29723016.html

编辑推荐

个人简历、会议发言、商业计划书、演讲稿、工作总结……
诗歌、小说、剧本、故事、散文、歌词……
调研报告、调查问卷、读书笔记……
朋友圈文案、个人自传、贺词、祝福语……
新闻稿、公众号文章、豆瓣书评、节目脚本、人物台词……
产品推广文案、测评文案、品牌故事……
各类文案写作,信手拈来!

内容简介

《ChatGPT AI文案写作实战108招》通过10个专题内容、108个实用技巧、240多分钟教学视频,讲解了以ChatGPT平台为代表的AI生成文案的方法,具体内容按以下两条线展开。
一是技能线:前3章内容详细讲解了ChatGPT平台的运用、向ChatGP提问的方法和高效提问的使用技巧,让读者从宏观上把握ChatGPT生成文案的技巧。
二是案例线:后7章内容包括6个文案场景和1个综合案例的AI文案生成技巧,分别为办公类文案写作、艺术类文案写作、学术类文案写作、娱乐类文案写作、媒体类文案写作、营销类文案写作和AI写作全流程案例,让读者结合具体的文案场景掌握ChatGPT生成文案的技巧。
本书案例丰富,实战性强,适合对AI文案感兴趣的读者,特别是文案策划者、文案写作人员、电商商家、新媒体编辑、广告策划者、短视频编导、作家和艺术工作者等,也可作为文学、语言、计算机等相关专业的教材。

作者简介

苏海,资深互联网人士,ChatGPT、文心一言等数据大模型首批使用者;对ChatGPT提问经验丰富,超过10000 组人机互动提问词研究和实战应用;运用ChatGPT进行过各类文案的写作,如办公类文案、艺术类文案、学术类文案、营销类文案等;著有畅销书《活动策划实战宝典:品牌推广 人气打造 实战案例》。

目  录

第1 章 技能入门:熟悉ChatGPT 平台的运用 001
◎ 1.1 掌握ChatGPT 的基本用法002
001 让ChatGPT 生成文案002
002 让ChatGPT 停止生成文案003
003 让ChatGPT 重新生成文案003
004 移动鼠标选择复制文案004
005 单击相应按钮复制文案005
006 输入提示词时进行换行 006
007 改写发送的指令或提示词008
◎ 1.2 掌握ChatGPT 的进阶用法009
008 用ChatGPT 生成各种图表009
009 让ChatGPT 找到合适的图片011
◎ 1.3 管理ChatGPT 的聊天窗口012
010 新建一个聊天窗口 013

前  言

人工智能在响应各行各业需求的呼声中高速发展着,不仅能够解放人们的双手,代替人类进行大量琐碎、重复的体力劳动,而且在不断升级与进化中,也可以助力人们的脑力劳动,AI 生成文案就是一个很好的例子。
ChatGPT 作为生成式AI 的主要代表,在生成文案方面有它的优势,一是通过提示词生成文案,二是联系上下文内容生成文案,这两个优势使得ChatGPT 自发布到应用之际都广受欢迎。
秉承主动识变应变求变,主动防范化解风险的精神,我们致力于探索ChatGPT 生成文案的实际应用,结合不同场景中的文案需求,通过改变提示词, 让ChatGPT 进行文案创作。在探索中,我们发现提示词是ChatGPT 生成文案的关键,因此将提示词的编写方式,即提问技巧,也即ChatGPT 生成文案的技巧, 浓缩为108 招式,汇编成此书,便于读者直接学习并掌握实用技巧,进而抢占AI 文案的高地。
综合来看,本书有以下3 个亮点。
(1)实战干货。本书提供了108 个实用的技巧和实例,涵盖了宏观上的33 招AI 生成文案技巧和微观上的75 招实际场景中的AI 生成文案技巧,让读者实打实地把握ChatGPT 的应用和AI 文案的生成。
(2)优中择优。本书选取了办公类文案写作、艺术类文案写作、学术类文案写作、娱乐类文案写作、媒体类文案写作、营销类文案写作6 大场景文案来介绍AI 生成文案的方法,且每一个案例都提供提问思路和实操技巧,让读者有选择性地、有针对性地高效学习。
(3)物超所值。书中除了介绍AI 生成文案的方法,还随书赠送了108 集教学视频、提示词和效果文件等,让读者学而无忧、学有所得。
本书内容高度凝练,由浅入深,以实战为核心,无论是初学者还是有一定经验的读者,都能够从本书中获益。
特别提示:本书在编写时,是基于ChatGPT-3.5 的界面截取的实际操作图片。需要注意的是,即使是相同的关键词,ChatGPT 每次的回复也会有差别, 因此在扫码观看教学视频时,读者应把更多的精力放在ChatGPT 关键词的编写和实操步骤上。
特别提醒:尽管ChatGPT 具备强大的模拟人类对话的能力,但由于其是基于机器学习的模型,因此在生成的文案中仍然会存在一些语法错误,读者需根据自身需求对文案进行适当修改或再加工后方可使用。
本书由苏海编著,参与编写的人员还有朱霞芳,在此表示感谢。若有与本书相关的问题需要沟通和交流,读者可扫描封底“文泉云盘”二维码获取作者联系方式。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/871987.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Qt|QTreewidget类下函数qt助手详解说明示例(二)

上篇:Qt|QTreewidget类下函数qt助手详解说明示例(一) 该系列持续更新,喜欢请一键三连,一起学习进步,升职加薪,感谢各位大佬。 QT5.14.2 参考官方QT助手 Kimi辅助说明 文章目录 insertTopLevelI…

服务器数据恢复—2块硬盘离线且热备盘未完全激活的raid5数据恢复案例

服务器存储数据恢复环境: 北京某企业一台EMC FCAX-4存储上搭建一组由12块成员盘的raid5磁盘阵列,其中包括2块热备盘。 服务器存储故障: raid5阵列中两块硬盘离线,热备盘只有一块成功激活,raid瘫痪,上层LUN…

记录些Spring+题集(1)

接口防刷机制 接口被刷指的是同一接口被频繁调用,可能是由于以下原因导致: 恶意攻击:攻击者利用自动化脚本或工具对接口进行大量请求,以消耗系统资源、拖慢系统响应速度或达到其他恶意目的。误操作或程序错误:某些情…

防火墙小试——部分(书接上回)NAT

toop接上回 1.实验拓扑及要求 前情回顾 DMZ区内的服务器,办公区仅能在办公时间内(9:00 - 18:00)可以访问,生产区的设备全天可以访问. 生产区不允许访问互联网,办公区和游客区允许访问互联网 …

全球DeepFake攻防挑战赛DataWhale AI 夏令营——图像赛道

全球DeepFake攻防挑战赛&DataWhale AI 夏令营——图像赛道 赛题背景 随着人工智能技术的迅猛发展,深度伪造技术(Deepfake)正成为数字世界中的一把双刃剑。这项技术不仅为创意内容的生成提供了新的可能性,同时也对数字安全构…

两个视频怎么剪辑成一个视频?3个方法分享

两个视频怎么剪辑成一个视频?将两个视频剪辑成一个视频,是现代数字内容创作中的高频需求,它不仅简化了素材管理,还能通过创意剪辑提升作品连贯性与表现力。通过精心编排,两个视频片段可以无缝融合,讲述更完…

PLC电工实操题库—匠心整理—高分资源—即刻下载!

1.编制用PLC控制的车辆出入库管理控制程序 答: 传感器布置: 显示电路: 说明: 1.光传感器的接收光被遮断时定义为“有信号”;2.传感器1#有信号时启动增计数逻辑:3.传感器2#有信号时启动减计数逻辑:4.传感器1#完成脉冲同时2#有信…

【深度学习】PyTorch框架(2):激活函数

1.引言 在文中,我们将深入探讨流行的激活函数,并分析它们在神经网络优化特性中的作用。激活函数在深度学习模型中扮演着至关重要的角色,因为它们为网络引入了非线性特性。尽管文献中描述了众多的激活函数,但它们并非一视同仁&…

220v降压5v用几k电阻?

# 220V降压至5V的电阻选择与AH8652和AH8696芯片的应用 在电子电路设计中,将高电压转换为低电压是常见的需求。例如,将220V交流电(AC)降压至5V直流电(DC)用于低功耗设备。这通常通过使用降压转换器&#xf…

C判断一个点在三角形上

背景 鼠标操作时,经常要判断是否命中显示控件,特开发此算法快速判断。 原理 三角形三等分点定理是指在任意三角形ABC中,可以找到三个点D、E和F,使得线段AD、BE和CF均等分三角形ABC。 这意味着三个等分点分别位于三个边界上&…

Golang中init()函数初始化顺序

Q24.init()函数初始化顺序 init() 函数是用于程序执行前做包的初始化的函数,比如初始化包里的变量等一个包可以出线多个 init() 函数,一个源文件也可以包含多个 init() 函数同一个包中多个 init() 函数的执行顺序没有明确定义,但是不同包的init函数是根…

线程的复习

目录 大纲Java中的线程概念创建线程的方法线程的生命周期线程的同步和通信线程的优先级和调度线程的中断 案例 大纲 Java中的线程概念 在Java中,线程是操作系统能够进行运算调度的最小单位,它被包含在进程之中,是进程中实际运作的部分。一个…

网络配置命令

文章目录 一、查看网络接口信息 ifconfig1.1 网络接口名称1.2 使用 ifconfig 查看网络接口信息1.2.1 输出示例1.2.2 输出解释 1.3 查看特定网络接口信息1.3.1 输出示例 1.4 查看所有网络接口信息1.5 特殊网络接口 二、修改网络配置文件2.1 配置文件示例2.2 使配置生效2.3 关闭 …

图——图的遍历(DFS与BFS)

前面的文章中我们学习了图的基本概念和存储结构,大家可以通过下面的链接学习: 图的定义和基本术语 图的类型定义和存储结构 这篇文章就来学习一下图的重要章节——图的遍历。 目录 一,图的遍历定义: 二,深度优先…

应用实践之基于MindNLP+MusicGen生成自己的个性化音乐

前言 MusicGen是基于单个语言模型(LM)的音乐生成模型,使用文本描述或音频提示生成高质量的音乐样本。它基于Transformer结构,包括文本编码器模型和音频压缩模型,以及一个解码器来预测离散的隐形状态音频token。与传统…

uni-data-select 插件配置接收字段,更改默认的text,value

当后台返回的数据源格式不是如下value,text字段时,需要自定义字段配置 range: [{ value: 0, text: "篮球" },{ value: 1, text: "足球" },{ value: 2, text: "游泳" },], 思路有两个, 思路一:前端遍历更改为…

PE文件(十一)移动导出表和重定位表

移动表的原因 一个PE文件中有很多节,每个节都存储不同的数据。而PE文件中的各种表也都分散存储在这些节当中。此时各种表的信息与程序的代码和数据相互混合在一起,如果我们直接对整个程序进行加密,那系统在初始化程序时就会出问题。比如&…

DHCP原理及配置

目录 一、DHCP原理 DHCP介绍 DHCP工作原理 DHCP分配方式 工作原理 DHCP重新登录 DHCP优点 二、DHCP配置 一、DHCP原理 1 DHCP介绍 大家都知道,现在出门很多地方基本上都有WIFI,那么有没有想过这样一个问题,平时在家里都是“固定”的…

【总结】实际业务场景中锁、事务、异常如何考虑使用?

文章目录 锁处理目的:考虑锁控制思路:生命周期接口并发控制解决方案:测试锁是否生效:模拟多线程并发场景的2种方式: 事务处理目的:考虑事务控制思路:解决方案: 总结 锁处理 目的&am…

利用AI辅助制作ppt封面

如何利用AI辅助制作一个炫酷的PPT封面 标题使用镂空字背景替换为动态视频 标题使用镂空字 1.首先,新建一个空白的ppt页面,插入一张你认为符合主题的图片,占满整个可视页面。 2.其次,插入一个矩形,右键选择设置形状格式…