C++的正则表达式简介

文章目录

    • 一、基本概念
    • 二、正则表达式的基本用法
      • 1、头文件
      • 2、正则表达式对象
      • 3、正则表达式匹配
      • 4、正则表达式语法
        • (1)基本字符和元字符
        • (2)字符类
        • (3)预定义字符类
        • (4)量词
        • (5)边界
        • (6)分组和捕获
      • 5、错误处理
    • 三、常见用例
    • 四、性能考虑

一、基本概念

C++ 的正则表达式功能是 C++11 引入的标准库的一部分,提供了用于模式匹配和文本处理的强大工具。正则表达式(Regular Expression)是一种用于匹配和操作字符串的模式。它使用特定的语法规则来定义搜索模式,并可以用来查找、替换、分割和验证文本。

二、正则表达式的基本用法

1、头文件

#include <regex>

2、正则表达式对象

正则表达式对象由 std::regex 类表示。使用正则表达式字符串来构造std::regex对象。

#include <iostream>
#include <regex>
#include <string>int main() {std::string pattern = R"(\d{3}-\d{2}-\d{4})"; // 正则表达式:匹配类似 "123-45-6789" 的格式std::regex re(pattern);std::string test_str = "My number is 123-45-6789";std::smatch matches;if (std::regex_search(test_str, matches, re)) {std::cout << "Match found: " << matches[0] << std::endl;} else {std::cout << "No match found." << std::endl;}return 0;
}
// 输出 “Match found: 123-45-6789”

3、正则表达式匹配

std::regex_match:检查整个字符串是否完全匹配正则表达式。

std::regex re("\\d{3}-\\d{2}-\\d{4}");
std::string test_str = "123-45-6789";if (std::regex_match(test_str, re)) {std::cout << "Full match found." << std::endl;
} else {std::cout << "No match found." << std::endl;
}

std::regex_search:检查字符串中是否存在符合正则表达式的子字符串。

std::regex re("\\d{3}-\\d{2}-\\d{4}");
std::string test_str = "My number is 123-45-6789";if (std::regex_search(test_str, re)) {std::cout << "Match found." << std::endl;
} else {std::cout << "No match found." << std::endl;
}

std::regex_replace:替换匹配正则表达式的部分。

std::regex re("\\d{3}-\\d{2}-\\d{4}");
std::string test_str = "My number is 123-45-6789";
std::string replaced = std::regex_replace(test_str, re, "XXX-XX-XXXX");std::cout << replaced << std::endl; // 输出 "My number is XXX-XX-XXXX"

4、正则表达式语法

(1)基本字符和元字符

字符: 字母、数字和其他符号直接匹配对应字符。
点号 (.): 匹配任意单个字符(除了换行符)。

(2)字符类

[abc]:匹配 a、b 或 c。
[^abc]:匹配任何不是 a、b 或 c 的字符。
[0-9]:匹配任何数字。
[a-z]:匹配任何小写字母。

(3)预定义字符类

\d:匹配任何数字([0-9])。
\D:匹配任何非数字。
\w:匹配任何单词字符(字母、数字、下划线)。
\W:匹配任何非单词字符。
\s:匹配任何空白字符(空格、制表符、换行符)。
\S:匹配任何非空白字符。

(4)量词

*:匹配前面的子表达式零次或多次。
+:匹配前面的子表达式一次或多次。
?:匹配前面的子表达式零次或一次。
{n}:匹配前面的子表达式恰好 n 次。
{n,}:匹配前面的子表达式至少 n 次。
{n,m}:匹配前面的子表达式至少 n 次,但不超过 m 次。

(5)边界

^:匹配字符串的开始。
$:匹配字符串的结束。

(6)分组和捕获

(abc):匹配 abc,并将其捕获为一个分组。
(?:abc):匹配 abc,但不捕获它。
\1:引用第一个捕获分组。

5、错误处理

正则表达式中的错误通常会抛出 std::regex_error 异常。可以通过 std::regex_error 的成员函数 code() 获取错误码,成员函数what()获取错误相关的描述字符串。

#include <iostream>
#include <regex>int main() {try {std::regex re("("); // 错误的正则表达式} catch (const std::regex_error& e) {std::cout << "Regex error: " << e.what() << std::endl;}return 0;
}

三、常见用例

验证输入: 正则表达式常用于验证用户输入是否符合指定的格式,如验证电子邮件地址、电话号码、邮政编码等。
查找与替换: 正则表达式非常适合在字符串中查找符合特定模式的子串,并进行替换操作。
文本处理: 在文本分析、数据清理等场景中,正则表达式可以帮助提取有用的信息或去除不必要的字符。

四、性能考虑

正则表达式功能强大,但复杂的模式可能会导致性能问题。在处理非常大的字符串或需要频繁匹配的场景中,应注意正则表达式的效率问题。对于简单的匹配,可以考虑使用更直接的字符串操作来替代。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/52244.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Pandas数据清洗之数据分组和删除重复数据

数据分组 在Pandas中&#xff0c;你可以使用groupby()函数对DataFrame进行分组。这是一个非常强大的功能&#xff0c;可以基于一个或多个列的值来聚合数据。 这里是一个简单的例子来说明如何使用groupby()&#xff1a; 导入Pandas库: import pandas as pd创建一个示例DataFra…

vue3中的组件通信

props通信 可以实现父子组件通信&#xff0c;props数据还是只读的&#xff01;&#xff01;&#xff01; <template><div class"box"><h1>props:我是父组件曹操</h1><hr /><Child info"我是曹操" :money"money&qu…

Redis的缓存穿透、击穿、雪崩

目录 缓存穿透 定义&#xff1a; 解决方法&#xff1a; 缓存击穿 定义&#xff1a; 解决方案&#xff1a; 缓存雪崩 定义&#xff1a; 解决方案&#xff1a; 缓存穿透、缓存击穿和缓存雪崩的区别 缓存穿透 定义&#xff1a; 查询一个不存在的数据&#xff0c;数据库未…

探索802.1X:构筑安全网络的认证之盾

在现代网络安全的世界里&#xff0c;有一个极其重要但又常常被忽视的角色&#xff0c;它就是802.1x认证协议。这个协议可以被称作网络安全的守护者&#xff0c;为我们提供了强有力的防护。今天&#xff0c;我们就来深入探讨一下802.1x的原理、应用和测试&#xff0c;看看它是如…

[000-01-022].第09节:RabbitMQ中的消息分发策略

我的后端学习大纲 RabbitMQ学习大纲 1.不公平分发&#xff1a; 1.1.什么是不公平分发&#xff1a; 1.在最开始的时候我们学习到 RabbitMQ 分发消息采用的轮训分发&#xff0c;但在某种场景下这种策略并不是很好&#xff0c;比方说有两个消费者在处理任务&#xff0c;其中有个…

卷积算子的介绍

在卷积神经网络&#xff08;CNN&#xff09;中&#xff0c;卷积算子&#xff08;或称为卷积核、滤波器&#xff09;是一个用于特征提取的重要工具。以下是对卷积算子及其用途的详细解释&#xff1a; 卷积算子是什么&#xff1f; 卷积算子是一个小矩阵&#xff08;通常为二维&…

js 实现对一个元素得拉伸

前言&#xff1a; 最近写一个项目遇到了需要拉伸调整一个元素得大小&#xff08;宽高&#xff09;。所以打算实现一下。 思路就是用 mousedown、mousemove、mouseup 来实现。 mousemove是动态获取坐标&#xff0c;然后 动态改变元素宽度 js自己实现&#xff1a; html里实现…

平衡编码与学习:程序员的自我提升之道

在这个快速迭代的编程世界里&#xff0c;程序员面临着双重挑战&#xff1a;一方面需要高效地完成日常编码任务&#xff0c;另一方面又必须不断学习新技术和深化专业知识以应对日益复杂的项目需求。如何在繁忙的工作和个人成长之间找到平衡点&#xff0c;是许多程序员共同面临的…

使用html-docx-js + fileSaver实现前端导出word

因为html-docx-js是16年的老库了&#xff0c;它代码里面用到的with语法现在严格模式不允许&#xff0c;用npm直接引入会报错&#xff0c;所以我们需要用其它方式引入 首先要将html-docx-js的代码放到项目中 html-docx-js/dist/html-docx.js at master evidenceprime/html-do…

Coze插件发布!PDF转Markdown功能便捷集成,打造你的专属智能体

近日&#xff0c;TextIn开发的PDF转Markdown插件正式上架Coze。 在扣子搜索“pdf转markdown”&#xff0c;或在Coze搜索“pdf2markdown” 即可找到插件&#xff0c;在你的专属智能体中便捷使用文档解析功能。 如果想测试解析插件在你需要的场景下表现如何&#xff0c;可以直接…

网络安全之xss靶场练习

目录 一、xss靶场练习 1、Ma Spaghet! 2、Jefff 第一个方法 第二个方法 3、Ugandan Knuckles 4、Ricardo Milos 5、Ah Thats Hawt 6、Ligma 7、Mafia​编辑 8、Ok, Boomer 一、xss靶场练习 靶场地址 https://xss.pwnfunction.com/ 页面显示如下 1、Ma Spaghet! 分析…

linux 你会配置静态路由吗?

1. centos 1. 配置静态路由 运行在openstack的虚拟机有多网卡的承载不同的物理平面的网络&#xff0c;比如业务网、管理网、存储网等。但是默认路由只有一条&#xff0c;所以只能通过静态路由来指定路由。 for example&#xff1a; 虚拟机eth0是管理网&#xff1a;10.0.43.0/…

【ARM 芯片 安全与攻击 5 -- 测信道攻击(Side-channel Attack)】

文章目录 什么是测信道攻击?测信道攻击在 ARM 架构中的设计与应用电源分析攻击(Power Analysis Attack)DPA 攻击示例时间分析攻击(Timing Attack)时间分析攻击示例缓存侧信道攻击(Cache Side-channel Attack)Flush+Reload 攻击示例应对测信道攻击的防御措施Summary什么是…

谈一谈数据虚拟化的技术核心和应用架构

数据虚拟化&#xff08;Data Virtualization&#xff09;是对数据资源的抽象&#xff0c;通过屏蔽数据资源的存储位置和访问方式&#xff0c;能够将不同数据源、不同格式的数据资源&#xff0c;进行逻辑上的整合集成。这一技术方案与过去面对传统数仓的弊端&#xff0c;业界过去…

板子电源接线

目的 就是电源接板子时&#xff0c;分清正负 过程 AC、交流电 没有正负 分火线和0线 AC-L 交流火线 AC-N 交流0线 FG&#xff1a;接的是大地 G&#xff1a;是直流输出的地 U&#xff1a;表示的是电压 DC是直流正&#xff0c;DC-是直流负 2个AC是接交流的&#xff0c;一般是左…

免费的真是太香了!Chainlit接入抖音 Coze AI知识库接口快速实现自定义用户聊天界面

前言 由于Coze 只提供了一个分享用的网页应用&#xff0c;网页访问地址没法自定义&#xff0c;虽然可以接入NextWeb/ChatGPT web/open webui等开源应用。但是如果我们想直接给客户应用&#xff0c;还需要客户去设置配置&#xff0c;里面还有很多我们不想展示给客户的东西怎么办…

源代码一定要加密!10款超级好用的源代码加密软件排行榜

在当今高度竞争的商业环境中&#xff0c;源代码不仅是软件产品的基础&#xff0c;更是企业的核心资产之一。保护源代码免受未经授权的访问和盗窃至关重要。为此&#xff0c;许多企业采用源代码加密软件来为这一重要资产增加额外的安全层。以下是2024年企业通用的十大源代码加密…

SNMP入门笔记

简介 SNMP是英文"Simple Network Management Protocol"的缩写&#xff0c;中文意思是"简单网络管理协议"。SNMP是一种简单网络管理协议&#xff0c;它属于TCP/IP五层协议中的应用层协议&#xff0c;用于网络管理的协议。SNMP主要用于网络设备的管理。由于…

session、cookie、token概念介绍

一、Cookie 1、cookie介绍 Cookie是网站为了辨别用户身份而储存在用户本地终端&#xff08;Client Side&#xff09;上的小型文本文件。 作用&#xff1a;Cookie主要用于保存用户登录信息、浏览记录等&#xff0c;以便用户再次访问时能够自动识别并提供个性化服务。存储位置…

汽车电子 -- python脚本组包软件版本号

python脚本组包软件版本号 import pandas as pd import click import os import datetimedef cmdGetSwInfo():targetFilePath ../APP.htargetKeyWord #definetargetProgType PROJECT_TYPEtargetSoftware SOFTWARE_VERSIONtargetVersionInfo VERSION_INFO fileRead …