Oracle数据库数据编程SQL<5 正则表达式函数*****>

Oracle 提供了一组强大的正则表达式函数,用于在 SQL 和 PL/SQL 中进行复杂的模式匹配和文本处理。这些函数基于 POSIX 标准正则表达式,功能强大且灵活。

目录

一、Oracle 正则表达式函数概览

二、函数详解及示例

1. REGEXP_LIKE

2. REGEXP_INSTR

3. REGEXP_SUBSTR

4. REGEXP_REPLACE

5. REGEXP_COUNT

三、正则表达式模式元素

四、高级正则表达式技巧

1. 后向引用

2. 非贪婪匹配

3. 零宽断言

五、性能考虑

六、综合应用示例 

1. 数据验证

2. 数据清洗

3. 复杂文本分析

七、各Oracle版本的正则表达式支持


一、Oracle 正则表达式函数概览

Oracle 主要提供以下正则表达式函数:

  1. REGEXP_LIKE:检查字符串是否匹配正则表达式模式
  2. REGEXP_INSTR:返回匹配子串的位置
  3. REGEXP_SUBSTR:提取匹配的子串
  4. REGEXP_REPLACE:替换匹配的子串
  5. REGEXP_COUNT (11g+):计算匹配出现的次数

二、函数详解及示例

1. REGEXP_LIKE

【功能:】检查字符串是否匹配指定的正则表达式模式,返回满足条件的字段【语法:】
REGEXP_LIKE(source_string, pattern [, match_parameter])
regexp_like(列名,匹配模式,匹配行为)
由正则表达式构成匹配模式,长度在512个字节内【参数:】
source_string:要搜索的字符串
pattern:正则表达式模式
match_parameter:可选,修改匹配行为,可包含以下字符:'i':不区分大小写'c':区分大小写'n':允许点号(.)匹配换行符'm':多行模式【示例:】
-- 检查字符串是否包含数字
SELECT * FROM employees 
WHERE REGEXP_LIKE(job_id, '[0-9]');-- 不区分大小写匹配
SELECT * FROM customers 
WHERE REGEXP_LIKE(name, '^john', 'i');

2. REGEXP_INSTR

【功能:】返回匹配子字符串的起始或结束位置;返回满足条件的字符或字符串的位置【语法:】
REGEXP_INSTR(source_string, pattern [, start_position [, occurrence [, return_option [, match_parameter [, subexpression]]]])
regexp_instr(列名,匹配模式,数1,数2,匹配行为)--从数1位开始查,查第数2次匹配的位置【参数:】
start_position:开始搜索的位置,默认为1
occurrence:    要查找的第几个匹配项,默认为1
return_option:0:返回匹配的第一个字符位置(默认)1:返回匹配后的下一个字符位置
subexpression: 对于有子表达式的模式,指定哪个子表达式【示例:】
-- 查找第一个数字出现的位置
SELECT REGEXP_INSTR('Order 12345', '[0-9]') FROM dual;
-- 结果:7-- 查找第二个数字出现的位置
SELECT REGEXP_INSTR('Order 12345', '[0-9]', 1, 2) FROM dual;
-- 结果:8-- 查找电子邮件中的域名位置
SELECT REGEXP_INSTR('user@example.com', '@[^.]+\\.') FROM dual;

3. REGEXP_SUBSTR

【功能:】提取匹配正则表达式的子字符串【语法:】
REGEXP_SUBSTR(source_string, pattern [, start_position [, occurrence [, match_parameter [, subexpression]]]])
regexp_substr(列名,匹配模式,数1,数2,匹配行为)【示例:】
-- 提取字符串中的第一个数字序列
SELECT REGEXP_SUBSTR('Order 12345 for 678 items', '[0-9]+') FROM dual;
-- 结果:12345-- 提取电子邮件中的用户名
SELECT REGEXP_SUBSTR('user@example.com', '^[^@]+') FROM dual;
-- 结果:user-- 提取第三个由空格分隔的单词
SELECT REGEXP_SUBSTR('Oracle Database 12c', '[^ ]+', 1, 3) FROM dual;
-- 结果:12c

4. REGEXP_REPLACE

【功能:】替换匹配正则表达式的子字符串【语法:】
REGEXP_REPLACE(source_string, pattern [, replace_string [, start_position [, occurrence [, match_parameter]]])
regexp_replace(列名,匹配模式,字符,数1,数2,匹配行为)【示例:】
-- 隐藏信用卡号中间数字
SELECT REGEXP_REPLACE('Card: 1234-5678-9012-3456', '([0-9]{4})-([0-9]{2})[0-9]{2}-([0-9]{4})', '\1-XX-XX-\3') FROM dual;
-- 结果:Card: 1234-XX-XX-3456-- 标准化日期格式
SELECT REGEXP_REPLACE('31/12/2023', '([0-9]{2})/([0-9]{2})/([0-9]{4})', '\3-\2-\1') FROM dual;
-- 结果:2023-12-31-- 移除所有非字母字符
SELECT REGEXP_REPLACE('A1B2C3', '[^A-Za-z]', '') FROM dual;
-- 结果:ABC

5. REGEXP_COUNT

【功能:】计算正则表达式模式出现的次数(Oracle 11g+)【语法:】
REGEXP_COUNT(source_string, pattern [, start_position [, match_parameter]])
regexp_count(列名,匹配模式,数1,匹配行为)--从数1位开始查【示例:】
-- 计算字符串中数字出现的次数
SELECT REGEXP_COUNT('Order 12345 for 678 items', '[0-9]') FROM dual;
-- 结果:8-- 计算单词"the"出现的次数(不区分大小写)
SELECT REGEXP_COUNT('The quick brown fox jumps over the lazy dog', '\bthe\b', 1, 'i') FROM dual;
-- 结果:2

三、正则表达式模式元素

Oracle 支持的标准正则表达式元字符:

元字符描述示例
^

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/75856.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

el-tabs添加按钮增加点击禁止样式

前置文章 一、vue使用element-ui自定义样式思路分享【实操】 二、vue3&ts&el-tabs多个tab表单校验 现状确认 点击添加按钮,没有点击样式,用户感知不明显没有限制最大的tab添加数量,可以无限添加 调整目标&代码编写 调整目标…

DB-Mysql中TIMESTAMP与DATETIME的区别

文章目录 ‌存储范围‌‌时区处理‌存储空间‌默认值和自动更新‌‌零值处理‌适用场景‌总结 在MySQL中,TIMESTAMP和DATETIME是两种常用的日期时间数据类型,它们虽然都用于存储日期和时间,但在多个方面存在显著差异。以下是它们的主要区别&a…

Spring 中有哪些设计模式?

🧠 一、Spring 中常见的设计模式 设计模式类型Spring 中的应用场景单例模式创建型默认 Bean 是单例的工厂模式创建型BeanFactory、FactoryBean抽象工厂模式创建型ApplicationContext 提供多个工厂接口代理模式结构型AOP 动态代理(JDK/CGLIB)…

C# Winform 入门(3)之尺寸同比例缩放

放大前 放大后 1.定义当前窗体的宽度和高度 private float x;//定义当前窗体的宽度private float y;//定义当前窗台的高度 2.接收当前窗体的尺寸大小 x this.Width;//存储原始宽度ythis.Height;//存储原始高度setTag(this);//为控件设置 Tag 属性 3.声明方法,获…

从零开始的编程-java篇1.6.3

前言: 通过实践而发现真理,又通过实践而证实真理和发展真理。从感性认识而能动地发展到理性认识,又从理性认识而能动地指导革命实践,改造主观世界和客观世界。实践、认识、再实践、再认识,这种形式,循环往…

【Redis】数据的淘汰策略

目录 淘汰策略方案(8种) LRU和LFU策略的区别 使用建议 手搓LRU算法 方式一 方式二 大家好,我是jstart千语。今天和大家回来聊一下redis,这次要讲的是它的淘汰策略。为什么需要淘汰策略呢,就是当redis里面的内存占…

【前端】Node.js一本通

近两天更新完毕,建议关注收藏点赞。 目录 复习Node.js概述使用fs文件系统模块path路径模块 http模块 复习 为什么JS可以在浏览器中执行 原理:待执行的JS代码->JS解析引擎 不同的浏览器使用不同的 JavaScript 解析引擎:其中,C…

【AI论文】JavisDiT: 具备层次化时空先验同步机制的联合音视频扩散Transformer

摘要:本文介绍了一种新型的联合音频-视频扩散变换器JavisDiT,该变换器专为同步音频-视频生成(JAVG)而设计。 基于强大的扩散变换器(DiT)架构,JavisDiT能够根据开放式用户提示同时生成高质量的音…

Java-实现公有字段自动注入(创建人、创建时间、修改人、修改时间)

文章目录 Mybatis-plus实现自动注入定义 MetaObjectHandler配置 MyBatis-Plus 使用 MetaObjectHandler实体类字段注解使用服务类进行操作测试 Jpa启用审计功能实现自动注入添加依赖启动类启用审计功能实现AuditorAware接口实体类中使用审计注解 总结 自动注入创建人、创建时间、…

金融机构开源软件风险管理体系建设

开源软件为金融行业带来了创新活力的同时,也引入了一系列独特的风险。金融机构需要构建系统化的风险管理体系,以识别和应对开源软件在全生命周期中的各种风险点。下面我们将解析开源软件在金融场景下的主要风险类别,并探讨如何建立健全的风险…

图形渲染中的定点数和浮点数

三种API的NDC区别 NDC全称,Normalized Device Coordinates Metal、Vulkan、OpenGL的区别如下: featureOpenGL NDCMetal NDCVulkan NDC坐标系右手左手右手z值范围[-1,1][0,1][0,1]xy视口范围[-1,1][-1,1][-1,1] GPU渲染的定点数和浮点数 定点数类型&a…

同花顺客户端公司财报抓取分析

目标客户端下载地址:https://ft.51ifind.com/index.php?c=index&a=download PC版本 主要难点在登陆,获取token中的 jgbsessid (每次重新登录这个字段都会立即失效,且有效期应该是15天的) 抓取jgbsessid 主要通过安装mitmproxy 使用 mitmdump + 下边的脚本实现监听接口…

QT工程建立

打开软件新建一个工程 选择chose 工程命名,选择保存路径,可以自己选择,但是不要有中文路径 默认的直接下一步 任意选一个下一步 点击完成 之后是这个界面,点击右下角的绿色三角形编译一下 实验内容 添加类 第一个是建立cpp和.h文件…

【NLP 53、投机采样加速推理】

目录 一、投机采样 二、投机采样改进:美杜莎模型 流程 改进 三、Deepseek的投机采样 流程 Ⅰ、输入文本预处理 Ⅱ、引导模型预测 Ⅲ、候选集筛选(可选) Ⅳ、主模型验证 Ⅴ、生成输出与循环 骗你的,其实我在意透了 —— 25.4.4 一、…

ffmpeg时间基与时间戳

时间基、时间戳 时间基:表示时间单位的分数,用来定义视频或音频流中时间的精度。其形式是一个分数,分子通常为 1,而分母则表示每秒的单位数。 时间戳:代表在时间轴里占了多少个格子,是特定的时间点。 时间…

激光加工中平面倾斜度的矫正

在激光加工中,加工平面的倾斜度矫正至关重要,直接影响加工精度和材料处理效果。以下是系统的矫正方法和步骤: 5. 验证与迭代 二次测量:加工后重新检测平面度,确认残余误差。 反馈优化:根据误差分布修正补偿…

算法刷题记录——LeetCode篇(2.2) [第111~120题](持续更新)

更新时间:2025-04-04 算法题解目录汇总:算法刷题记录——题解目录汇总技术博客总目录:计算机技术系列博客——目录页 优先整理热门100及面试150,不定期持续更新,欢迎关注! 114. 二叉树展开为链表 给你二…

C语言学习笔记-9

九、结构体 构造类型: 不是基本类型的数据结构也不是指针类型, 它是若干个相同或不同类型的数据构成的集合 结构体类型: 结构体是一种构造类型的数据结构,是一种或多种基本类型或构造类型的数据的集合。 1.结构体类型定义 定…

Test——BUG篇

目录 一软件测试的生命周期 二BUG 1概念 2描述Bug 3Bug级别 4Bug的生命周期 三与开发人员发生争执怎么办 ​编辑1先自省:是否Bug描述不清晰 2站在用户角度考虑并抛出问题 3Bug定级有理有据 4不仅要提出问题,还要给出解决方案 5Bug评审 5.1…

【Block总结】HWAB,半小波注意力块|即插即用

论文信息 标题: HALF WAVELET ATTENTION ON M-NET+ FOR LOW-LIGHT IMAGE ENHANCEMENT 地址: arXiv:2203.01296 日期: 2022年3月 创新点 改进的分层架构 M-Net+: 提出了一个专为低光图像增强设计的改良分层模型 M-Net+。该架构旨在缓解采样过程中的空间信息损失问题。通过采用…