资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

正则表达式教程和示例

创作时间:

作者:

@小白创作中心

正则表达式教程和示例

引用

CSDN

https://blog.csdn.net/hey_wei_ran/article/details/136250897

正则表达式（Regular Expression，简称regex）是一种强大的文本处理工具，广泛应用于编程、数据处理和文本搜索等领域。本文将从基础语法到高级应用，全面介绍正则表达式的使用方法，并通过大量实例和练习帮助读者掌握这一重要技能。

语法

示例

ananswer or a question（这里是待匹配文本，其中加粗部分是被匹配字符）

  
^\w+（这里写的是正则表达式）

说明

/w+/g，“/“是表达式开始和结束的定界符，在不特殊说明使用标志（全局g，多行m，忽略大小写i）的情况下，下面就隐藏”//g”

锚点

^开头

匹配字符串或行的开头。

ananswer or a question

  
^\w+

这个例子仅说明”^“的用法，其中“\w”表示匹配字母、数字或下划线，”+“表示匹配一个或多个。

$末尾

匹配字符串或行的末尾。

an answer or aquestion

  
\w+$

\b边界

匹配单词的开头或末尾，单词边界。

ananswer or a question

n\b

\B非边界

匹配不在单词开头或末尾的位置，非单词边界。

an answer or a question

n\B

字符类

[abc]字符集

匹配集合中的任意字符。

barberbirborbur

  
b[eo]r

[^abc]否定字符集

匹配不在集合中的任意字符。

barberbirborbur

  
b[^eo]r

[a-z]范围

匹配两个字符之间的任意字符，包括它们本身。

abcdefghijklmnopqrstuvwxyz

  
[e-i]

.点

匹配除换行符之外的任意字符。

hi012_-!?

\w单词

匹配字母、数字或下划线。

hi012 _-!?

\w

\W非单词

匹配除字母、数字和下划线之外的任意字符。

hi[空格]012[空格]_-!?

\W

\d数字

匹配所有数字。

+1-(444)-222

\d

\D非数字

匹配除数字外的任意字符。

**+1-(444)-**222

\D

\s空白符

匹配所有空白字符。

one[空格]two

\s

\S非空白符

匹配除空白字符以外的任意字符。

onetwo

\S

量词与分支

+一或多

表达式匹配一个或多个。

bpbepbeepbeeep

  
/be+p/g

*零或多

表达式匹配零个或多个。

bpbepbeepbeeep

  
/be*p/g

{1-3}重复

表达式匹配指定范围的位数。

bpbepbeepbeeep

  
/be{1,2}p/g

?可选

使表达式可选。

color,colour

  
/colou?r/g

|或

类似于“或”。用于匹配多种符合条件的表达式之一。

fat,cat,rat

  
/(c|r)at/g

零宽断言

(?=)正向先行断言

例如，我们要匹配文本中的小时值。为了只匹配后面有 PM 的数值，我们需要在表达式后面使用正向先行断言 (?=)，并在括号内的 = 后面添加 PM

Date: 4 Aug 3PM

  
\d+(?=PM)

(?!)负向先行断言

例如，我们要在文本中匹配除小时值以外的数字。我们需要在表达式后面使用负向先行断言 (?!)，并在括号内的 ! 后面添加 PM，从而只匹配没有 PM 的数值。

Date:4Aug 3PM

  
\d+(?!PM)

(?<=)正向后行断言

例如，我们要匹配文本中的金额数。为了只匹配前面带有 $ 的数字。我们要在表达式前面使用正向后行断言 (?<=)，并在括号内的 = 后面添加 $。

Product Code: 1064 Price: $5

  
(?<=\$)\d+

(?<!)负向后行断言

例如，我们要在文本中匹配除价格外的数字。为了只匹配前面没有 $ 的数字，我们要在表达式前用负向后行断言 (?<!)，并在括号内的 ! 后面添加 $。

Product Code:1064Price: $5

  
(?<!\$)\d+

标志

g全局标志

全局标志使表达式选中所有匹配项，如果不启用全局标志，那么表达式只会匹配第一个匹配项。现在，请启用全局标志，以便匹配所有匹配项。

domain.com,test.com,site.com

  
/\w+\.com/g

m多行标志

正则表达式将所有文本视作一行。但如果我们使用了多行标志，它就会单独处理每一行。这次，我们将根据每一行行末的规律来写出表达式，现在，请启用多行标志来查找所有匹配项。

domain.com
test.com
site.com

  
/\w+\.com$/gm

i忽略大小写标志

为了使我们编写的表达式不再大小写敏感，我们必须启用不区分大小写标志。

DOMAIN.COM
TEST.COM
SITE.COM

  
/\w+\.com$/gmi

组和引用

()分组

我们可以对一个表达式进行分组，并用这些分组来引用或执行一些规则。为了给表达式分组，我们需要将文本包裹在 () 中。现在，请尝试为下方文本中的 haa 构造分组。

ha-ha,haa-haa

  
(haa)

引用组

单词 ha 和 haa 分组如下。第一组用 \1 来避免重复书写。这里的 1 表示分组的顺序。请在表达式的末尾键入 \2 以引用第二组。

ha-ha,haa-haa

  
(ha)-\1,(haa)-\2

(?:)非捕获分组

您可以对表达式进行分组，并确保它不被引用捕获。例如，下面有两个分组，但我们用 \1 引用的第一个组实际上是指向第二个组，因为第一个是未被捕获的分组。

ha-ha,haa-haa

  
(?:ha)-ha,(haa)-\1

不会再去匹配ha，而是整体作为一个组

贪婪匹配

正则表达式默认执行贪婪匹配。这意味着匹配内容会尽可能长。请看下面的示例，它匹配任何以 r 结尾的字符串，以及前面带有该字符串的文本，但它不会在第一个 r 处停止匹配。

ber beer beeer beeeer

.*r

懒惰匹配

与贪婪匹配不同，懒惰匹配在第一次匹配时停止。下面的例子中，在 * 之后添加 ?，将查找以 r 结尾且前面带有任意字符的第一个匹配项。这意味着本次匹配将会在第一个字母 r 处停止。

berbeer beeer beeeer

  
.*?r

练习

字符集

写出匹配文本中所有单词的表达式。单词首字母是唯一变化的字符。

beerdeerfeer

  
[bdf]eer

大括号-1

用 {} 编写表达式，匹配文本中，位数为 4 的阿拉伯数字。

Release 10/9/2021

  
[0-9]{4}

大括号-2

用 {} 编写表达式，匹配文本中，位数至少为 2 的阿拉伯数字。

Release10/9/2021

  
[0-9]{2,}

大括号-3

用 {} 编写表达式，匹配文本中，位数为 1 至 4 的阿拉伯数字。

Release10/9/2021

  
[0-9]{1,4}

热门推荐

深度学习图书推荐指南

日本无翼鸟的魅力是什么（探秘虚拟角色与文化影响）

购买二手iPhone指南：全面检查要点

成都美学新地标让建筑和艺术作品对话

海南潮州两天一夜深度游攻略及预算指南：费用明细与省钱技巧

市房管局的服务效率如何？这里的办事流程和政策有哪些特点？

探索大脑的奖励系统：多巴胺如何让我们追求更多

发展智慧交通提高出行效率（国际视点）

当三昧真火遇见银幕传奇〡解密《哪吒》里的中医智慧

消化酶在胃病治疗中的应用

开源项目管理指南：从目标设定到社区维护的全方位实践

青钱柳的功效与作用

当AI遇上AI，华科大用DeepSeek“整活”了！

湿气比较重的有效祛湿方法

世界顶尖国际高中盘点：这些学校让你领略全球教育精髓！

哪吒传说里的中医智慧

视觉中国：聚焦非遗传承现场，捕捉非遗的独特魅力

将蓝牙鼠标或触控板与iPad配合使用

孤独患者的社交困境：如何建立有效的人际关系

乔迁吉日精选：最佳搬家吉日大盘点

艾灸穴位促进新陈代谢，艾灸的功效与作用

高空安全带使用全攻略：从选购到保养，一文详解

不满18岁算童工吗？全面解析我国相关法律法规

水解透明质酸钠：革新护肤和医疗治疗

粪便虫卵检查方法有哪些？了解粪便检查背后的健康意义

正则表达式教程和示例

正则表达式教程和示例

推荐网站

学习

使用

语法

锚点

^开头

$末尾

\b边界

\B非边界

字符类

[abc]字符集

[^abc]否定字符集

[a-z]范围

.点

\w单词

\W非单词

\d数字

\D非数字

\s空白符

\S非空白符

量词与分支

+一或多

*零或多

{1-3}重复

?可选

|或

零宽断言

(?=)正向先行断言

(?!)负向先行断言

(?<=)正向后行断言

(?<!)负向后行断言

标志

g全局标志

m多行标志

i忽略大小写标志

组和引用

()分组

引用组

(?:)非捕获分组

贪婪匹配

懒惰匹配

练习

字符集

大括号-1

大括号-2

大括号-3