正则表达式

Regular Expressions Regex

unknown

/ Regex /g  global 
/ Regex /m  multiline
/ Regex /i  case insensitive

大括号 {} Curly Braces ：在该字符的末尾

unknown

[0-9]{2,}  //匹配文本中，位数至少为 2 的阿拉伯数字

括号 () 分组，我们可以对一个表达式进行分组，并用这些分组来引用或执行一些规则。为了给表达式分组，我们需要将文本包裹在 () 中。 -\n 表示第 n 个分组

括号 (?:group) 非捕获分组：对表达式进行分组，但是不被引用捕获

unknown

(ha)-\1,(haa)-\2      \\ ha-ha,haa-haa 
(?:ha)-ha,(haa)-\1     \\  ha-ha,haa-haa

竖线 | 竖线允许一个表达式包含多个不同的分支。所有分支用 | 分隔。（相当于或）
转义字符 \ Escape Character： {} [] / \ + * . $ ^ | ? 这些特殊字符。为了匹配这些特殊字符本身，我们需要通过 \ 将它们转义
插入符 ^：匹配字符串的开始，在表达式前面加上 ^
美元符号 $：匹配字符串的结束，在表达式末尾加上 $

unknown

^[0-9]    //  仅查找行首的数字
html$     // 在行末出现的 html

希望正在写的词语出现在另一个词语之前或之后

unknown

Date: 4 Aug 3PM 
\d+(?=PM)     // 得到 3 
\d+(?!PM)     // 得到 4

正向后行断言 Positive lookbehind ：在表达式前面使用正向后行断言 (?<=pattern) ，匹配出现在 pattern 后面的表达式
负向后行断言 Negative lookbehind assertion：在表达式前面使用 (?<!pattern) ，不匹配出现在 pattern 后面的表达式

unknown

Product Code: 1064 Price: $5 

(?<=\$)\d+  //5  正向后行断言 匹配前面带有 \$ 的数字 

(?<!\$)\d+  //1064  负向后行断言

(?<=$)\d+ //5 正向后行断言匹配前面带有 $ 的数字

(?<!$)\d+ //1064 负向后行断言

python

import re

API	作用	返回值
`re.search(pattern, text)`	在任意位置找第一次匹配	`Match` 对象或 `None`
`re.match(pattern, text)`	只在开头匹配	`Match` 对象或 `None`
`re.fullmatch(pattern, text)`	整段必须完全匹配	`Match` 对象或 `None`
`re.findall(pattern, text)`	返回所有匹配片段的列表 List	`list[str]`
`re.finditer(pattern, text)`	返回迭代器（省内存）	`Iterator[Match]`
`re.sub(pattern, repl, text, count=0)`	替换	替换后的字符串

re.sub(pattern, repl, string) 常用的“查找-替换”函数之一，它会在一个字符串中搜索与正则表达式匹配的所有子串，然后用你指定的新内容把它们全部替换掉，最后返回替换后的完整字符串。

python

return re.sub(r'([A-Z]{3,})|([a-z]{3,})',lambda m: m.group(1).lower() if m.group(1) else m.group(2).upper(),s)

unknown

[\u4e00-\u9fa5]   匹配中文文本

(\]\()/(img/user/Functional%20files/Photo%20Resources/[^)]+\. (?:png|jpg|jpeg|gif|webp|svg))

$1../$2

unknown

\\*\*[^*]+\*\*\

\\*\*|\*\*\|\[\[|\]\]

交互式学习网站：https://regexlearn.com/