正则表达式的元字符是具有特殊含义的字符,用于定义匹配规则。
第1点:元字符
\d 匹配所有单个数字(可以代替[0-9],但不能取代)
\D 匹配单个数字以外的字符(包括字母,汉字,空格,下划线,各类符号。可以替代[a-zA-Z],但不能取代)
[一-龥]或[\u4E00-\U9FA5]只匹配汉字
\w 区配单个字母,汉字,数字,和_
\W 匹配任何非单词字符(包括空格,各类符号,但不能识别下划线)
\s 匹配任何空白字符(空格,制表符,换行符等,眼睛看不到的)
\S 匹配任何非字白字符(眼睛能看到的)
\n 匹配一个换行符
\r 匹配一个回车符
\t 匹配一个制表符(tab键)
. 匹配除"\n"之外的任何单个字符
\b 匹配一个字母和空格的位置(不支持汉字)
第2点:案例说明
将表格中的数字用正则表达式提取出来
表格
Sub yzf()Dim s As Range, sj, n'导入正则表达式Set regx = CreateObject("vbscript.regexp")With regx .Global = True '\d表示匹配数字 .Pattern = "\d+" For Each s In Range("a1", Cells(Rows.Count, 1).End(xlUp)) Set sj = .Execute(s) For Each ssl In sj n = n + 1 s.Offset(0, n) = ssl Next ssl n = 0 Next sEnd WithSet regx = NothingEnd Sub第3点:学习要点
先掌握核心元字符:从 . * + [] \d 等基础开始,不要急于学习复杂规则。
结合场景练习:比如用正则提取文本中的手机号、邮箱,或清洗 Excel 数据.

