基础速查 | 基础正则表达式语法

admin 2024年6月6日08:31:30评论8 views字数 3057阅读10分11秒阅读模式

正则表达式

1# 概念

正则表达式,又称规则表达式(Regular Expression,在代码中常简写为regex、regexp或RE),是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符"),是计算机科学的一个概念。

正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,通常被用来检索、替换那些符合某个模式(规则)的文本

2# 规则

1.[] 字符集

表示一个字符,该字符可以是[]中指定的内容

[abc]:这个字符可以是abc
[a-z]:表示任意一个小写字母
[a-zA-Z]:表示任意一个字母
[a-zA-Z0-9_]:表示任意一个数字字母下划线
[^abc]:该字符只要不是abc

2.预定义字符

. :表示任意一个字符,没有范围限制
d :表示任意一个数字,等同于[0-9]
w :表示任意一个单词字符,等同于[a-zA-Z0-9_]–单词指字母/数字/_
s :表示任意一个空白字符
D :表示不是数字
W :不是单词字符
S:不是空白字符

3.量词

? :表示前面的内容出现0-1
例如: [abc]? 可以匹配:a  b  c 或什么也不写

+ :表示前面的内容最少出现1
  例如: [abc]+ 可以匹配:baaaaaaaaaa…或abcabcbabcbabcba
  但是不能匹配:什么都不写  abcfdfsbbaqbb34bbwer

: 表示前面的内容出现任意次(0-多次)—匹配内容与+一致,只是可以一次都不写
例如: [abc]* 可以匹配:baaaaaaaaaa…或abcabcba…或什么都不写
但是不能匹配:abcfdfsbbaqbb34bbwer

{n} :表示前面的内容出现n
例如: [abc]{3} 可以匹配:aaa  bbb  aab abc bbc
但是不能匹配: aaaa  aad

{n,m} :表示前面的内容出现最少n次最多m
例如: [abc]{3,5} 可以匹配:aaa  abcab 或者 abcc
但是不能匹配:aaaaaa  aabbd

{n,} :表示前面的内容出现n次以上(含n次)
例如: [abc]{3,} 可以匹配:aaa  aaaaa  abcbabbcbabcba
但是不能匹配:aa  abbdaw

4.() 括号

是将括号内的内容看做是一个整体

(abc){3} 表示abc整体出现3次. 可以匹配abcabcabc
但是不能匹配aaa abcabc

(abc|def){3}表示abcdef整体出现3次.
可以匹配: abcabcabc  defdefdef  abcdefabc
但是不能匹配abcdef abcdfbdef

3# 常用表达式演示:

1.邮箱正则:

[a-zA-Z0-9]+@[a-zA-Z0-9.]+.[a-z]{2,7}

2.数字校验:

数字:^ [0-9]*$
n位的数字:^d{n}$
至少n位的数字:^d{n,}$
m-n位的数字:^d{m,n}$
零和非零开头的数字:^(0|[1-9][0-9]*)$
非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(.[0-9]{1,2})?$
1-2位小数的正数或负数:^(-)?d+(.d{1,2})?$
正数、负数、和小数:^(-|+)?d+(.d+)?$
有两位小数的正实数:^ [0-9]+(.[0-9]{2})?$
1~3位小数的正实数:^ [0-9]+(.[0-9]{1,3})?$
非零的正整数:^ [1-9]d* ^([1-9][0-9]){1,3} ^+?[1-9][0-9]$
非零的负整数:^-[1-9][]0-9"$ 或 ^-[1-9]d$
非负整数:^d+$ 或 ^ [1-9]d*|0$
非正整数:^-[1-9]d*|0$ 或 ^((-d+)|(0+))$
非负浮点数:^d+(.d+)?$ 或 ^ [1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$
非正浮点数:^((-d+(.d+)?)|(0+(.0+)?))$ 或 ^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$
正浮点数:^ [1-9]d*.d*|0.d*[1-9]d*$ 或 ^ (([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9]))$
负浮点数:^-([1-9]d*.d*|0.d*[1-9]d*)$ 或 ^(-(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9])))$
浮点数:^(-?d+)(.d+)?$ 或 ^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$

3.验证字符:

汉字 :^ [u4e00-u9fa5]{0,}$
英文和数字:^ [A-Za-z0-9]+ ^ [A-Za-z0-9]{4,40}$
长度为3-20的所有字符:^.{3,20}$
26个英文字母组成的字符串:^ [A-Za-z]+$
26个大写英文字母组成的字符串:^ [A-Z]+$
26个小写英文字母组成的字符串:^ [a-z]+$
由数字和26个英文字母组成的字符串:^ [A-Za-z0-9]+$
由数字、26个英文字母或者下划线组成的字符串:^w+ ^w{3,20}$
中文、英文、数字包括下划线:^ [u4E00-u9FA5A-Za-z0-9_]+$
中文、英文、数字但不包括下划线等符号:^ [u4E00-u9FA5A-Za-z0-9]+ ^ [u4E00-u9FA5A-Za-z0-9]{2,20}$

4.其他常用验证

1.域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?

2.手机号码:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])d{8}$

3.身份证号(15位、18位数字):^d{15}|d{18}$

4.密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线):^ [a-zA-Z]w{5,17}$

5.日期格式:^d{4}-d{1,2}-d{1,2}

6.一年的12个月(0109112):^(0?[1-9]|1[0-2])$

7.一个月的31天(0109131):^((0?[1-9])|((1|2)[0-9])|30|31)$

8.xml文件:^([a-zA-Z]±?)+[a-zA-Z0-9]+.[x|X][m|M][l|L]$

9.中文字符的正则表达式:[u4e00-u9fa5]

10.QQ号:[1-9][0-9]{4,} (腾讯QQ号从10000开始)

11.中国邮政编码:[1-9]d{5}(?!d) (中国邮政编码为6位数字)

12.IP地址:d+.d+.d+.d+ (提取IP地址时有用)

13.IP地址:(( ? : ( ?:25[0-5]|2[0-4]d|[01]?d?d).){3}(?:25[0-5]|2[0-4]d|[01]?d?d))

14.文件扩展名效验:^([a-zA-Z]|\)\([^\]+\)* [ ^ /: * ?"<>|]+.txt(l)?$



原文始发于微信公众号(Eonian Sharp):基础速查 | 基础正则表达式语法

免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2024年6月6日08:31:30
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   基础速查 | 基础正则表达式语法https://cn-sec.com/archives/2821053.html
                  免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉.

发表评论

匿名网友 填写信息