
2. 抽取邮箱
使用正则表达式抽取邮箱

3. 邮箱的正则表达式
邮箱的正则表达式是:
[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}
文本:
正则表达式:
[email protected]
[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}
1
john.doe
[a-zA-Z0-9._%+-]+
2
@
@
3
company
[a-zA-Z0-9.-]+
4
.
\.
5
com
[a-zA-Z]{2,}
1
[a-zA-Z0-9._%+-]+
[a-zA-Z0-9._%+-]
字符集.
, 字符 _
, 字符 %
, 字符 +
, 字符 -
.+
数量2
匹配字符:"@"@
字符3
[a-zA-Z0-9.-]+
[a-zA-Z0-9.-]
字符集.
, 字符 -
.+
数量4
匹配字符:"."\.
字符5
[a-zA-Z]{2,}
[a-zA-Z]
字符集{2,}
数量4. 抽取电话号码
使用正则表达式抽取电话号码

5. 电话号码的正则表达式
电话号码的正则表达式是:
\(\d{3}\)\s?\d{3}[-\s]?\d{4}
文本:
正则表达式:
(123) 456-7890
\(\d{3}\)\s?\d{3}[-\s]?\d{4}
1
(
\(
2
123
\d{3}
3
)
\)
4
\s?
5
456
\d{3}
6
-
[-\s]?
7
7890
\d{4}
1
匹配字符:"("\(
字符2
\d{3}
\d
数字{3}
数量3
匹配字符:")"\)
字符4
\s?
\s
字符集?
数量5
\d{3}
\d
数字{3}
数量6
[-\s]?
[-\s]
字符集-
, 任意空白字符 (空格, tab, 换行).?
数量7
\d{4}
\d
数字{4}
数量6. 抽取社会安全号码
使用正则表达式抽取社会安全号码

7. 社会安全号码的正则表达式
社会安全号码的正则表达式是:
\b\d{3}-\d{2}-\d{4}\b
文本:
正则表达式:
123-45-6789
\b\d{3}-\d{2}-\d{4}\b
1
\b
2
123
\d{3}
3
-
-
4
45
\d{2}
5
-
-
6
6789
\d{4}
7
\b
1
匹配一个词的边界.\b
词边界2
\d{3}
\d
数字{3}
数量3
匹配字符:"-"-
字符4
\d{2}
\d
数字{2}
数量5
匹配字符:"-"-
字符6
\d{4}
\d
数字{4}
数量7
匹配一个词的边界.\b
词边界8. 抽取价格
使用正则表达式抽取价格

9. 价格的正则表达式
价格的正则表达式是:
\$\d+(?:,\d{3})*(?:\.\d{2})?
文本:
正则表达式:
$1,234.56
\$\d+(?:,\d{3})*(?:\.\d{2})?
1
$
\$
2
1
\d+
3
,234
(?:,\d{3})*
4
.56
(?:\.\d{2})?
1
匹配字符:"$"\$
字符2
\d+
\d
数字+
数量3
(?:,\d{3})*
(?:
,
\d{3}
\d
数字{3}
数量)
*
数量4
(?:\.\d{2})?
(?:
.
\d{2}
\d
数字{2}
数量)
?
数量10. 抽取数字
使用正则表达式抽取数字

11. 数字的正则表达式
数字的正则表达式是:
\b\d+\b
文本:
正则表达式:
10
\b\d+\b
1
\b
2
10
\d+
3
\b
1
匹配一个词的边界.\b
词边界2
\d+
\d
数字+
数量3
匹配一个词的边界.\b
词边界12. 抽取日期
使用正则表达式抽取日期

13. 日期的正则表达式
日期的正则表达式是:
\b\d{1,2}/\d{1,2}/\d{2,4}\b
文本:
正则表达式:
12/25/1985
\b\d{1,2}/\d{1,2}/\d{2,4}\b
1
\b
2
12
\d{1,2}
3
/
/
4
25
\d{1,2}
5
/
/
6
1985
\d{2,4}
7
\b
1
匹配一个词的边界.\b
词边界2
\d{1,2}
\d
数字{1,2}
数量3
匹配字符:"/"/
数量4
\d{1,2}
\d
数字{1,2}
数量5
匹配字符:"/"/
数量6
\d{2,4}
\d
数字{2,4}
数量7
匹配一个词的边界.\b
词边界14. 抽取时间
使用正则表达式抽取时间

15. 时间的正则表达式
时间的正则表达式是:
\b(?:[01]?\d|2[0-3]):[0-5]\d(?:\s?[AP]M)?\b
文本:
正则表达式:
09:00AM
\b(?:[01]?\d|2[0-3]):[0-5]\d(?:\s?[AP]M)?\b
1
\b
2
09
(?:[01]?\d|2[0-3])
3
:
:
4
00
[0-5]\d
5
AM
(?:\s?[AP]M)?
6
\b
1
匹配一个词的边界.\b
词边界2
(?:[01]?\d|2[0-3])
(?:
[01]?\d
数字|
间隔2[0-3]
数字)
3
匹配字符:":":
数量4
0 到 59[0-5]\d
数字5
(?:\s?[AP]M)?
(?:
\s?
[AP]M
字符集)
?
数量6
匹配一个词的边界.\b
词边界