加入收藏 | 设为首页 | 会员中心 | 我要投稿 莆田站长网 (https://www.0594zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营中心 > 建站资源 > 优化 > 正文

代码详解:Python正则表达式的优秀使用指南

发布时间:2019-09-29 22:53:58 所属栏目:优化 来源:读芯术
导读:副标题#e# 处理文本数据的一个主要任务就是创建许多以文本为基础的特性。 人们可能想要在文本中找出特定格式的内容,比如找出存在于文本中的电子邮件,或者大型文本中的电话号码。 虽然想要实现上述功能听起来很繁琐,但是如果使用Python正则表达式模块,就

例如,想在字符串中找出以小d或大写D开头,以字母e结尾,包含6个字母的子字符串。

代码详解:Python正则表达式的优秀使用指南

3.一些元序列

在使用正则表达式时,一些模式会经常被用到。因此正则表达式为这些模式创建了一些快捷方式。最常用的快捷方式如下:

w,匹配任何字母、数字或下划线。相当于[a-zA-Z0–9_]

W,匹配除字母、数字或下划线以外的任何内容。

d,匹配任何十进制数字。相当于[0–9]。

D,匹配除十进制数字以外的任何数字。

4.加号和星形运算符

代码详解:Python正则表达式的优秀使用指南

点算符只是用于获取任何字符的单个实例。如果想找出更多实例要怎么做呢?

加号+用于表示最左边字符的一个或多个实例。

星号*用于表示最左边字符的0个或多个实例。

例如,如果想找出所有以d开头,以e结尾的子字符串,d和e之间可以没有也可以有多个字符。我们可以用:dw*e

如果想找出所有以d开头,以e结尾的子字符串,在d和e之间至少有一个字符,我们可以用:dw+e

代码详解:Python正则表达式的优秀使用指南

还可以使用更为通用的方法:用{}

w{n} - 重复w 正好n次。

w{n,} - 重复w至少n次,或者更多次。

w{n1, n2} - 重复 w 至少n1次,但不超过n2次。

5.^插入符号和$美元符号。

^插入符号匹配字符串的开始,而$美元符号则匹配字符串的结尾。

代码详解:Python正则表达式的优秀使用指南

6.单词边界

这是一个重要的概念。

有没有注意到,在上面的例子中,总是匹配子字符串,而不是匹配单词?

如果想找出所有以d开头的单词呢?

可以使用dw*模式吗?下面用网络工具来试一试吧。

代码详解:Python正则表达式的优秀使用指南

正则表达式函数

目前为止,只使用了 re包中的findall 函数,其实还有很多其他函数。下面来逐个介绍。

1. findall

上面已经使用了 findall。这是我最常使用的一个。下面来正式认识一下这个函数吧。

输入:模式和测试字符串

(编辑:莆田站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读