18赞

当前位置: 开发笔记 > 编程语言 > 正文

Python中re模块的常用方法总结

作者：女女的家_747 | 2022-01-26 00:00

这篇文章主要给大家介绍了关于Python中re模块的相关资料，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

前言

正则表达式作为计算机科学的一个概念，通常被用来检索、替换那些符合某个规则的文本。正则表达式是对字符串操作的一种逻辑公式，用事先定义好的规则字符串对字符串进行过滤逻辑处理。

re模块总结，正则表达式。在网络爬虫中对于数据定位，学习regex也很有必要

常用方法

re.compile()
将指定的正则表达式模式编译为正则表达式对象，可用于匹配和搜索
re.match()
该方法用于匹配字符串开头的模式
re.serach()
该方法用于匹配出现在字符串中任意位置的模式
re.findall()
该方法返回字符串中制定正则表达式模式的所有非重叠匹配项
re.finditer()
对于从左到右扫描字符串中的特定模式，该方法以迭代器的形式返回所有匹配的实例
re.sub()
用于以替换串来替代字符串中特定的模式，他仅仅替换字符串中最左侧出现的模式

重要标识符

正则表达式可以包含一些可选标志修饰符来控制匹配的模式。修饰符被指定为一个可选的标志。多个标志可以通过按位 OR(|) 它们来指定。如 re.I | re.M 被设置成 I 和 M 标志：

常用表达式规则

举例说明

下面的代码描述了其中一些方法，并展示了在处理字符串和正则表达式通常如何使用他们

import re
pattern = "python"
s1 = "Python is an excellent language"
s2 = "I love Python language.I also use Python to build applicants at work!"

re.match(pattern, string, flags=0)

从起始位置开始根据模型去字符串中匹配指定内容，匹配单个

re.match(pattern,s1)

因为大小写，无法匹配成功

re.I 或 re.IGNORECASE 用于匹配不区分大小写的模式

re.match(pattern,s1,re.I)

re.match(pattern,s1,re.IGNORECASE)

re.search(pattern, string, flags=0)

根据模型去字符串中匹配指定内容，匹配单个

现在来看下find()和search()方法在正则表达式是如何工作的

re.search(pattern,s2,re.IGNORECASE)

re.findall(pattern, string, flags=0)

match and search均用于匹配单值，即：只能匹配字符串中的一个，如果想要匹配到字符串中所有符合条件的元素，则需要使用 findall。

re.findall(pattern,s2,re.IGNORECASE)

['Python', 'Python']

re.sub(pattern, repl, string, count=0, flags=0)

用于文本替换的正则表达式对于查找和替换字符串中的特定文本标识符很有用

用于替换匹配的字符串,比str.replace功能更加强大

re.sub(pattern,"Java",s2,flags=re.I)

'I love Java language.I also use Java to build applicants at work!'

re.subn(pattern,"Java",s2,flags=re.I)

('I love Java language.I also use Java to build applicants at work!', 2)

re.split(pattern, string, maxsplit=0, flags=0)

用匹配到的值做为分割点，把值分割成列表

s1

'Python is an excellent language'

re.split(" ",s1)

['Python', 'is', 'an', 'excellent', 'language']

按数字分割

print(re.split("\d+","https://blog.csdn.net/qq_45176548"))

‘(?P…)' 分组匹配

s = '230701200104280028'
print(re.search('(?P\d{3})(?P\d{3})(?P\d{8})(?P\d{4})',s))
print(re.search('(?P\d{3})(?P\d{3})(?P\d{8})(?P\d{4})',s).groups())
res = re.search('(?P\d{3})(?P\d{3})(?P\d{8})(?P\d{4})',s)
print(res.groupdict())

('230', '701', '20010428', '0028')
{'province': '230', 'city': '701', 'born_date': '20010428', 'seq': '0028'}
---

总结

到此这篇关于Python中re模块常用方法的文章就介绍到这了,更多相关Python中re模块方法内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持！

推荐阅读

程序员
使用Javascript(Croppie)裁剪图像

如何解决《使用Javascript(Croppie)裁剪图像》经验，为你挑选了1个好方法。 ... [详细]
程序员
CSS链接边框样式不起作用:访问过

如何解决《CSS链接边框样式不起作用:访问过》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何编写/引用PHP可调用函数易于管理我的IDE

如何解决《如何编写/引用PHP可调用函数易于管理我的IDE》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Symfony 2.8生成表单会抛出Twig_Error_Runtime

如何解决《使用Symfony2.8生成表单会抛出Twig_Error_Runtime》经验，为你挑选了2个好方法。 ... [详细]
程序员
我应该用setter创建一个构造函数

如何解决《我应该用setter创建一个构造函数》经验，为你挑选了2个好方法。 ... [详细]
程序员
在Tcl中使用名称模式的tar不起作用

如何解决《在Tcl中使用名称模式的tar不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
问:保存Qt-creator应用程序的SQLite数据库的最佳"路径"在哪里？

如何解决《问:保存Qt-creator应用程序的SQLite数据库的最佳"路径"在哪里？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Nullable初始化为null - 理解源代码

如何解决《Nullable初始化为null-理解源代码》经验，为你挑选了1个好方法。 ... [详细]
程序员
什么是CocoaPods"(未使用)"

如何解决《什么是CocoaPods"(未使用)"》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在BitBucket上创建文件夹？

如何解决《如何在BitBucket上创建文件夹？》经验，为你挑选了2个好方法。 ... [详细]
程序员
限制Log4J中的消息长度

如何解决《限制Log4J中的消息长度》经验，为你挑选了1个好方法。 ... [详细]
程序员
工作日的对象如星期日,星期一,......,星期六

如何解决《工作日的对象如星期日,星期一,,星期六》经验，为你挑选了1个好方法。 ... [详细]
程序员
在javascript中具有特定形状的词云

如何解决《在javascript中具有特定形状的词云》经验，为你挑选了0个好方法。 ... [详细]
程序员
禁用Flask中的缓存

如何解决《禁用Flask中的缓存》经验，为你挑选了2个好方法。 ... [详细]
程序员
C++如何从std :: string中删除\ 0 char

如何解决《C++如何从std::string中删除\0char》经验，为你挑选了1个好方法。 ... [详细]
程序员
错误R10(引导超时) - > Web进程在启动后60秒内无法绑定到$ PORT - Heroku

如何解决《错误R10(引导超时)->Web进程在启动后60秒内无法绑定到$PORT-Heroku》经验，为你挑选了2个好方法。 ... [详细]
程序员
从数组列表中删除元素并在java中更新选项卡大小

如何解决《从数组列表中删除元素并在java中更新选项卡大小》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用int而不是size_t索引来访问向量元素的性能降低了吗？

如何解决《使用int而不是size_t索引来访问向量元素的性能降低了吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Angular Material Design创建黑白主题？

如何解决《如何使用AngularMaterialDesign创建黑白主题？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Pycharm警告:必须实现所有抽象方法

如何解决《Pycharm警告:必须实现所有抽象方法》经验，为你挑选了1个好方法。 ... [详细]

女女的家_747

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章