电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

Python正则式学习笔记VIP专享VIP免费

Python正则式学习笔记_第1页
Python正则式学习笔记_第2页
Python正则式学习笔记_第3页
1. Py thon 正则式的基本用法 1.1 基本规则 1.2 重复 1.2.1 最小匹配与精确匹配 1.3 前向界定与后向界定 1.4 组的基本知识 2. re 模块的基本函数 2.1 使用compile 加速 2.2 match 和 search 2.3 finditer 2.4 字符串的修改与替换 3. 更深入的了解 re 的组与对象 3.1 编译后的Pattern 对象 3.2 组与 Match 对象 3.2.1 组的名字与序号 3.2.2 Match 对象的方法 4. 更多的资料 初学Py thon,对Py thon 的文字处理能力有很深的印象,除了str 对象自带的一些方法外,就是正则表达式这个强大的模块了。但是对于初学者来说,要用好这个功能还是有点难度,我花了好长时间才摸出了点门道。由于我记性不好,很容易就忘事,所以还是写下来比较好一些,同时也可以加深印象,整理思路。 由于我是初学,所以肯定会有些错误,还望高手不吝赐教,指出我的错误。 1 Python 正则式的基本用法 Py thon 的正则表达式的模块是 „re‟ ,它的基本语法规则就是指定一个字符序列,比如你要在一个字符串 s=‟ 123abc456‟ 中查找字符串 ‟ abc‟ ,只要这样写: >>> import re >>> s='123abc456eabc789' >>> re.findall(r‟ abc‟ ,s) 结果就是: ['abc', 'abc'] 这里用到的函数 ” findall(rule , target [,flag] )” 是个比较直观的函数,就是在目标字符串中查找符合规则的字符串。第一个参数是规则,第二个参数是目标字符串,后面还可以跟一个规则选项(选项功能将在 compile 函数的说明中详细说明)。返回结果结果是一个列表,中间存放的是符合规则的字符串。如果没有符合规则的字符串被找到,就返回一个空列表。 为什么要用 r’ ..‘ 字符串(raw 字符串)? 由于正则式的规则也是由一个字符串定义的,而在正则式中大量使用转义字符’ /’ ,如果不用 raw 字符串,则在需要写一个’ /’ 的地方,你必须得写成’ //’ ,那么在要从目标字符串中匹配一个’ /’ 的时候,你就得写上 4 个’ /’ 成为’ ////’ !这当然很麻烦,也不直观,所以一般都使用 r’ ’来定义规则字符串。当然,某些情况下,可能不用 raw 字符串比较好。 以上是个最简单的例子。当然实际中这么简单的用法几乎没有意义。为了实现复杂的规则查找,re 规定了若干语法规则。它们分为这么几类: 功能字符 : „.‟ „*‟ „+‟ „|‟ „?‟ „^‟ „$‟ „/‟ 等,它们...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部