当前位置:  开发笔记 > 编程语言 > 正文

Python正则表达式

如何解决《Python正则表达式》经验,为你挑选了1个好方法。

我有一个像这样的字符串,我需要解析成2D数组:

 str = "'813702104[813702106]','813702141[813702143]','813702172[813702174]'"

数组等于:

arr[0][0] = 813702104
arr[0][1] = 813702106
arr[1][0] = 813702141
arr[1][1] = 813702143
#... etc ...

我试图通过REGEX做到这一点.上面的字符串隐藏在HTML页面中,但我可以肯定它是页面上该模式中唯一的字符串.我不确定这是不是最好的方式,但这就是我现在所拥有的一切.

imgRegex = re.compile(r"(?:'(?P
\d+)\[(?P\d+)\]',?)+")

如果我跑,imgRegex.match(str).groups()我只得到一个结果(第一对).我如何获得多个匹配或第二个匹配对象(如果存在这样的东西!)?

注意:与它的外观相反,这不是功课

注意部分deux:真正的字符串嵌入在一个大的 HTML文件中,因此拆分似乎不是一个选项.

我仍然在为此得到答案,所以我想我更好地编辑它以显示我为什么不改变已接受的答案.拆分虽然在此测试字符串上更有效,但不会从整个HTML文件中提取部件.我可以结合正则表达式和分裂,但这看起来很傻.

如果您确实有更好的方法从HTML加载中找到这些部分(该模式\d+\[\d+\]在源代码中对此字符串是唯一的),我将很乐意更改已接受的答案.其他任何东西都是学术性的



1> stesch..:

我会尝试findallfinditer代替match.

由Oli编辑:是的,findall工作出色,但我必须简化正则表达式:

r"'(?P
\d+)\[(?P\d+)\]',?"

推荐阅读
云聪京初瑞子_617
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有