17赞

在python中使用正则表达式的问题

作者：手机用户2502852037 | 2023-09-05 13:29

如何解决《在python中使用正则表达式的问题》经验，为你挑选了1个好方法。

好吧,所以我正在使用正则表达式来搜索站点中的所有标题信息.

我编译了正则表达式:

regex = re.compile(r'''
    \s?
    ()?\s?
    [A-Za-z0-9.,:'"=/?;\s]*\s?
    [A-Za-z0-9.,:'"=/?;\s]?
''',  re.X)

当我在python reg ex中运行它时.测试员,它非常好用.

样本数据:


    Dog 
    Cat 
    Fancy 
    Tall cup of lemons
    Dog thing

现在,在REDemo中,它运行得非常好.

但是,当我把它放在我的python代码中时,它只会打印出来

这是我的python代码,我不确定我是做错了什么还是翻译时丢失了什么.我感谢您的帮助.

stories=[]
response = urllib2.urlopen('http://apricotclub.org/duh.html')
html = response.read().lower()
p = re.compile('\\s?()?\\s?[A-Za-z0-9.,:\'\"=/?;\\s]*\\s?[A-Za-z0-9.,:\'\"=/?;\\s]?')
stories=re.findall(p, html)
for i in stories:
    if len(i) >= 5:
        print i

我还应该注意,当我()?从正则表达式中取出它时,它适用于非链接行.

1> Jerub..：

在过去的几天里,这个问题已经以多种形式提出,所以我将非常清楚地说出这个问题.

问:如何使用正则表达式解析HTML？ A:请不要.

使用BeautifulSoup,html5lib或lxml.html.请.

推荐阅读

程序员
使用Angularjs中的pdfMake从HTML生成PDF

如何解决《使用Angularjs中的pdfMake从HTML生成PDF》经验，为你挑选了2个好方法。 ... [详细]
程序员
python:试图理解"子进程"O/S调用

如何解决《python:试图理解"子进程"O/S调用》经验，为你挑选了1个好方法。 ... [详细]
程序员
FullCalendar在周时间线视图中隐藏时间

如何解决《FullCalendar在周时间线视图中隐藏时间》经验，为你挑选了1个好方法。 ... [详细]
程序员
超薄3黑色错误

如何解决《超薄3黑色错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
c#到vb.net转换 - Action(Of T,string)作为元组项

如何解决《c#到vb.net转换-Action(OfT,string)作为元组项》经验，为你挑选了1个好方法。 ... [详细]
程序员
将json格式的Chrome书签文件转换为html

如何解决《将json格式的Chrome书签文件转换为html》经验，为你挑选了0个好方法。 ... [详细]
程序员
TensorFlow random_shuffle_queue已关闭且元素不足

如何解决《TensorFlowrandom_shuffle_queue已关闭且元素不足》经验，为你挑选了2个好方法。 ... [详细]
程序员
从postgres日期提取周数

如何解决《从postgres日期提取周数》经验，为你挑选了1个好方法。 ... [详细]
程序员
嵌套列表中的min/max函数如何工作？

如何解决《嵌套列表中的min/max函数如何工作？》经验，为你挑选了2个好方法。 ... [详细]
程序员
NSNotification不会调用@selector方法

如何解决《NSNotification不会调用@selector方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
以编程方式在代码隐藏中添加Visual State Setter

如何解决《以编程方式在代码隐藏中添加VisualStateSetter》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否有理由使用$ scope.$ apply而不是$ applyAsync？

如何解决《是否有理由使用$scope.$apply而不是$applyAsync？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Emscripten malloc和JS和C++之间的免费版

如何解决《Emscriptenmalloc和JS和C++之间的免费版》经验，为你挑选了1个好方法。 ... [详细]
程序员
Does AVAudioUnitEQ actually work on iOS?

如何解决《DoesAVAudioUnitEQactuallyworkoniOS?》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Smalltalk中访问类变量

如何解决《如何在Smalltalk中访问类变量》经验，为你挑选了1个好方法。 ... [详细]
程序员
添加到SourceBuffer的MediaSource在第一次之后不起作用

如何解决《添加到SourceBuffer的MediaSource在第一次之后不起作用》经验，为你挑选了0个好方法。 ... [详细]
程序员
无法解析方法setText(java.lang.String)

如何解决《无法解析方法setText(java.lang.String)》经验，为你挑选了1个好方法。 ... [详细]
程序员
从moment.js对象中删除时区

如何解决《从moment.js对象中删除时区》经验，为你挑选了3个好方法。 ... [详细]
程序员
如果不首先删除侦听器,重新分配数据源是否会导致内存泄漏？

如何解决《如果不首先删除侦听器,重新分配数据源是否会导致内存泄漏？》经验，为你挑选了0个好方法。 ... [详细]
程序员
numpy的标准偏差

如何解决《numpy的标准偏差》经验，为你挑选了1个好方法。 ... [详细]

手机用户2502852037

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章