12赞

Python正则表达式提取html段落

作者：黄晓敏3023 | 2023-09-09 03:47

如何解决《Python正则表达式提取html段落》经验，为你挑选了1个好方法。

我正在尝试使用以下代码行从HTML中提取parapgraph:

paragraphs = re.match(r'.{1,}', html)

但即使我知道有,也没有返回.为什么？

1> alecxe..：

为什么不使用HTML解析器来解析HTML.示例使用BeautifulSoup:

>>> from bs4 import BeautifulSoup
>>> 
>>> data = """
...     
...         text1
...         
...         text2
...     
... """
>>> soup = BeautifulSoup(data, "html.parser")
>>> [p.get_text() for p in soup.find_all("p", text=True)]
[u'text1', u'text2']

请注意,这text=True有助于过滤掉空段落.

推荐阅读

程序员
php:// input和php:// stdin之间有什么区别？

如何解决《php://input和php://stdin之间有什么区别？》经验，为你挑选了1个好方法。 ... [详细]
程序员
概念和声明顺序

如何解决《概念和声明顺序》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何使用v7工具栏上的工具栏主页按钮提供向上导航

如何解决《如何使用v7工具栏上的工具栏主页按钮提供向上导航》经验，为你挑选了2个好方法。 ... [详细]
程序员
当Redux状态更改为低于第一级时,React不会更新

如何解决《当Redux状态更改为低于第一级时,React不会更新》经验，为你挑选了0个好方法。 ... [详细]
程序员
在片段中实现RecyclerView

如何解决《在片段中实现RecyclerView》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android Google Auth登录handleSignInResult:false

如何解决《AndroidGoogleAuth登录handleSignInResult:false》经验，为你挑选了0个好方法。 ... [详细]
程序员
在Swift中将CGFloat转换为NSNumber

如何解决《在Swift中将CGFloat转换为NSNumber》经验，为你挑选了3个好方法。 ... [详细]
程序员
在模块内实例化类时,超出了最大调用堆栈

如何解决《在模块内实例化类时,超出了最大调用堆栈》经验，为你挑选了1个好方法。 ... [详细]
程序员
初学者安装模块最简单的方法是什么？

如何解决《初学者安装模块最简单的方法是什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
刚刚通过NuGet更新了ImageResizer,无法运行app,因为它无法找到BundleAttribute

如何解决《刚刚通过NuGet更新了ImageResizer,无法运行app,因为它无法找到BundleAttribute》经验，为你挑选了1个好方法。 ... [详细]
程序员
python将列表的所有元素向右移动一个

如何解决《python将列表的所有元素向右移动一个》经验，为你挑选了2个好方法。 ... [详细]
程序员
C++,无法打开源文件"ifstream"Visual Studio

如何解决《C++,无法打开源文件"ifstream"VisualStudio》经验，为你挑选了1个好方法。 ... [详细]
程序员
在C＃单元测试中使用64位本机.DLL

如何解决《在C＃单元测试中使用64位本机.DLL》经验，为你挑选了1个好方法。 ... [详细]
程序员
清除std :: vector数组的最佳方法是什么？

如何解决《清除std::vector数组的最佳方法是什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java Nashorn脚本模式：如何写入文件

如何解决《JavaNashorn脚本模式：如何写入文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从大师分支以来git diff所有变化？

如何解决《如何从大师分支以来gitdiff所有变化？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在Swift中以编程方式创建"Back"UIBarButton项？

如何解决《如何在Swift中以编程方式创建"Back"UIBarButton项？》经验，为你挑选了2个好方法。 ... [详细]
程序员
python pandas-应用具有两个列参数的函数

如何解决《pythonpandas-应用具有两个列参数的函数》经验，为你挑选了2个好方法。 ... [详细]
程序员
位置:固定,底部:0似乎不适用于离子应用程序

如何解决《位置:固定,底部:0似乎不适用于离子应用程序》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何告诉scikit-learn给出F-1 /精度/召回分数的标签（二进制分类）？

如何解决《如何告诉scikit-learn给出F-1/精度/召回分数的标签（二进制分类）？》经验，为你挑选了1个好方法。 ... [详细]

黄晓敏3023

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章