13赞

删除python中的所有html？

作者：sx-March23 | 2023-06-26 21:38

如何解决《删除python中的所有html？》经验，为你挑选了2个好方法。

有没有办法使用lxml.html删除/转义html标签而不是有一些xss问题的beautifulsoup？我尝试使用清洁,但我想删除所有的HTML.

1> 小智..：

我相信,这段代码可以帮助你:

from lxml.html.clean import Cleaner

html_text = "HelloText"
cleaner = Cleaner(allow_tags=[''], remove_unknown_tags=False)
cleaned_text = cleaner.clean_html(html_text)

2> Steven..：

尝试.text_content()使用元素上的方法,最好在使用后lxml.html.clean删除不需要的内容(脚本标记等).例如:

from lxml import html
from lxml.html.clean import clean_html

tree = html.parse('http://www.example.com')
tree = clean_html(tree)

text = tree.getroot().text_content()

推荐阅读

程序员
如何使用gawk多次通过？

如何解决《如何使用gawk多次通过？》经验，为你挑选了1个好方法。 ... [详细]
程序员
这些ES6导入方法有什么区别？

如何解决《这些ES6导入方法有什么区别？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Ember Fastboot Jquery

如何解决《EmberFastbootJquery》经验，为你挑选了1个好方法。 ... [详细]
程序员
ScalaMock:如何模拟/存根方法每次调用返回不同的值？

如何解决《ScalaMock:如何模拟/存根方法每次调用返回不同的值？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在android中分享APK通过分享选项

如何解决《在android中分享APK通过分享选项》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么许多例子在Matplotlib/pyplot/python中使用"fig,ax = plt.subplots()"

如何解决《为什么许多例子在Matplotlib/pyplot/python中使用"fig,ax=plt.subplots()"》经验，为你挑选了3个好方法。 ... [详细]
程序员
非法动态参考

如何解决《非法动态参考》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用管道命令忽略Bash脚本中的HUP信号

如何解决《使用管道命令忽略Bash脚本中的HUP信号》经验，为你挑选了1个好方法。 ... [详细]
程序员
嵌套 - 被抄送的项目 - 范围澄清？

如何解决《嵌套-被抄送的项目-范围澄清？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Miminum对Google tensorflow图像分类器的要求

如何解决《Miminum对Googletensorflow图像分类器的要求》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何停止Java或Hibernate缓存

如何解决《如何停止Java或Hibernate缓存》经验，为你挑选了1个好方法。 ... [详细]
程序员
Angular UI Router单独的文件

如何解决《AngularUIRouter单独的文件》经验，为你挑选了0个好方法。 ... [详细]
程序员
从pandas数据框中删除带有空列表的行

如何解决《从pandas数据框中删除带有空列表的行》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在Angular2中为Http获取MockBackend进行单元测试？

如何解决《如何在Angular2中为Http获取MockBackend进行单元测试？》经验，为你挑选了0个好方法。 ... [详细]
程序员
@SqlResultSetMapping列:具有子实体的实体

如何解决《@SqlResultSetMapping列:具有子实体的实体》经验，为你挑选了0个好方法。 ... [详细]
程序员
Matlab R2015b中`toc`功能可能出现的错误

如何解决《MatlabR2015b中`toc`功能可能出现的错误》经验，为你挑选了0个好方法。 ... [详细]
程序员
从Jekyll的集合中获取特定项目

如何解决《从Jekyll的集合中获取特定项目》经验，为你挑选了1个好方法。 ... [详细]
程序员
宏未打开时自动运行

如何解决《宏未打开时自动运行》经验，为你挑选了1个好方法。 ... [详细]
程序员
我如何验证REST API调用是否正在使用Paw压缩响应？

如何解决《我如何验证RESTAPI调用是否正在使用Paw压缩响应？》经验，为你挑选了1个好方法。 ... [详细]
程序员
代码为5号码摘要

如何解决《代码为5号码摘要》经验，为你挑选了1个好方法。 ... [详细]

sx-March23

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章