PHP中严格的HTML验证和过滤

作者：贾志军 | 2023-09-04 09:53

如何解决《PHP中严格的HTML验证和过滤》经验，为你挑选了2个好方法。

我正在寻找对用户提交的HTML执行严格(白名单)验证/过滤的最佳实践.

主要目的是过滤掉可能通过网络表单输入的XSS和类似的恶意软件.次要目的是限制非技术用户输入的HTML内容的破坏,例如通过具有HTML视图的WYSIWYG编辑器.

我正在考虑使用HTML Purifier,或者通过使用HTML DOM解析器来完成HTML(脏) - > DOM(脏) - >过滤器 - > DOM(干净) - > HTML(干净)等过程.

您能用这些或任何更简单的策略描述成功吗？有什么陷阱需要注意？

1> Kornel..：

我已经测试了我在HTML Purifier上所知道的所有漏洞并且它做得非常好.它不仅可以过滤HTML,还可以过滤CSS和URL.

一旦你将元素和属性缩小到无辜的元素和属性,陷阱就是属性内容 - javascript:伪URL(IE允许协议名称中的制表符 - java script:仍然有效)和触发JS的CSS属性.

解析URL可能很棘手,例如这些是有效的:http://spoof.com:xxx@evil.com或//evil.com.国际化域(IDN)可以用两种方式编写 - Unicode和punycode.

使用HTML Purifier - 它已经完成了大部分工作.如果您只想修复损坏的HTML,请使用HTML Tidy(它可用作PHP扩展).

事实证明,它在2008年远非安全,这些漏洞在2011年被发现:http://secunia.com/advisories/43907/,2010:http://secunia.com/advisories/39613/教训:务必始终更新过滤器安装.

2> Ross..：

用户提交的HTML并不总是有效,或者确实完整.浏览器将解释各种无效的HTML,您应该确保能够捕获它.

还要注意有效的外观:

和

click

推荐阅读

程序员
angular2组件过渡动画

如何解决《angular2组件过渡动画》经验，为你挑选了0个好方法。 ... [详细]
程序员
在SceneKit中背面剔除

如何解决《在SceneKit中背面剔除》经验，为你挑选了1个好方法。 ... [详细]
程序员
将位转换为Int8 Haskell

如何解决《将位转换为Int8Haskell》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Linq组合两个c#对象

如何解决《如何使用Linq组合两个c#对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何通过使用对象的xpath检查对象在网页中是否可见？

如何解决《如何通过使用对象的xpath检查对象在网页中是否可见？》经验，为你挑选了0个好方法。 ... [详细]
程序员
用于人类比较的列表排序算法

如何解决《用于人类比较的列表排序算法》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何使用JavaScript创建等距拖放网格？

如何解决《如何使用JavaScript创建等距拖放网格？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何处理Redux + Microservices的相互通信

如何解决《如何处理Redux+Microservices的相互通信》经验，为你挑选了0个好方法。 ... [详细]
程序员
R:基于先前非NA行中的值分配先前的非NA值"n"次

如何解决《R:基于先前非NA行中的值分配先前的非NA值"n"次》经验，为你挑选了1个好方法。 ... [详细]
程序员
我的C程序无法检测乘法符号

如何解决《我的C程序无法检测乘法符号》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么reference_wrapper对内置类型的行为有所不同？

如何解决《为什么reference_wrapper对内置类型的行为有所不同？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Sublime-Text强制不加载以前的文件

如何解决《Sublime-Text强制不加载以前的文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从BeautifulSoup中的表格td获取价值？

如何解决《如何从BeautifulSoup中的表格td获取价值？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Kotlin Foo :: class.java"未解决的参考:Java"错误

如何解决《KotlinFoo::class.java"未解决的参考:Java"错误》经验，为你挑选了3个好方法。 ... [详细]
程序员
ES6 Class超出最大调用堆栈大小

如何解决《ES6Class超出最大调用堆栈大小》经验，为你挑选了1个好方法。 ... [详细]
程序员
鉴于选择,混合模式程序集与单独的互操作DLL的优缺点是什么？

如何解决《鉴于选择,混合模式程序集与单独的互操作DLL的优缺点是什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从S3获取GetObjectResponse的字节？

如何解决《如何从S3获取GetObjectResponse的字节？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何向UILocalNotification警报添加操作按钮/操作？

如何解决《如何向UILocalNotification警报添加操作按钮/操作？》经验，为你挑选了1个好方法。 ... [详细]
程序员
猫头鹰旋转木马的图像大小不同？

如何解决《猫头鹰旋转木马的图像大小不同？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在数组/范围javascript中查找所有缺少的元素

如何解决《在数组/范围javascript中查找所有缺少的元素》经验，为你挑选了1个好方法。 ... [详细]

贾志军

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章