当前位置:  开发笔记 > 后端 > 正文

抓取器解码html实体?

如何解决《抓取器解码html实体?》经验,为你挑选了1个好方法。
如何解决《抓取器解码html实体?》经验,为你挑选了1个好方法。

我想知道爬虫和机器人是否可以解码html实体,例如在我的html中我有类似的东西:

salariés

他们这样读过吗?或类似的东西:

salariés

哪个选项更适合SEO?



1> Pekka suppor..:

我会说你可以放心地假设HTML实体被正确解码了.它们是有效的HTML,而不解码它们的爬虫最终会有大量破碎的内容.

推荐阅读
地之南_816
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有