我想知道爬虫和机器人是否可以解码html实体,例如在我的html中我有类似的东西:
salariés
他们这样读过吗?或类似的东西:
哪个选项更适合SEO?
我会说你可以放心地假设HTML实体被正确解码了.它们是有效的HTML,而不解码它们的爬虫最终会有大量破碎的内容.