当前位置:  开发笔记 > 后端 > 正文

Ajax Crawling:旧方式与新方式(#!)

如何解决《AjaxCrawling:旧方式与新方式(#!)》经验,为你挑选了1个好方法。

我们的想法是使AJAX应用程序可以抓取.根据HTTP规范,无论片段标识符(哈希标记之后的部分)如何,URL都引用相同的文档.因此,搜索引擎会忽略片段标识符:如果您有链接www.example.com/page#content,则抓取工具只会请求www.example.com/page.

使用新方案时,当您使用#!表示法时,爬虫会知道链接引用其他内容.抓取工具将URL转换为另一个(丑陋的)URL并从您的Web服务器请求它.Web服务器应该使用代表AJAX内容的静态HTML进行响应.

编辑关于原始问题:如果您已经有静态页面的常规链接,那么这个方案对您没有帮助.



1> Amnon..:

我们的想法是使AJAX应用程序可以抓取.根据HTTP规范,无论片段标识符(哈希标记之后的部分)如何,URL都引用相同的文档.因此,搜索引擎会忽略片段标识符:如果您有链接www.example.com/page#content,则抓取工具只会请求www.example.com/page.

使用新方案时,当您使用#!表示法时,爬虫会知道链接引用其他内容.抓取工具将URL转换为另一个(丑陋的)URL并从您的Web服务器请求它.Web服务器应该使用代表AJAX内容的静态HTML进行响应.

编辑关于原始问题:如果您已经有静态页面的常规链接,那么这个方案对您没有帮助.

推荐阅读
赛亚兔备_393
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有