我已经阅读了有关站点地图格式的Google文档,但有一件事他们不清楚:搜索引擎是否会自动查找并找到/sitemap_index.xml,或者你必须通过/robots.txt或者主要来告诉他们/sitemap.xml?你有没有 /sitemap.xml,仍然可以依赖/sitemap_index.xml找到并收获?
在robots.txt中,您可以使用相同的语法指向站点地图或站点地图索引文件:
Sitemap:
搜索引擎会通过查看文件知道它是什么类型.
值得注意的是,sitemap.xml和sitemap_index.xml只是建议的文件名,您可以使用任何您想要的名称.与robots.txt的已知位置不同,搜索引擎不会检查任何位置,例如sitemap.xml或sitemap_index.xml,而不会告诉它该位置有什么内容.
最好的方法是在robots.txt中指向您的站点地图:
Sitemap:
在www.sitemaps.org上有一个很好的解释
我已经阅读了很多关于这个问题的讨论,没有人知道Google如何处理这个问题.
有人说默认情况下抓取工具会查找这些文件:
/sitemap.xml
/sitemap.xml.gz
/sitemap.gz
如果您阅读Google关于xml-sitemaps的文章,他们经常谈论这些文件名,这是巧合吗?
也许这是真的,但是,我建议遵循Google指南并使用robots.txt +通过Google网站站长工具提交站点地图.
我认为网站管理员工具被低估了,它非常值得,您可以直接从Google接收信息,这些信息可以帮助您改进网站.
如果您不希望每次登录网站管理员工具以在更新时重新提交站点地图,您可以ping Google以告知他们有关更改的信息.
ping Google的链接:www.google.com/webmasters/tools/ping?sitemap = sitemap_url
有关Google支持的更多信息.