我想将我的网站国际化,以便可以使用多种语言访问.将自动在请求数据中检测语言设置,并且可以在用户的设置中覆盖/存储在会话中.
我的问题是关于如何根据页面的URL显示基于语言的同一页面的各种版本.假设我们只是查看索引页面http://www.example.com/
,默认为英文.现在,如果讲法语的人加载索引页面,我应该只保留URL http://www.example.com/
,还是应该将其重定向到http://www.example.com/fr/
?
我试图弄清楚这在SEO方面有什么好处或后果.我不希望该网站的法语版本显示在google.com上,如果它阻止相同页面的英文版本显示在那里,但我希望它显示在google.fr中.
当您开始将网站本地化为多种语言时,从搜索的角度来看,有很多事情需要考虑.一般来说,您需要注意并确保您不会因用户的意图过于聪明.自动检测语言和将它们存储在cookie中的事情在某些情况下可能会很好,但是如果它们成为本地化正常工作的要求,那么搜索引擎(以及真实的人)也会遇到一些问题.
对于搜索引擎,您需要确保他们可以查找和访问所有不同语言的所有内容,而无需POST请求(无下拉表单),javascript,flash或cookie.因为搜索引擎通常不使用这些技术.
事实证明,这通常对真实客户也有好处.如果你依赖于浏览器设置或ip检测,那么一些真正的客户要么借用朋友的电脑,要么在国外旅行,可能会陷入错误的语言(微软Bing实际上已经有这个问题了一段时间).
这是一些要记住的最佳实践
每种语言都应包含在信息体系结构的某个根目录下.最佳选择是为您的网站获取每个特定区域的TLD(mysite.fr).虽然这有时是不可行的,所以第二个选择是使用一个子域(fr.mysite.com),和第三个选项是使用一个子文件夹(mysite.com/fr).这使得我们最简单地查看一组页面并最好地确定语言/区域.不要把它作为参数(mysite.com/products/iphone/lang=en®ion=us),这是我们检测的最难的情况.
我们有语言分类器(人工智能网),试图确定页面描述的语言/区域.因此,请确保您的网页上有足够的线索来说明语言是什么.例如,如果页面是法语,请确保元描述标签也是法语,标签,标题也是如此,并确保您在法语中有一对固定的句子.许多网站会混合使用语言,并且页面上只有很少的实际法语
电话号码,邮寄地址和地理位置名称也是搜索引擎识别页面区域/语言的重要线索.使用这些(并确保它们是页面上的实际文本,而不是图像)
使用Google网站站长工具指定网页的语言和区域.创建一个帐户,验证您的网站,然后您可以指定您网站的不同部分所针对的区域和语言.
错误信息 - lang属性或您可能听说过的任何语言标签目前都没有被任何搜索引擎使用.当我们(微软Bing)去年对这些进行分析时,人们使用的最常见的"标准"lang标签仅出现在网络上0.000125%的页面上 - 这还不够有用!
凡妮莎福克斯(她打造谷歌的网站管理员中心,并建立了站点地图协议)最近写了一个特别好的一篇关于谷歌如何思考关于本地化和这意味着什么对网站架构.我建议在这里检查出来:http://www.ninebyblue.com/blog/making-geotargeted-content-findable-for-the-right-searchers/