这些天我遇到了几个谷歌搜索结果,其中包含的网站链接与我的搜索词完全匹配.网站如何动态更改其内容,或者他们如何欺骗谷歌为我的关键字索引其网页.我读过关于内容农场的内容,但这似乎不是一个正确的答案.有人能让我知道这种技术叫什么吗?我会尝试更多地了解它.
我的理解是,使用Google或任何其他索引引擎的唯一方法是让机器人实际抓取您的网站并生成结果.显然,Google可以抓取动态网站:
http://googlewebmastercentral.blogspot.com/2008/09/dynamic-urls-vs-static-urls.html
然而,我发现这是一个关于你的问题的进化而不是革命性的变化.
我认为在幕后发生的是这些事情的组合:
内容索引
准备好的指数
用户提交的内容
推荐人搜索更新
我将尝试在一个销售音乐的虚构网站上解释每一个 - 你有很多例子来比较经验.它当然会在example.com域上.
内容索引显然,作为一个想要提供某些东西的网站,你实际上有一些内容.通常,您以某种方式对此内容进行分组.我们假设我们的音乐网站可以按不同类别对内容进行分组:
作者
音乐流派
用户提交
内容分级
这些中的每一个都可以抽象地表示为标签.例如,我们的网站可以选择使用example.com/tags/eagles来表示Eagles,或者使用example.com/tags/rock来表示所有摇滚乐队.谷歌可以将这些索引编入索引,因此任何潜在的搜索都可以生成我们网站的链接.
准备好的指数准备好的索引类似,但是是通用索引而不是真实内容.这可以通过多种方式准备,例如:
拿一本字典并添加所有单词
从Web抓取几百万个页面(可能使用搜索引擎提供的链接!)并从那里获得经常重复的短语
从免费论坛获取内容
使用维基百科
从免费提供的书籍中获取文本,例如来自Project Gutenberg的书籍
例如,我们的网站将以任何方式从与音乐相关的文本中获取任何单词,并使标签与之前的标签类似.例如,只需抓取维基百科上的Rock音乐页面,就可以获得很多标签.
用户提交的内容这通常是在您的网站启动并运行之后.假设我们在我们的网站上放了一个搜索框,然后用户进来输入"摇滚音乐".Doh,我们已经知道了,所以搜索没有什么好处.但是,假设我们遍历 Web服务器日志并查看langeleik的一些搜索.现在,这将是我们之前可能没有索引的东西.很酷,只是在我们的网站上生成另一个标签.
显然,谷歌并不知道 - 所以我们在我们的站点地图中创建了一个条目,并且它是在另一个Googlebot抓取之后.当用户在Google上搜索"langeleik"时,其中一个链接可能是指向example.com/tags/langeleik的链接.
还有其他可能更有价值的用户输入形式 - 评论,论坛帖子等.因此,除了托管论坛之外,还有许多通用论坛没有其他目的.这是一个很棒的数据源,您可以免费获得新内容.
最后,所有这些都应该转到您的站点站点地图.您可以拥有巨大的站点地图,请看:
https://webmasters.stackexchange.com/questions/26964/google-sitemap-for-dynamic-url-structure
介绍人
最后一件事是推荐.在您的网站启动并运行后,您的某些Google搜索将直接发送给您.那时你可以利用HTTP Referer标题(是的,这是拼写错误 - 在维基百科上查看),请看:
是否可以从Google搜索中捕获搜索字词?
请注意,Google搜索是:
残缺
模糊
因此,您可以在上面搜索"langeleik",但有些链接的标题为"Langeleik and Harpe".没有什么不寻常的,但请注意反过来 - 如果你搜索"langeleik和harpe",它不仅会找到包含这两个术语的所有页面,而且还会找到包含这两个术语的页面.如果我们知道harpe,但不是langeleik,并且有人搜索"langeleik和harpe",我们将通过HTTP Referer标题获得如下的q
参数q=langeleik+harpe
.很酷 - 如果我们想要的话,只需添加另一个词即可添加到我们的站点地图中.
至于模糊性,请注意当你搜索"老鹰"时,你可以获得从鸟类到NFL球队到摇滚乐队的所有东西.因此,即使我们是一个音乐网站,我们也可以扩展我们的视野(如果需要)到最新的NFL新闻 - 一些完全不相关的东西,对某些网站非常有用.
结论 - 这是一种幻觉我认为所有这些都是非常丰富的站点地图构建源的组合.您可以使用上述技术轻松生成数百万个唯一标记.因此,您输入的"任何内容"都可以在example.com/tags上找到.
但是,你必须注意到这只是一种幻觉.例如,如果您搜索"ertfghedctgb"(在常规QWERTY键盘上轻松输入 - ert + fgh + edc + tgb),您很可能无法从Google获得任何内容(我目前不知道).对于任何人来说,将它放在他们的站点地图中是不常见的(或者不足以让搜索引擎将其编入索引).