很确定这个问题对于大多数Web 2.0支持者来说都是亵渎神灵,但我确实认为有时候你可能不希望你的网站碎片很容易被扯到别人的网络聚合器中.至少足够他们如果他们真的想要的话,他们需要被手工制作.
我的想法是创建一个脚本,按照它们在各自段落中正常出现的顺序,按绝对坐标定位文本节点,然后在DOM中以随机,混乱的顺序存储这些文本节点.当然,让这样的系统正常工作(正确的文本换行,对齐,样式等)似乎几乎类似于从头开始编写我自己的文档渲染器.
我也在考虑将它与类似CAPTCHA的东西结合起来,以微妙的方式混淆文本,以阻止屏幕抓取器,它可以简单地查看快照,识别字母或诸如此类的东西.但这可能是在过度思考它.
嗯.有没有人设计过任何好方法来做这样的事情?
考虑到刮刀无法读取的所有内容,搜索引擎也无法读取.话虽如此,您可以在页面加载后通过Javascript将内容注入到您的文档中.