当前位置:  开发笔记 > 编程语言 > 正文

什么是阻止屏幕抓取工具从我的网站上抓取特定内容的好方法?

如何解决《什么是阻止屏幕抓取工具从我的网站上抓取特定内容的好方法?》经验,为你挑选了1个好方法。

很确定这个问题对于大多数Web 2.0支持者来说都是亵渎神灵,但我确实认为有时候你可能希望你的网站碎片很容易被扯到别人的网络聚合器中.至少足够他们如果他们真的想要的话,他们需要被手工制作.

我的想法是创建一个脚本,按照它们在各自段落中正常出现的顺序,按绝对坐标定位文本节点,然后在DOM中以随机,混乱的顺序存储这些文本节点.当然,让这样的系统正常工作(正确的文本换行,对齐,样式等)似乎几乎类似于从头开始编写我自己的文档渲染器.

我也在考虑将它与类似CAPTCHA的东西结合起来,以微妙的方式混淆文本,以阻止屏幕抓取器,它可以简单地查看快照,识别字母或诸如此类的东西.但这可能是在过度思考它.

嗯.有没有人设计过任何好方法来做这样的事情?



1> Eran Galperi..:

考虑到刮刀无法读取的所有内容,搜索引擎也无法读取.话虽如此,您可以在页面加载后通过Javascript将内容注入到您的文档中.

推荐阅读
oDavid_仔o_880
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有