识别敌对网络爬虫

作者：乐韵答题 | 2023-08-25 16:49

如何解决《识别敌对网络爬虫》经验，为你挑选了1个好方法。

我想知道是否有任何技术可以识别收集非法使用信息的网络爬虫.简单来说,数据被盗可以创建一个网站的碳副本.

理想情况下,此系统会检测来自未知来源的爬行模式(如果不在列表中使用Google抓取工具等),并向抓取爬虫发送伪造信息.

如果作为一名防御者,我会检测到一个定期击中该网站的未知爬虫,攻击者会将这些间隔随机化.

如果作为防御者,我检测到相同的代理/ IP,攻击者将随机化代理.

这就是我迷路的地方 - 如果攻击者将间隔和代理随机化,我怎么能不区分代理和机器从同一网络上攻击网站？

我正在考虑使用javascript和cookie支持来检查可疑代理.如果柏忌无法做到一致,那么这就是坏人.

我还可以做些什么？是否有任何算法,甚至是为快速实时分析历史数据而设计的系统？

1> tomjen..：

我的解决方案是制造一个陷阱.在您的网站上放置一些robots.txt禁止访问的网页.在你的页面上建立一个链接,但用CSS隐藏它,然后ip禁止任何访问该页面的人.

这将迫使违法者服从robots.txt,这意味着你可以永久地将重要的信息或服务放在他身边,这将使他的碳复制克隆无用.

推荐阅读

程序员
Mongo中findOne和find_one有什么区别？

如何解决《Mongo中findOne和find_one有什么区别？》经验，为你挑选了1个好方法。 ... [详细]
程序员
当提交足够的任务时,修复了线程池线程阻塞

如何解决《当提交足够的任务时,修复了线程池线程阻塞》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在pyspark中找到两个rdd的交叉点？

如何解决《如何在pyspark中找到两个rdd的交叉点？》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么以下函数不是尾递归？

如何解决《为什么以下函数不是尾递归？》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否有适用于AWS Lambda的模拟器？

如何解决《是否有适用于AWSLambda的模拟器？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在迁移层5.1中设置自动增量字段开始表单1000

如何解决《在迁移层5.1中设置自动增量字段开始表单1000》经验，为你挑选了3个好方法。 ... [详细]
程序员
std :: string :: assign vs std :: string :: operator =

如何解决《std::string::assignvsstd::string::operator=》经验，为你挑选了1个好方法。 ... [详细]
程序员
未找到AngularJS控制器,未定义

如何解决《未找到AngularJS控制器,未定义》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么不能只读取属性

如何解决《为什么不能只读取属性》经验，为你挑选了1个好方法。 ... [详细]
程序员
TCriticalSection TryEnter方法始终返回True

如何解决《TCriticalSectionTryEnter方法始终返回True》经验，为你挑选了0个好方法。 ... [详细]
程序员
四舍五入到MySQL中的最高.5值

如何解决《四舍五入到MySQL中的最高.5值》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从waitgroup调用的函数中捕获运行时错误？

如何解决《如何从waitgroup调用的函数中捕获运行时错误？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Pydub from_mp3给出[Errno 2]没有这样的文件或目录

如何解决《Pydubfrom_mp3给出[Errno2]没有这样的文件或目录》经验，为你挑选了1个好方法。 ... [详细]
程序员
Maven:无法执行目标org.codehaus.mojo:sonar-maven-plugin:2.7.1:声纳

如何解决《Maven:无法执行目标org.codehaus.mojo:sonar-maven-plugin:2.7.1:声纳》经验，为你挑选了0个好方法。 ... [详细]
程序员
从Maven控制台删除logback`INFO`消息以进行junit测试

如何解决《从Maven控制台删除logback`INFO`消息以进行junit测试》经验，为你挑选了1个好方法。 ... [详细]
程序员
Firebase.ServerValue.TIMESTAMP未在侦听器与实际添加数据的客户端之间同步

如何解决《Firebase.ServerValue.TIMESTAMP未在侦听器与实际添加数据的客户端之间同步》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何用空格分割字符串并在结果中包含空格作为元素？多个空格分割

如何解决《如何用空格分割字符串并在结果中包含空格作为元素？多个空格分割》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Fish shell中检索当前脚本的路径

如何解决《如何在Fishshell中检索当前脚本的路径》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用jquery在弹出窗口中打开pdf文件

如何解决《如何使用jquery在弹出窗口中打开pdf文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
HDFS上的root scratch dir:/ tmp/hive应该是可写的.当前权限是:rw-rw-rw-(在Windows上)

如何解决《HDFS上的rootscratchdir:/tmp/hive应该是可写的.当前权限是:rw-rw-rw-(在Windows上)》经验，为你挑选了5个好方法。 ... [详细]

乐韵答题

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章