如何以编程方式检测机器人

作者：依然-狠幸福 | 2023-07-10 20:20

如何解决《如何以编程方式检测机器人》经验，为你挑选了2个好方法。

我们有一种情况,我们记录访问和访问页面命中和机器人堵塞我们的数据库.我们不能使用验证码或其他类似的技术,因为这是在我们甚至要求人工输入之前,基本上我们正在记录页面命中,我们只想记录人类的页面命中.

那里有已知的僵尸网络IP列表吗？检查已知的bot用户代理是否有效？

1> Guffa..：

没有确定的方式来抓住所有机器人.如果有人想要,机器人可以像真正的浏览器一样行事.

最严重的机器人在代理字符串中清楚地标识自己,因此使用已知机器人的列表,您可以装配大部分机器人.在列表中,您还可以添加一些默认情况下某些HTTP库使用的代理字符串,以捕获那些甚至不知道如何更改代理字符串的人的机器人.如果您只记录访问者的代理字符串,您应该能够选择要存储在列表中的访问者字符串.

您还可以通过在页面上放置一个隐藏的链接来制作"糟糕的机器人陷阱",该链接会导致您的robots.txt文件中的网页被过滤掉.严重的机器人不会跟随链接,人类无法点击它,因此只有不遵守规则的机器人才会请求该文件.

您还可以为行为良好的机器人http://www.robotstxt.org/orig.html创建robots.txt文件

2> RHSeeger..：

根据您要检测的bot的类型:

检测诚实的Web爬虫

检测隐形Web爬虫

推荐阅读

程序员
为什么我不能在"while"上称之为"gist"？(Perl 6)

如何解决《为什么我不能在"while"上称之为"gist"？(Perl6)》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在iOS 8和9中14天后重复本地通知

如何解决《如何在iOS8和9中14天后重复本地通知》经验，为你挑选了1个好方法。 ... [详细]
程序员
Apple News使用什么来确定何时显示图像？

如何解决《AppleNews使用什么来确定何时显示图像？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Nodejs承诺不能正常工作？

如何解决《Nodejs承诺不能正常工作？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Spring Stomp Web Sockets Client for Android

如何解决《SpringStompWebSocketsClientforAndroid》经验，为你挑选了0个好方法。 ... [详细]
程序员
ObjectList/Repeater的QML DefaultProperty

如何解决《ObjectList/Repeater的QMLDefaultProperty》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在IntelliJ中一次对多个错误应用“快速修复”？

如何解决《如何在IntelliJ中一次对多个错误应用“快速修复”？》经验，为你挑选了1个好方法。 ... [详细]
程序员
给出ReferenceError的mocha命令:未定义窗口

如何解决《给出ReferenceError的mocha命令:未定义窗口》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用PHP获取服务器响应时间

如何解决《如何使用PHP获取服务器响应时间》经验，为你挑选了1个好方法。 ... [详细]
程序员
CUDA流压缩算法

如何解决《CUDA流压缩算法》经验，为你挑选了1个好方法。 ... [详细]
程序员
ListView.set.adapter导致NullPointerException

如何解决《ListView.set.adapter导致NullPointerException》经验，为你挑选了1个好方法。 ... [详细]
程序员
如果在Swift中为nil,那么赋值的速记？

如何解决《如果在Swift中为nil,那么赋值的速记？》经验，为你挑选了1个好方法。 ... [详细]
程序员
警告:"pecl/mongo"已弃用,以支持"channel:/// mongodb"

如何解决《警告:"pecl/mongo"已弃用,以支持"channel:///mongodb"》经验，为你挑选了1个好方法。 ... [详细]
程序员
条纹Webhook响应

如何解决《条纹Webhook响应》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用dplyr删除所有列总和为零

如何解决《使用dplyr删除所有列总和为零》经验，为你挑选了2个好方法。 ... [详细]
程序员
在C中请求密码程序

如何解决《在C中请求密码程序》经验，为你挑选了1个好方法。 ... [详细]
程序员
在PHP7 Apache/2.4.7(Ubuntu)上安装phpmyadmin时遇到问题

如何解决《在PHP7Apache/2.4.7(Ubuntu)上安装phpmyadmin时遇到问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用javascript正则表达式从字符串中提取子字符串

如何解决《使用javascript正则表达式从字符串中提取子字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
在laravel 4中使用bootstrap datepicker时,在昨天之前禁用日期

如何解决《在laravel4中使用bootstrapdatepicker时,在昨天之前禁用日期》经验，为你挑选了1个好方法。 ... [详细]
程序员
在HTML5 SharedWorker中的socket.io Websocket连接

如何解决《在HTML5SharedWorker中的socket.ioWebsocket连接》经验，为你挑选了1个好方法。 ... [详细]

依然-狠幸福

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章