是否有已知的网络抓取工具列表？

作者：手机用户2502851955 | 2023-08-15 16:52

如何解决《是否有已知的网络抓取工具列表？》经验，为你挑选了2个好方法。

我正在尝试为Web服务器上的某些文件获取准确的下载数字.我看一下用户代理,有些显然是机器人或网络抓取工具,但很多很多我不确定,它们可能是也可能不是网络爬虫,它们导致很多下载,因此对我来说很重要.

是否存在一些已知的Web爬虫列表,其中包含一些文档,如用户代理,IP,行为等？

我对官方的不感兴趣,比如Google,雅虎或微软.这些通常是表现良好和自我识别.

1> Jaan J..：

我通常使用http://www.user-agents.org/作为参考,希望这可以帮助你.

您也可以尝试http://www.robotstxt.org/db.html或http://www.botsvsbrowsers.com.

2> Martin Monpe..：

我在https://github.com/monperrus/crawler-user-agents/上维护了一个爬虫用户代理模式列表.

它是协作的,您可以通过拉取请求为其做出贡献.

推荐阅读

程序员
Makefile | 依赖于头文件中包含的另一个头文件

如何解决《Makefile|依赖于头文件中包含的另一个头文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么Elixir警告我我的导入未被使用？

如何解决《为什么Elixir警告我我的导入未被使用？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Itext替换PDF文件中的字符串,但不替换字母X.

如何解决《使用Itext替换PDF文件中的字符串,但不替换字母X.》经验，为你挑选了1个好方法。 ... [详细]
程序员
MP Chart Android未显示所有x轴标签

如何解决《MPChartAndroid未显示所有x轴标签》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用10**9超过10亿的成本？

如何解决《使用10**9超过10亿的成本？》经验，为你挑选了2个好方法。 ... [详细]
程序员
support.v7.widgets和android.widgets Toolbar,Fragment之间的区别

如何解决《support.v7.widgets和android.widgetsToolbar,Fragment之间的区别》经验，为你挑选了0个好方法。 ... [详细]
程序员
AVR如何执行浮点运算

如何解决《AVR如何执行浮点运算》经验，为你挑选了0个好方法。 ... [详细]
程序员
当通过本地apache发送请求时,POST转换为GET

如何解决《当通过本地apache发送请求时,POST转换为GET》经验，为你挑选了0个好方法。 ... [详细]
程序员
具有客户端访问控制的Mongodb docker容器

如何解决《具有客户端访问控制的Mongodbdocker容器》经验，为你挑选了1个好方法。 ... [详细]
程序员
C中for循环中的操作顺序

如何解决《C中for循环中的操作顺序》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么strtod没有以正确的方式工作？

如何解决《为什么strtod没有以正确的方式工作？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从源更新Tensorflow

如何解决《如何从源更新Tensorflow》经验，为你挑选了1个好方法。 ... [详细]
程序员
Browserify/Babelify React用于生产(NODE_ENV生产)

如何解决《Browserify/BabelifyReact用于生产(NODE_ENV生产)》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在弹簧靴中注册自定义转换器？

如何解决《如何在弹簧靴中注册自定义转换器？》经验，为你挑选了0个好方法。 ... [详细]
程序员
我想在CXF codegen上添加@XmlRoot注释

如何解决《我想在CXFcodegen上添加@XmlRoot注释》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在夜班表测试中绕过人员检查？

如何解决《如何在夜班表测试中绕过人员检查？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何最小化webpack捆绑的大小？

如何解决《如何最小化webpack捆绑的大小？》经验，为你挑选了3个好方法。 ... [详细]
程序员
如何计算所选元素的数量？

如何解决《如何计算所选元素的数量？》经验，为你挑选了1个好方法。 ... [详细]
程序员
CKModifyRecordsOperation modifyRecordsCompletionBlock未被调用

如何解决《CKModifyRecordsOperationmodifyRecordsCompletionBlock未被调用》经验，为你挑选了1个好方法。 ... [详细]
程序员
sql否定运算符:!= vs <>

如何解决《sql否定运算符:!=vs<>》经验，为你挑选了1个好方法。 ... [详细]

手机用户2502851955

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章