9赞

Asp.net Request.Browser.Crawler - 动态爬虫列表？

作者：ar_wen2402851455 | 2023-09-01 10:20

如何解决《Asp.netRequest.Browser.Crawler-动态爬虫列表？》经验，为你挑选了2个好方法。

我在C#中了解了为什么Request.Browser.Crawler始终为假(http://www.digcode.com/default.aspx?page=ed51cde3-d979-4daf-afae-fa6192562ea9&article=bc3a7a4f-f53e-4f88-8e9c-c9337f6c05a0) .

有没有人使用某种方法来动态更新Crawler的列表,所以Request.Browser.Crawler会非常有用吗？

1> DavGarcia..：

我很高兴Ocean的Browsercaps提供的结果.它支持Microsoft的配置文件没有费力检测的爬虫.它甚至会解析您网站上的爬虫版本,而不是我真正需要的详细程度.

2> splattne..：

你可以检查(正则表达式)Request.UserAgent.

Peter Bromberg撰写了一篇关于在ASP.NET中编写ASP.NET请求记录器和Crawler Killer的好文章.

这是他在Logger班上使用的方法:

public static bool IsCrawler(HttpRequest request)
{
   // set next line to "bool isCrawler = false; to use this to deny certain bots
   bool isCrawler = request.Browser.Crawler;
   // Microsoft doesn't properly detect several crawlers
   if (!isCrawler)
   {
       // put any additional known crawlers in the Regex below
       // you can also use this list to deny certain bots instead, if desired:
       // just set bool isCrawler = false; for first line in method 
       // and only have the ones you want to deny in the following Regex list
       Regex regEx = new Regex("Slurp|slurp|ask|Ask|Teoma|teoma");
       isCrawler = regEx.Match(request.UserAgent).Success;
   }
   return isCrawler;
}

警告 - 这不是*万无一失!如果您安装某些版本的Ask.com工具栏(至少在IE中),它将修改用户代理以某种形式包含"询问",从而导致误报.

推荐阅读

程序员
Android上是否有任何类型的粒子发射器,如iOS CAEmitterLayer用于圆形发射器？

如何解决《Android上是否有任何类型的粒子发射器,如iOSCAEmitterLayer用于圆形发射器？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在ASP.NET MVC 5中使用带有razor语法的jquery？

如何解决《如何在ASP.NETMVC5中使用带有razor语法的jquery？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何使用runhaskell取消隐藏ghc库

如何解决《如何使用runhaskell取消隐藏ghc库》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否可以在rmarkdown呈现的pdf文档中包含svg图像？

如何解决《是否可以在rmarkdown呈现的pdf文档中包含svg图像？》经验，为你挑选了0个好方法。 ... [详细]
程序员
无法建立搅拌机

如何解决《无法建立搅拌机》经验，为你挑选了0个好方法。 ... [详细]
程序员
在django-import-export中导入m2m关系

如何解决《在django-import-export中导入m2m关系》经验，为你挑选了1个好方法。 ... [详细]
程序员
Lodash过滤器和功能组合

如何解决《Lodash过滤器和功能组合》经验，为你挑选了1个好方法。 ... [详细]
程序员
在宏变量名称SAS中解析包含%eval的宏

如何解决《在宏变量名称SAS中解析包含%eval的宏》经验，为你挑选了1个好方法。 ... [详细]
程序员
C++模板专业化和继承

如何解决《C++模板专业化和继承》经验，为你挑选了1个好方法。 ... [详细]
程序员
IntelliJ正在生成私有的getter

如何解决《IntelliJ正在生成私有的getter》经验，为你挑选了1个好方法。 ... [详细]
程序员
webpack插件中的流水线代码生成

如何解决《webpack插件中的流水线代码生成》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何动态设置TableLayoutPanel中的单元格颜色？

如何解决《如何动态设置TableLayoutPanel中的单元格颜色？》经验，为你挑选了1个好方法。 ... [详细]
程序员
类的超类不匹配

如何解决《类的超类不匹配》经验，为你挑选了1个好方法。 ... [详细]
程序员
在本地范围内重新定义typedef

如何解决《在本地范围内重新定义typedef》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何拦截提交按钮点击？

如何解决《如何拦截提交按钮点击？》经验，为你挑选了1个好方法。 ... [详细]
程序员
模拟设备背光对人类图像感知的影响

如何解决《模拟设备背光对人类图像感知的影响》经验，为你挑选了0个好方法。 ... [详细]
程序员
"哎呀,发生错误!代码:201601301501048 .."在TYPO3 7.6中

如何解决《"哎呀,发生错误!代码:201601301501048.."在TYPO37.6中》经验，为你挑选了2个好方法。 ... [详细]
程序员
Android - 删除主页和导航按钮

如何解决《Android-删除主页和导航按钮》经验，为你挑选了0个好方法。 ... [详细]
程序员
OrientDB如何在一个查询中获取顶点及其边的结果集

如何解决《OrientDB如何在一个查询中获取顶点及其边的结果集》经验，为你挑选了1个好方法。 ... [详细]
程序员
启动Jboss Wildfly 9.02服务器时出现并发超时异常

如何解决《启动JbossWildfly9.02服务器时出现并发超时异常》经验，为你挑选了2个好方法。 ... [详细]

ar_wen2402851455

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章