测试大量格式良好的URL的有效性的最快方法是什么

作者：小白也坚强_177 | 2023-08-30 14:36

如何解决《测试大量格式良好的URL的有效性的最快方法是什么》经验，为你挑选了2个好方法。

我的项目要求我验证大量的Web URL.这些URL已被一个我无法控制的非常不可靠的进程捕获.所有的URL都已经过regexp验证,并且已知格式正确.我也知道他们都有有效的TLD

我希望能够快速过滤这些网址,以确定哪些网址不正确.此时我并不关心页面上的内容是什么 - 我只想尽快知道哪些页面不可访问(例如产生404错误).

鉴于有很多这些我不想下载整个页面,只是HTTP标头,然后从标题的内容中好好猜测页面是否可能存在.

可以吗？

1> MrTopf..：

要真正做到这一点,您可能还会使用使用非阻塞IO的eventlet来加快速度.

您可以使用这样的头部请求:

from eventlet import httpc
try:
    res = httpc.head(url)
except httpc.NotFound:
    # handle 404

然后,您可以将其放入一些简单的脚本,例如此处的示例脚本.有了它,你应该通过使用协同程序池获得相当多的并发性.

2> Jeff..：

我假设您希望根据您的标签在Python中执行此操作.在那种情况下,我会使用httplib.(可选)以某种方式按主机对URL进行分组,以便您可以在一个连接中为具有相同主机的URL发出多个请求.使用HEAD请求.

conn = httplib.HTTPConnection("example.com")
conn.request("HEAD", "/index.html")
resp = conn.getresponse()
print resp.status

推荐阅读

程序员
Golang嵌入式结构

如何解决《Golang嵌入式结构》经验，为你挑选了0个好方法。 ... [详细]
程序员
JPA Query返回空值 - 具有空列的Composite Key

如何解决《JPAQuery返回空值-具有空列的CompositeKey》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在特定设备上运行命令'ionic run android'？

如何解决《如何在特定设备上运行命令'ionicrunandroid'？》经验，为你挑选了2个好方法。 ... [详细]
程序员
react-router和cordova无法正常工作

如何解决《react-router和cordova无法正常工作》经验，为你挑选了1个好方法。 ... [详细]
程序员
Swift 2.1 [UInt8] --utf8->字符串？

如何解决《Swift2.1[UInt8]--utf8->字符串？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将键值数据帧转换为列表

如何解决《将键值数据帧转换为列表》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何防止回调被送入javascript函数

如何解决《如何防止回调被送入javascript函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Bootstrap Date Range Picker中配置语言

如何解决《在BootstrapDateRangePicker中配置语言》经验，为你挑选了2个好方法。 ... [详细]
程序员
保存对立即调用的函数的引用

如何解决《保存对立即调用的函数的引用》经验，为你挑选了1个好方法。 ... [详细]
程序员
既然Swift是开源的,我可以在不是Mac的计算机上编写和编译iOS应用程序吗？

如何解决《既然Swift是开源的,我可以在不是Mac的计算机上编写和编译iOS应用程序吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将<Header>设置为Other Elements - CSS

如何解决《将<Header>设置为OtherElements-CSS》经验，为你挑选了1个好方法。 ... [详细]
程序员
通过API将Twilio语音响应设置为URL而不是TwiML App

如何解决《通过API将Twilio语音响应设置为URL而不是TwiMLApp》经验，为你挑选了1个好方法。 ... [详细]
程序员
张量流中具有未指定尺寸的张量

如何解决《张量流中具有未指定尺寸的张量》经验，为你挑选了1个好方法。 ... [详细]
程序员
访问DbSet时的Effort(EF6)异常(字典中没有给定的密钥)

如何解决《访问DbSet时的Effort(EF6)异常(字典中没有给定的密钥)》经验，为你挑选了0个好方法。 ... [详细]
程序员
CakePHP:找不到FlashComponent

如何解决《CakePHP:找不到FlashComponent》经验，为你挑选了1个好方法。 ... [详细]
程序员
Cordova应用程序在Android上获得404所有XMLHttpRequests

如何解决《Cordova应用程序在Android上获得404所有XMLHttpRequests》经验，为你挑选了1个好方法。 ... [详细]
程序员
SQL Server中的UNION如何将一行与另一行进行比较？

如何解决《SQLServer中的UNION如何将一行与另一行进行比较？》经验，为你挑选了1个好方法。 ... [详细]
程序员
配置Nodejs中的最大旧空间大小

如何解决《配置Nodejs中的最大旧空间大小》经验，为你挑选了1个好方法。 ... [详细]
程序员
反向/ dev/null

如何解决《反向/dev/null》经验，为你挑选了1个好方法。 ... [详细]
程序员
安装Swift开源Xcode工具链时出错:您无法在此位置安装Swift开源Xcode工具链

如何解决《安装Swift开源Xcode工具链时出错:您无法在此位置安装Swift开源Xcode工具链》经验，为你挑选了1个好方法。 ... [详细]

小白也坚强_177

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章