18赞

从原始URL获取重定向的URL

作者：coco2冰冰 | 2023-08-28 16:04

如何解决《从原始URL获取重定向的URL》经验，为你挑选了3个好方法。

我的数据库中有一个表,其中包含一些网站的URL.我必须打开这些URL并验证这些页面上的一些链接.问题是某些URL被重定向到其他URL.我的逻辑是没有这样的URL.

有什么方法可以通过我的原始URL字符串并重新获取重定向的URL？

示例:我正在尝试使用此URL:http: //individual.troweprice.com/public/Retail/xStaticFiles/FormsAndLiterature/CollegeSavings/trp529Disclosure.pdf

它被重定向到这个:http: //individual.troweprice.com/staticFiles/Retail/Shared/PDFs/trp529Disclosure.pdf

我试着使用以下代码:

HttpWebRequest req = (HttpWebRequest)WebRequest.Create(Uris);
req.Proxy = proxy;
req.Method = "HEAD";
req.AllowAutoRedirect = false;

HttpWebResponse myResp = (HttpWebResponse)req.GetResponse();
if (myResp.StatusCode == HttpStatusCode.Redirect)
{
  MessageBox.Show("redirected to:" + myResp.GetResponseHeader("Location"));
}

当我执行上面的代码时,它给了我HttpStatusCodeOk.我很惊讶它为什么不考虑重定向.如果我在Internet Explorer中打开该链接,它将重定向到另一个URL并打开PDF文件.

有人可以帮助我理解为什么它不能正常运行示例URL吗？

顺便说一句,我检查了Hotmail的URL(http://www.hotmail.com)并正确返回重定向的URL.

谢谢,

1> Marcelo Calb..：

此函数将返回链接的最终目标 - 即使存在多个重定向.它不考虑基于JavaScript的重定向或META重定向.请注意,之前的解决方案没有处理绝对和相对URL,因为LOCATION标头可能返回类似"/ newhome"的内容,您需要与提供该响应的URL结合使用以识别完整的URL目标.

    public static string GetFinalRedirect(string url)
    {
        if(string.IsNullOrWhiteSpace(url))
            return url;

        int maxRedirCount = 8;  // prevent infinite loops
        string newUrl = url;
        do
        {
            HttpWebRequest req = null;
            HttpWebResponse resp = null;
            try
            {
                req = (HttpWebRequest) HttpWebRequest.Create(url);
                req.Method = "HEAD";
                req.AllowAutoRedirect = false;
                resp = (HttpWebResponse)req.GetResponse();
                switch (resp.StatusCode)
                {
                    case HttpStatusCode.OK:
                        return newUrl;
                    case HttpStatusCode.Redirect:
                    case HttpStatusCode.MovedPermanently:
                    case HttpStatusCode.RedirectKeepVerb:
                    case HttpStatusCode.RedirectMethod:
                        newUrl = resp.Headers["Location"];
                        if (newUrl == null)
                            return url;

                        if (newUrl.IndexOf("://", System.StringComparison.Ordinal) == -1)
                        {
                            // Doesn't have a URL Schema, meaning it's a relative or absolute URL
                            Uri u = new Uri(new Uri(url), newUrl);
                            newUrl = u.ToString();
                        }
                        break;
                    default:
                        return newUrl;
                }
                url = newUrl;
            }
            catch (WebException)
            {
                // Return the last known good URL
                return newUrl;
            }
            catch (Exception ex)
            {
                return null;
            }
            finally
            {
                if (resp != null)
                    resp.Close();
            }
        } while (maxRedirCount-- > 0);

        return newUrl;
    }

2> Can Berk Güd..：

您提到的URL使用JavaScript重定向,该重定向仅重定向浏览器.因此,没有简单的方法来检测重定向.

为了正确(HTTP状态代码和位置:)重定向,您可能想要删除

req.AllowAutoRedirect = false;

并使用获取最终的URL

myResp.ResponseUri

因为可以有多个重定向.

更新:有关重定向的更多说明:

将浏览器重定向到另一个URL的方法不止一种.

第一种方法是使用3xx HTTP状态代码和Location:标头.这是神想要HTTP重定向工作的方式,也被称为"一种真正的方式".此方法适用于所有浏览器和抓取工具.

然后是魔鬼的方式.这些包括元刷新,Refresh:标头和JavaScript.虽然这些方法适用于大多数浏览器,但它们肯定不能保证工作,偶尔会导致奇怪的行为(又称打破后退按钮).

大多数网络抓取工具(包括Googlebot)都会忽略这些重定向方法,您也应该这样做.如果您必须检测所有重定向,则必须解析META标记的HTML,在响应中查找Refresh:标头,并评估Javascript.祝最后一个好运.

3> Prithvi Raj ..：

使用此代码来重定向网址

public void GrtUrl(string url)
    {
        HttpWebRequest webRequest = (HttpWebRequest)WebRequest.Create(url);
        webRequest.AllowAutoRedirect = false;  // IMPORTANT

        webRequest.Timeout = 10000;           // timeout 10s
        webRequest.Method = "HEAD";
        // Get the response ...
        HttpWebResponse webResponse;
        using (webResponse = (HttpWebResponse)webRequest.GetResponse())
        {
            // Now look to see if it's a redirect
            if ((int)webResponse.StatusCode >= 300 && (int)webResponse.StatusCode <= 399)
            {
                string uriString = webResponse.Headers["Location"];
                Console.WriteLine("Redirect to " + uriString ?? "NULL");
                webResponse.Close(); // don't forget to close it - or bad things happen!
            }

        }

    }

推荐阅读

程序员
从S3上的静态站点进行POST时,AWS API Gateway端点会出现CORS错误

如何解决《从S3上的静态站点进行POST时,AWSAPIGateway端点会出现CORS错误》经验，为你挑选了2个好方法。 ... [详细]
程序员
在Python中合并两个GEOJSON多边形

如何解决《在Python中合并两个GEOJSON多边形》经验，为你挑选了2个好方法。 ... [详细]
程序员
在chrome扩展中更改代码后,gulp刷新活动选项卡

如何解决《在chrome扩展中更改代码后,gulp刷新活动选项卡》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何聚合(最小/最大等)Django JSONField数据？

如何解决《如何聚合(最小/最大等)DjangoJSONField数据？》经验，为你挑选了3个好方法。 ... [详细]
程序员
ajax错误导致成功函数调用

如何解决《ajax错误导致成功函数调用》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何查询Firebase以获取equalTo布尔参数？

如何解决《如何查询Firebase以获取equalTo布尔参数？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Numpy中的Blockwise操作

如何解决《Numpy中的Blockwise操作》经验，为你挑选了1个好方法。 ... [详细]
程序员
g_main_loop_run阻止Qthread并且不允许停止视频

如何解决《g_main_loop_run阻止Qthread并且不允许停止视频》经验，为你挑选了0个好方法。 ... [详细]
程序员
Elixir是否支持内省以显示功能来源？

如何解决《Elixir是否支持内省以显示功能来源？》经验，为你挑选了1个好方法。 ... [详细]
程序员
从ResultSet Java获取价值

如何解决《从ResultSetJava获取价值》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在VS 2015/.NET 4.6中添加引用？

如何解决《如何在VS2015/.NET4.6中添加引用？》经验，为你挑选了0个好方法。 ... [详细]
程序员
从函数指针列表中获取函数的索引

如何解决《从函数指针列表中获取函数的索引》经验，为你挑选了1个好方法。 ... [详细]
程序员
由于物理设备上的XCApplicationStateRunningActive,Xcode UI测试失败

如何解决《由于物理设备上的XCApplicationStateRunningActive,XcodeUI测试失败》经验，为你挑选了0个好方法。 ... [详细]
程序员
尝试使用Spring MVC和Thymeleaf进行React/Ajax调用

如何解决《尝试使用SpringMVC和Thymeleaf进行React/Ajax调用》经验，为你挑选了1个好方法。 ... [详细]
程序员
正确实现异步Android SQLite数据库

如何解决《正确实现异步AndroidSQLite数据库》经验，为你挑选了1个好方法。 ... [详细]
程序员
我无法删除我的VPC

如何解决《我无法删除我的VPC》经验，为你挑选了2个好方法。 ... [详细]
程序员
Laravel API最佳实践

如何解决《LaravelAPI最佳实践》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java List <Map <String,Long >>映射键的组合之和

如何解决《JavaList<Map<String,Long>>映射键的组合之和》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用API 19+以较短的间隔更新Widget

如何解决《使用API19+以较短的间隔更新Widget》经验，为你挑选了0个好方法。 ... [详细]
程序员
尝试从apache的sharedRDD中检索数据点燃上下文

如何解决《尝试从apache的sharedRDD中检索数据点燃上下文》经验，为你挑选了1个好方法。 ... [详细]

coco2冰冰

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章