Python:urllib/urllib2/httplib混淆

作者：贾志军 | 2023-09-02 17:53

如何解决《Python:urllib/urllib2/httplib混淆》经验，为你挑选了6个好方法。

我试图通过在Python中编写登录序列脚本来测试Web应用程序的功能,但我遇到了一些麻烦.

这是我需要做的事情:

使用一些参数和标题执行POST.

遵循重定向

检索HTML正文.

现在,我对python相对较新,但到目前为止我测试过的两件事都没有用.首先我使用了httplib,putrequest()(传递URL中的参数)和putheader().这似乎没有遵循重定向.

然后我尝试了urllib和urllib2,将标题和参数作为dicts传递.这似乎返回登录页面,而不是我尝试登录的页面,我想这是因为缺少cookie或其他东西.

我错过了一些简单的事吗？

谢谢.

1> S.Lott..：

专注urllib2于此,它运作良好.不要乱用httplib,它不是顶级API.

您注意到的是urllib2不遵循重定向.

您需要折叠一个实例HTTPRedirectHandler,以捕获并遵循重定向.

此外,您可能希望将默认值子类HTTPRedirectHandler化为捕获信息,然后将其作为单元测试的一部分进行检查.

cookie_handler= urllib2.HTTPCookieProcessor( self.cookies )
redirect_handler= HTTPRedirectHandler()
opener = urllib2.build_opener(redirect_handler,cookie_handler)

然后,您可以使用此opener对象进行POST和GET,正确处理重定向和cookie.

您可能还想添加自己的子类HTTPHandler来捕获和记录各种错误代码.

urllib2.urlopen似乎处理重定向就好了.

2> Jason Pepas..：

这是我对这个问题的看法.

#!/usr/bin/env python

import urllib
import urllib2


class HttpBot:
    """an HttpBot represents one browser session, with cookies."""
    def __init__(self):
        cookie_handler= urllib2.HTTPCookieProcessor()
        redirect_handler= urllib2.HTTPRedirectHandler()
        self._opener = urllib2.build_opener(redirect_handler, cookie_handler)

    def GET(self, url):
        return self._opener.open(url).read()

    def POST(self, url, parameters):
        return self._opener.open(url, urllib.urlencode(parameters)).read()


if __name__ == "__main__":
    bot = HttpBot()
    ignored_html = bot.POST('https://example.com/authenticator', {'passwd':'foo'})
    print bot.GET('https://example.com/interesting/content')
    ignored_html = bot.POST('https://example.com/deauthenticator',{})

3> Ace..：

@ S.Lott,谢谢.你的建议对我有用,经过一些修改.这就是我做到的.

data = urllib.urlencode(params)
url = host+page
request = urllib2.Request(url, data, headers)
response = urllib2.urlopen(request)

cookies = CookieJar()
cookies.extract_cookies(response,request)

cookie_handler= urllib2.HTTPCookieProcessor( cookies )
redirect_handler= HTTPRedirectHandler()
opener = urllib2.build_opener(redirect_handler,cookie_handler)

response = opener.open(request)

4> Eli Courtwri..：

我最近必须自己做这件事.我只需要标准库中的类.这是我的代码的摘录:

from urllib import urlencode
from urllib2 import urlopen, Request

# encode my POST parameters for the login page
login_qs = urlencode( [("username",USERNAME), ("password",PASSWORD)] )

# extract my session id by loading a page from the site
set_cookie = urlopen(URL_BASE).headers.getheader("Set-Cookie")
sess_id = set_cookie[set_cookie.index("=")+1:set_cookie.index(";")]

# construct headers dictionary using the session id
headers = {"Cookie": "session_id="+sess_id}

# perform login and make sure it worked
if "Announcements:" not in urlopen(Request(URL_BASE+"login",headers=headers), login_qs).read():
    print "Didn't log in properly"
    exit(1)

# here's the function I used after this for loading pages
def download(page=""):
    return urlopen(Request(URL_BASE+page, headers=headers)).read()

# for example:
print download(URL_BASE + "config")

5> Matthew Chri..：

我给机械师(http://wwwsearch.sourceforge.net/mechanize/)一个机会.它可以透明地处理您的cookie /标题.

6> gimel..：

尝试使用twill - 一种允许用户从命令行界面浏览Web的简单语言.使用斜纹,您可以浏览使用表单,cookie和大多数标准Web功能的网站.更重要的是,twill被编写Python并具有python API,例如:

from twill import get_browser
b = get_browser()

b.go("http://www.python.org/")
b.showforms()

推荐阅读

程序员
如何将键盘按键连接到操作

如何解决《如何将键盘按键连接到操作》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么要用QT编译OpenCV？

如何解决《为什么要用QT编译OpenCV？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如果我使用hashMap.values().remove()从HashMap中删除一个值,它会从地图中删除完整的键/值记录吗？

如何解决《如果我使用hashMap.values().remove()从HashMap中删除一个值,它会从地图中删除完整的键/值记录吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Fortran的参数语句是否类似于C/C++的#define语句？

如何解决《Fortran的参数语句是否类似于C/C++的#define语句？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在android中的视图上方添加阴影

如何解决《如何在android中的视图上方添加阴影》经验，为你挑选了2个好方法。 ... [详细]
程序员
比较Go中的指针

如何解决《比较Go中的指针》经验，为你挑选了1个好方法。 ... [详细]
程序员
将Google地图徽标移到底部的自定义界面上方.JavaScript的

如何解决《将Google地图徽标移到底部的自定义界面上方.JavaScript的》经验，为你挑选了0个好方法。 ... [详细]
程序员
对于类似于GIS细化算法(egrthin,GRASS GIS)的栅格对象,R中是否存在细化或骨架化算法？

如何解决《对于类似于GIS细化算法(egrthin,GRASSGIS)的栅格对象,R中是否存在细化或骨架化算法？》经验，为你挑选了0个好方法。 ... [详细]
程序员
AttributeError:'module'对象没有属性'MutableMapping'

如何解决《AttributeError:'module'对象没有属性'MutableMapping'》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java integer ++我没有改变这个值

如何解决《Javainteger++我没有改变这个值》经验，为你挑选了4个好方法。 ... [详细]
程序员
Travis报告了Gemfile.lock损坏的奇怪消息

如何解决《Travis报告了Gemfile.lock损坏的奇怪消息》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何测试我的.Net客户端使用的TLS版本

如何解决《如何测试我的.Net客户端使用的TLS版本》经验，为你挑选了3个好方法。 ... [详细]
程序员
如何在Visual Studio Intellisense中记录JavaScript配置对象

如何解决《如何在VisualStudioIntellisense中记录JavaScript配置对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
C递归不会递归

如何解决《C递归不会递归》经验，为你挑选了1个好方法。 ... [详细]
程序员
静态constexpr变量的自我初始化是否格式良好？

如何解决《静态constexpr变量的自我初始化是否格式良好？》经验，为你挑选了1个好方法。 ... [详细]
程序员
iOS以编程方式取消TouchID身份验证对话框

如何解决《iOS以编程方式取消TouchID身份验证对话框》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么对同一函数的两个绑定返回不同的值

如何解决《为什么对同一函数的两个绑定返回不同的值》经验，为你挑选了0个好方法。 ... [详细]
程序员
简单的HttpURLConnection POST文件multipart/form-data从android到google blobstore

如何解决《简单的HttpURLConnectionPOST文件multipart/form-data从android到googleblobstore》经验，为你挑选了3个好方法。 ... [详细]
程序员
如果没有运行测试,如何使Jenkins构建失败？

如何解决《如果没有运行测试,如何使Jenkins构建失败？》经验，为你挑选了0个好方法。 ... [详细]
程序员
从专业课程中获取ClassTag

如何解决《从专业课程中获取ClassTag》经验，为你挑选了1个好方法。 ... [详细]

贾志军

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章