转换网址为抓取工具

作者：LEEstarmmmmm | 2023-07-07 18:43

如何解决《转换网址为抓取工具》经验，为你挑选了1个好方法。

我正在研究一个爬虫.通常,当我在浏览器中输入url1时,浏览器会将其转换为url2.我怎么能用Python做到这一点？

url1:www.odevsitesi.com/ara.asp？kelime =doğanındengesininbozulması

url2:www.odevsitesi.com/ara.asp?kelime=do%F0an%FDn%20dengesinin%20bozulmas%FD

1> Alex Martell..：

您需要正确编码URL(在您的情况下为iso-8859-9),将其分成几部分,urllib.quote查询部分,然后再将它们放在一起.即:

>>> import urlparse
>>> import urllib
>>> x = u'http://www.odevsitesi.com/ara.asp?kelime=do?an?n dengesinin bozulmas?' 
>>> y = x.encode('iso-8859-9')
>>> # just to show what the split of y looks like (we can also handle it as a tuple):
>>> urlparse.urlsplit(y)
SplitResult(scheme='http', netloc='www.odevsitesi.com', path='/ara.asp', query='kelime=do\xf0an\xfdn dengesinin bozulmas\xfd', fragment='')
>>> z = urlparse.urlsplit(y)
>>> quoted = z[:3] + (urllib.quote(z.query), z.fragment)
>>> # now just to show you what the 'quoted' tuple looks like:
>>> quoted
('http', 'www.odevsitesi.com', '/ara.asp', 'kelime%3Ddo%F0an%FDn%20dengesinin%20bozulmas%FD', '')
>>> # and finally putting it back together:
>>> urlparse.urlunsplit(quoted)
'http://www.odevsitesi.com/ara.asp?kelime%3Ddo%F0an%FDn%20dengesinin%20bozulmas%FD'

推荐阅读

程序员
使用Doxygen生成图形和图表

如何解决《使用Doxygen生成图形和图表》经验，为你挑选了1个好方法。 ... [详细]
程序员
从代码打开文档时,如何防止出现"更新链接"对话框？

如何解决《从代码打开文档时,如何防止出现"更新链接"对话框？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用shell脚本解压缩.lzo文件

如何解决《使用shell脚本解压缩.lzo文件》经验，为你挑选了2个好方法。 ... [详细]
程序员
匿名类扩展

如何解决《匿名类扩展》经验，为你挑选了1个好方法。 ... [详细]
程序员
Mysql Fetch Array Foreach

如何解决《MysqlFetchArrayForeach》经验，为你挑选了1个好方法。 ... [详细]
程序员
显示一个javascript函数

如何解决《显示一个javascript函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Oracle 11g中创建触发器时出现问题

如何解决《在Oracle11g中创建触发器时出现问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
scanf不打印或读取任何内容

如何解决《scanf不打印或读取任何内容》经验，为你挑选了1个好方法。 ... [详细]
程序员
C#编译器是否转换并存储静态变量？

如何解决《C#编译器是否转换并存储静态变量？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用php date函数显示不同于本地服务器时间的时间？

如何解决《如何使用phpdate函数显示不同于本地服务器时间的时间？》经验，为你挑选了1个好方法。 ... [详细]
程序员
为github上的项目做贡献,如何"在主人之上重新调整我的拉取请求"

如何解决《为github上的项目做贡献,如何"在主人之上重新调整我的拉取请求"》经验，为你挑选了2个好方法。 ... [详细]
程序员
了解C中的静态存储类

如何解决《了解C中的静态存储类》经验，为你挑选了2个好方法。 ... [详细]
程序员
我如何在Python中迭代字母表,拜托？

如何解决《我如何在Python中迭代字母表,拜托？》经验，为你挑选了2个好方法。 ... [详细]
程序员
范围对象在内部将值更改为控制器范围时更新UI

如何解决《范围对象在内部将值更改为控制器范围时更新UI》经验，为你挑选了1个好方法。 ... [详细]
程序员
执行segue导航栏停留的位置和Tab Bar消失

如何解决《执行segue导航栏停留的位置和TabBar消失》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将大数组切成小数组

如何解决《如何将大数组切成小数组》经验，为你挑选了1个好方法。 ... [详细]
程序员
SCons-***未找到SConstruct文件

如何解决《SCons-***未找到SConstruct文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
ajax php javascript:使用POST方法时出错

如何解决《ajaxphpjavascript:使用POST方法时出错》经验，为你挑选了1个好方法。 ... [详细]
程序员
Hazelcast地图同步

如何解决《Hazelcast地图同步》经验，为你挑选了1个好方法。 ... [详细]
程序员
Application.Restart如何在.NET中运行？

如何解决《Application.Restart如何在.NET中运行？》经验，为你挑选了1个好方法。 ... [详细]

LEEstarmmmmm

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章