16赞

网站抓取:python请求不下载完整网站？

作者：围脖上的博博_771 | 2023-09-07 22:40

如何解决《网站抓取:python请求不下载完整网站？》经验，为你挑选了1个好方法。

我在抓取网站时遇到了问题.目的是在某些日子里为伦敦的酒店取得价格.为此,我从booking.com加载以下网址,然后尝试搜索关键字.但由于某种原因,requests.get不会下载完整的网站.例如,下面的URL显示了浏览器中的酒店列表.每个都显示'总计'和价格.但是,在下面的代码中,site.find('Total')表示在字符串中找不到单词'Total',即使它在浏览器中可见.任何有关为什么会发生这种情

import requests

url='http://www.booking.com/searchresults.en-gb.html?label=gen173nr-17CAEoggJCAlhYSDNiBW5vcmVmaFCIAQGYAS64AQTIAQTYAQHoAQH4AQs;sid=1a43e0952558ac0ad0061d5b6523a7bc;dcid=1;checkin_monthday=4;checkin_year_month=2016-2;checkout_monthday=11;checkout_year_month=2016-2;city=-2601889;class_interval=1;csflt=%7B%7D;group_adults=7;group_children=0;highlighted_hotels=1192837;hp_sbox=1;label_click=undef;no_rooms=1;review_score_group=empty;room1=A%2CA%2CA%2CA%2CA%2CA%2CA;sb_price_type=total;score_min=0;si=ai%2Cco%2Cci%2Cre%2Cdi;ss=London;ssafas=1;ssb=empty;ssne=London;ssne_untouched=London&;order=price_for_two'
r=requests.get(url)

site=r.text
site.find('Total')

jumbopap.. 6

您正在谈论的"总计"信息是使用浏览器中的Javascript生成的.Requests库无法为您生成此HTML,因为它不是浏览器环境.

要查看我在说什么,请尝试在没有Javascript的浏览器中运行该URL.

在此输入图像描述

如果你想要刮掉需要运行Javascript的HTML,你应该研究一个绑定到浏览器环境的库,比如Selenium.

1> jumbopap..：

您正在谈论的"总计"信息是使用浏览器中的Javascript生成的.Requests库无法为您生成此HTML,因为它不是浏览器环境.

要查看我在说什么,请尝试在没有Javascript的浏览器中运行该URL.

在此输入图像描述

如果你想要刮掉需要运行Javascript的HTML,你应该研究一个绑定到浏览器环境的库,比如Selenium.

推荐阅读

程序员
将SEXP从R转换为C++中的字符串向量

如何解决《将SEXP从R转换为C++中的字符串向量》经验，为你挑选了1个好方法。 ... [详细]
程序员
C#6 null传播当object为null时设置的值

如何解决《C#6null传播当object为null时设置的值》经验，为你挑选了2个好方法。 ... [详细]
程序员
iOS Swift:从两个Int创建Float值

如何解决《iOSSwift:从两个Int创建Float值》经验，为你挑选了1个好方法。 ... [详细]
程序员
寻找对应于最小特征值的特征向量

如何解决《寻找对应于最小特征值的特征向量》经验，为你挑选了1个好方法。 ... [详细]
程序员
NPM安装与package.json在提取 - > gunzTarPerm期间退出,没有错误消息

如何解决《NPM安装与package.json在提取->gunzTarPerm期间退出,没有错误消息》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Google BigQuery中选择除一些以外的所有列？

如何解决《在GoogleBigQuery中选择除一些以外的所有列？》经验，为你挑选了2个好方法。 ... [详细]
程序员
完成Docker for Windows教程时找不到Eval命令

如何解决《完成DockerforWindows教程时找不到Eval命令》经验，为你挑选了0个好方法。 ... [详细]
程序员
前n个奇数的总和

如何解决《前n个奇数的总和》经验，为你挑选了1个好方法。 ... [详细]
程序员
Javascript \ x转义

如何解决《Javascript\x转义》经验，为你挑选了1个好方法。 ... [详细]
程序员
Vimscript:在字符串上获取正则表达式的所有匹配项

如何解决《Vimscript:在字符串上获取正则表达式的所有匹配项》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何检查整数是否是一个完美的正方形

如何解决《如何检查整数是否是一个完美的正方形》经验，为你挑选了1个好方法。 ... [详细]
程序员
NodeJS - connect-keycloak中间件空响应错误

如何解决《NodeJS-connect-keycloak中间件空响应错误》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何使用socket.io发送二进制数据？

如何解决《如何使用socket.io发送二进制数据？》经验，为你挑选了1个好方法。 ... [详细]
程序员
添加文件并在Xcode中选择多个目标

如何解决《添加文件并在Xcode中选择多个目标》经验，为你挑选了0个好方法。 ... [详细]
程序员
AWS JS SDK,IAM和DynamoDB问题

如何解决《AWSJSSDK,IAM和DynamoDB问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
Django编辑和删除，使用通用编辑视图或在视图中创建函数。

如何解决《Django编辑和删除，使用通用编辑视图或在视图中创建函数。》经验，为你挑选了1个好方法。 ... [详细]
程序员
创建一个范围内有间隙的序列

如何解决《创建一个范围内有间隙的序列》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用spring MVC的Maven jackson依赖项的问题

如何解决《使用springMVC的Mavenjackson依赖项的问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在visual studio中调试python(如何进入库)？

如何解决《如何在visualstudio中调试python(如何进入库)？》经验，为你挑选了0个好方法。 ... [详细]
程序员
DataTables获取所选行的单元格的数组数据

如何解决《DataTables获取所选行的单元格的数组数据》经验，为你挑选了1个好方法。 ... [详细]

围脖上的博博_771

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章