15赞

python爬虫爬取淘宝商品信息

作者：喜生-Da | 2022-01-06 01:57

这篇文章主要为大家详细介绍了python爬虫爬取淘宝商品信息，具有一定的参考价值，感兴趣的小伙伴们可以参考一下

本文实例为大家分享了python爬取淘宝商品的具体代码，供大家参考，具体内容如下

import requests as req 
import re 
 
def getHTMLText(url): 
 try: 
 r = req.get(url, timeout=30) 
 r.raise_for_status() 
 r.encoding = r.apparent_encoding 
 return r.text 
 except: 
 return "" 
 
def parasePage(ilt, html): 
 try: 
 plt = re.findall(r'\"view_price\"\:\"[\d\.]*\"', html) 
 tlt = re.findall(r'\"raw_title\"\:\".*?\"', html) 
 for i in range(len(plt)): 
  price = eval(plt[i].split(':')[1]) 
  title = eval(tlt[i].split(':')[1]) 
  ilt.append([price, title]) 
 except: 
 print("") 
 
 
def printGoodsList(ilt): 
 tplt = "{:4}\t{:8}\t{:16}" 
 print(tplt.format("序列号", "价格", "商品名称")) 
 count = 0 
 for j in ilt: 
 count = count + 1 
 print(tplt.format(count, j[0], j[1])) 
 
def main(): 
 goods = "python爬虫" 
 depth = 3 
 start_url = 'https://s.taobao.com/search?q=' + goods 
 infoList = [] 
 for i in range(depth): 
 try: 
  url = start_url + '&s=' + str(44*i) 
  html = getHTMLText(url) 
  parasePage(infoList, html) 
 except: 
  continue 
 printGoodsList(infoList) 
 
main()

效果图：

更多内容请参考专题《python爬取功能汇总》进行学习。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

推荐阅读

程序员
C#类实例列表

如何解决《C#类实例列表》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在中间(垂直)对齐文本

如何解决《如何在中间(垂直)对齐文本》经验，为你挑选了1个好方法。 ... [详细]
程序员
Xcode 7.2找不到匹配的配置文件

如何解决《Xcode7.2找不到匹配的配置文件》经验，为你挑选了6个好方法。 ... [详细]
程序员
如何使用键盘快捷方式在atom中添加文件夹？

如何解决《如何使用键盘快捷方式在atom中添加文件夹？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在R中停止一个耗时太长的函数并给它一个替代方案？

如何解决《如何在R中停止一个耗时太长的函数并给它一个替代方案？》经验，为你挑选了1个好方法。 ... [详细]
程序员
计算字符串重复SCALA的次数

如何解决《计算字符串重复SCALA的次数》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Ruby 2.3中引入的Array#dig和Hash #dig？

如何解决《如何使用Ruby2.3中引入的Array#dig和Hash#dig？》经验，为你挑选了2个好方法。 ... [详细]
程序员
是否有任何常见的电子邮件客户端预取链接而不是图像？

如何解决《是否有任何常见的电子邮件客户端预取链接而不是图像？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在R中按组省略两个最高值和最低值的行

如何解决《如何在R中按组省略两个最高值和最低值的行》经验，为你挑选了1个好方法。 ... [详细]
程序员
集成在Python中返回数组的函数

如何解决《集成在Python中返回数组的函数》经验，为你挑选了0个好方法。 ... [详细]
程序员
Theano:更改`base_compiledir`以将编译的文件保存在另一个目录中

如何解决《Theano:更改`base_compiledir`以将编译的文件保存在另一个目录中》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何执行线程安全获取然后使用ConcurrentHashMap删除？

如何解决《如何执行线程安全获取然后使用ConcurrentHashMap删除？》经验，为你挑选了2个好方法。 ... [详细]
程序员
Express - 在中间件函数之间传递数据的更好模式

如何解决《Express-在中间件函数之间传递数据的更好模式》经验，为你挑选了1个好方法。 ... [详细]
程序员
Kotlin懒惰的默认属性

如何解决《Kotlin懒惰的默认属性》经验，为你挑选了1个好方法。 ... [详细]
程序员
输入文本框的jQuery悬停事件不起作用

如何解决《输入文本框的jQuery悬停事件不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在忽略文章（A，An，the）的同时对javascript数组进行排序？

如何解决《如何在忽略文章（A，An，the）的同时对javascript数组进行排序？》经验，为你挑选了1个好方法。 ... [详细]
程序员
当多个用户正在查看记录并且1个人更新记录时,如何通知其他记录更新？

如何解决《当多个用户正在查看记录并且1个人更新记录时,如何通知其他记录更新？》经验，为你挑选了0个好方法。 ... [详细]
程序员
UISearchController搜索栏动画第一次很慢

如何解决《UISearchController搜索栏动画第一次很慢》经验，为你挑选了0个好方法。 ... [详细]
程序员
pandas按另一列中的值对列进行排序

如何解决《pandas按另一列中的值对列进行排序》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用python旋转此列表列表

如何解决《如何使用python旋转此列表列表》经验，为你挑选了2个好方法。 ... [详细]

喜生-Da

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章