安卓最美应用页面爬虫,爬虫很简单,设计的东西到挺多的
文件操作
正则表达式
字符串替换等等
import requests import re url = "http://zuimeia.com" r = requests.get('http://zuimeia.com/community/app/hot/?platform=2') pattern = re.compile(r'') urlList = pattern.findall(r.content) def requestsUrl(url): r = requests.get(url) title = re.findall(r'"app-title">(.*?)
',r.content) #print title category = re.findall(r'(.*?)',r.content) #print category describe = re.findall(r'(.*?)',r.content) #print type(describe[0]) strdescribe = srtReplace(describe[0]) #print strdescribe downloadUrl = re.findall(r'', '
', '', '
', '', '', '', '', '', '','','', ''] for eachListReplace in listReplace: string = string.replace(str(eachListReplace),'\n') string = string.replace('\n\n','') return string def categornFinal(category): categoryFinal ='' for eachCategory in category: categoryFinal = categoryFinal+str(eachCategory)+'-->' return categoryFinal def urlReplace(url): url = url.replace('&', '&') return url requestsUrl("http://zuimeia.com/community/app/27369/?platform=2") for eachUrl in urlList: eachUrl = url+eachUrl content = requestsUrl(eachUrl) categoryFinal ='' title = content[0][0] category = categornFinal(content[1]) strdescribe = content[2] downloadUrl = urlReplace(content[3][0]) with open('c:/wqa.txt', 'a+') as fd: fd.write('title:'+title+'\n'+'category:'+category+'\n'+'strdescribe:'+strdescribe+'\n'+'downloadUrl:'+downloadUrl+'\n\n\n-----------------------------------------------------------------------------------------------------------------------------\n\n\n')', '
', '
', '
', '
', '
','','', '
', '推荐阅读
如何解决《在scikit-learnPipeline中插入或删除一个步骤》经验,为你挑选了2个好方法。 ... [详细] 如何解决《super().__init__()中的'意外的关键字参数'》经验,为你挑选了1个好方法。 ... [详细] 如何解决《OSGiMaven依赖vs导入包vs嵌入依赖》经验,为你挑选了1个好方法。 ... [详细] 如何解决《谷歌登录不工作的android?》经验,为你挑选了1个好方法。 ... [详细] 如何解决《如何将ARG值传递给ENTRYPOINT?》经验,为你挑选了2个好方法。 ... [详细] 如何解决《仅在$touch为true时显示的角度ng-messages》经验,为你挑选了1个好方法。 ... [详细] 如何解决《将Spark与Cassandra结合使用?》经验,为你挑选了1个好方法。 ... [详细] 如何解决《ASP.NET5中的子域路由》经验,为你挑选了0个好方法。 ... [详细] 如何解决《GitHub:如何对超过1500行的新文件进行代码审查》经验,为你挑选了0个好方法。 ... [详细] 如何解决《编译'com.firebase:firebase-client-android:2.5.0'时出现build.gradle错误》经验,为你挑选了1个好方法。 ... [详细] 如何解决《将iOS应用程序上传到iTunesConnect时出现问题:"符号工具失败"》经验,为你挑选了1个好方法。 ... [详细] 如何解决《可能有损转换从double到int并且找不到符号》经验,为你挑选了1个好方法。 ... [详细] 如何解决《将TensorFlowLSTM转换为synapticjs》经验,为你挑选了1个好方法。 ... [详细] 如何解决《CSS模块组成》经验,为你挑选了1个好方法。 ... [详细] 如何解决《对象在-z和-x角的z轴上翻转180度》经验,为你挑选了0个好方法。 ... [详细] 如何解决《在IPython笔记本中更改绘图窗口大小》经验,为你挑选了1个好方法。 ... [详细] 如何解决《使用来自不同HTML属性的项填充数组》经验,为你挑选了0个好方法。 ... [详细] 如何解决《Umbraco将"IPublishedContent"类型转换为"CustomModel"类型》经验,为你挑选了1个好方法。 ... [详细] 如何解决《功能编程:Curry&Fold-什么是词源?》经验,为你挑选了1个好方法。 ... [详细] 如何解决《AndroidWidget更改背景颜色》经验,为你挑选了1个好方法。 ... [详细]吐了个 "CAO" !Tags | 热门标签RankList | 热门文章
- 1ActionBar与工具栏或ActionBar和工具栏
- 2在Javascript中声明函数的最有效方法是什么?
- 3使用Facebook PHP SDK获取Facebook广告内容
- 4Erlang中的排列示例
- 5函数返回类型是否会影响过载的选择?
- 6使用不相等的索引将系列分配给DataFrame
- 7Azure Elastic DB中ReferenceTableInfo与ShardedTableInfo有什么区别?
- 8无法创建Google Analytics配置文件
- 9当我从虚拟基础派生D时,为什么在VS2015中sizeof(D)增加了8个字节?
- 10为什么新的Date()函数在chrome和firefox中提供不同的输出
- 11Numpy列和行向量
- 12我可以使用实际Chrome安装的Cookie运行Selenium ChromeDriver吗?
- 13使用C++编译比使用C++ 98慢11?
- 14使用webpack构建时mime-db\db.json出错
- 15Elixir阻止了GenServer进程
- 16如何在Android电视上显示数字软件键盘?
- 17从阵列打印值有时不起作用
- 18如何防止Android设备从Qt应用程序进入休眠状态
- 19使用公共maven存储库代替本地库的优点
- 20Google地方信息自动填充功能需要多个国家/地区组件限制
DevBox开发工具箱 | 专业的在线开发工具网站 京公网安备 11010802040832号 | 京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有