当前位置:  开发笔记 > 编程语言 > 正文

从网页抓取文本

如何解决《从网页抓取文本》经验,为你挑选了2个好方法。

我想写一个程序,找到公共汽车站的时间并相应地更新我的个人网页.

如果我手动这样做,我会的

    访问www.calgarytransit.com

    输入一个停止号码.即)9510

    点击"下一班巴士"按钮

结果可能如下所示:

10:16p Route 154
10:46p Route 154
11:32p Route 154

一旦我抓住了时间和路线,我就会相应地更新我的网页.

我不知道从哪里开始.我知道他们对网络编程很沮丧,但可以编写一些C和Python.我可以研究哪些主题/库?



1> 小智..:

Beautiful Soup是一个用于解析网页的Python库.在它和urllib2之间(Python 3中的urllib.request)你应该能够弄清楚你需要什么.



2> Charlie Mart..:

您所询问的内容称为"网页抓取".我敢肯定,如果你在谷歌周围找到一些东西,但核心概念是你想打开一个网站的连接,在HTML中啜饮,解析它并识别你想要的块.

在Python的维基有一个很好的很多东西.

推荐阅读
牛尾巴2010
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有