我想写一个程序,找到公共汽车站的时间并相应地更新我的个人网页.
如果我手动这样做,我会的
访问www.calgarytransit.com
输入一个停止号码.即)9510
点击"下一班巴士"按钮
结果可能如下所示:
10:16p Route 154
10:46p Route 154
11:32p Route 154
一旦我抓住了时间和路线,我就会相应地更新我的网页.
我不知道从哪里开始.我知道他们对网络编程很沮丧,但可以编写一些C和Python.我可以研究哪些主题/库?
Beautiful Soup是一个用于解析网页的Python库.在它和urllib2之间(Python 3中的urllib.request)你应该能够弄清楚你需要什么.
您所询问的内容称为"网页抓取".我敢肯定,如果你在谷歌周围找到一些东西,但核心概念是你想打开一个网站的连接,在HTML中啜饮,解析它并识别你想要的块.
在Python的维基有一个很好的很多东西.