当前位置:  开发笔记 > 编程语言 > 正文

从Twitter中提取多页搜索词

如何解决《从Twitter中提取多页搜索词》经验,为你挑选了1个好方法。

我试图通过PHP和Twitter搜索api找出一种方法来获取特定搜索词的所有推文.

所以功能包括1.包括搜索词2.从每个页面中拉出术语.3.仅从上次搜索中提取新术语4.导出到数据库或平面文件.

除了遍历多个页面之外,我对所有这些都非常清楚



1> great_llama..:

twitter API采用页码参数.在atom结果中,有链接元素,具有next和previous的rel属性.这将是您是否应该去寻找第二页等的最佳指标.该标记的href属性甚至会告诉您应该请求的URL.

您创建的查询也采用since_id参数.您需要存储在响应中看到的最大ID号,并在后续请求中使用它,这样您就不必过滤重复项.

至于数据存储,您的选择可能最好以您计划对结果进行的操作为指导...如果您要进行任何查询,您应该将其归档到数据库中,即MySQL.如果您只是记录,平面文件应该没问题.

推荐阅读
爱唱歌的郭少文_
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有