我的公司正在开始构建基于Web的RSS阅读器,用户可以注册并跟踪提要; 很像Google Reader.
我的第一个想法是,一旦我有某个博客或网站的提要URL,我只需要轮询一次以获取内容,然后将条目插入数据库以供订阅它的任何人使用.
然而; 如果有人使用像FeedBurner这样的服务来跟踪读者统计数据,那么100个读者可以订阅特定的博客或网站,它只会向实际作者显示为1个读者.
为每个订户轮询一次将是一个巨大的不必要的开销,特别是如果一千个用户订阅相同的订阅源.您是否有任何建议,或者是唯一能够快速连续多次轮询相同数据的解决方案?
据我所知,谷歌阅读器以这种方式解决了这个问题:他们客户的用户代理字符串包括通过他们的阅读器读取此提要的订阅者数量.
我不知道FeedBurner或其他工具是否解释了这一点,但理论上至少可以通过这种方式从http日志文件中获取准确的统计信息.
编辑:
根据官方Google Reader文档,其Feed提取程序的User-Agent标头如下所示:
User-Agent: Feedfetcher-Google; (+http://www.google.com/feedfetcher.html; 4 subscribers; feed-id=1794595805790851116)