使用feedparser或其他一些Python库来下载和解析RSS提要; 我怎样才能可靠地检测new
物品和modified
物品?
到目前为止,我已经看到Feed中的新项目,其发布日期早于最新项目.此外,我看到饲料阅读器显示相同的项目发布时内容略有不同作为单独的项目.我没有实现提要阅读器应用程序,我只想要一个合理的策略来存档提要数据.
这取决于您对饲料来源的信任程度.feedparser为feed项提供.id属性 - 对于RSS和ATOM源,此属性应该是唯一的.有关示例,请参阅feedparser的ATOM文档.尽管.id将涵盖大多数情况,但可以想象源可能会发布具有相同ID的多个项目.在这种情况下,您没有太多选择,只能散列项目的内容.