我正在使用RSS库,因此我可以在Ruby和Rails中解析Atom和RSS并将其存储在模型中.我看过标准的RSS库,但是有一个库会自动检测到有一个新的RSS源,所以我可以更新我的数据库吗?
触发指令以存储新rss feed的最佳做法是什么?我应该使用线程来处理这个问题吗?它会变慢吗?谢谢您的帮助
好的,这是交易.
如果你想要一个真正的快速饲料解析器去Feedzirra.在Windows上不起作用.http://github.com/pauldix/feedzirra
自动发现?
-resres truffle-hog如果你不想做GET重定向.http://github.com/pauldix/truffle-hog
-Theres feedbag如果你想做GET重定向来找到来自给定网址的提要.但这比较慢.http://github.com/damog/feedbag
如果您想要查询Feed的新条目,Feedzirra是最好的选择.但是如果你想要一个更加非轮询的解决方案来解决你的问题,那么我建议你通过pubsubhubbub规范.确保在解析您的Feed时,他们启用了pubsubhubbub.检查链接标记.如果它指向pubsubhubbub.appspot.com或任何其他启用pubsub的集线器,则只需通过向集线器发送订阅请求来订阅源.然后,您可以在应用中定义端点,该端点将从集线器接收订阅源的更新输入ping.只需读取原始POST数据并将其存储在数据库中即可.统计数据显示,95%的博客博客都是pubsub.这已经掌握了很多数据.:)
如果要轮询更改,则应检查标题中的last-modified或etag,而不是再次解析整个Feed.让您免于浪费资源.Feedzirra会为您解决这个问题.