14赞

feedparser和谷歌新闻

作者：郑小蒜9299_941611_G | 2023-08-16 13:33

如何解决《feedparser和谷歌新闻》经验，为你挑选了1个好方法。

我正在尝试使用带有python的通用feedparser从Google新闻下载一组新闻(尝试进行一些自然语言处理).我对XML一无所知,我只是使用了如何使用feedparser的示例.问题是我在dict中找不到我从RSS提要获得的新闻内容只是标题.

我目前正在尝试使用的代码是:

import feedparser
url = 'http://news.google.com.br/news?pz=1&cf=all&ned=us&hl=en&output=rss' 
# just some GNews feed - I'll use a specific search later

feed = feedparser.parse(url)
for post in feed.entries:
   print post.title
   print post.keys()

我在这篇文章中得到的关键只是标题,摘要,日期等......没有内容.

这是谷歌新闻的一些问题还是我做错了什么？有办法吗？

1> Bartek..：

您是否检查了Google新闻的Feed？

每个Feed中都有一个根元素,其中包含一堆信息和实际条目.这是一种看待可用内容的肮脏方式:

import feedparser
d = feedparser.parse('http://news.google.com/news?pz=1&cf=all&ned=ca&hl=en&topic=w&output=rss')

print [field for field in d]

从我们可以看到,我们有一个entries很可能包含的字段..新闻条目!如果你:

import pprint
pprint.pprint(entry for entry in d['entries'])

我们得到更多信息:)这将以漂亮的印刷方式显示与每个条目相关的所有字段(这就是pprint的用途)

因此,要从此Feed中获取新闻条目的所有标题:

titles = [entry.title for entry in d['entries']

所以,玩弄它.希望这是一个有用的开始

推荐阅读

程序员
当通过本地apache发送请求时,POST转换为GET

如何解决《当通过本地apache发送请求时,POST转换为GET》经验，为你挑选了0个好方法。 ... [详细]
程序员
具有客户端访问控制的Mongodb docker容器

如何解决《具有客户端访问控制的Mongodbdocker容器》经验，为你挑选了1个好方法。 ... [详细]
程序员
C中for循环中的操作顺序

如何解决《C中for循环中的操作顺序》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么strtod没有以正确的方式工作？

如何解决《为什么strtod没有以正确的方式工作？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从源更新Tensorflow

如何解决《如何从源更新Tensorflow》经验，为你挑选了1个好方法。 ... [详细]
程序员
Browserify/Babelify React用于生产(NODE_ENV生产)

如何解决《Browserify/BabelifyReact用于生产(NODE_ENV生产)》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在弹簧靴中注册自定义转换器？

如何解决《如何在弹簧靴中注册自定义转换器？》经验，为你挑选了0个好方法。 ... [详细]
程序员
我想在CXF codegen上添加@XmlRoot注释

如何解决《我想在CXFcodegen上添加@XmlRoot注释》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在夜班表测试中绕过人员检查？

如何解决《如何在夜班表测试中绕过人员检查？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何最小化webpack捆绑的大小？

如何解决《如何最小化webpack捆绑的大小？》经验，为你挑选了3个好方法。 ... [详细]
程序员
如何计算所选元素的数量？

如何解决《如何计算所选元素的数量？》经验，为你挑选了1个好方法。 ... [详细]
程序员
CKModifyRecordsOperation modifyRecordsCompletionBlock未被调用

如何解决《CKModifyRecordsOperationmodifyRecordsCompletionBlock未被调用》经验，为你挑选了1个好方法。 ... [详细]
程序员
sql否定运算符:!= vs <>

如何解决《sql否定运算符:!=vs<>》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么"a:悬停必须来自:链接和a:访问过(w3school)"？

如何解决《为什么"a:悬停必须来自:链接和a:访问过(w3school)"？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java QueryDsl是否为“更新myTable其中myColumn在（'有趣'，'值'）中”？

如何解决《JavaQueryDsl是否为“更新myTable其中myColumn在（'有趣'，'值'）中”？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Django：将用户上传内容保存在单独的文件夹中

如何解决《Django：将用户上传内容保存在单独的文件夹中》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android AlertDialog标题背景颜色

如何解决《AndroidAlertDialog标题背景颜色》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在阿达的unix时代获得秒数？

如何解决《如何在阿达的unix时代获得秒数？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Swift中运算符' - '与'abs()'的模糊使用

如何解决《Swift中运算符'-'与'abs()'的模糊使用》经验，为你挑选了1个好方法。 ... [详细]
程序员
LLVM中的抽象解释

如何解决《LLVM中的抽象解释》经验，为你挑选了0个好方法。 ... [详细]

郑小蒜9299_941611_G

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章