18赞

python使用心得之获得github代码库列表

作者：吻过彩虹的脸_378 | 2021-09-08 08:45

最近接了个项目，要求获得github的repo的api，度娘了一下，有不少文章介绍，总结了本文，分享给大家并附上代码

1.背景

项目需求，要求获得github的repo的api，以便可以提取repo的数据进行分析。研究了一天，终于解决了这个问题，虽然效率还是比较低下。

因为github的那个显示repo的api，列出了每个repo的详细信息，而且是json格式的。现在貌似还没有找到可以分析多个json格式数据的方法，所以用的是比较蠢得splite加re的方法。如果大家有更好的方法，不发留言讨论！

2.代码

import re
import os

def GetUrl(num):
 str = os.popen("curl -G https://api.github.com/repositories?since=%d"%(num)).read()
 pattern = '"url"'
 pattern1='repos'
 urls=str.split(',\n')  
 for i in urls:
  if pattern in i and pattern1 in i:   
#  text1=i.splite(':')
  text=re.compile('"(.*?)"').findall(i)[1]
  print text
if __name__=='__main__':
 GetUrl(1000)

其中num的值指的是页面的id，我们可以做一个循环，不断增大num的值，就可以无限提取repo。因为github的api对于流量是有限制的，所以这么做是一个可行的方法。

效果如下（提取下来的repo的api地址）：

https://api.github.com/repos/wycats/merb-core

https://api.github.com/repos/rubinius/rubinius

https://api.github.com/repos/mojombo/god

https://api.github.com/repos/vanpelt/jsawesome

https://api.github.com/repos/wycats/jspec

https://api.github.com/repos/defunkt/exception_logger

https://api.github.com/repos/defunkt/ambition

https://api.github.com/repos/technoweenie/restful-authentication

https://api.github.com/repos/technoweenie/attachment_fu

https://api.github.com/repos/topfunky/bong

https://api.github.com/repos/Caged/microsis

https://api.github.com/repos/anotherjesse/s3

https://api.github.com/repos/anotherjesse/taboo

https://api.github.com/repos/anotherjesse/foxtracs

https://api.github.com/repos/anotherjesse/fotomatic

https://api.github.com/repos/mojombo/glowstick

https://api.github.com/repos/defunkt/starling

https://api.github.com/repos/wycats/merb-more

https://api.github.com/repos/macournoyer/thin

https://api.github.com/repos/jamesgolick/resource_controller

https://api.github.com/repos/jamesgolick/markaby

https://api.github.com/repos/jamesgolick/enum_field

https://api.github.com/repos/defunkt/subtlety

https://api.github.com/repos/defunkt/zippy

https://api.github.com/repos/defunkt/cache_fu

https://api.github.com/repos/KirinDave/phosphor

推荐阅读

程序员
使用Symfony 2.8进行LDAP身份验证

如何解决《使用Symfony2.8进行LDAP身份验证》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么align-self:伸展不能在flex项目上工作？

如何解决《为什么align-self:伸展不能在flex项目上工作？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在SceneKit中缩放SCNNode

如何解决《在SceneKit中缩放SCNNode》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在多主机之间创建docker overlay网络？

如何解决《如何在多主机之间创建dockeroverlay网络？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Javascript数组初始化行为

如何解决《Javascript数组初始化行为》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何以编程方式为outlook生成电子邮件线程？

如何解决《如何以编程方式为outlook生成电子邮件线程？》经验，为你挑选了0个好方法。 ... [详细]
程序员
无法使用jQuery UI的日期选择器设置默认日期

如何解决《无法使用jQueryUI的日期选择器设置默认日期》经验，为你挑选了1个好方法。 ... [详细]
程序员
在C++中将十六进制转换为整数的最快方法是什么？

如何解决《在C++中将十六进制转换为整数的最快方法是什么？》经验，为你挑选了2个好方法。 ... [详细]
程序员
对于JavaScript事件,泡沫比捕获更好吗？

如何解决《对于JavaScript事件,泡沫比捕获更好吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在python中有效地扩展数组？

如何解决《如何在python中有效地扩展数组？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Spark SQL - 使用SQL语句而不是表名来使用JDBC加载数据

如何解决《SparkSQL-使用SQL语句而不是表名来使用JDBC加载数据》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用AMP HTML搜索可能吗？

如何解决《使用AMPHTML搜索可能吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
从数组中删除对象 - 两种不同的方法,在查询每个数组的长度时有两种不同的结果

如何解决《从数组中删除对象-两种不同的方法,在查询每个数组的长度时有两种不同的结果》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在绘图的文本注释(ggplot2)中放置+/-加减运算符？

如何解决《如何在绘图的文本注释(ggplot2)中放置+/-加减运算符？》经验，为你挑选了2个好方法。 ... [详细]
程序员
Visual Studio搜索和替换行结尾

如何解决《VisualStudio搜索和替换行结尾》经验，为你挑选了2个好方法。 ... [详细]
程序员
Silverstripe 3.2可重复使用的块

如何解决《Silverstripe3.2可重复使用的块》经验，为你挑选了1个好方法。 ... [详细]
程序员
即使在大括号中也显示strace中的完整参数

如何解决《即使在大括号中也显示strace中的完整参数》经验，为你挑选了2个好方法。 ... [详细]
程序员
有没有办法在这里省略特征的生命周期？

如何解决《有没有办法在这里省略特征的生命周期？》经验，为你挑选了1个好方法。 ... [详细]
程序员
异步/等待不等待

如何解决《异步/等待不等待》经验，为你挑选了1个好方法。 ... [详细]
程序员
CSS类恢复为非活动状态

如何解决《CSS类恢复为非活动状态》经验，为你挑选了1个好方法。 ... [详细]

吻过彩虹的脸_378

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章