8赞

python使用心得之获得github代码库列表- Python教程

作者：大大炮 | 2021-09-03 01:51

最近接了个项目，要求获得github的repo的api，度娘了一下，有不少文章介绍，总结了本文，分享给大家并附上代码

1.背景

项目需求，要求获得github的repo的api，以便可以提取repo的数据进行分析。研究了一天，终于解决了这个问题，虽然效率还是比较低下。

因为github的那个显示repo的api，列出了每个repo的详细信息，而且是json格式的。现在貌似还没有找到可以分析多个json格式数据的方法，所以用的是比较蠢得splite加re的方法。如果大家有更好的方法，不发留言讨论！

2.代码

import re
import os

def GetUrl(num):
 str = os.popen("curl -G https://api.github.com/repositories?;since=%d"%(num)).read()
 pattern = '"url"'
 pattern1='repos'
 urls=str.split(',\n')  
 for i in urls:
  if pattern in i and pattern1 in i:   
#  text1=i.splite(':')
  text=re.compile('"(.*?)"').findall(i)[1]
  print text
if __name__=='__main__':
 GetUrl(1000)

其中num的值指的是页面的id，我们可以做一个循环，不断增大num的值，就可以无限提取repo。因为github的api对于流量是有限制的，所以这么做是一个可行的方法。

效果如下（提取下来的repo的api地址）：

https://api.github.com/repos/wycats/merb-core

https://api.github.com/repos/rubinius/rubinius

https://api.github.com/repos/mojombo/god

https://api.github.com/repos/vanpelt/jsawesome

https://api.github.com/repos/wycats/jspec

https://api.github.com/repos/defunkt/exception_logger

https://api.github.com/repos/defunkt/ambition

https://api.github.com/repos/technoweenie/restful-authentication

https://api.github.com/repos/technoweenie/attachment_fu

https://api.github.com/repos/topfunky/bong

https://api.github.com/repos/Caged/microsis

https://api.github.com/repos/anotherjesse/s3

https://api.github.com/repos/anotherjesse/taboo

https://api.github.com/repos/anotherjesse/foxtracs

https://api.github.com/repos/anotherjesse/fotomatic

https://api.github.com/repos/mojombo/glowstick

https://api.github.com/repos/defunkt/starling

https://api.github.com/repos/wycats/merb-more

https://api.github.com/repos/macournoyer/thin

https://api.github.com/repos/jamesgolick/resource_controller

https://api.github.com/repos/jamesgolick/markaby

https://api.github.com/repos/jamesgolick/enum_field

https://api.github.com/repos/defunkt/subtlety

https://api.github.com/repos/defunkt/zippy

https://api.github.com/repos/defunkt/cache_fu

https://api.github.com/repos/KirinDave/phosphor

推荐阅读

程序员
将ISO 639-1转换为ISO 639-2

如何解决《将ISO639-1转换为ISO639-2》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何缓存读取？

如何解决《如何缓存读取？》经验，为你挑选了1个好方法。 ... [详细]
程序员
你能根据`Monads`来定义`Comonads`吗？

如何解决《你能根据`Monads`来定义`Comonads`吗？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Apple推送通知无法在生产中使用

如何解决《Apple推送通知无法在生产中使用》经验，为你挑选了0个好方法。 ... [详细]
程序员
拖放(事件)不会触发ajax POST

如何解决《拖放(事件)不会触发ajaxPOST》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用OpenCV在棋盘中检测中国象棋棋子

如何解决《使用OpenCV在棋盘中检测中国象棋棋子》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何访问ListBox中所选项的属性并将其粘贴到TextBox中

如何解决《如何访问ListBox中所选项的属性并将其粘贴到TextBox中》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python正则表达式在内部找到并替换

如何解决《Python正则表达式在内部找到并替换》经验，为你挑选了1个好方法。 ... [详细]
程序员
通过PInvoke"Hello World"

如何解决《通过PInvoke"HelloWorld"》经验，为你挑选了1个好方法。 ... [详细]
程序员
美丽的汤元内容标记

如何解决《美丽的汤元内容标记》经验，为你挑选了1个好方法。 ... [详细]
程序员
随机分类的数字到变量

如何解决《随机分类的数字到变量》经验，为你挑选了1个好方法。 ... [详细]
程序员
iOS 9自定义转换 - 未调用animationControllerForDismissedController

如何解决《iOS9自定义转换-未调用animationControllerForDismissedController》经验，为你挑选了1个好方法。 ... [详细]
程序员
将JSON反序列化为对象C#

如何解决《将JSON反序列化为对象C#》经验，为你挑选了1个好方法。 ... [详细]
程序员
d3访问分组条形图中的嵌套数据

如何解决《d3访问分组条形图中的嵌套数据》经验，为你挑选了1个好方法。 ... [详细]
程序员
Dynamics CRM 2013图表DrillDown排序

如何解决《DynamicsCRM2013图表DrillDown排序》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在Visual Studio 2015中切换已登录的用户？

如何解决《如何在VisualStudio2015中切换已登录的用户？》经验，为你挑选了1个好方法。 ... [详细]
程序员
是不是可以为ForkJoinPool提供线程库或名称模式？

如何解决《是不是可以为ForkJoinPool提供线程库或名称模式？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Flask:如何在蓝图中的每个路径之前运行方法？

如何解决《Flask:如何在蓝图中的每个路径之前运行方法？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Textarea字段在提交时返回空

如何解决《Textarea字段在提交时返回空》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在OSx更新后修复损坏的python 2.7.11

如何解决《如何在OSx更新后修复损坏的python2.7.11》经验，为你挑选了2个好方法。 ... [详细]

大大炮

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章