App Engine上的后台任务

作者：携手相约幸福 | 2023-09-04 17:44

如何解决《AppEngine上的后台任务》经验，为你挑选了2个好方法。

如何在App Engine上运行后台任务？

1> Jason Rikard..：

您可以使用Task Queue Python API.

2> 小智..：

GAE是构建可伸缩Web应用程序的非常有用的工具.许多人指出的限制不支持后台任务,缺乏周期性任务以及严格限制每个HTTP请求花费的时间,如果请求超过该时间限制操作终止,这使得运行耗时的任务变得不可能.

如何运行后台任务？
在GAE中,仅在存在HTTP请求时才执行代码.关于代码可以花多长时间有一个严格的时间限制(我想10秒).因此,如果没有请求,则不执行代码.建议的工作之一是使用外部框连续发送请求,因此创建后台任务.但为此我们需要一个外部盒子,现在我们依赖于另外一个元素.另一种方法是发送302重定向响应,以便客户端重新发送请求,这也使我们依赖于客户端的外部元素.如果外部盒子是GAE本身怎么办？在语言中使用不支持循环构造的函数式语言的每个人都知道替代方法,即递归是循环的替代.那么如果我们完成部分计算并在同一个网址上进行HTTP GET并且时间非常短,比如1秒呢？这会在运行在apache上的php代码上创建一个循环(递归).

一些如何在GAE上不起作用.那么,如果我们在其他网址上执行HTTP GET,请说url2在第一个网址上执行HTTP GET会怎么样？这似乎适用于GAE.代码就是这样的.

class FirstUrl(webapp.RequestHandler):
    def get(self):
        self.response.out.write("ok")
        time.sleep(2)
        urlfetch.fetch("http://"+self.request.headers["HOST"]+'/url2')

class SecondUrl(webapp.RequestHandler):
    def get(self):
        self.response.out.write("ok")
        time.sleep(2)
        urlfetch.fetch("http://"+self.request.headers["HOST"]+'/url1')

application = webapp.WSGIApplication([('/url1', FirstUrl), ('/url2', SecondUrl)])
def main():
    run_wsgi_app(application)
if __name__ == "__main__":
    main()

由于我们找到了运行后台任务的方法,因此我们可以为周期性任务(计时器)和跨越许多HTTP请求(foreach)的循环结构构建抽象.

Timer
Now建立计时器是直截了当的.基本思想是列出计时器列表和每个计时器的间隔.一旦达到该间隔,就调用回调函数.我们将使用memcache来维护计时器列表.为了找出何时调用回调,我们将把一个密钥存储在memcache中,间隔为到期时间.我们定期(比如5secs)检查该密钥是否存在,如果不存在则调用回调并再次设置该密钥.

def timer(func, interval):
    timerlist = memcache.get('timer')
    if(None == timerlist):
        timerlist = []
    timerlist.append({'func':func, 'interval':interval})
    memcache.set('timer-'+func, '1', interval)
    memcache.set('timer', timerlist)

def checktimers():
    timerlist = memcache.get('timer')
    if(None == timerlist):
        return False
    for current in timerlist:
        if(None == memcache.get('timer-'+current['func'])):
            #reset interval
            memcache.set('timer-'+current['func'], '1', current['interval'])
            #invoke callback function
            try:
                eval(current['func']+'()')
            except:
                pass
            return True
    return False

Foreach
当需要长时间计算时,需要对1000个数据库行进行一些操作或获取1000个URL等,这是必需的.基本思路是维护memcache中的回调和参数列表,并且每次使用参数调用回调.

def foreach(func, args):
    looplist = memcache.get('foreach')
    if(None == looplist):
        looplist = []
    looplist.append({'func':func, 'args':args})
    memcache.set('foreach', looplist)

def checkloops():
    looplist = memcache.get('foreach')
    if(None == looplist):
        return False
    if((len(looplist) > 0) and (len(looplist[0]['args']) > 0)):
        arg = looplist[0]['args'].pop(0)
        func = looplist[0]['func']
        if(len(looplist[0]['args']) == 0):
            looplist.pop(0)
        if((len(looplist) > 0) and (len(looplist[0]['args']) > 0)):
            memcache.set('foreach', looplist)
        else:
            memcache.delete('foreach')
        try:
            eval(func+'('+repr(arg)+')')
        except:
            pass
        return True
    else:
        return False

# instead of
# foreach index in range(0, 1000):
#   someoperaton(index)
# we will say
# foreach('someoperaton', range(0, 1000))

现在建立一个每小时获取网址列表的程序是直截了当的.这是代码.

def getone(url):
    try:
        result = urlfetch.fetch(url)
        if(result.status_code == 200):
            memcache.set(url, '1', 60*60)
            #process result.content
    except :
        pass

def getallurl():
    #list of urls to be fetched
    urllist = ['http://www.google.com/', 'http://www.cnn.com/', 'http://www.yahoo.com', 'http://news.google.com']
    fetchlist = []
    for url in urllist:
        if (memcache.get(url) is None):
            fetchlist.append(url)
    #this is equivalent to
    #for url in fetchlist: getone(url)
    if(len(fetchlist) > 0):
        foreach('getone', fetchlist)

#register the timer callback
timer('getallurl', 3*60)

完整的代码在这里http://groups.google.com/group/httpmr-discuss/t/1648611a54c01aa 我已经在appengine上运行这段代码几天没有太大问题.

警告:我们大量使用urlfetch.每天urlfetch的限制是160000.所以要小心不要达到这个限制.

使用新的Task API或Cron API.不要使用上面的那些.

推荐阅读

程序员
名称中的React native Image变量不起作用

如何解决《名称中的ReactnativeImage变量不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么使用dotenv库而不是解析ini文件？

如何解决《为什么使用dotenv库而不是解析ini文件？》经验，为你挑选了0个好方法。 ... [详细]
程序员
打印免费monad

如何解决《打印免费monad》经验，为你挑选了1个好方法。 ... [详细]
程序员
提取/读取React propTypes

如何解决《提取/读取ReactpropTypes》经验，为你挑选了1个好方法。 ... [详细]
程序员
SBT - 如何禁用特定任务的插件(例如"包")

如何解决《SBT-如何禁用特定任务的插件(例如"包")》经验，为你挑选了0个好方法。 ... [详细]
程序员
一个小游戏/测验:你看到我的价值观了吗？(解释十六进制值)

如何解决《一个小游戏/测验:你看到我的价值观了吗？(解释十六进制值)》经验，为你挑选了0个好方法。 ... [详细]
程序员
"粘性"选择Angular应用程序

如何解决《"粘性"选择Angular应用程序》经验，为你挑选了1个好方法。 ... [详细]
程序员
Symfony2从事件中更改Form data_class

如何解决《Symfony2从事件中更改Formdata_class》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何将"dd/MM/yyyy"字符串转换为DateTime

如何解决《如何将"dd/MM/yyyy"字符串转换为DateTime》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android中的@UiThread和@MainThread注释有什么区别？

如何解决《Android中的@UiThread和@MainThread注释有什么区别？》经验，为你挑选了1个好方法。 ... [详细]
程序员
DataTables:无法读取未定义的属性"长度"

如何解决《DataTables:无法读取未定义的属性"长度"》经验，为你挑选了4个好方法。 ... [详细]
程序员
滚动条到达面板底部时的触发事件

如何解决《滚动条到达面板底部时的触发事件》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在使用PHP上传图像之前检查/修复图像旋转

如何解决《如何在使用PHP上传图像之前检查/修复图像旋转》经验，为你挑选了1个好方法。 ... [详细]
程序员
Ansible在角色之间共享文件

如何解决《Ansible在角色之间共享文件》经验，为你挑选了2个好方法。 ... [详细]
程序员
仅在填写所有详细信息后才能显示按钮

如何解决《仅在填写所有详细信息后才能显示按钮》经验，为你挑选了1个好方法。 ... [详细]
程序员
Grunt,Gulp.js和Bower有什么区别？为什么以及何时使用它们？

如何解决《Grunt,Gulp.js和Bower有什么区别？为什么以及何时使用它们？》经验，为你挑选了4个好方法。 ... [详细]
程序员
调试Visual Studio本机测试项目

如何解决《调试VisualStudio本机测试项目》经验，为你挑选了0个好方法。 ... [详细]
程序员
是否可以用C++编写自定义转换操作符(如`static_cast`)？

如何解决《是否可以用C++编写自定义转换操作符(如`static_cast`)？》经验，为你挑选了1个好方法。 ... [详细]
程序员
自我训练算法

如何解决《自我训练算法》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何使用存储过程将oracle表数据转换为单独的xml文件

如何解决《如何使用存储过程将oracle表数据转换为单独的xml文件》经验，为你挑选了1个好方法。 ... [详细]

携手相约幸福

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章