在Celery中使用Flask的上下文

其实我只是想把邮件发送这个动作移到Celery中执行。
既然用到了Celery,那么每次发邮件都单独开一个线程似乎有点多余,异步任务还是交给Celery吧。

在Flask应用中集成Celery

Celery和Flask一起使用并没有什么不和谐的地方,都可以不用定制的Flask扩展,按照网上随处可见的示例也很简单:

from flask import Flask
from celery import Celery

app = Flask(__name__)
app.config['CELERY_BROKER_URL'] = 'redis://localhost:6379/0'
app.config['CELERY_RESULT_BACKEND'] = 'redis://localhost:6379/0'

celery = Celery(app.name, broker=app.config['CELERY_BROKER_URL'])
celery.conf.update(app.config)

@celery.task
def send_email():
    ....

然而,稍微上点规模的Flask应用都会使用Factory模式,即只有在创建Flask实例时,才会初始化各种扩展,这样可以动态的修改扩展程序的配置。比如你有一套线上部署的配置和一套本地开发测试的配置,希望通过不同的启动入口,就使用不同的配置。
使用Factory模式的话,上面的代码大概要修改成这个样:

from flask import Flask
from celery import Celery

app = Flask(__name__)
celery = Celery()

def create_app(config_name):
    app.config.from_object(config[config_name])
    celery.conf.update(app.config)

通过config_name,来动态调整celery的配置。然而,这样子是不行的!
Celery的__init__()函数会调用celery._state._register_app()直接就通过传入的配置生成了Celery实例,上面的代码中,celery = Celery()直接使用默认的amqp作为了broker,随后通过celery.conf.update(app.config)是更改不了broker的。这也就是为什么网上的示例代码中,在定义Celery实例时,就传入了broker=app.config['CELERY_BROKER_URL'],而不是之后通过celery.conf.update(app.config)传入。当你的多套配置文件中,broker设置的不同时,就悲剧了。

当然不用自己造轮子,Flask-Celery-Helper就是解决以上问题的FLask扩展。
看看它的__init__()函数:

def __init__(self, app=None):
        """If app argument provided then initialize celery using application config values.
        If no app argument provided you should do initialization later with init_app method.
        :param app: Flask application instance.
        """
        self.original_register_app = _state._register_app  # Backup Celery app registration function.
        _state._register_app = lambda _: None  # Upon Celery app registration attempt, do nothing.
        super(Celery, self).__init__()
        if app is not None:
            self.init_app(app)

_state._register_app函数备份,再置为空。这样__init__()就不会创建Celery实例了。但如果指定了app,那么进入init_app,嗯,大多数Flask扩展都有这个函数,用来动态生成扩展实例。

def init_app(self, app):
        """Actual method to read celery settings from app configuration and initialize the celery instance.
        :param app: Flask application instance.
        """
        _state._register_app = self.original_register_app  # Restore Celery app registration function.
        if not hasattr(app, 'extensions'):
            app.extensions = dict()
        if 'celery' in app.extensions:
            raise ValueError('Already registered extension CELERY.')
        app.extensions['celery'] = _CeleryState(self, app)

        # Instantiate celery and read config.
        super(Celery, self).__init__(app.import_name, broker=app.config['CELERY_BROKER_URL'])
        ...

_state._register_app函数还原,再执行Celery原本的__init__。这样就达到动态生成实例的目的了。接着往下看:

task_base = self.Task

# Add Flask app context to celery instance.
class ContextTask(task_base):
    """Celery instance wrapped within the Flask app context."""
    def __call__(self, *_args, **_kwargs):
        with app.app_context():
            return task_base.__call__(self, *_args, **_kwargs)
setattr(ContextTask, 'abstract', True)
setattr(self, 'Task', ContextTask)

这里重载了celery.Task类,通过with app.app_context():,在app.app_context()的上下文环境下执行Task。对于一个已生成的Flask实例,应用上下文不会随便改变。所以这就现实了在Celery中使用Flask的应用上下文。
下面是官方的示例代码:

# extensions.py
from flask_celery import Celery
celery = Celery()

# application.py
from flask import Flask
from extensions import celery

def create_app():
    app = Flask(__name__)
    app.config['CELERY_IMPORTS'] = ('tasks.add_together', )
    app.config['CELERY_BROKER_URL'] = 'redis://localhost'
    app.config['CELERY_RESULT_BACKEND'] = 'redis://localhost'
    celery.init_app(app)
    return app
    
# tasks.py
from extensions import celery

@celery.task()
def add_together(a, b):
    return a + b

# manage.py
from application import create_app
app = create_app()
app.run()

跟普通的Flask扩展一样了。

Celery中使用Flask上下文

在Flask的view函数中调用task.delay()时,这个task相当于一个离线的异步任务,它对Flask的应用上下文和请求上下文一无所知。但是这都可能是异步任务需要用到的。比如发送邮件要用到的render_templateurl_for就分别要用到应用上下文和请求上下文。不在celery中引入它们的话,就是Running code outside of a request
引入应用上下文的工作Flask-Celery-Helper已经帮我们做好了,在Flask的文档中也有相关介绍。实现方法和上面Flask-Celery-Helper的一样。然而,不管是Flask-Celery-Helper还是Flask文档,都没有提及如何在Celery中使用请求上下文。

要引入请求上下文,需要考虑这两个问题:

  1. 如何在Celery中产生请求上下文。Flask中有request_contexttest_request_context可以产生请求上下文。区别是request_context需要WSGI环境变量environ,而test_request_context根据传入的参数生成请求上下文。我没有找到如何在Celery中获取到WSGI环境变量的方法,所以只能自己传入相关参数生成请求上下文了。

  2. 请求上下文是随HTTP请求产生的,要获取请求上下文,就必须在view函数中处理,view函数通过task.delay()发送Celery任务。所以需要重载task.delay(),以获取请求上下文。

具体的思路还是在init_app中重载celery.Task类,通过with app.test_request_context():,在app.test_request_context()的上下文环境下执行Task。
首先获取request,从中整理出test_request_context()需要的参数。根据test_request_context的函数注释,它需要的参数和werkzeug.test.EnvironBuilder类的参数一样。

CONTEXT_ARG_NAME = '_flask_request_context'
def _include_request_context(self, kwargs):
    """Includes all the information about current Flask request context
    as an additional argument to the task.
    """
    if not has_request_context():
        return

    # keys correspond to arguments of :meth:`Flask.test_request_context`
    context = {
        'path': request.path,
        'base_url': request.url_root,
        'method': request.method,
        'headers': dict(request.headers),
        'data': request.form
    }
    if '?' in request.url:
        context['query_string'] = request.url[(request.url.find('?') + 1):]

    kwargs[self.CONTEXT_ARG_NAME] = context

_include_request_context函数从request中提取path,base_url,method,headers,data,query_string。将他们传入test_request_context,生成伪造的请求上下文可以覆盖大多数的使用情况。
Celery通过apply_async,apply,retry调用异步任务(delayapply_async的简化方法)。这里需要重载它们,让这些函数获取request:

def apply_async(self, args=None, kwargs=None, **rest):
    self._include_request_context(kwargs)
    return super(ContextTask, self).apply_async(args, kwargs, **rest)

def apply(self, args=None, kwargs=None, **rest):
    self._include_request_context(kwargs)
    return super(ContextTask, self).apply(args, kwargs, **rest)

def retry(self, args=None, kwargs=None, **rest):
    self._include_request_context(kwargs)
    return super(ContextTask, self).retry(args, kwargs, **rest)

最后重载celery.Task__call__方法:

def __call__(self, *args, **kwargs):
    """Execute task code with given arguments."""
    call = lambda: super(ContextTask, self).__call__(*args, **kwargs)

    context = kwargs.pop(self.CONTEXT_ARG_NAME, None)
    if context is None or has_request_context():
        return call()

    with app.test_request_context(**context):
        result = call()

        # process a fake "Response" so that
        # ``@after_request`` hooks are executed
        app.process_response(make_response(result or ''))

    return result

context是我们从request中获取的参数,将它传给test_request_context,伪造请求上下文,并在这个上下文环境中执行task。既然伪造了请求,那也得为这个假请求生成响应,万一你定义了after_request这个在响应后执行的钩子呢?通过process_response就可以激活after_request
注意这里并没有传入应用上下文,因为Flask在创建请求上下文时,会判断应用上下文是否为空,为空就先创建应用上下文,再创建请求上下文。

完整代码:

celery = CeleryWithContext()创建的Celery实例就可以给各种task使用了。
另外创建一个celery_worker.py文件,生成一个Flask实例,供Celery的worker使用。

# celery_worker.py

#!/usr/bin/env python
from app import create_app
from app.extensions import celery

app = create_app()

启动worker:celery -A celery_worker.celery worker -l info
这下就可以使用Celery发邮件了。唉,还真是麻烦。

reference

http://xion.io/post/code/celery-include-flask-request-context.html

Comments
Write a Comment