Eventlet 协程并发:为何顺序执行而非并行?
使用 Eventlet 进行并发请求时,常常出现看似顺序执行而非并行的情况。这通常源于对 Eventlet 及其与阻塞型 I/O 操作交互方式的误解。
问题根源:阻塞 I/O 与 GreenPool
Eventlet 的 GreenPool
允许同时运行多个任务。然而,如果任务中包含阻塞 I/O 操作(例如,使用 urllib.request.urlopen
进行网络请求),该操作会阻塞整个 GreenPool
,导致其他任务无法并发执行。
解决方案:非阻塞 I/O 与 Monkey Patching
解决方法主要在于:
使用非阻塞 I/O 库: 避免使用阻塞型库如 urllib.request
。推荐使用 requests
等异步或协程友好的 HTTP 客户端库,它们能够执行非阻塞网络请求。
应用 Eventlet 的 monkey_patch
: monkey_patch
将标准库中的函数替换为 Eventlet 的协程版本。这对于在 Eventlet 环境中使用原本阻塞的库至关重要,例如将 urllib.request
替换为 eventlet.http
。
示例代码:使用 requests 库实现真正的并发
以下代码演示如何使用 requests
库和 Eventlet 实现真正的并发请求:
import eventlet
import requests
eventlet.monkey_patch() # 关键步骤:应用 monkey_patch
urls = [
"http://localhost:5000/",
"http://localhost:5000/",
"http://localhost:5000/",
]
def fetch(url: str) -> str:
response = requests.get(url)
response.raise_for_status() # 检查HTTP状态码
return response.text
pool = eventlet.GreenPool(1000)
for body in pool.imap(fetch, urls):
print("获取内容:", len(body), body)
执行结果:
正确使用 requests
和 monkey_patch
后,请求将并行执行,总执行时间将显著缩短,接近于单个请求时间的几倍(取决于服务器响应速度)。
通过以上改进,您可以充分利用 Eventlet 的并发能力,避免阻塞 I/O 导致的性能瓶颈,实现真正的并行网络请求。 记住 eventlet.monkey_patch()
是关键,它使得 requests
在 Eventlet 协程环境下能够正确工作。