性能比拼: Go标准库 vs Python FastAPI(第二轮)

本内容是对知名性能评测博主 Anton Putra Python (FastAPI) vs Go (Golang) (Round 2) Performance Benchmark 内容的翻译与整理, 有适当删减, 相关指标和结论以原作为准

介绍

这是第二轮关于 FastAPI 和 Golang 的对比测试。我几天前运行了前一次的基准测试，到目前为止，我已经收到了 13 个关于 Python 性能改进的 Pull Request。如果你是一名开发者，我建议你先观看之前的基准测试，并对比视频描述中提供的源码和所有的 Pull Request，这样可以帮助你避免我在上一次基准测试中犯的错误。

在第一轮测试中，我们将测量以下指标：

使用 90% 分位数 测量客户端每个请求的延迟。
使用每秒请求数（Requests Per Second）来衡量吞吐量。
应用程序的 CPU 使用率。
内存使用情况。
可用性或错误率。
CPU 限制（CPU Throttling）情况。
这些测试将在 AWS 的生产级 Kubernetes 集群中运行。

在第二轮测试中，我们将模拟一个真实的用例：应用程序接收请求后，将数据保存到关系型数据库中，并使用缓存来提高性能。数据库使用 Postgres 17.2，缓存使用 Memcached。如果你感兴趣，可以观看我之前对比 Redis 和 Memcached 的视频结果（结果差距很大）。

所有的基准测试都在 AWS 上运行，使用了不同类型的 EC2 实例。目前，我主要使用基于 ARM 架构的 Graviton 实例，因为它们价格更低。

Postgres 使用存储优化型的 i8g.large 实例。
缓存使用 m8g.large 实例。
Kubernetes 集群中的监控组件（如 Prometheus 和 Grafana）及负载生成客户端，运行在计算优化型实例上。
每个应用程序运行在专用虚拟机上，使用了 m7a.large 实例，并通过 Tolerations 和 Affinity 设置实现隔离(以能够使它们运行在自己专用的虚拟机上面)。

AWS 的费用不低，为了支持我的频道和支付这些基础设施成本，我提供一对一咨询和其他服务。详情请查看视频描述。

第一轮测试（静态内容）

好了，让我们开始第一轮测试。这是第二轮测试了，我建议你先观看使用未经优化的 Python 代码进行的第一次基准测试，然后与这次测试进行对比。在第一轮测试中，我们让应用返回硬编码的对象。

这次测试中：

我使用了 FastAPI 推荐的默认 Web 服务器 Uvicorn，并配置了两个工作线程（workers）。
端点使用了异步处理（Async Handler）。

虽然在第一次基准测试中性能稍好，但最终还是失败了并恢复运行。

在这次测试中，性能稍微更稳定，但只能达到 每秒 11,000 请求。虽然差距不是很大，但对性能还是有影响。在运行到每秒约 11,000 请求时，由于 CPU 限制，开始出现失败，延迟大幅上升，可用性下降。

我原本期望经过这些优化和收到的众多 Pull Request（你可以在视频描述中找到所有这些 Pull Request），性能会更好。不过，我会继续运行测试，直到 Go 应用程序也开始出现失败。

Golang 的表现依旧出色，可以达到 每秒 60,000 到 65,000 请求，这是非常不错的性能。虽然不是最顶尖的，但一些语言（比如 Rust 和 Zig）在类似测试中可以达到 每秒 100,000 请求。但无论如何，在这次测试中，Go 的效率远远高于 FastAPI。