使用 AppSignal 在 Django 中查找并修复 N+ueries

hao123数码23/12/2024 10:49:0500

在本文中，您将了解 n 1 查询、如何使用 appsignal 检测它们，以及如何修复它们以显着加快 django 应用程序的速度。

我们将从理论方面开始，然后转向实际示例。实际示例将反映您在生产环境中可能遇到的场景。

让我们开始吧！

什么是n 1查询？

n 1 查询问题是与数据库交互的 web 应用程序中普遍存在的性能问题。这些查询可能会导致严重的瓶颈，并且随着数据库的增长而加剧。

当您检索对象集合，然后访问集合中每个项目的相关对象时，就会出现问题。例如，获取书籍列表需要单个查询（1 个查询），但访问每本书的作者会触发对每个项目的额外查询（n 个查询）。

在数据库中创建或更新数据时也可能会出现 n 1 问题。例如，通过循环迭代来单独创建或更新对象，而不是使用bulk_create() 或bulk_update() 等方法，可能会导致过多的查询。

n 1 查询效率极低，因为执行大量小查询比将操作合并为更少、更大的查询要慢得多，而且更耗费资源。

django 的默认 queryset 行为可能会无意中导致 n 1 问题，特别是如果您不知道 queryset 的工作原理的话。 django 中的查询集是惰性的，这意味着在计算查询集之前不会执行任何数据库查询。

先决条件

确保您拥有：

python 3.9 和 git 安装在本地计算机上
支持 appsignal 的操作系统
appsignal 帐户

注意：此项目的源代码可以在 appsignal-django-n-plus-one github 存储库中找到。

项目设置

我们将使用图书管理网络应用程序。该 web 应用程序旨在演示 n 1 查询问题以及如何解决它。

首先克隆 github 存储库的基础分支：

$ git clone git@github.com:duplxey/appsignal-django-n-plus-one.git 
    --single-branch --branch base && cd appsignal-django-n-plus-one

登录后复制

接下来，创建并激活虚拟环境：

$ python3 -m venv venv && source venv/bin/activate

登录后复制

安装要求：

(venv)$ pip install -r requirements.txt

登录后复制

迁移并填充数据库：

(venv)$ python manage.py migrate
(venv)$ python manage.py populate_db

登录后复制

最后，启动开发服务器：

(venv)$ python manage.py runserver

登录后复制

打开您最喜欢的网络浏览器并导航到http://localhost:8000/books.网络应用程序应从数据库返回包含 500 本书的 json 列表。

可通过 http://localhost:8000/admin. 访问 django 管理站点，管理员凭据为：

user: username
pass: password

登录后复制

为 django 安装 appsignal

要在 django 项目上安装 appsignal，请按照官方文档操作：

appsignal python 安装
appsignal django 检测
appsignal sqlite 工具

通过重新启动开发服务器确保一切正常：

(venv)$ python manage.py runserver

登录后复制

您的应用程序应自动向 appsignal 发送演示错误。从此时起，您的所有错误都将发送到 appsignal。此外，appsignal 将监控您应用的性能并检测任何问题。

网络应用程序逻辑

修复 n 1 查询的先决条件是了解应用程序的数据库架构。密切关注模型的关系：它们可以帮助您查明潜在的 n 1 问题。

型号

web 应用程序有两个模型 - 作者和书籍 - 它们共享一对多 (1:m) 关系。这意味着每本书都与一个作者相关联，而一个作者可以链接到多本书。

两个模型都有一个 to_dict() 方法，用于将模型实例序列化为 json。最重要的是，book 模型使用深度序列化（序列化书籍以及书籍的作者）。

模型在 books/models.py 中定义：

# books/models.py
class author(models.model):
    first_name = models.charfield(max_length=64)
    last_name = models.charfield(max_length=64)
    birth_date = models.datefield()

    def full_name(self):
        return f"{self.first_name} {self.last_name}"

    def to_dict(self):
        return {
            "id": self.id,
            "first_name": self.first_name,
            "last_name": self.last_name,
            "birth_date": self.birth_date,
        }

    def __str__(self):
        return f"{self.first_name} {self.last_name}"


class book(models.model):
    title = models.charfield(max_length=128)
    author = models.foreignkey(
        to=author,
        related_name="books",
        on_delete=models.cascade,
    )
    summary = models.textfield(max_length=512, blank=true, null=true)
    isbn = models.charfield(max_length=13, unique=true, help_text="isbn-13")
    published_at = models.datefield()

    def to_dict(self):
        return {
            "id": self.id,
            "title": self.title,
            "author": self.author.to_dict(),
            "summary": self.summary,
            "isbn": self.isbn,
            "published_at": self.published_at,
        }

    def __str__(self):
        return f"{self.author}: {self.title}"

登录后复制

然后它们在 books/admin.py 中注册 django 管理站点，如下所示：

# books/admin.py
class bookinline(admin.tabularinline):
    model = book
    extra = 0


class authoradmin(admin.modeladmin):
    list_display = ["full_name", "birth_date"]
    inlines = [bookinline]


class bookadmin(admin.modeladmin):
    list_display = ["title", "author", "published_at"]


admin.site.register(author, authoradmin)
admin.site.register(book, bookadmin)

登录后复制

请注意，authoradmin 使用 bookinline 在作者的管理页面中显示作者的书籍。

意见

网络应用程序提供以下端点：

/books/ 返回书籍列表
/books// 返回特定的书籍
/books/by-authors/ 返回按作者分组的书籍列表
/books/authors/ 返回作者列表
/books/authors// 返回特定作者

如果您正在运行开发网络服务器，则可以单击上面的链接。

它们在 books/views.py 中定义如下：

# books/views.py
def book_list_view(request):
    books = book.objects.all()
    return jsonresponse(
        {
            "count": books.count(),
            "results": [book.to_dict() for book in books],
        }
    )


def book_details_view(request, book_id):
    try:
        book = book.objects.get(id=book_id)
        return jsonresponse(book.to_dict())
    except book.doesnotexist:
        return jsonresponse({"error": "book not found"}, status=404)


def book_by_author_list_view(request):
    try:
        authors = author.objects.all()
        return jsonresponse(
            {
                "count": authors.count(),
                "results": [
                    {
                        "author": author.to_dict(),
                        "books": [book.to_dict() for book in author.books.all()],
                    }
                    for author in authors
                ],
            }
        )
    except author.doesnotexist:
        return jsonresponse({"error": "author not found"}, status=404)


def author_list_view(request):
    authors = author.objects.all()
    return jsonresponse(
        {
            "count": authors.count(),
            "results": [author.to_dict() for author in authors],
        }
    )


def author_details_view(request, author_id):
    try:
        author = author.objects.get(id=author_id)
        return jsonresponse(author.to_dict())
    except author.doesnotexist:
        return jsonresponse({"error": "author not found"}, status=404)

登录后复制

太棒了，您现在知道网络应用程序是如何工作的！

在下一节中，我们将对我们的应用程序进行基准测试，以使用 appsignal 检测 n 1 查询，然后修改代码以消除它们。

使用 appsignal 检测 django 应用程序中的 n 1 查询

使用 appsignal 检测性能问题很容易。您所要做的就是像平常一样使用/测试应用程序（例如，通过访问所有端点并验证响应来执行最终用户测试）。

当某个端点被命中时，appsignal 将为其创建一份性能报告，并将所有相关访问分组在一起。每次访问都将作为样本记录在端点的报告中。

检测视图中的 n 1 查询

首先，访问您应用程序的所有端点以生成性能报告：

/书籍/
/books//
/书籍/作者/
/书籍/作者/
/books/authors//

接下来，让我们使用 appsignal 仪表板来分析慢速端点。

示例 1：一对一关系 (select_lated())

导航到您的 appsignal 应用程序并选择侧边栏上的 性能 > 问题列表。然后单击平均值 按平均响应时间降序对问题进行排序。

使用 AppSignal 在 Django 中查找并修复 N+ueries-第1张图片-海印网

点击最慢的端点（books/）查看其详细信息。

使用 AppSignal 在 Django 中查找并修复 N+ueries-第2张图片-海印网

查看最新示例，我们可以看到该端点在 1090 毫秒内返回响应。组细分显示 sqlite 需要 651 毫秒，而 django 需要 439 毫秒。

这表明存在问题，因为像这样简单的端点不应该花费那么长时间。

要获取有关所发生事件的更多详细信息，请选择侧边栏中的示例，然后选择最新示例。

使用 AppSignal 在 Django 中查找并修复 N+ueries-第3张图片-海印网

向下滚动到事件时间线以查看执行了哪些 sql 查询。

使用 AppSignal 在 Django 中查找并修复 N+ueries-第4张图片-海印网

将鼠标悬停在 query.sql 文本上会显示实际的 sql 查询。

执行了超过 1000 个查询：

select * from "books_book";
select * from "books_author" where "books_author"."id" = 3; -- 3= 1st book's author id
select * from "books_author" where "books_author"."id" = 6; -- 6= 2nd book's author id
...
select * from "books_author" where "books_author"."id" = n; -- n= n-th book's author id

登录后复制

这些是 n 1 查询的明显标志。第一个查询获取一本书 (1)，随后的每个查询获取该书的作者详细信息 (n)。

要修复它，请导航到 books/views.py 并修改 book_list_view()，如下所示：

# books/views.py
def book_list_view(request):
    books = book.objects.all().select_related("author")  # modified
    return jsonresponse(
        {
            "count": books.count(),
            "results": [book.to_dict() for book in books],
        }
    )

登录后复制

通过利用 django 的 select_lated() 方法，我们在初始查询中选择其他相关对象数据（即作者）。 orm 现在将利用 sql 连接，最终查询将如下所示：

select * from "books_book"
    inner join "books_author" on ("books_book"."author_id" = "books_author"."id")

登录后复制

等待开发服务器重新启动并重新测试受影响的端点。

使用 AppSignal 在 Django 中查找并修复 N+ueries-第5张图片-海印网

再次进行基准测试后，响应时间从 1090 减少到 45，查询数量从 1024 减少到 2。分别提高了 24 倍和 512 倍。

示例 2：多对一关系 (prefetch_lated())

接下来，让我们看看第二慢的端点（books/by-authors/）。

像我们在上一步中所做的那样使用仪表板来检查端点的 sql 查询。您会注意到此端点有类似但不太严重的 n 1 模式。

这个端点的性能不太严重，因为 django 足够聪明，可以缓存频繁执行的 sql 查询，即重复获取一本书的作者。查看官方文档以了解有关 django 缓存的更多信息。

让我们利用 books/views.py 中的 prefetch_lated() 来加速端点：

# books/views.py
def book_by_author_list_view(request):
    try:
        authors = author.objects.all().prefetch_related("books")  # modified
        return jsonresponse(
            {
                "count": authors.count(),
                "results": [
                    {
                        "author": author.to_dict(),
                        "books": [book.to_dict() for book in author.books.all()],
                    }
                    for author in authors
                ],
            }
        )
    except author.doesnotexist:
        return jsonresponse({"error": "author not found"}, status=404)

登录后复制

在上一节中，我们使用 select_lated() 方法来处理一对一关系（每本书都有一个作者）。然而，在本例中，我们正在处理一对多关系（一个作者可以拥有多本书），因此我们必须使用 prefetch_lated()。

这两种方法的区别在于 select_lated() 工作在 sql 级别，而 prefetch_lated() 则在 python 级别进行优化。后一种方法也可以用于多对多关系。

有关更多信息，请查看 django 关于 prefetch_lated() 的官方文档。

基准测试后，响应时间从 90 毫秒减少到 44 毫秒，查询数量从 32 减少到 4。

在 django admin 中检测 n 1 查询

在 django 管理站点中发现 n 1 查询的工作原理类似。

首先，登录您的管理站点并生成绩效报告（例如，创建一些作者或书籍，更新和删除它们）。

接下来，导航到您的 appsignal 应用仪表板，这次由管理员过滤问题：

使用 AppSignal 在 Django 中查找并修复 N+ueries-第6张图片-海印网

就我而言，两个最慢的端点是：

/管理/登录
/admin/books/author/

我们无法对 /admin/login 做太多事情，因为它完全由 django 处理，所以让我们关注第二个最慢的端点。检查它会发现 n 1 查询问题。每本书都会单独获取作者。

要解决此问题，请重写 bookinline 中的 get_queryset() 以在初始查询中获取作者详细信息：

# books/admin.py
class BookInline(admin.TabularInline):
    model = Book
    extra = 0

    def get_queryset(self, request):
        queryset = super().get_queryset(request)
        return queryset.select_related("author")

登录后复制

再次进行基准测试并验证查询数量是否有所减少。