Amazon Aurora Parallel Query – функция базы данных Amazon Aurora, которая обеспечивает ускоренное выполнение аналитических запросов к текущим данным без необходимости их копирования в отдельную систему. Данная возможность может ускорить выполнение запросов до двух порядков, одновременно поддерживая высокую производительность при выполнении основных транзакционных рабочих нагрузок.
В то время как некоторые базы данных могут распараллеливать обработку запросов между несколькими процессорами на одном или нескольких серверах, Parallel Query использует уникальную архитектуру БД Aurora, чтобы передавать и распараллеливать обработку запросов между тысячами процессоров на уровне хранилища Aurora. Переводя обработку аналитических запросов на уровень хранилища Aurora, Parallel Query разгружает сеть, процессор и минимизирует конфликты транзакционных рабочих нагрузок на уровне буферного пула.
Возможности
Ускорение аналитических запросов
В традиционных базах данных выполнение аналитических запросов непосредственно в базе влечет за собой снижение производительности запросов и рабочих нагрузок транзакций даже при выполнении простых запросов. Запросы могут выполняться от нескольких минут до нескольких часов в зависимости от размера таблиц и инстансов сервера баз данных. Скорость выполнения запросов также может снижаться из‑за задержки в сети, поскольку может требоваться передача целых таблиц с уровня хранилища на сервер БД для обработки.
Благодаря возможности Parallel Query обработка запросов выполняется на уровне хранилища Aurora. На запрос выделяется большее количество вычислительных ресурсов, и требуется передача гораздо меньшего объема данных по сети. В то же время инстанс БД Aurora может продолжать выполнять транзакции с гораздо меньшим количеством прерываний. Таким образом, в одной БД Aurora можно одновременно выполнять транзакционные и аналитические рабочие нагрузки, при этом поддерживая высокую производительность.
Запросы к новым данным
Для многих аналитических рабочих нагрузок требуются как новые данные, так и высокая производительность запросов. Например, рабочие системы, отвечающие за выполнение таких задач, как мониторинг сети, обеспечение кибербезопасности или выявление мошенничества, используют новые данные, получаемые в режиме реального времени из транзакционных баз данных. В таких ситуациях нет возможности ждать, пока данные загрузятся в систему аналитики.
При выполнении запросов в той же базе данных, что используется для обработки транзакций, Amazon Aurora Parallel Query предоставляет эффективные оперативные решения, сохраняя производительность транзакций. При этом установка дополнительного ПО или внесение изменений в запросы не требуются.
Начало работы
Возможность Parallel Query доступна для версии Amazon Aurora, совместимой с MySQL. Начать работу просто: достаточно активировать Parallel Query при создании кластера Aurora.
Оптимизатор запросов Aurora, основанный на оценке ожидаемого роста производительности, автоматически определяет, стоит ли использовать Parallel Query для каждого конкретного запроса. Аналогично другим запросам Aurora, плата начисляется только за фактически произведенные операции ввода‑вывода.
Подробнее о версии Amazon Aurora, совместимой с MySQL