Вопросы и ответы по Amazon DocumentDB (с поддержкой совместимости с MongoDB)

Общие вопросы

Сервис Amazon DocumentDB (совместимость с MongoDB) – это быстрая, масштабируемая, высокодоступная и полностью управляемая корпоративная база данных документов, которая поддерживает специализированные рабочие нагрузки JSON. Amazon DocumentDB специально создавалась как база данных документов, поэтому в ней очень легко сохранять, индексировать данные в формате JSON и выполнять запросы к ним. Для запуска и масштабирования рабочих нагрузок в Amazon DocumentDB, а также для управления ими разработчики могут использовать тот же код приложения, драйверы и инструменты MongoDB, с которыми работают сейчас. Получите усовершенствованную производительность, масштабируемость и доступность, не беспокоясь об управлении базовой инфраструктурой.

С помощью Сервиса миграции баз данных AWS (AWS DMS) клиенты могут с минимальными простоями перенести свои нереляционные базы данных MongoDB, размещенные как локально, так и в Эластичном облаке вычислений Amazon (EC2), в сервис Amazon DocumentDB. Amazon DocumentDB не требует предварительных вложений, оплате подлежат только используемые ресурсы.

Документно-ориентированные базы данных – это одна из самых быстро развивающихся категорий баз данных noSQL. Это связано в первую очередь с тем, что базы данных документов поддерживают и гибкие схемы, и широкие возможности для запросов. Модель документов – отличный выбор для случаев использования с динамическими наборами данных, которые требуют специальных запросов, индексирования и агрегирования. Благодаря масштабу, который обеспечивает Amazon DocumentDB, она применяется самыми разными клиентами для таких сценариев использования, как управление контентом, персонализация, каталоги, мобильные и веб-приложения, IoT и управление профилями.

«Совместимость с MongoDB» означает, что Amazon DocumentDB взаимодействует с открытыми API MongoDB версий 3.6, 4.0 и 5.0 на платформе Apache 2.0. Таким образом, вы можете использовать драйверы, приложения и инструменты MongoDB в Amazon DocumentDB практически без изменений. Amazon DocumentDB поддерживает большинство API MongoDB, обычно используемых клиентами, но не все. Мы стремимся предоставить клиентам возможности, которые им действительно необходимы.

С момента выпуска мы прислушиваемся к отзывам клиентов и уже добавили более 80 возможностей, в том числе совместимость с MongoDB 4.0 и 5.0, транзакции и сегменты. Подробнее о поддерживаемых API MongoDB см. в документации по совместимости. Подробнее о недавно выпущенных версиях Amazon DocumentDB см. в разделе «Объявления об Amazon DocumentDB» на странице ресурсов по Amazon DocumentDB.

Нет. Amazon DocumentDB не использует код SSPL для MongoDB, поэтому соответствующая лицензия не распространяется на этот сервис. Вместо этого Amazon DocumentDB взаимодействует с открытыми API MongoDB 3.6, 4.0 и 5.0 на платформе Apache 2.0. Мы продолжим прислушиваться к отзывам клиентов и добавлять необходимые им возможности. Подробнее о поддерживаемых API MongoDB см. в документации по совместимости. Подробнее о недавно выпущенных версиях Amazon DocumentDB см. в разделе «Объявления об Amazon DocumentDB» на странице ресурсов по Amazon DocumentDB.

С помощью Сервиса миграции баз данных AWS (DMS) клиенты могут с минимальными простоями перенести в сервис Amazon DocumentDB свои базы данных MongoDB, размещенные как локально, так и в Эластичном вычислительном облаке Amazon (EC2). DMS позволяет выполнить миграцию фрагментированного кластера или набора реплик MongoDB в Amazon DocumentDB. Кроме того, для переноса данных из базы данных MongoDB в Amazon DocumentDB клиенты могут использовать большинство существующих инструментов, в том числе mongodump/mongorestore, mongoexport/mongoimport, и инструменты сторонних разработчиков, поддерживающие режим Change Data Capture (CDC) через oplog. Подробнее см. в разделе о миграции в Amazon DocumentDB.

Нет, сервис Amazon DocumentDB поддерживает подавляющее большинство драйверов MongoDB, совместимых с MongoDB 3.4 и более поздних версий.

Да. Благодаря совместимости с MongoDB 4.0, Amazon DocumentDB теперь поддерживает возможность выполнять транзакции атомарности, непротиворечивости, изолированности, долговечности (ACID) для нескольких документов, выражений, коллекций и баз данных одновременно.

Нет, Amazon DocumentDB не следует тем же жизненным циклам поддержки, что и MongoDB, и график EOL MongoDB не применяется к Amazon DocumentDB.

Развертывание кластеров Amazon DocumentDB выполняется в Amazon VPC (VPC), принадлежащем клиенту. Доступ к ним можно получить с инстансов Эластичного облака вычислений Amazon (EC2) или с помощью других сервисов AWS, развернутых в том же VPC. Кроме того, инстансы Amazon EC2 или другие сервисы AWS из других VPC в том же регионе или других регионах могут обращаться к Amazon DocumentDB посредством пирингового подключения между VPC. Доступ к кластерам Amazon DocumentDB нужно выполнять через оболочку mongo или драйверы MongoDB. При подключении к кластеру сервис Amazon DocumentDB запрашивает аутентификацию. Подробнее о дополнительных вариантах см. в разделе о подключении к кластеру Amazon DocumentDB извне Amazon VPC.

Для предоставления некоторых возможностей управления, включая управление жизненным циклом инстансов, шифрование данных при хранении с использованием ключей Сервиса управления ключами Amazon (KMS) и управление группами безопасности, Amazon DocumentDB использует ту же операционную технологию, что применяется в Службе реляционных баз данных Amazon (RDS) и Amazon Neptune. При использовании CLI API AWS для describe-db-instances и describe-db-clusters мы рекомендуем фильтровать ресурсы Amazon DocumentDB с указанием следующего параметра: «--filter Name=engine,Values=docdb».

Актуальная информация о доступных типах инстансов по регионам находится на странице цен на Amazon DocumentDB.

Чтобы попробовать работать с Amazon DocumentDB, изучите руководство по началу работы.

Производительность

Во время записи в хранилище Amazon DocumentDB сохраняет только журналы с упреждающей записью и не требует записи полной синхронизации буферных страниц. В результате такой оптимизации, не влияющей на надежность, операции записи в Amazon DocumentDB обычно исполняются быстрее, чем в традиционных базах данных. Кластеры Amazon DocumentDB способны масштабироваться до миллионов операций чтения в секунду и до 15 реплик чтения.

Цены

Актуальная информация по регионам и ценам находится на странице цен на Amazon DocumentDB.

Да, вы можете пользоваться бесплатной пробной версией Amazon DocumentDB в течение 1 месяца. Если вы ранее не пользовались Amazon DocumentDB, то имеете право пользоваться бесплатной пробной версией в течение 1 месяца. Ваша организация получит 750 часов использования инстансов t3.medium в месяц, 30 млн операций ввода-вывода, 5 ГБ хранилища и 5 ГБ хранилища резервных копий бесплатно на 30 дней. По окончании действия бесплатной пробной версии (один месяц) или при превышении объема разрешенного использования можно остановить кластер, чтобы избежать затрат, или продолжить его использование с оплатой согласно стандартному тарифу по требованию. Дополнительную информацию см. на странице бесплатной пробной версии DocumentDB.

Конфигурация Amazon DocumentDB, оптимизированная для ввода-вывода – идеальный выбор, если вы хотите контролировать свои затраты или у имеете приложения с высокой частотой операций ввода-вывода. Если вы ожидаете, что затраты на ввод-вывод превысят 25 % от общей стоимости базы данных Amazon DocumentDB, это будет наилучшим вариантом в плане соотношения цены и производительности. Дополнительные сведения, включая инструкции по началу работы, см. в нашей документации по конфигурации Amazon DocumentDB, оптимизированной для ввода-вывода.

Вы можете переключать существующие кластеры баз данных раз в 30 дней на оптимизированную для ввода-вывода конфигурацию Amazon DocumentDB. В любой момент можно вернуться к стандартным конфигурациям хранилища Amazon DocumentDB.

Да, плата за операции ввода-вывода, необходимые для репликации данных в разных регионах, продолжает взиматься. За операции ввода-вывода для чтения и записи, что отличаются от репликации данных, в оптимизированной для ввода-вывода конфигурации Amazon DocumentDB плата не взимается. Дополнительные сведения см. в нашей документации по Amazon DocumentDB, оптимизированной для ввода-вывода.

Эластичные кластеры

Эластичные кластеры Amazon DocumentDB обеспечивают эластичное масштабирование базы данных документов для обработки миллионов операций записи и чтения до объема, исчисляемого в петабайтах. Эластичные кластеры упрощают взаимодействие клиентов с Amazon DocumentDB, автоматически управляя базовой инфраструктурой и устраняя потребность в создании, удалении, обновлении и масштабировании инстансов.

Вы можете создать эластичный кластер с помощью API, SDK, интерфейса командной строки Amazon DocumentDB, CloudFormation (CFN) или консоли AWS. При выделении кластера вы указываете, сколько сегментов и вычислительных мощностей на сегмент нужно для рабочей нагрузки. После создания кластера вы готовы приступить к использованию масштабируемости эластичных кластеров. Теперь вы можете подключаться к эластичному кластеру и читать или записывать данные прямо в своем приложении. Эластичные кластеры являются эластичными. В зависимости от потребностей рабочей нагрузки вы можете добавлять или удалять вычислительные мощности, изменяя количество сегментов и количество вычислительных мощностей в кластере с помощью консоли, API, командной строки или SDK AWS. Эластичные кластеры будут автоматически выделять и отменять выделение базовой инфраструктуры и перераспределять данные.

Эластичные кластеры используют сегментирование для распределения данных в распределенной системе хранилища Amazon DocumentDB. В ходе сегментирования, которое также называется разбиением, крупные наборы данных разделяются на небольшие наборы данных на множестве узлов, что позволяет пользователям масштабировать базу данных, преодолевая ограничения вертикального масштабирования цельной базы данных. Эластичные кластеры отделяют вычислительные мощности от хранилища в Amazon DocumentDB. Вместо того чтобы перераспределять коллекции, перемещая небольшие фрагменты данных между вычислительными узлами, эластичные кластеры могут эффективно копировать данные в распределенной системе хранения.

Эластичные кластеры поддерживают разбиение на основе хэша.

Используя эластичные кластеры, вы можете с легкостью проводить масштабирование в рабочей нагрузке в Amazon DocumentDB обычно без простоя или с минимальным простоем приложений и снижения производительности, независимо от размера данных. Подобная операция в MongoDB снижает производительность приложения и длится часами, а иногда даже днями. Кроме того, эластичные кластеры предоставляют возможности дифференцированного управления, например резервное копирование без снижения производительности и быстрое восстановление на момент времени, позволяя клиентам уделять основное внимание работе с приложением, а не управлению базой данных.

Нет. Вам не нужно вносить изменения в свое приложение, чтобы использовать эластичные кластеры.

Нет, в ближайшем будущем вы можете использовать Сервис миграции баз данных AWS (DMS) для переноса данных из существующего кластера Amazon DocumentDB в эластичный кластер.

Выбор оптимального ключа сегмента для эластичных кластеров не отличается от других баз данных. Хороший ключ сегмента отличается двумя характеристиками: высокой частотой и высокой мощностью. Например, если ваше приложение хранит user_orders в DocumentDB, то обычно данные должен получать пользователь. Поэтому вы хотите, чтобы все заказы, связанные с определенным пользователем, хранились в одном сегменте. В таком случае хорошим ключом сегмента будет user_id. Подробнее... 

  • Эластичный кластер – кластер Amazon DocumentDB, позволяющий масштабировать пропускную способность рабочей нагрузки до миллионов операций чтения-записи в секунду, а размер хранилища – до петабайтов. Эластичный кластер состоит из одного или нескольких сегментов для томов вычислений и хранения данных и по умолчанию отличается высокой доступностью в нескольких зонах доступности.
  • Сегмент выполняет вычисления для эластичного кластера. По умолчанию сегмент содержит три узла: один – для записи, другие два – для чтения. У вас может быть максимум 32 сегмента, в каждом из которых может быть максимум 64 виртуальных ЦПУ.
  • Ключ сегмента – необязательное поле в документах JSON, используемое эластичными кластерами для направления трафика чтения и записи на соответствующий компьютер. Советуем выбирать ключи, которые содержат множество уникальных значений. Хороший ключ сегмента будет равномерно распределять данные между множеством базовых сегментов, обеспечивая наивысшую пропускную способность и производительность рабочей нагрузки. 
  • Сегментированная коллекция – коллекция, данные в которой распределены по эластичному кластеру.

Эластичные кластеры интегрируются с другими сервисами AWS таким же способом, как это сейчас делает DocumentDB. Во-первых, вы можете воспользоваться Сервисом миграции баз данных AWS (DMS) для миграции с MongoDB и других реляционных баз данных на эластичные кластеры. Во-вторых, вы можете отслеживать производительность эластичного кластера с помощью Amazon CloudWatch. В-третьих, вы можете настроить аутентификацию и авторизацию через пользователей и роли AWS IAM и использовать AWS VPC для безопасных подключений только к облакам VPC. Наконец, вы можете использовать AWS Glue для импорта данных из других сервисов AWS и их экспорта в другие сервисы AWS, в частности S3, Redshift и OpenSearch.

Да. Вы можете выполнить миграцию сегментированных рабочих нагрузок MongoDB в эластичные кластеры. Вы можете либо воспользоваться Сервисом миграции баз данных AWS или встроенными инструментами MongoDB, такими как mongodump и mongorestore, для миграции своей рабочей нагрузки MongoDB в эластичные кластеры. Также эластичные кластеры поддерживают широко используемые API MongoDB, такие как shardCollection(), обеспечивая гибкость повторного использования существующих инструментов и сценариев в Amazon DocumentDB.

Оборудование, масштабирование и хранилище

Минимальный объем хранилища – 10 ГБ. По мере использования кластера хранилище Amazon DocumentDB может, не снижая производительности, автоматически расширяться до 128 ТиБ с шагом в 10 ГБ. При использовании эластичных кластеров Amazon DocumentDB хранилище будет автоматически расти до 4 ПБ с шагом в 10 ГБ. В любом случае выделять хранилище заранее не требуется.

Масштабирование Amazon DocumentDB выполняется по двум направлениям: для хранилища и для вычислительных ресурсов. Хранилище Amazon DocumentDB автоматически масштабируется с 10 ГБ до 128 ТиБ в кластерах на базе инстансов и до 4 PiB для эластичных кластеров Amazon DocumentDB. Вычислительные ресурсы Amazon DocumentDB можно масштабировать путем использования более крупных инстансов или же горизонтально (для повышения производительности при чтении), т. е. путем добавления в кластер дополнительных инстансов‑реплик.

Вычислительные ресурсы, выделенные инстансу, можно масштабировать в Консоли управления AWS, выбрав нужный инстанс и нажав кнопку «Modify» (Изменить). Масштабирование ресурсов памяти и ЦПУ выполняется за счет изменения класса инстанса.

После изменения класса инстанса запрошенные изменения вступают в силу в течение настроенного окна обслуживания. Как вариант, можно установить флажок «Apply Immediately» (Применить сразу) для немедленного выполнения запроса на масштабирование. В обоих случаях это снизит доступность БД на несколько минут, в течение которых выполняется масштабирование. Имейте в виду, что одновременно будут применены любые другие ожидающие применения системные изменения.

Резервное копирование и восстановление

Автоматическое резервное копирование для кластеров в Amazon DocumentDB включено всегда. Простая возможность резервного копирования базы данных в Amazon DocumentDB обеспечивает восстановление кластера на момент времени. Интервал резервного копирования для восстановления на момент времени можно увеличить до 35 дней. Резервное копирование не влияет на производительность базы данных.

Да. Созданные вручную снимки состояния можно хранить дольше, чем предусмотрено интервалом резервного копирования. Создание снимков состояния не влияет на производительность. Учтите, что восстановление данных из снимков состояния кластера требует создания нового кластера.

Amazon DocumentDB автоматически обеспечивает долговечность данных в трех зонах доступности в пределах региона и автоматически пытается восстановить ваш инстанс в работоспособной зоне доступности без потери данных. В маловероятном случае, когда данные в хранилище Amazon DocumentDB становятся недоступны, можно восстановить их в новый кластер из снимка состояния кластера или выполнить операцию восстановления на момент времени. Имейте в виду, что последнее доступное время восстановления при операции восстановления на момент времени может отставать от текущего на несколько минут (не более пяти).

Система предлагает создать снимок финального состояния при удалении инстанса. Такой снимок состояния впоследствии можно будет применить для восстановления удаленного инстанса. После удаления инстанса сервис Amazon DocumentDB сохраняет итоговые снимки состояния, созданные пользователями, со всеми прочими снимками состояния, созданными вручную. При этом после удаления сохраняются только снимки состояния (то есть созданные автоматически резервные копии для восстановления на момент времени не сохраняются).

При удалении аккаунта AWS все созданные автоматически резервные копии и резервные копии снимков состояния, содержащиеся в аккаунте, будут удалены.

Да. Amazon DocumentDB предоставляет возможность создавать снимки состояния кластера, которые в дальнейшем можно использовать для его восстановления. Снимок можно предоставить в совместное использование для другого аккаунта AWS, при этом владелец такого аккаунта сможет использовать этот снимок для восстановления кластера, содержащего ваши данные. Снимок состояния можно сделать даже публичным – в этом случае любой пользователь сможет восстановить кластер, содержащий соответствующие публичные данные. Эту возможность можно применять для совместного использования данных разными средами (рабочей средой, средой разработки и тестирования, промежуточной средой и т. д.), когда они относятся к разным аккаунтам AWS, а также для того, чтобы безопасно хранить резервные копии всех данных в нескольких аккаунтах на тот случай, если используемый главный аккаунт AWS будет взломан.

За совместное использование снимка состояния несколькими аккаунтами плата не взимается. При этом плата может начисляться за сам снимок состояния, а также за любой кластер, восстановленный из совместно используемых снимков состояния.

Совместное использование автоматически созданных снимков состояния кластера не поддерживается. Для совместного использования автоматически созданных снимков состояния нужно вручную создать копию снимка состояния и сделать его общим.

Нет. Совместно используемые снимки состояния Amazon DocumentDB будут доступны только для аккаунтов, которые находятся в том же регионе, что и аккаунт, предоставивший общий доступ к этим снимкам состояния.

Да. К зашифрованным снимкам состояния Amazon DocumentDB можно настроить совместный доступ. Получателю совместно используемого снимка состояния потребуется доступ к ключу KMS, использованному для шифрования этого снимка.

Нет, снимки состояния Amazon DocumentDB можно использовать только в пределах этого сервиса.

Вы можете создать итоговый снимок состояния при удалении кластера. Такой снимок состояния впоследствии можно будет применить для восстановления удаленного кластера. После удаления кластера сервис Amazon DocumentDB сохраняет итоговые снимки состояния, созданные пользователями, со всеми прочими снимками состояния, созданными вручную.

Высокая доступность и репликация

Amazon DocumentDB автоматически делит общий объем хранилища на сегменты по 10 ГБ, распределенные по нескольким дискам. Каждый 10‑гигабайтный блок хранилища шестикратно реплицируется в трех зонах доступности (AZ). Amazon DocumentDB обеспечивает автоматическую обработку потери до двух копий данных без снижения доступности операций записи и до трех копий без снижения доступности операций чтения. Кроме того, тома хранилища Amazon DocumentDB обладают способностью к самостоятельному восстановлению. Блоки данных и диски непрерывно сканируются на наличие ошибок и автоматически восстанавливаются.

Чтобы база данных Amazon DocumentDB стала доступна для операций после сбоя базы данных, в отличие от других БД, не требуется воспроизводить журнал повтора с последней контрольной точки базы данных (обычно этот процесс занимает пять минут) и проверять, все ли изменения были применены. Благодаря этому время перезапуска базы данных в большинстве случаев составляет менее 60 секунд. Amazon DocumentDB изолирует кэш от процессов базы данных и делает его мгновенно доступным уже во время перезагрузки. Это предотвращает необходимость регулировать доступ до тех пор, пока кэш не заполнен, во избежание сбоев доступа.

Amazon DocumentDB поддерживает реплики чтения, подключенные к тому же тому хранилища, что и основной инстанс. Сделанные в основном инстансе обновления видны всем репликам Amazon DocumentDB.

  • Возможность: реплики чтения Amazon DocumentDB
  • Количество реплик: до 15
  • Тип репликации: асинхронный (обычно на уровне миллисекунд)
  • Влияние на производительность основного инстанса: низкое
  • Возможность использования в качестве целевого объекта при обработке отказа: есть (без потери данных)
  • Возможность автоматической обработки отказа: есть

Да, реплицировать данные между регионами можно с помощью функции Global Cluster. Кластеры Global Clusters охватывают множество регионов AWS. Global Clusters реплицируют данные в кластеры пяти регионов, почти не влияя на производительность. Глобальные кластеры Global Clusters обеспечивают аварийное восстановление в результате сбоев в масштабе региона и чтение глобальных данных с низкой задержкой. Подробнее об этом можно прочитать в нашем блоге.

Да. Каждому инстансу в кластере можно присвоить приоритет использования. При отказе основного инстанса сервис Amazon DocumentDB назначает вместо него реплику с наивысшим приоритетом. Если две или более реплик имеют одинаковый уровень приоритета, сервис Amazon DocumentDB использует реплику, размер которой совпадает с размером основного инстанса.

Уровень приоритета инстанса можно изменять в любое время. Само по себе изменение уровня приоритета не приводит к запуску механизма отказоустойчивости.

Репликам, которые не планируется преобразовывать в основной инстанс, можно назначить более низкий уровень приоритета. Но если по какой‑либо причине реплики с высоким приоритетом в кластере неработоспособны или недоступны, Amazon DocumentDB будет использовать реплику с более низким приоритетом.

Amazon DocumentDB можно развертывать в высокодоступной конфигурации, используя инстансы‑реплики в нескольких зонах доступности AWS в качестве целевых объектов при обработке отказа. Если на основном инстансе происходит сбой, инстанс реплики автоматически становится новым основным инстансом. Данный процесс происходит с минимальными сбоями в работе сервиса.

Можно добавить дополнительные реплики Amazon DocumentDB. Реплики Amazon DocumentDB используют то же самое хранилище, что и основной инстанс. Любую реплику Amazon DocumentDB можно сделать основной без какой‑либо потери данных и, соответственно, использовать для повышения отказоустойчивости в случае сбоя основного инстанса. Для повышения доступности кластера просто создайте от 1 до 15 реплик в нескольких зонах доступности, и Amazon DocumentDB будет автоматически включать их в список выбора основного инстанса в случае его отказа.

Amazon DocumentDB обрабатывает отказы автоматически, чтобы приложения могли как можно скорее возобновлять операции с базами данных без ручного вмешательства администратора.

  • При наличии инстанса реплики Amazon DocumentDB в той же или в другой зоне доступности при обработке отказа сервис Amazon DocumentDB переадресует запись канонического имени (CNAME) инстанса так, чтобы она указывала на работоспособную реплику, которая, в свою очередь, становится основной. Обработка отказа обычно полностью выполняется за 30 секунд. 
  • При отсутствии инстанса реплики Amazon DocumentDB (т. е. при использовании кластера из одного инстанса) Amazon DocumentDB попытается создать новый инстанс в той же самой зоне доступности, что и исходный инстанс. Замена исходного инстанса выполняется на основе принципа «разумных усилий» и может не состояться, к примеру, если существует проблема, которая значительно влияет на зону доступности. 

В случае потери соединения приложение должно попытаться повторно подключиться к базе данных.

Amazon DocumentDB автоматически обнаружит проблему с основным инстансом и перенаправит трафик операций чтения / записи на инстанс реплики Amazon DocumentDB. В среднем обработка отказа в такой ситуации занимает 30 секунд. Кроме того, на короткий промежуток времени будет прерван трафик операций чтения, который обслуживали инстансы реплик Amazon DocumentDB.

Поскольку реплики Amazon DocumentDB используют тот же самый том данных, что и первичный инстанс, никакого отставания репликации практически не существует. По нашим наблюдениям, интервал отставания обычно сохраняется на уровне десятков миллисекунд.

Безопасность и соответствие требованиям

Да. Для этого все кластеры Amazon DocumentDB должны быть созданы в облаке VPC. Amazon VPC дает возможность определять топологию виртуальной сети, очень напоминающую традиционную сеть, которая могла бы работать в вашем собственном центре обработки данных. Это предоставляет нашим клиентам полный контроль над тем, кто получает доступ к их кластерам Amazon DocumentDB.

В Amazon DocumentDB реализована поддержка RBAC со встроенными ролями. RBAC позволяет принудительно применять рекомендованный доступ по принципу наименьших привилегий, ограничивая набор действий, которые разрешено выполнять пользователям. Подробнее об этом см. здесь.

Amazon DocumentDB использует строгие границы сети и авторизацию VPC. Аутентификация и авторизация в API управления Amazon DocumentDB осуществляется на основе пользователей, ролей и политик IAM. Аутентификация в базе данных Amazon DocumentDB осуществляется с помощью стандартных инструментов и драйверов MongoDB с использованием стандартного механизма аутентификации MongoDB: Salted Challenge Response Authentication Mechanism (SCRAM).

Да. Amazon DocumentDB поддерживает шифрование кластеров с использованием ключей, управление которыми осуществляется в Сервисе управления ключами AWS (AWS KMS). В кластере Amazon DocumentDB с шифрованием шифруются все данные, хранимые в базовой системе хранения, а также их автоматические резервные копии, снимки состояния и реплики чтения в том же кластере. Шифрование и дешифрование осуществляются незаметно для пользователя. Дополнительную информацию об использовании KMS с Amazon DocumentDB см. в разделе о шифровании данных Amazon DocumentDB при хранении.

На данный момент шифрование существующего незашифрованного кластера Amazon DocumentDB не поддерживается. Чтобы использовать шифрование Amazon DocumentDB для существующего незашифрованного кластера, создайте новый кластер с включенным шифрованием и перенесите данные в него.

Сервис Amazon DocumentDB разработан в соответствии в самыми строгими стандартами безопасности, что позволяет клиентам проверить наш уровень безопасности и выполнить свои обязательства по соответствию нормативным требованиям. Проверка Amazon DocumentDB показала его соответствие стандартам PCI DSS, ISO 9001, 27001, 27017 и 27018, SOC 1, 2 и 3, а также сертификации Health Information Trust Alliance (HITRUST) Common Security Framework (CSF). Кроме того, этот сервис соответствует требованиям HIPAA. Отчеты по соответствию AWS требованиям можно скачать в AWS Artifact.

Обновление основной версии

С помощью местного обновления можно актуализировать кластеры Amazon DocumentDB 3.6 или 4.0 до Amazon DocumentDB 5.0 посредством консоли AWS, пакета средств разработки ПО (SDK) или интерфейса командной строки (CLI). Благодаря этому нет необходимости создавать новые кластеры или менять конечные точки. Местное обновление основной версии доступно во всех регионах, где есть Amazon DocumentDB 5.0. Для того чтобы начать работу с местным обновлением основной версии, ознакомьтесь с его документацией.

Оно позволяет легко актуализировать кластеры Amazon DocumentDB 3.6 или 4.0 до версии 5.0 без необходимости выполнять резервное копирование, восстановление в другой кластер и без использования иных инструментов миграции данных. Таким образом, это сокращает время и количество усилий, которые нужны для обычного процесса обновления с настройкой исходных и целевых конечных точек, миграцией индексов и данных, изменением кода приложения и многим другим.

После обновления вам не нужно будет менять конечную точку в своих приложениях. Поскольку данные остаются в том же кластере, дополнительная плата за функцию не взимается.

Время простоя может варьироваться в зависимости от количества коллекций, индексов, баз данных и инстансов. Прежде чем запускать местное обновление основной версии производственного кластера, мы настоятельно рекомендуем сперва сделать это в среде тестирования, чтобы проверить время простоя, производительность, а также убедиться в том, что приложения работают должным образом.

Можно также использовать функцию быстрого клонирования Amazon DocumentDB, чтобы скопировать данные из кластера для тестирования. Вы можете обратиться за дополнительной помощью к нашему архитектору решений для баз данных, если у вас возникнут сложности с внедрением Amazon DocumentDB.

Местное обновление доступно только в Amazon DocumentDB 3.6 или 4.0 в качестве отправной точки и версии 5.0 в качестве конечной точки. Но оно недоступно для глобальных или эластичных кластеров Amazon DocumentDB, а также DocumentDB 4.0 в качестве конечной точки.

Машинное обучение

Amazon DocumentDB поддерживает интеграцию с Amazon SageMaker Canvas, что упрощает создание моделей машинного обучения и настройку базовых моделей с использованием данных из Amazon DocumentDB без единой строки кода. Больше не нужно разрабатывать собственные конвейеры данных и машинного обучения между Amazon DocumentDB и SageMaker Canvas. Вы можете запустить SageMaker Canvas из консоли Amazon DocumentDB и добавить существующие базы данных Amazon DocumentDB в качестве источника данных, чтобы приступить к созданию моделей машинного обучения. Данные из DocumentDB в SageMaker Canvas можно использовать для создания моделей прогнозирования оттока клиентов, сбоев в обслуживании, финансовых показателей и продаж, выявления мошенничества, оптимизации запасов, обобщения и создания контента.

Amazon SageMaker Canvas предлагает интерфейс без программирования для создания моделей машинного обучения с использованием данных из различных источников, включая Amazon DocumentDB. С вас взимается плата за использование SageMaker Canvas и за операции ввода-вывода при чтении данных из инстанса Amazon DocumentDB, осуществляемого SageMaker Canvas. За использование DocumentDB в качестве источника данных для Amazon SageMaker Canvas дополнительная плата не взимается. Подробнее см. на страницах цен на Amazon DocumentDB и SageMaker Canvas.

Генеративный искусственный интеллект и машинное обучение

Векторный поиск для Amazon DocumentDB сочетает гибкость и широкие возможности запросов, присущие базе данных документов на основе JSON, которая оснащена векторным поиском. Можно использовать существующие данные Amazon DocumentDB или гибкую структуру данных документов для создания сценариев использования машинного обучения и генеративного искусственного интеллекта, таких как семантический поиск, рекомендации по продуктам, персонализация, чат-боты, обнаружение мошенничества и аномалий. Дополнительные сведения см. в документации по векторному поиску для Amazon DocumentDB.

Векторный поиск для Amazon DocumentDB позволяет использовать семантический поиск, чтобы уловить смысл, контекст и цель ваших данных. Поиск по ключевым словам позволяет найти документ на основе фактического текста или предопределенных сопоставлений синонимов. Например, в традиционном приложении интернет-магазина по запросу «красное платье» могут быть найдены товары, в описании которых есть слова «красное» и «платье». Семантический поиск позволит получить результаты с платьями разных оттенков красного, что повышает удобство использования.  

Использование векторного поиска для Amazon DocumentDB не требует дополнительных затрат. При хранении, индексировании и поиске векторов в Amazon DocumentDB будет взиматься стандартная плата за вычисления, ввод-вывод, хранение и резервное копирование. Подробные сведения см. на странице цен на Amazon DocumentDB.

Amazon DocumentDB интегрируется с Amazon SageMaker Canvas, что упрощает создание приложений на основе генеративного искусственного интеллекта (ИИ) и машинного обучения (МО) с использованием данных, хранящихся в Amazon DocumentDB. Больше не нужно разрабатывать собственные конвейеры данных и машинного обучения между Amazon DocumentDB и SageMaker Canvas. Интеграция в консоль устраняет необходимость в подключении и доступе к данным, что позволяет ускорить разработку машинного обучения без необходимости писать код. Вы можете запустить SageMaker Canvas из консоли Amazon DocumentDB и добавить существующие базы данных Amazon DocumentDB в качестве источника данных.

Интеграция с нулевым использованием ETL

Интеграция с сервисом Amazon OpenSearch с нулевым использованием ETL позволяет устранить операционные сложности, связанные с извлечением, преобразованием и загрузкой данных из коллекции Amazon DocumentDB в управляемый кластер или бессерверную коллекцию Amazon OpenSearch. Благодаря этой интеграции вам больше не придется создавать конвейеры данных, управлять ими или преобразовывать их содержание.

Если вы хотите использовать API MongoDB, следует применять возможности встроенных баз данных Amazon DocumentDB для выполнения векторного поиска среди документов. Интеграция Amazon DocumentDB с сервисом Amazon OpenSearch с нулевым использованием ETL – отличный вариант для поиска по коллекциям, а также для хранения и индексирования векторов с более чем 2000 измерениями.

При интеграции Amazon DocumentDB с сервисом Amazon OpenSearch с нулевым использованием ETL применяется Amazon OpenSearch Ingestion, что позволяет беспрепятственно перемещать операционные данные из Amazon DocumentDB в сервис Amazon OpenSearch. Сначала следует включить функцию изменения потока в коллекции Amazon DocumentDB, которую вы планируете реплицировать. Функция интеграции с нулевым использованием ETL настраивает конвейер Amazon OpenSearch Ingestion в вашем аккаунте, который автоматически реплицирует данные в управляемый кластер сервиса Amazon OpenSearch или бессерверную коллекцию.

Amazon OpenSearch Ingestion автоматически определяет формат данных в коллекциях Amazon DocumentDB и сопоставляет данные с сервисом Amazon OpenSearch для наиболее эффективных результатов поиска. Можно синхронизировать данные из нескольких коллекций Amazon DocumentDB с помощью разных конвейеров в один управляемый кластер или бессерверную коллекцию Amazon OpenSearch, чтобы получить целостную аналитику по нескольким приложениям. Дополнительно можно указать собственные процессоры данных при определении конфигурации получения данных в сервисе Amazon OpenSearch. Последующие обновления коллекций DocumentDB также реплицируются в сервис Amazon OpenSearch без вмешательства в ручном режиме.

Интеграция с нулевым использование ETL работает на встроенных возможностях преобразования данных конвейеров Amazon OpenSearch Ingestion для агрегации и фильтрации данных во время их перемещения.

Можно написать пользовательский алгоритм преобразования, если вам требуется специализированная функция, а Amazon OpenSearch Ingestion будет управлять самим процессом преобразования. Кроме того, если необходимо без дополнительной настройки перенести все данные из источника в получатель, Amazon OpenSearch Ingestion предоставляет готовые чертежи, с помощью которых можно выполнять интеграцию всего несколькими щелчками мыши.

Чтобы Amazon OpenSearch Ingestion предоставлялись необходимые разрешения на репликацию данных с Amazon DocumentDB, функция интеграции с нулевым использованием ETL создает роль IAM с необходимыми разрешениями для чтения данных коллекции Amazon DocumentDB, а также записи в домен или коллекцию Amazon OpenSearch. Затем эту роль берут на себя конвейеры получения данных Amazon OpenSearch, гарантирующие постоянное соблюдение надлежащего уровня безопасности при перемещении данных от источника к конечной точке.

Все метрики по интеграции с Amazon DocumentDB с нулевым использованием ETL, можно просмотреть на консольных панелях, предоставленных в конвейерах Amazon DocumentDB и OpenSearch Ingestion. В Amazon CloudWatch также можно запрашивать журналы в реальном времени и настраивать собственные оповещения, которые запускаются при превышении заданных пользователем пороговых значений.

Подробнее о ценах

Посетите страницу цен на сервис Amazon DocumentDB (с поддержкой совместимости с MongoDB).

Подробнее 
Зарегистрировать бесплатный аккаунт

Получите мгновенный доступ к уровню бесплатного пользования AWS. 

Регистрация 
Начало разработки в консоли

Начните разработку с помощью сервиса Amazon DocumentDB (с поддержкой совместимости с MongoDB) в консоли AWS.

Войти