Продукты Машинное обучение AWS HealthOmics  › Цены на AWS HealthOmics

 

 

Обзор

Сервис AWS HealthOmics ускоряет научные достижения с помощью полностью управляемой биоинформации и разработки лекарственных препаратов. Такая архитектура предназначена для обработки рабочих процессов и хранения данных в больших масштабах. Используя AWS HealthOmics, вы платите исключительно по факту использования. Затраты на лицензирование AWS HealthOmics отсутствуют.

Сервис AWS HealthOmics предусматривает два типа рабочих процессов. Частные рабочие процессы – это настраиваемые пользователем рабочие процессы, которые позволяют использовать собственные биоинформатические сценарии, написанные на наиболее часто используемых языках рабочих процессов. Цены на частные рабочие процессы зависят от вычислительных ресурсов и ресурсов файловой системы, запрашиваемых для каждого запуска. Рабочие процессы Ready2Run – это готовые биоинформатические конвейеры на базе стандартных отраслевых средств анализа. Вы платите фиксированную стоимость за каждый запуск.

Сервис AWS HealthOmics предусматривает два типа хранения данных. Хранилища справочников и последовательностей – это хранилища данных для объектов с многоуровневым распределением, сжатием и каталогизацией метаданных для обеспечения экономичного хранения и организации биоинформатических данных. Цены зависят от размера хранимого объекта и уровня данных. Хранилище вариантов и аннотаций – это хранилища с нулевым использованием ETL, которые извлекают ключевые данные из биоинформатических данных для создания озера данных, оптимизированного для поиска и создания когорт. Цены зависят от размера хранилища извлеченной информации.

При необходимости рабочие процессы и хранилища данных можно использовать вместе или отдельно. Если вы готовы взять на себя обязательства по использованию в течение трех или пяти лет, свяжитесь с нами для получения скидки.

Уровень бесплатного пользования

На Уровне бесплатного пользования AWS можно начать работу с сервисом AWS HealthOmics бесплатно. После регистрации новые клиенты AWS получают до 275 часов работы инстансов omics.m.xlarge (или эквивалент) и 49 000 гигабайт в час рабочего хранилища для выполнения частных рабочих процессов, а также 1500 гигабаз в месяцев активного и архивного хранилища в хранилище последовательностей и 200 гигабайт в месяц хранения в хранилище вариантов. Использование Уровня бесплатного пользования рассчитывается каждый месяц во всех регионах, за исключением региона AWS GovCloud (США), и автоматически применяется к счету. Неиспользованные в рамках месячного доступа ресурсы не переходят на последующие месяцы. Действуют определенные ограничения. Дополнительные сведения см. в условиях.

 

Ежемесячное использование уровня бесплатного пользования в течение первых 2 месяцев

Рабочие процессы AWS HealthOmics

Частные рабочие процессы: 275 часов работы инстанса omics.m.xlarge или эквивалентных вычислительных инстансов и 49 000 ГБ-часов хранилища запусков

Хранилища данных AWS HealthOmics Хранилище последовательностей: 1500 гигабаз в месяц в классе активного хранения и 1500 гигабаз в месяц в классе архивного хранения

Хранилище вариантов: 200 гигабайт в месяц

Клиенты AWS имеют возможность каждый месяц передавать в Интернет 100 ГБ исходящих данных совокупно для всех сервисов и регионов AWS (за исключением Китая и GovCloud).

Цены на частные рабочие процессы

Частные рабочие процессы – это настраиваемые рабочие процессы, которые вы определяете в зависимости от выбранного языка рабочих процессов для запуска биоинформации или разработки лекарственных препаратов. Стоимость зависит от двух компонентов инстансов – задач рабочих процессов и эксплуатиремого хранилища.

Плата взимается за инстанс omics, используемый для каждой задачи рабочего процесса. Каждая задача рабочего процесса сопоставляется с наименьшим доступным инстансом omics, удовлетворяющим запрошенным для этой задачи виртуальным ЦПУ, памяти и (или) графическим процессорам. Например, задача, для выполнения которой требуется 8 ЦПУ и 60 ГБ оперативной памяти, будет связана с типом инстанса omics.r.2xlarge. Сервис AWS HealthOmics всегда выделяет именно те ресурсы, которые требуются. В этом примере для выполнения задачи будет доступно 8 ЦПУ и 60 ГиБ оперативной памяти. Плата за выполнение задач выставляется с шагом в 1 секунду; однако минимальный порог оплаты составляет 60 секунд для каждой задачи. Если для задачи не указаны параметры виртуальных ЦПУ или памяти, сервис AWS HealthOmics автоматически предоставит для этих задач наименьший доступный тип инстанса omics.c.large. Кроме того, не взимается плата за вычислительные ресурсы, связанные с промежуточным хранением данных (например, импортом и экспортом), а также плата за использование ресурсов в разных Зонах доступности.

Чтобы хранить данные для запуска, можно выбрать статистически подготовленную файловую систему с большей пропускной способностью такой системы или динамически масштабируемую файловую систему. Статическое хранилище доступно в таких размерах: 1200, 2400 ГиБ, а затем с шагом 2400 ГиБ с минимальным выделенным размером 1200 ГиБ. Хранилище с динамическим запуском масштабируется в зависимости от использования и не имеет минимальных требований к выделению ресурсов хранения.

Плата за ресурсы взимается только после запуска. За запуски в состоянии ожидания, начала или остановки плата не взимается. За отмененные или неудачные запуски выставляется счет за все ресурсы, которые были израсходованы до момента отмены или сбоя.

Вы можете просматривать общую стоимость каждого запуска в счете AWS, что упрощает и ускоряет расчет затрат. Сервис AWS HealthOmics также предоставляет инструмент для анализа запуска с открытым исходным кодом, что позволяет оптимизировать эксплуатационные ресурсы, затраты и производительность. Если вы планируете масштабировать производственные процессы и готовы взять на себя обязательства по использованию в течение трех или пяти лет, свяжитесь с нами для получения скидки.

 

Цены на рабочие процессы Ready2Run

Рабочие процессы Ready2Run – это предварительно настроенные рабочие процессы, разработанные ведущими сторонними компаниями-разработчиками программного обеспечения, такими как NVIDIA, Sentieon, Element Biosciences и Ultima, а также стандартные конвейеры с открытым исходным кодом, например рабочий процесс GATK от Института Броуда и AlphaFold для прогнозирования структуры белков. Вы можете просто использовать рабочие процессы Ready2Run для обработки данных без необходимости управлять программными инструментами или сценариями рабочего процесса. Рабочие процессы Ready2Run оплачиваются за каждый запуск. Одинаковая фиксированная плата взимается за успешное выполнение запусков независимо от времени выполнения. Если запуск отменен или завершен с ошибкой в течение первого часа, плата за запуск пропорциональна первому часу использования. Счета за запуски, длящиеся более 1 часа, оплачиваются в размере полной стоимости запуска. Для рабочих процессов Sentieon Ready2Run требуется отдельная подписка, приобретенная у Sentieon. Sentieon автоматически предоставляет бесплатную пробную подписку на две недели без дополнительной оплаты для новых пользователей Sentieon Ready2Run. Подробнее о доступных рабочих процессах Ready2Run, включая входные параметры, диаграммы рабочих процессов и предполагаемое время выполнения см. на консоли AWS HealthOmics.

Цены на хранилища данных

Хранилища данных HealthOmics – это управляемое для поиска, доступное, совместимое и повторно используемое хранилище (FAIR) для крупномасштабных выборочных данных с автоматическим сжатием данных и оптимизированной функцией запроса вариантов и аннотаций.

Хранилище последовательностей позволяет сократить расходы за счет многоуровневого распределения и сжатия с учетом использования. Хранимые объекты сгруппированы по наборам для чтения, что позволяет упорядочить поиск. При хранении данных в хранилище последовательностей вы платите за гигабазу данных в месяц. 1 гигабаза – это 1 млрд пар оснований из импортированных вами файлов последовательностей (например, FASTQ, BAM или CRAM). Вы платите за гигабазу, поэтому вам не нужно беспокоиться об оптимальных форматах файлов или методах сжатия. Сервис AWS HealthOmics оптимизирует этот процесс. Доступ к данным в хранилище последовательностей возможен двумя способами. 1. С помощью API AWS HealthOmics для чтения, записи и обновления, а также чтения через API S3. В случае доступа через API AWS HealthOmics плата взимается за GET-запросы к объектам читаемых множеств. Другие типы запросов AWS HealthOmics к читаемым наборам являются бесплатными. 2. Через LIST S3 и получение API. В случае доступа через API S3 плата за запросы COPY и LIST взимается отдельно от других типов запросов. Чтобы узнать, сколько стоит хранилище последовательностей AWS HealthOmics по сравнению с альтернативными вариантами хранения, см. наш блог: https://thinkwithwp.com/blogs/industries/store-omics-data-cost-effectively-at-any-scale-with-aws-healthomics/

Хранилища вариантов и аннотаций не используют ETL для подготовки данных вариантов и аннотаций к запросам, когортированию и анализу с помощью сервисов AWS, таких как Amazon Athena и Amazon SageMaker. Вложенные файлы обрабатываются AWS HealthOmics и преобразуются в форматы, оптимизированные для запросов. Вы можете хранить любое количество данных о вариантах и аннотациях, оплачивая только сохраненные данные. Размер оплачиваемых данных определяется как размер данных после приема и преобразования. Доступ к данным в хранилище вариантов и аннотаций обычно осуществляется через другие сервисы AWS. При запросах к другим службам и проведении анализа данных в них вы платите за использование этих служб.

Минимальный оплачиваемый срок хранения данных в хранилищах данных AWS HealthOmics составляет 30 дней. За данные, удаленные до истечения 30-дневного срока, взимается плата, пропорциональная стоимости хранения за оставшиеся дни. 

Примеры расчета стоимости

  • Ученая-биоинформатик хочет запустить рабочий поток Nextflow в рабочих потоках AWS HealthOmics на Востоке США (Северная Вирджиния). Ее рабочий поток состоит из 3 задач. Под первую резервируется 16 vCPU, 30 ГБ памяти и 3 часа работы. Под вторую требуется 32 vCPU, 160 ГБ памяти и 2 часа работы. Под третью резервируется 4 виртуальных ЦП и 10 ГБ памяти, а ее выполнение занимает 10 минут. Клиент регистрирует рабочий поток и вызывает API StartRun с файловой системой по умолчанию (1200 ГБ). Общие расходы вычисляются так:
    Задача №1 (omics.c.4xlarge): 0,9180 USD/час * 3 часа = 2,754 USD
    Задача №2 (omics.r.8xlarge): 2,7216 USD/час * 2 часа = 5,4432 USD
    Задача №3 (omics.m.xlarge): 0,2592 USD/час * 1/6 часа = 0,0432 USD
    Статическое хранилище: 0,0001918/ГБ в час * (1200 ГБ * (3 часа + 2 часа + 1/6 часа)) = 1,18916 USD
    Итого: 9,42956 USD

  • Специалист по биоинформатике разрабатывает новый рабочий процесс WDL на основе AWS HealthOmics в регионе Восток США (Северная Вирджиния). Этот рабочий процесс состоит из двух задач. Под первую резервируется 16 виртуальных ЦП и 30 ГБ памяти, а ее выполнение занимает 3,5 часа. Для второй нужно 32 виртуальных ЦП, 160 ГБ памяти и 2,25 часа работы. Клиент регистрирует рабочий поток и вызывает API StartRun с динамической файловой системой. В течение 5,75 часов работы размер файловой системы линейно растет с 0 ГБ до 1043 ГБ, что составляет совокупно 3000 ГБ-ч использования файлового хранилища. Общие расходы вычисляются так:
    Задача №1 (omics.c.4xlarge): 0,9180 USD/час * 3,5 часа = 3,213 USD
    Задача №2 (omics.r.8xlarge): 2,7216 USD/час * 2,25 часа = 6,1236 USD
    Динамическое хранилище: 0,0004110 USD/ГБ-ч * 3000 ГБ-ч = 1,233 USD
    Итого: 10,5696 USD

  • Специалист по вычислениям хочет запустить рабочий процесс GATK-BP Germline fq2vcf для 30-кратного генома Ready2Run в регионе Восток США (Северная Вирджиния) для 3 образцов. Клиент вводит свои данные и вызывает API StartRun для каждого образца. Стоимость трех запусков
    Рабочий процесс GATK-BP Germline fq2vcf для 30-кратного генома Ready2Run: 10,00 USD/запуск * 3 = 30,00 USD
    Итого: 30,00 USD

  • В рамках инициативы по секвенированию населения начинается секвенирование людей из собранного биобанка. Провести его решено на Западе ЕС (Ирландия). Секвенируются 100 000 человек с получением 130 гигабаз (50 гигабайт) на каждого и хранением необработанных данных секвенирования в хранилище AWS HealthOmics. Через 30 дней после импорта они на 5 лет отправляются в класс архивного хранения. К ним обращаются в среднем дважды, и тогда они на 30 дней переходят в класс активного хранения. Для доступа к файлам используются API S3. Все геномы загружаются в 500 частях, генерируя 500 вызовов API GET. Общая стоимость за один геном в течение пять лет
    Класс активного хранения: 0,005769 USD гигабаз/месяц * 130 гигабаз * 90 дней = 2,22 USD
    Класс архивного хранения: 0,001154 USD гигабаз/месяц * 130 гигабаз * (1825 – 90) дней = 8,56 USD.
    API S3 GET: 0,0004 USD / 1000 вызовов API * (2 * 500 вызовов API) = 0,0004 USD
    Общая стоимость за 5 лет: 2,22 USD + 8,56 USD + 0,0004 USD = 10,78 USD (или 2,15 USD в год)

  • У специалиста по анализу данных есть 3202 файла в формате VCF (формат варианта вызова), которые он хочет проанализировать с помощью Amazon Athena в регионе Восток США (Северная Вирджиния). Он создает хранилище вариантов и загружает эти файлы с использованием AWS HealthOmics API. Размер загруженных файлов составляет 1,5 ТБ. В течение следующего месяца он обрабатывает в Athena 1000 запросов по расчету частоты аллелей для различных подсовокупностей, каждый из которых в среднем занимает 50 ГБ. Его общие ежемесячные расходы
    Хранилище вариантов: 0,035 USD ГБ/месяц * (1024 ГБ/ТБ * 1,5 ТБ) = 53,76 USD
    Amazon Athena: 5 USD/ТБ * 1000 * 50/1024 = 244,14 USD

Цены на передачу данных

Вы платите за всю пропускную способность AWS HealthOmics. Плата за передачу данных не распространяется на данные, переданные в какие-либо сервисы AWS в том же регионе AWS, что и хранилище данных. Приведенные ниже цены основаны на передаче данных в хранилище AWS HealthOmics или из него (через общедоступный Интернет)†††. Подробнее о ценах на AWS Direct Connect. Если объем передачи данных превышает 500 ТБ в месяц, свяжитесь с нами.

Уровни расценок учитывают совокупное использование исходящей передачи данных в Интернет всеми сервисами AWS.

††† Объем передачи исходящих данных может отличаться от объема, полученного вашим приложением, в случае предварительного прерывания подключения с вашей стороны, например, если вы запросите объект размером 10 ГБ и прервете подключение после получения первых 2 ГБ данных. AWS HealthOmics пытается остановить передачу данных, однако это не происходит незамедлительно. В приведенном примере объем исходящих данных будет равен 3 ГБ (на 1 ГБ больше, чем 2 ГБ, которые вы получили). В таком случае придется оплатить передачу 3 ГБ данных.