Prezzi di AWS HealthOmics
Panoramica
AWS HealthOmics consente ai clienti ad accelerare le scoperte scientifiche con un'infrastruttura di bioinformatica e scoperta di farmaci completamente gestita e progettata per gestire flussi di lavoro e archiviazione su vasta scala. Con HealthOmics, i prezzi sono calcolati in base all'uso effettivo e non ci sono costi di licenza HealthOmics.
HealthOmics offre due tipi di flussi di lavoro. I flussi di lavoro privati sono personalizzati e definiti dall'utente; consentono di portare i propri script bioinformatici scritti nei linguaggi di flusso di lavoro utilizzati più di frequente. I prezzi dei flussi di lavoro privati si basano sulle risorse di calcolo e di file system richieste per ogni esecuzione. I flussi di lavoro Ready2Run sono pipeline bioinformatiche predefinite basate su analisi di settore comuni e prevedono il pagamento di un costo fisso per esecuzione.
HealthOmics offre due tipi di archiviazione. Gli archivi di riferimento e delle sequenze sono archivi di dati per oggetti che utilizzano tiering, compressione e catalogazione dei metadati per consentire l'archiviazione e l'organizzazione dei dati bioinformatici a costi contenuti. I prezzi si basano sulla dimensione dell'oggetto archiviato e sul tier dei dati. Gli archivi di varianti e annotazioni sono archivi zero-ETL che estraggono dati chiave dai dati bioinformatici per creare un data lake ottimizzato per la ricerca e la creazione di coorti. I prezzi si basano sulle dimensioni di archiviazione delle informazioni estratte.
È possibile utilizzare i flussi di lavoro e gli archivi dati insieme o separatamente, a seconda della necessità. In caso ci fosse la volontà di stabilire un impegno per tre o cinque anni, basta contattarci per ottenere prezzi scontati.
Esplora i prezzi per tipo
Con AWS HealthOmics, i prezzi sono calcolati solo in base all’uso effettivo. Esplora i prezzi per tipo di seguito.
Piano gratuito
Grazie al Piano gratuito AWS, è possibile iniziare a utilizzare AWS HealthOmics gratuitamente. Al momento dell'iscrizione, i nuovi clienti AWS ricevono fino a 275 ore di istanza omics.m.xlarge (o equivalenti) e 49.000 gigabyte all'ora di archiviazione per l'esecuzione di flussi di lavoro privati, 1.500 gigabase al mese di archiviazione attiva e di archiviazione nell'archivio delle sequenze e 200 gigabyte al mese di archiviazione nel archivio di varianti. L'utilizzo del piano gratuito viene calcolato ogni mese in tutte le Regioni, ad eccezione delle regioni AWS GovCloud (Stati Uniti), e viene applicato automaticamente in fattura; l'utilizzo mensile non utilizzato non verrà cumulato. Sono previste restrizioni. Consultare i termini per ulteriori dettagli.
Uso del piano gratuito mensile per i primi 2 mesi |
|
Flussi di lavoro di HealthOmics | Flussi di lavoro privati: 275 ore di istanza omics.m.xlarge, o istanze di calcolo equivalenti, e 49.000 GB all'ora di archiviazione di esecuzione |
Datastore di HealthOmics | Archivio delle sequenze: 1.500 gigabase al mese nella classe di archiviazione attiva e 1.500 gigabase al mese nella classe di archiviazione per archivio Archivio di varianti: 200 gigabyte al mese |
I clienti AWS ricevono 100 GB gratuiti di trasferimento dei dati in uscita su Internet ogni mese, aggregati in tutti i servizi e le Regioni AWS (eccetto Cina e GovCloud).
Prezzi dei flussi di lavoro privati
I flussi di lavoro privati sono flussi di lavoro personalizzati che vengono definiti in base al linguaggio di flusso di lavoro prescelto per eseguire pipeline di bioinformatica o scoperta di nuovi farmaci. Il costo è suddiviso in due componenti: le istanze delle attività del flusso di lavoro e l'archiviazione di esecuzione.
L'istanza omica viene addebitata in base agli utilizzi per ogni attività del tuo flusso di lavoro. Ogni attività del flusso di lavoro è mappata sulla più piccola istanza omica disponibile che soddisfi le vCPU, la memoria e/o le GPU richieste per l'attività. Ad esempio, un'attività definita per utilizzare 8 CPU e 60 GB di RAM verrà mappata al tipo di istanza omics.r.2xlarge per l'esecuzione. HealthOmics fornisce sempre esattamente le risorse richieste. In questo esempio, per l'operazione saranno disponibili 8 CPU e 60 GiB di RAM. Le attività vengono fatturate con incrementi di 1 secondo; tuttavia, esiste una soglia di fatturazione minima di 60 secondi per attività. Nel caso in cui non si specifichino vCPU o memoria per un'attività, HealthOmics fornirà automaticamente il tipo di istanza più piccolo disponibile, omics.c.large, per queste attività. Inoltre, non vengono addebitati i costi di calcolo associati al data staging, ovvero alla gestione temporanea dei dati (ad esempio, importazioni ed esportazioni), e non sono previsti costi tra diverse zone di disponibilità (AZ).
Per l'archiviazione in esecuzione, è possibile scegliere un file system con provisioning statistico con un throughput maggiore del file system o un file system che scali dinamicamente. L'archiviazione a esecuzione statica è disponibile nelle seguenti dimensioni: 1.200 GiB, 2.400 GiB e successivamente in incrementi di 2.400 GiB, con una dimensione minima prevista di 1.200 GiB. L'archiviazione a esecuzione dinamica scala in base all'utilizzo e non richiede un requisito minimo di provisioning dell'archiviazione.
Vengono addebitate le risorse solo mentre l'esecuzione è in corso. Non viene addebitato alcun costo per le esecuzioni negli stati di attesa, di avvio o di arresto. Per le esecuzioni annullate o non riuscite, verranno addebitate tutte le risorse utilizzate fino al momento dell'annullamento o dell'esito negativo.
È possibile visualizzare i costi totali per ogni esecuzione sulla fattura AWS, rendendo facile e veloce la determinazione dei costi. HealthOmics fornisce anche uno strumento open source di analisi delle esecuzioni per aiutare a ottimizzare risorse, costi e prestazioni di esecuzione. In caso fosse previsto di eseguire flussi di lavoro di produzione su larga scala e ci fosse la volontà di stabilire un impegno per tre o cinque anni di utilizzo, basta contattarci per ottenere prezzi scontati.
Prezzi dei flussi di lavoro Ready2Run
I flussi di lavoro Ready2Run sono flussi di lavoro preconfigurati progettati da società di software di terze parti leader del settore, come NVIDIA, Sentieon, Element Biosciences e Ultima, insieme a pipeline open source comuni come i flussi di lavoro GATK del Broad Institute e AlphaFold per la previsione della struttura proteica. È possibile utilizzare semplicemente i flussi di lavoro Ready2Run per elaborare i dati senza la necessità di gestire gli strumenti software o gli script del flusso di lavoro. I flussi di lavoro Ready2Run sono basati su costo per esecuzione, e viene addebitata la stessa tariffa fissa quando le esecuzioni vengono completate con successo, indipendentemente dal tempo di esecuzione. Se l'esecuzione viene annullata o non viene completata correttamente entro la prima ora, il costo per esecuzione viene ripartito proporzionalmente in base alla prima ora di utilizzo. Le esecuzioni che vengono eseguite per più di 1 ora vengono fatturate per l'intero prezzo dell'esecuzione. I flussi di lavoro Sentieon Ready2Run richiedono un abbonamento separato, acquistabile da Sentieon. Un abbonamento di valutazione gratuito di due settimane viene fornito automaticamente da Sentieon senza costi aggiuntivi agli utenti che utilizzano Sentieon Ready2Run per la prima volta. Per visualizzare informazioni dettagliate sui flussi di lavoro Ready2Run disponibili, inclusi parametri di input, diagrammi del flusso di lavoro e tempi di esecuzione stimati, visitare la console HealthOmics.
Prezzi dei datastore
I datastore HealthOmics sono archivi gestiti in modo reperibile, accessibile, interoperabile e riutilizzabile (i cosiddetti FAIR) per dati di esempio su larga scala con compressione automatica dei dati e interrogabilità ottimizzata di varianti/annotazioni.
L'archivio delle sequenze offre risparmi sui costi grazie al tiering e alla compressione basati sull'utilizzo. Gli oggetti archiviati sono raggruppati in set di lettura per l'organizzazione e la reperibilità. Quando i dati vengono archiviati nell'archivio delle sequenze, il pagamento avviene per gigabase al mese. Un gigabase è un miliardo di basi dai file di sequenza importati (come FASTQ, BAM e CRAM). Poiché la fatturazione è per gigabase, non è necessario preoccuparsi dei formati dei file o delle tecniche di compressione ottimali. AWS HealthOmics ottimizza il tutto per conto dell'utente. È possibile accedere ai dati nell'archivio delle sequenze in due modi: 1/ Tramite lettura, scrittura e aggiornamento delle API HealthOmics e lettura tramite le API S3. Per l'accesso tramite le API HealthOmics, il pagamento avviene in base alle richieste GET inviate agli oggetti read-set. Tutti gli altri tipi di richiesta HealthOmics sui read-set sono gratuiti. 2/ Tramite elenco e API S3 GET. Per l'accesso tramite API S3, le richieste COPY e LIST vengono fatturate separatamente da tutti gli altri tipi di richiesta. Per vedere come i costi dell'archivio delle sequenze di HealthOmics si confrontano con opzioni di archiviazione alternative, consultare il nostro blog: https://thinkwithwp.com/blogs/industries/store-omics-data-cost-effectively-at-any-scale-with-aws-healthomics/
Gli archivi di varianti e annotazioni utilizzano Zero-ETL per preparare i dati di varianti e annotazioni per l'esecuzione di query, la creazione di coorti e l'analisi con servizi AWS come Amazon Athena e Amazon SageMaker. I file inseriti vengono elaborati da HealthOmics e convertiti in formati ottimizzati per le query. È possibile archiviare qualsiasi quantità di dati di varianti e annotazioni e il pagamento avviene in base a ciò che viene archiviato. La dimensione dei dati fatturati è definita come la dimensione dei dati dopo l'inserimento e la trasformazione. L'accesso ai dati nell'archivio delle varianti e delle annotazioni avviene in genere tramite altri servizi AWS. Tuttavia, quando vengono eseguite query e analisi di dati in altri servizi, è necessario pagare per l'utilizzo di tali servizi.
I dati archiviati negli archivi AWS HealthOmics vengono addebitati per una durata di archiviazione minima di 30 giorni, mentre i dati eliminati prima di tale scadenza comportano un addebito proporzionale pari al costo di archiviazione per i giorni rimanenti.
Esempi di prezzo
-
Esempio di prezzo n. 1: flusso di lavoro privato con archiviazione a esecuzione statica
Una scienziata bioinformatica desidera eseguire un flusso di lavoro Nextflow nei flussi di lavoro AWS HealthOmics nella Regione degli Stati Uniti orientali (Virginia settentrionale). Ha tre attività nel flusso di lavoro. La prima riserva 16 vCPU e 30 GB di memoria e impiega 3 ore per essere eseguita. La seconda richiede 32 vCPU e 160 GB di memoria e impiega 2 ore per essere eseguita. La terza riserva 4 vCPU e 10 GB di memoria e impiega 10 minuti per essere eseguita. Il cliente registra il flusso di lavoro e chiama l'API StartRun con il file system predefinito da 1200 GB. I costi complessivi addebitati sono:
Attività 1 (omics.c.4xlarge): 0,9180 USD all'ora × 3 ore = 2,754 USD
Attività 2 (omics.c.8xlarge): 2,7216 USD all'ora × 2 ore = 5,4432 USD
Attività 3 (omics.m.xlarge): 0,2592 USD all'ora × 1/6 ore = 0,0432 USD
Archiviazione a esecuzione statica: 0.0001918 USD per GB all’ora × (1.200 GB × (3 ore+2 ore+1/6 ora)) = 1,18916 USD
Totale: 9,42956 USD -
Esempio di prezzo n. 2: flusso di lavoro privato con archiviazione a esecuzione dinamica
Una scienziata bioinformatica sta sviluppando un nuovo flusso di lavoro WDL in AWS HealthOmics nella Regione degli Stati Uniti orientali (Virginia settentrionale). Ha tre attività nel flusso di lavoro. La prima riserva 16 vCPU e 30 GB di memoria e impiega 3.5 ore per essere eseguita. La seconda richiede 32 vCPU e 160 GB di memoria e impiega 2.25 ore per essere eseguita. Il cliente registra il flusso di lavoro e chiama l'API StartRun con il file system dinamico. Nel corso dell'esecuzione del flusso di lavoro di 5,75 ore, il file system cresce linearmente da 0 GB a 1043 GB, per un totale di 3000 GB all'ora di spazio di archiviazione dei file. I costi complessivi addebitati sono:
Attività 1 (omics.c.4xlarge): 0,9180 USD all'ora × 3,5 ore = 3,213 USD
Attività 2 (omics.c.8xlarge): 2,7216 USD all'ora × 2,25 ore = 6,1236 USD
Archiviazione a esecuzione dinamica: 0,0004110 USD per GB all’ora × 3.000 GB all’ora = 1,233 USD
Totale: 10,5696 USD -
Esempio di prezzo n. 3: flussi di lavoro Ready2Run
Una scienziata computazionale desidera eseguire la linea germinale GATK-BP fq2vcf per un flusso di lavoro Ready2Run del genoma 30x nella Regione degli Stati Uniti orientali (Virginia settentrionale) per 3 campioni. Il cliente inserisce i propri dati e chiama l'API StartRun per ogni campione. Il costo per le 3 esecuzioni è:
Linea germinale GATK-BP fq2vcf per un flusso di lavoro Ready2Run del genoma 30x: 10 USD per esecuzione × 3 = 30 USD
Totale: 30 USD -
Esempio di prezzo n. 4: archivio delle sequenze
Un'iniziativa di sequenziamento della popolazione sta iniziando a sequenziare gli individui da una biobanca raccolta. Si è scelto di farlo nella Regione Europa occidentale (Irlanda). Sequenziano 100.000 individui (ciascuno su 130 gigabase, 50 gigabyte) e archiviano i dati di sequenziamento non elaborati nell’archiviazione di AWS HealthOmics. Nei successivi cinque anni, rimangono nella classe di archiviazione dell'archivio dopo i 30 giorni successivi all'importazione, e vi si accede in media due volte quando passano alla classe di archiviazione attiva per 30 giorni. Usano le API S3 per accedere ai file. Ogni genoma viene scaricato in 500 parti, generando 500 chiamate API GET. Il loro costo totale in cinque anni per un singolo genoma è:
Classe di archiviazione attiva: 0,005769 USD gigabase al mese × 130 gigabase × 90 giorni = 2,22 USD
Classe di archiviazione attiva: 0,001154 USD gigabase al mese × 130 gigabase × (1.825 - 90) giorni = 8,56 USD.
API S3 GET: 0,0004 USD/1000 chiamate API × (2 × 500 chiamate API) = 0,0004 USD
Costo totale per 5 anni: 2,22 USD + 8,56 USD + 0,0004 USD = 10,78 USD (o 2,15 USD all'anno)
-
Esempio di prezzo n. 5: Archivio di varianti
Un data scientist ha 3.202 file di formato (VCF) di chiamata che desidera analizzare in Amazon Athena nella Regione degli Stati Uniti orientali (Virginia settentrionale). Crea un archivio di varianti e inserisce questi file con le API di AWS HealthOmics. I dati inseriti hanno la dimensione di 1,5 TB. Nel corso del mese successivo, esegue 1.000 query in Athena, calcolando le frequenze alleliche per diverse sottopopolazioni, ciascuna delle quali consuma in media 50 GB. I suoi costi totali mensili sono:
Archivio di varianti: 0,035 USD GB al mese × (1.024 GB/TB × 1,5 TB) = 53,76 USD
Amazon Athena: 5 USD / TB × 1.000 × 50 / 1.024 = 244,14 USD
Prezzi per trasferimento dei dati
Viene addebitato il prezzo per l'intera larghezza di banda di HealthOmics. Le tariffe per il trasferimento dei dati non si applicano ai dati trasferiti a qualsiasi servizio AWS all'interno della stessa Regione AWS dell'archivio dati. I prezzi riportati di seguito si basano sui dati trasferiti «in entrata» e «in uscita» da AWS HealthOmics (tramite Internet pubblico) †††. Ulteriori informazioni sui prezzi di AWS Direct Connect. Per trasferimenti di dati superiori a 500 TB/mese, contattaci.
I livelli tariffari tengono conto dell'utilizzo aggregato per i trasferimenti di dati in uscita verso Internet su tutti i servizi AWS.
††† Il trasferimento dei dati in uscita potrebbe essere diverso dai dati ricevuti dall'applicazione nel caso in cui la connessione venga interrotta in modo prematuro. Ad esempio, se viene effettuata una richiesta per un oggetto da 10 GB e la connessione è interrotta dopo aver ricevuto 2 GB di dati. AWS HealthOmics tenta di interrompere lo streaming di dati, ma ciò non avviene istantaneamente. Nell'esempio, il trasferimento dei dati in uscita potrebbe essere 3 GB (1 GB in più rispetto ai 2 GB ricevuti). Di conseguenza, in questo caso verranno addebitati 3 GB di trasferimento dei dati in uscita.