Publicado en: May 27, 2022
Hoy, nos complace anunciar que la versión 1.5.0 de la CLI de Amazon Genomics ha agregado compatibilidad para flujos de trabajo escritos en el lenguaje común del flujo de trabajo (CWL) mediante el motor de flujos de trabajo Toil. Además de con el CWL, la CLI de Amazon Genomics es compatible con flujos de trabajo escritos en el lenguaje de definición de flujos de trabajo (WDL), Nextflow, y Snakemake, lo que permite a los clientes ejecutar una amplia variedad de análisis de datos genómicos, como una llamada conjunta de variaciones genómicas y RNA-seq de una sola célula.
La CLI de Amazon Genomics simplifica y automatiza la implementación de recursos en la nube como motores de flujo de trabajo y clústeres de computación, lo que brinda a los clientes de genómica y ciencias biológicas una línea de comandos fácil de usar para configurar y ejecutar rápidamente flujos de trabajo de genómica en Amazon Web Services (AWS).
El lenguaje común del flujo de trabajo (CWL) es un estándar abierto para describir cómo ejecutar herramientas de línea de comandos y conectarlos para crear flujos de trabajo. Las herramientas y flujos de trabajo descritos con CWL pueden trasladarse a varias plataformas, de modo que se facilita el escalado de análisis de datos complejos y flujos de trabajo de machine learning desde una única computadora portátil a entornos de computación en la nube. Toil es un sistema de administración de canalizaciones entre plataformas escalable y eficiente desarrollado por el Instituto Genómico de la Universidad de California Santa Cruz (UCSC-GI) y brinda compatibilidad total para la versión 1.2 del CWL. Gracias a una contribución de código abierto del equipo de Toil al UCSC-GI, ahora puede implementar rápidamente Toil en su cuenta de AWS como un contexto de la CLI de Amazon Genomics para ejecutar flujos de trabajo del CWL. Al igual que ocurre con otros contextos que utiliza la CLI de Amazon Genomics, Toil utilizará AWS Batch para computación, sacando partido de la asignación de trabajos y uso óptimos de las instancias de spot o bajo demanda de Amazon EC2.
Esta versión también incorpora la capacidad de configurar subredes de VPC específicas para su uso al brindar su propia VPC durante la activación de la cuenta; también es posible especificar una AMI personalizada para utilizarla en ciertos contextos. Estas mejoras ayudarán a los clientes a utilizar la CLI de Amazon Genomics en entornos de AWS que requieran el uso de AMI reforzadas y cuenten con topologías de red únicas.
Para obtener más información sobre la CLI de Amazon Genomics y comenzar a utilizarla, visite: