O Quantitative Biology Center conduz novas pesquisas genômicas mais rapidamente usando a AWS

QuadX

Analisando as diferenças de expressão gênica

Todos os dias, pesquisadores do Quantitative Biology Center (QBiC) usam plataformas de computação de alta performance (HPC) para analisar dados genômicos e determinar, por exemplo, diferenças na expressão gênica entre tecidos normais e doentes. O QBiC está localizado na Universidade de Tübingen, na Alemanha, e apoia a pesquisa genômica dentro da universidade e em outras organizações de pesquisa em todo o mundo.

As workloads de HPC do QBiC são hospedadas principalmente em um datacenter on-premises. No entanto, como o volume de dados de pesquisa continua a crescer rapidamente, o QBiC prevê dificuldades em dimensionar de forma rápida e econômica. “Com o aumento de nosso volume de dados, percebemos que precisávamos de muito mais capacidade computacional do que nossa infraestrutura on-premises poderia fornecer”, explica Alex Peltzer, cientista sênior de pesquisa em bioinformática do QBiC. “Os pesquisadores que usam nossa plataforma também precisavam de melhor desempenho, para que pudessem analisar mais dados e concluir suas pesquisas mais rapidamente.” O maior valor do QBiC é o processamento de dados de acordo com os princípios de dados FAIR: encontrabilidade, acessibilidade, interoperabilidade e reusabilidade. “Atender aos requisitos de processamento FAIR envolve a necessidade de escalar com eficiência, o que não poderíamos fazer facilmente”, diz Peltzer.

“A configuração avaliada pode potencialmente reduzir nosso tempo de pesquisa genômica em 50% devido à automação e orquestração que obtemos com o AWS Batch.”

Alex Peltzer, cientista sênior de pesquisa em bioinformática, Centro de Biologia Quantitativa, Universidade de Tübingen

  • Sobre o Quantitative Biology Center (QBiC)
  • O Quantitative Biology Center (QBiC) é uma unidade de pesquisa que faz parte da Universidade de Tübingen, na Alemanha. O QBiC hospeda uma plataforma de pesquisa HPC para pesquisadores internos e externos analisarem e processarem dados genômicos.

  • Benefícios
    • Pode processar até 100 mil amostras genéticas em um único projeto de pesquisa
    • Reduz o tempo de pesquisa genômica em 50%
    • Acelera a pesquisa de diferenças de expressão genética
    • Reduz o custo da análise
  • Serviços da AWS usados

Aproveitar uma plataforma de pesquisa HPC e computação em nuvem baseada na AWS

A necessidade de escalabilidade e desempenho do QBiC o levou à nuvem Amazon Web Services (AWS). “Sabíamos que a nuvem atenderia às nossas necessidades e a AWS oferece tecnologia mais avançada do que os outros provedores que analisamos”, diz Peltzer. A AWS também se integra às estruturas Nextflow e nf-core, que oferecem suporte a fluxos de trabalho científicos escaláveis ​​usando contêineres de software. “A AWS funciona muito bem com o Nextflow, e nenhum outro provedor de nuvem poderia fazer isso”, diz Peltzer. “Sem essa integração, teríamos que gastar muito tempo e dinheiro reescrevendo os recursos de agendamento por conta própria.”

O QBiC optou por aproveitar as instâncias doAmazon Elastic Compute Cloud (Amazon EC2) com processadores Intel Xeon Scalable para sua infraestrutura on-premises existente. O QBiC agora executa o Nextflow na AWS para gerenciamento de fluxo de trabalho e usa o AWS Batchpara automação e orquestração de trabalhos em lote do Nextflow.

A organização também está usando instâncias spot do Amazon EC2 para reduzir os custos de análise. As instâncias spot do EC2 são capacidade de computação sobressalente na AWS disponível com descontos de até 90% em comparação com o preço das instâncias sob demanda. “Estamos reduzindo o custo da análise usando instâncias spot do Amazon EC2”, diz Peltzer. “Isso representa economia de custos que podemos colocar na pesquisa.”

Processando 100 mil amostras genéticas

Executando seus workloads de análise no Nextflow na AWS, o QBiC pode aproveitar o processamento paralelo e escalar sob demanda. “Usando a AWS, podemos escalar nossa plataforma HPC para cima ou para baixo rapidamente, seja processando 30 amostras genéticas ou 100 mil amostras em um projeto de pesquisa”, diz Peltzer. Além disso, o QBiC e seus clientes de pesquisa estão experimentando maior confiabilidade para trabalhos de sequenciamento genômico. “Não precisamos mais nos preocupar com interrupções do sistema e desempenho lento porque muitas pessoas estão na fila para processar trabalhos”, diz Peltzer. Embora a configuração esteja atualmente em execução em projetos de pesquisa técnica, os resultados atuais sugerem um potencial uso de produção.

Reduzindo o tempo de pesquisa genômica em 50%

Em seus projetos de benchmarking, o QBiC reduziu seu tempo de pesquisa e processamento para todos os trabalhos usando Amazon EC2 e AWS Batch, tanto para universidades como para organizações de pesquisa privadas que compartilham recursos com o centro. “A configuração avaliada pode potencialmente reduzir nosso tempo de pesquisa genômica em 50% devido à automação e orquestração que obtemos com o AWS Batch”, diz Peltzer. “Podemos fazer as coisas muito mais rápido em comparação com nosso ambiente on-premises.”

Como resultado, o QBiC e outras instituições de pesquisa na Alemanha veem um enorme potencial no uso de aplicações da Nuvem AWS. A infraestrutura distribuída pode ajudar o QBiC a concluir pesquisas mais rapidamente analisando a expressão gênica para encontrar mutações que possam estar envolvidas no câncer. “Realizando o sequenciamento genômico na AWS, estamos analisando dados de plantas e animais para ver como os tratamentos experimentais mudam a forma como certos genes são expressos”, diz Peltzer.

O QBiC continuará avaliando o uso dos serviços da AWS à medida que seus requisitos de pesquisa crescem. “Esperamos fazer parte de um dos maiores centros públicos de sequenciamento genômico na Alemanha nos próximos anos”, conta Peltzer. “A AWS nos ajudará a tornar isso possível.”

Saiba mais

Para saber mais, acesse thinkwithwp.com/hpc.