Publicado: Nov 19, 2020
O AWS ParallelCluster é uma ferramenta de gerenciamento de clusters de código aberto com suporte e manutenção completos que permite que cientistas, pesquisadores e administradores de TI implantem e gerenciem clusters de Computação de Alta Performance (HPC) na Nuvem AWS. Os clusters de HPC são coleções de recursos de computação, armazenamento e rede altamente acoplados. Com eles, os clientes podem executar cargas de trabalho científicas e de engenharia em grande escala.
Os aprimoramentos significativos dos recursos desta versão mais recente do AWS ParallelCluster incluem:
- Suporte para instâncias P4d: Agora, os clientes podem selecionar instâncias P4d para uso em seus clusters. Essas instâncias incluem suporte para o RDMA (Acesso remoto direto à memória) NVIDIA GPUDirect habilitado por meio do Elastic Fabric Adapter, que pode acelerar aplicativos acoplados firmemente usando a NVIDIA Collective Communications Library (NCCL) para comunicação entre GPUs. Essa opção pode ser habilitada usando a nova configuração enable_efa_gdr.
- Suporte para o sistema operacional CentOS 8: Agora, os clientes podem escolher o CentOS 8 como seu sistema operacional básico para executar clusters em arquiteturas x86 e Arm. Como em outros sistemas operacionais compatíveis com o AWS ParallelCluster, você pode escolher seu sistema operacional usando a opção de configuração base_os e também pode criar e usar sua própria AMI personalizada, construída com base no CentOS 8. O suporte ao CentOS 8 também inclui compatibilidade com todos os agendadores compatíveis com o AWS ParallelCluster e o NICE DCV para visualização remota.
- Painel Métricas de cluster do Amazon CloudWatch: Os clientes podem rastrear e visualizar métricas operacionais para seus clusters no CloudWatch. Isso inclui métricas como utilização de CPU e rede, operações de leitura e gravação de dados do sistema de arquivos e operações de leitura e gravação para volumes do Amazon Elastic Block Store. Os clientes podem usar esse painel para visualizar o uso de clusters ou identificar gargalos de desempenho para diagnosticar a melhor maneira de melhorar o desempenho do cluster.
O AWS ParallelCluster está disponível gratuitamente, e você paga somente pelos recursos da AWS necessários para executar seus aplicativos. Veja como executar um cluster de HPC usando o AWS ParallelCluster aqui.
Para obter mais informações, você encontra todas as observações sobre o lançamento da última versão do AWS ParallelCluster aqui.