客户案例 / 生命科学 / 美国

2024 年
A-alpha Bio 徽标

A-Alpha Bio 在 AWS 上使用 NVIDIA BioNeMo 提高蛋白质相互作用预测性能

了解生物技术公司 A-Alpha Bio 如何在 AWS 上使用 BioNeMo 将蛋白结合预测增加到 10 倍,同时将模型速度提高到 12 倍。

将推理调用速度

提高 12 倍

将评估的蛋白结合

预测增加 10 倍

进行了 108 万次

 推理调用

减少了 1 到 2 个试验循环,

因此降低了成本并加速了蛋白质设计

概述

生物技术初创企业 A-Alpha Bio 致力于利用合成生物技术和机器学习(ML)来测量、预测和设计蛋白质相互作用(PPI)。该公司在 Amazon Web Services(AWS)计算基础设施上使用了 BioNeMo Framework,这是 AWS 合作伙伴 NVIDIA 提供的用来研发药物的生成式人工智能(AI)解决方案。

通过在 AWS 上使用 BioNeMo,A-Alpha Bio 将 PPI 结合预测吞吐量增加到 12 倍,并在 2 个月内处理了 1 亿多次推理调用,是最初预测数量的 10 倍。在简单、高效的设置流程的支持下,A-Alpha Bio 在 AWS 上开展了培训。这极大地提高了候选药物的质量,因此能够在湿实验室中更高效地推动有前景的候选药物,同时减少了所需的设计-构建-测试循环。通过在基于 NVIDIA 的专用 AWS GPU 实例上使用 BioNeMo,A-Alpha Bio 显著提高了发现可行疗法的可能性。

1912524385

机会 | A-Alpha Bio 在 AWS Batch 上使用 NVIDIA BioNeMo 加速机器学习

总部位于西雅图的 A-Alpha Bio 致力于生成有关 PPI 的大规模定量数据,以加速药物发现并设计极其有效的蛋白质疗法。该公司采用了两个关键的专有解决方案。第一个是 AlphaSeq,这是一个试验平台,可以快速、定量地同时测量数百万种蛋白与蛋白结合力。第二个是 AlphaBind,这是在世界上的最大 PPI 数据集上训练的一个机器学习平台,用来预测蛋白质序列的结合亲和力。

2024 年初,A-Alpha Bio 在 AWS 上进行了一项大规模试验,使用一个开源蛋白质语言模型 ESM-2 生成嵌入,以微调他们专有的蛋白与蛋白结合数据。“结合力越强,它的治疗效果就越好,”A-Alpha Bio 的机器学习研究总监 Adrian Lange 表示。这个计算密集型过程涉及多个活动,每个活动通过 ESM 处理 900 多万次交互,每次运行产生 65 万个嵌入。

该公司与 AWS 合作,发现可以使用 BioNeMo 增强这项试验。该公司于 2024 年 2 月开始将他们的 BioNeMo 容器部署到完全托管式批处理计算服务 AWS Batch。“实施 BioNeMo ESM-2nv 模型花费了大约一周的时间,而且我们可以轻松将 BioNeMo 容器整合到现有的 AWS 工作流和基础设施中,”A-Alpha Bio 的高级机器学习科学家 Aditya Agarwal 说道。“与 GitHub 常规模型相比,这使我们能够全面探索蛋白质突变并对大大扩展的突变景观图进行采样,因此显著提高了我们发现卓越候选药物的可能性。”

kr_quotemark

通过在 AWS 上使用 BioNeMo 改进模型,可以帮助我们加快发现药物。我们可以比以往任何时候都更详尽地探索蛋白质突变景观图,这样就提高了我们发现卓越候选药物的可能性。”

Adrian Lange
A-Alpha Bio 机器学习研究总监

解决方案 | 在 Amazon EC2 P5 实例上使用 BioNeMo 将推理速度提高到 12 倍

A-Alpha Bio 在治疗开发领域的开创性工作是围绕发现和优化蛋白质序列而展开的,这些蛋白质序列符合单克隆抗体(mAB)的特定设计标准。这一过程通常涉及设计-构造-测试循环的多次迭代,每次迭代都需要进行全面的时间和资源密集型湿实验室试验。mAB 在治疗中占主导地位,这一事实可以彰显了这项工作的重要性。三种 mAB 跻身于 2023 年十大最畅销药物之列,而且美国食品药物管理局批准的 mAB 药物数量超过其他类别的药物。然而,即使拥有广泛的训练数据,一般的蛋白质机器学习模型在专门应用于抗体时也往往不尽如人意,这突显了药物开发这一关键领域对专用方法的需求。

通过在 AWS 上部署 BioNeMo,该公司以前所未有的效率和预测精度对模型进行了训练。A-Alpha Bio 在 BioNeMo 框架中使用 ESM2nv 训练抗体设计模型,并确定具有更高结合力的 mAB。“通过扩大我们的优化型结合剂突变体池,我们减少了寻找优秀候选药物所需的迭代次数,因此显著节省了实验室时间、资源和成本,”Lange 表示。

该公司使用 Amazon Elastic Compute Cloud(Amazon EC2)实例开启了在 AWS 上的旅程,这些实例可以为几乎任何工作负载提供安全、可调整大小的计算容量,然后扩展以包含用来存储数据的 AWS Batch。为了进一步提高模型速度,A-Alpha Bio 采用了 Amazon EC2 P5 实例,这些实例由先进的 NVIDIA H100 Tensor Core GPU 提供支持,可以在 Amazon EC2 中为深度学习和高性能计算应用程序提供优异的性能。“AWS 团队非常乐于助人、协作性强,并指导我们在 AWS 上确定经济高效的容量,”Lange 说道。

为了确保以预留价格访问 P5 实例,A-Alpha Bio 使用适用于 ML 的 Amazon EC2 容量块,各个组织使用这些容量块在 Amazon EC2 中预留 GPU 实例以运行机器学习工作负载。使用容量块,客户可以以 1 天为时间间隔预留 1 到 14 天的实例,因此提高了确定 GPU 容量时的灵活性。通过在 P5 实例上使用 BioNeMo,该公司提高了性能并取得了令人印象深刻的成果:与在上一代 GPU 上运行开源模型相比,推理运行速度提高到 12 倍,还降低了试验成本。“我们从 P5 实例中获得了承诺的性能,”Lange 表示。“采用这种设置,我们不仅节省了时间,还削减了成本。”

2024 年初,A-Alpha Bio 在 AWS 上使用 BioNeMo 大幅扩展了业务,开展了六个不同的活动,每个活动进行了 1800 万次推理调用,总计 1.08 亿次推理调用。“我们最初的计划是处理 1000 万次调用,但随着速度和效率的提高,我们能够将工作负载增加 10 倍,”Lange 说道。“性能的显著提升促使我们大幅扩大了试验范围并迅速扩大了规模。”

由于评估的潜在 PPI 数量增加到 10 倍,A-Alpha Bio 有效地提高了利用同一个因素发现优异候选药物的可能性。如今,通过利用生成式人工智能和机器学习选择最佳起点,该公司可以消除一到两个循环的湿实验室反复试验,这些反复试验比计算测试更加昂贵和耗时。这样不仅可以帮助研究人员更快地获得答案,还使他们能够探索更复杂的蛋白质修饰。“我们可以设计和测试比以前具有更多突变和组合的蛋白质序列,从统计学上讲,这意味着我们现在可以发现比以前更优化的蛋白质序列,”Agarwal 表示。

成果 | 在 AWS 上使用 BioNeMo 探索蛋白质以获得更好的疗法

A-Alpha Bio 现在准备采用 BioNeMo 作为他们未来活动的标准解决方案。该公司计划在 BioNeMo 中探索其他基础模型,例如 ESM-3 和用于蛋白质折叠的 OpenFold。重要的是,该公司的目标是使用他们专有的 PPI 数据进一步训练和微调机器学习模型。

“通过在 AWS 上使用 BioNeMo 改进模型,可以帮助我们加快发现药物,”Lange 说道。“我们可以比以往任何时候都更详尽地探索蛋白质突变景观图,这样就提高了我们发现卓越候选药物的可能性。”

关于 A-Alpha Bio

A-Alpha Bio 是一家生物技术公司,致力于利用合成生物技术和机器学习来测量、预测和设计蛋白质相互作用,以改善人类健康。

使用的 AWS 服务

AWS Batch

AWS Batch 是一项完全托管式批处理计算服务,可以在所有 AWS 计算产品中规划、安排和运行您的容器化批处理机器学习、模拟和分析工作负载

了解更多 »

Amazon EC2

Amazon Elastic Compute Cloud(Amazon EC2)提供最广泛、最深入的计算平台,拥有超过 750 个实例,可选择最新的处理器、存储、网络、操作系统和购买模型,以帮助您最好地满足工作负载的需求。

了解更多 »

Amazon EC2 P5 实例

Amazon EC2 P5 实例由最新的 NVIDIA H100 Tensor Core GPU 提供支持,可以在 Amazon EC2 中为深度学习和高性能计算应用程序提供最高性能。 

了解更多 »

适用于 ML 的 Amazon EC2 容量块

适用于 ML 的 Amazon EC2 容量块可轻松预留 Amazon EC2 P5 实例和 Amazon EC2 P4d 实例,以供将来的开始日期使用。

了解更多 »

更多生命科学行业客户案例

未找到任何项目 

1

行动起来

无论行业无论规模,每天都有各种机构在使用 AWS 实现自身业务转型、实现企业愿景。欢迎您联系我们的专家,立即踏上您的 AWS 之旅。