AWS Deep Learning Containers

使用经过优化的预打包容器镜像快速部署深度学习环境

使用预打包且经过完整测试的 Docker 镜像,在几分钟内部署深度学习环境。

通过适用于常见框架(如 TensorFlow、PyTorch 和 Apache MXNet)的优化模型训练,自动提升性能。

以微服务的方式将机器学习(ML)快速添加到在 Amazon EKS 和 Amazon EC2 上运行的应用程序中。

通过与 Amazon SageMaker、Amazon EKS 和 Amazon ECS 集成构建自定义机器学习工作流,用于训练、验证和部署。

工作原理

AWS Deep Learning Containers 是 Docker 映像,其已预先安装并使用最新版本的热门深度学习框架进行了测试。Deep Learning Containers 让您能够快速部署自定义机器学习环境,而无需从头构建并优化环境。

显示 AWS Deep Learning Containers 如何协助用户部署自定义机器学习环境并与其他 AWS 机器学习产品集成的示意图

使用案例

无人驾驶汽车 (AV) 部署

大规模开发高级 ML 模型,在您的环境中安全、快速地部署 AV 技术。

自然语言处理 (NLP)

使用最新的框架和库(包括 Hugging Face Transformers)减少部署 ML 模型所需的时间,同时加快投入生产的时间。

医疗保健数据分析

使用高级分析、ML 和深度学习功能分析不同的原始运行状况数据,以此识别趋势并进行预测。

支持的深度学习容器

有关深度学习容器支持的详细信息,请参阅发行说明

  框架: PyTorch TensorFlow    
  操作系统: Ubuntu Linux      
  实例: NVIDIA GPU AWS Trainium AWS Inferentia  
  平台: Amazon EC2 Amazon ECS Amazon EKS AWS Graviton

客户成功案例

  • Roblox

    Roblox 是一个沉浸式的游戏和创作平台,为人们提供了数百万种聚会方式,邀请其社区成员探索、创造和分享无尽的独特体验。Roblox 全球社区由数百万名开发人员组成,他们通过 Roblox Studio 创建和发布自己的沉浸式多人游戏体验。Roblox Studio 是该平台的多合一创作引擎,任何人都可以利用它构建自己想象中的一切。

    作为 Roblox 人工智能平台的一部分,我们在整个业务中训练并部署 250 多个模型。实际上,Roblox 上的每一次互动都有某种形式的人工智能驱动,包括安全性、生成式人工智能 3D 内容创作、体验推荐、实时翻译和其他用例。我们正在将 AWS 深度学习容器用于我们的 EKS GPU 节点组,因此我们不必担心基础设施、Nvidia 驱动程序和 CUDA 安装——这是可直接使用的。我们可以专注于对我们真正重要的事情,改进 GPU 调度和 GPU 利用率,以使我们的用户受益,降低我们为这些人工智能工作负载提供服务的成本。

    Denis Goupil,Roblox 首席机器学习工程师

如何开始

请查看更多资源

阅读 Deep Learning Containers 文档和教程。

开始通过免费账号试用

立即享受 AWS 免费套餐。

进行动手实践培训

开始在 Amazon EC2 上使用 Deep Learning Containers。


深入了解 AWS