将小型语音模型的机器学习模型训练时间
从数天缩短到几小时
将机器学习模型训练
吞吐量提升 30 倍
每周生成和存储
数 TB 的数据
最近的用户
增加了 456%
减少了视频制作
碳足迹
概述
传统上,当希望通过视频内容丰富自己的品牌影响力和沟通时,企业将面临着高昂的制作成本和漫长的过程。人工智能(AI)技术初创企业 Synthesia 致力于提供生成式人工智能视频创作即服务,以使客户能够在短短的几分钟内根据文本提示创建栩栩如生的视频。
Synthesia 希望改进他们的机器学习(ML)模型和升级他们用于训练这些模型的计算基础设施,以提高他们的视频制作软件即服务(SaaS)Synthesia Studio 的速度。这家快速成长的公司需要具有可扩展性和高性能的基础设施,因此利用 Amazon Web Services(AWS)上的 NVIDIA GPU 加速型实例来显著加快和扩展他们的机器学习训练,以支持 456% 的用户群增长。
机会 | 在 AWS 上使用由 NVIDIA GPU 提供支持的解决方案,通过人工智能快速从文本中制作视频
Synthesia 成立于 2017 年,致力于开发人工智能技术,客户可以使用这种技术制作以现有或自定义的人工智能头像为主角的教学视频。借助 Synthesia Studio,各个公司可以在几分钟内将文本转换成带有自然人工智能语音的专业视频,而不是等待几个月才能制作完整的视频。Synthesia 支持能够引起客户共鸣的丰富多彩的故事呈现和引人入胜的交流。该公司还优先考虑负责任地使用资源:所有机器学习训练数据都是在征得同意之后获得的,所有头像都是在演员同意的情况下开发的。此外,该公司还加入了“内容真实性倡议”,该计划提倡以负责任的方式使用合成媒体。
在迅速发展到 350 名员工和 5 万名客户之后,Synthesia 发现在本地计算机上训练机器学习模型变得效率低下。2023 年,该公司决定在 AWS 上优化他们的机器学习管道。尽管 Synthesia 的生产设施每周可生成数 TB 的数据,但该公司需要非常高的计算能力来训练他们的文本转视频机器学习模型。由于拥有 50 多名机器学习研究人员在训练大型模型,该公司需要一个可扩展的大型数据湖和计算集群,以便全天候运行多个生成式人工智能模型。
Synthesia 之所以选择 AWS,是因为 AWS 的完全托管式服务可以满足多项关键要求。“AWS 从一开始就成为了我们公司的一部分”,Synthesia 的 CTO Jon Starck 表示。“我们的目标是让更多的人们能够在世界上的任何地方参与视频创作,我们希望在云端提供大规模构建和自助服务。AWS 提供了我们希望采用的多种服务,而且他们为初创企业制定了关键计划。” 例如,该公司利用 AWS 提供的初始免费计算容量。这两个团队还定期召开会议,而且 Synthesia 发现了 AWS 在他们快速扩展时提供的支持的价值。“在 AWS 上,我们可以扩展和调整我们的设置,以满足我们的新需求”,Starck 说道。“AWS 团队可以帮助选择正确的服务,并提供财务规划以便能够实现成本效益。”
在 AWS 上,Synthesia 切换到了多节点计算集群,以使用 PyTorch 在由各种 NVIDIA GPU 提供支持的 Amazon Elastic Compute Cloud(Amazon EC2)实例上进行分布式机器学习模型训练。“随着公司的发展,安全性、可靠性、可用性和规模都至关重要”,Starck 表示。“随着规模的扩展,我们必须进行调整。由于能够访问 AWS 上的托管式服务以及可供我们使用的大量服务,因此我们获得了巨大的好处。”
在 AWS 上,我们可以灵活地更改我们的基础设施,同时保持计算可用性以满足我们的工作负载需求。”
Jon Starck
Synthesia 的 CTO
解决方案 | 使用由 NVIDIA GPU 提供支持的 Amazon EC2 实例,将机器学习模型训练速度提高 30 倍
该公司采用由 NVIDIA H100 Tensor Core GPU 提供支持的 Amazon EC2 P5 实例和由 NVIDIA A100 Tensor Core GPU 提供支持的 Amazon EC2 P4 实例,将模型训练速度提高了 30 倍。该公司还使用由 NVIDIA A10G Tensor Core GPU 提供支持的 Amazon EC2 G5 实例来处理数据和优化视频渲染运行时。在 AWS 上,Synthesia 可以快速制作客户视频,并比以前的系统更快地提供预览。“我们为新实验批处理数据集,通常可以同时运行多达 100 个实例,”Starck 说道。“实验是开发数百个能够提供自然、逼真的表演和内容的头像的关键。”
该公司使用 Amazon EKS、AWS ParallelCluster 和 AWS Batch 管理他们的计算容量。“我们需要训练人工智能模型并大规模提供人工智能工作负载,而由于拥有这些编排、集群管理和批处理选项,因此我们能够根据使用案例构建最佳、最高效的计算基础设施,”Starck 表示。使用这些托管式服务和由 NVIDIA GPU 提供支持的计算实例,Synthesia 将小型语音模型的机器学习模型训练时间从数天缩短到几小时。此外,该公司还在使用 Amazon Simple Storage Service(Amazon S3)存储他们的大型数据集,这项对象存储服务可以从任意位置检索任意数量的数据。
Synthesia 在 PyTorch 上构建他们的人工智能工作流,这些工作流专为灵活的机器学习试验和高效生产而设计。该公司还使用基于 GPU 的并行计算平台和编程模型 NVIDIA CUDA 进行视频渲染和推理。
Synthesia 的用户群在短时间内显著增长,在成长的道路上,该公司将可持续发展视为优先事项。例如,机器学习模型训练和推理中涉及的计算密集型工作负载在 AWS 欧洲区域的 NVIDIA GPU 上运行,这些区域几乎完全由可再生能源供电。总体而言,根据 Synthesia 的经验,合成视频制作比传统视频制作明显更具可持续性。
成果 | 利用可扩展的云基础设施支持持续增长
Synthesia 现在正在努力为他们的客户提供近乎实时的交互式视频渲染。随着规模不断发展壮大,该公司计划使用存储在他们的数据湖中的大型 3D 数据集创建更高级的 3D 头像。
“我们不再在本地 PC 上训练模型,而是在多节点计算集群上进行大规模训练,”Starck 说道。“在 AWS 上,我们可以灵活地更改我们的基础设施,同时保持计算可用性以满足我们的工作负载需求。”
关于 Synthesia
Synthesia 是一家人工智能(AI)技术公司,致力于开发将文本转换成视频的软件即服务产品,以供各个公司利用人工智能快速制作教学视频。
使用的 AWS 服务
Amazon EC2 G5 实例
Amazon EC2 G5 实例是基于 NVIDIA GPU 的最新一代实例,可用于各种图形密集型和机器学习使用案例。
Amazon EC2 P4 实例
Amazon Elastic Compute Cloud(Amazon EC2)P4d 实例为云端机器学习(ML)训练和高性能计算(HPC)应用提供了高性能。
Amazon EC2 P5 实例
Amazon Elastic Compute Cloud(Amazon EC2)P5 实例由最新的 NVIDIA H100 Tensor Core GPU 提供支持,在 Amazon EC2 中为深度学习(DL)和高性能计算(HPC)应用程序提供最高性能。
Amazon EKS
Amazon Elastic Kubernetes Service(Amazon EKS)是一项托管 Kubernetes 服务,用于在 AWS Cloud 和本地数据中心上运行 Kubernetes。
更多生成式人工智能客户案例
行动起来
无论行业无论规模,每天都有各种机构在使用 AWS 实现自身业务转型、实现企业愿景。欢迎您联系我们的专家,立即踏上您的 AWS 之旅。