宣布推出 AWS Neuron SDK 2.26.0
发布于:
2025年9月19日
今天,AWS 宣布全面推出 Neuron SDK 2.26.0,改进了基于 AWS Inferentia 和 Trainium 的实例的深度学习工作负载。此版本引入了对 PyTorch 2.8 和 JAX 0.6.2 的支持,并增强了 Trainium2 (Trn2) 实例的推理功能。这些更新使开发人员能够利用最新的框架,同时受益于模型部署灵活性的提高和性能的优化。
借助 Neuron SDK 2.26.0,客户现在可以在 Trn2 实例上部署 FLUX.1-dev 图像生成模型,以及 Llama 4 Scout 和 Maverick 变体(测试版)。该版本推出了专家并行支持(测试版),能够在多个 NeuronCore 中高效分发混合专家 (MoE) 模型,并通过新的 Neuron Kernel 接口 (NKI) API 增加新的功能。更新后的 Neuron Profiler 提供了改进的功能,包括对分布式工作负载的系统配置文件进行分组。
新的 SDK 版本现已在支持 Inferentia 和 Trainium 实例的所有 AWS 区域推出,为机器学习工作负载提供了增强的性能和监控功能。
要了解更多信息以及新功能和增强功能的完整列表,请参阅: