TwelveLabs 的 Marengo Embed 3.0 现已登陆 Amazon Bedrock,助力高级视频理解
发布于:
2025年10月29日
TwelveLabs 的 Marengo Embed 3.0 现已在 Amazon Bedrock 上线,为处理视频内容的开发者与组织带来先进的视频原生多模态嵌入能力。Marengo 嵌入模型能将视频、图像、音频及文本统一至单一表示空间,帮助用户构建支持任意模态间搜索的视频检索与内容分析应用、推荐系统及其他多模态任务,并实现业界领先的性能表现。
Marengo 3.0 提供了多项关键增强功能。视频处理容量扩展:现可处理最高时长达 4 小时的音视频内容及 6GB 文件。处理容量较前代版本翻倍,非常适合用于分析完整体育赛事、长篇培训视频及全片电影制作。体育分析功能增强:该模型能更精准地理解比赛动态、球员移动及事件检测,实现显著性能提升。全球多语言支持:支持语言数量从 12 种增至 36 种,助力全球性组织构建可跨不同区域和市场无缝运作的统一搜索及检索系统。多模态搜索精度提升:现可在单次嵌入请求中同时结合图像与描述文本,将视觉相似性与语义理解融合,提供更精准且贴合语境的搜索结果。
AWS 是首家提供 TwelveLab 的 Marengo 3.0 模型的云服务商,该模型现已在美国东部(弗吉尼亚州北部)、欧洲地区(爱尔兰)及亚太地区(首尔)上线。该模型支持同步推理(适用于低延迟的文本与图像嵌入)及异步推理(适用于视频、音频及大规模图像文件处理)。 要开始使用,请访问 Amazon Bedrock 控制台。要了解更多信息,请查阅产品页面与文档。