亚马逊AWS官方博客
Stable Diffusion 3.5 Large 现已在 Amazon Bedrock 正式可用
正如我们在 AWS re:Invent 2024 上预先宣布的那样,您现在可以在 Amazon Bedrock 上使用 Stable Diffusion 3.5 Large。这一强大的模型能够根据各种风格的文本描述生成高质量的图像,支持多种风格,帮助媒体、游戏、广告及零售行业的客户加速概念艺术、视觉效果以及精细产品图像的创作。
2024 年 10 月,Stability AI 推出了 Stable Diffusion 3.5 Large,这是 Stable Diffusion 家族中最强大的模型,拥有 81 亿参数,并在 Amazon SageMaker HyperPod 上接受了训练,具有卓越的质量和出色的文本提示响应能力。Stable Diffusion 3.5 Large 可加速分镜绘制、概念艺术创作和视觉效果的快速原型设计。您可以快速生成高质量的 1 百万像素图像,用于营销活动、社交媒体内容及广告,从而节省时间和资源,同时保持创意控制。
Stable Diffusion 3.5 Large 为用户提供了几乎无限的创意可能性,包括:
- 多功能风格 – 您可以生成各种风格和美学的图像,包括三维、摄影、绘画、线条艺术以及您能想象到的几乎任何视觉风格。
- 精准的提示响应 – Stable Diffusion 3.5 Large 具备高级的提示响应能力,能够严格遵循您的文本提示,是实现高效高质量创作的首选。
- 多样化的输出 – 您可以轻松创作反映多元世界的图像,包含不同肤色和特征的人物,无需进行复杂的提示设计。
现在,Amazon Bedrock 中的 Stable Image Ultra 已经更新,将 Stable Diffusion 3.5 Large 集成到其底层架构中。Stable Image Ultra 由 Stability AI 最先进的模型(包括 Stable Diffusion 3.5)提供支持,树立了图像生成的新标杆。它在排版设计、复杂构图、动态光影、鲜艳色彩和艺术协调性方面表现卓越。
通过此次对 Amazon Bedrock 中 Stable Diffusion 模型的最新更新,您将拥有更多的解决方案,助力提升创意并加速图像生成工作流程。
实操指南
开始使用之前,如果您是第一次使用 Stability AI 模型,请前往 Amazon Bedrock 控制台,然后在左下方窗格中选择模型访问权限。要访问最新的 Stability AI 模型,请请求访问 Stability AI 中的 Stable Diffusion 3.5 Large。
要在 Amazon Bedrock 中测试 Stability AI 模型,请在左侧菜单窗格的游乐场下选择图像/视频。随后,选择选择模型,然后选择 Stability AI 作为类别,并选择 Stable Diffusion 3.5 Large 作为模型。
您可以使用提示生成图像。以下是生成图像的示例提示:
夜晚,东京一条霓虹灯照亮的小巷里,高能量的街道场景,食物车里冒出蒸汽,五颜六色的霓虹灯照亮了雨水冲刷的人行道。
您还可以选择查看 API 请求,使用 AWS 命令行界面(AWS CLI)和 AWS SDK 中的代码示例访问模型,使用 stability.sd3-5-large-v1:0
作为模型 ID。
为了通过单个命令获取图像,可以输出 JSON 文件写入标准输出,然后使用 jq 工具提取编码的图像,以便即时解码。输出写入 img.png 文件中。
以下是 AWS CLI 命令的示例:
$ aws bedrock-runtime invoke-model \
--model-id stability.sd3-5-large-v1:0 \
--body "{\"text_prompts\":[{\"text\":\"夜晚,东京一条霓虹灯照亮的小巷里,高能量的街道场景,食物车里冒出蒸汽,五颜六色的霓虹灯照亮了雨水冲刷的人行道。\",\"weight\":1}],\"cfg_scale\":0,\"steps\":10,\"seed\":0,\"width\":1024,\"height\":1024,\"samples\":1}" \
--cli-binary-format raw-in-base64-out \
--region us-west-2 \
/dev/stdout | jq -r '.images[0]' | base64 --decode > img.jpg
以下是如何借助适用于 Python 的 Amazon SDK (Boto3),使用 Stable Image Ultra 1.1 在模型底层架构中包含 Stable Diffusion 3.5 Large 的。借助作为模型 ID 的 stability.stable-image-ultra-v1:1
,这个简单的应用程序以交互方式请求输入文本到图像提示词,然后调用 Amazon Bedrock 生成图像。
import base64
import boto3
import json
import os
MODEL_ID = "stability.stable-image-ultra-v1:1"
bedrock_runtime = boto3.client("bedrock-runtime", region_name="us-west-2")
print("输入文本到图像模型的提示词:")
prompt = input()
body = {
"prompt": prompt,
"mode": "text-to-image"
}
response = bedrock_runtime.invoke_model(modelId=MODEL_ID, body=json.dumps(body))
model_response = json.loads(response["body"].read())
base64_image_data = model_response["images"][0]
i, output_dir = 1, "output"
if not os.path.exists(output_dir):
os.makedirs(output_dir)
while os.path.exists(os.path.join(output_dir, f"img_{i}.png")):
i += 1
image_data = base64.b64decode(base64_image_data)
image_path = os.path.join(output_dir, f"img_{i}.png")
with open(image_path, "wb") as file:
file.write(image_data)
print(f"生成的图像已保存到 {image_path}")
应用程序会将生成的图像写入 output
目录,如果不存在则会创建该目录。为了避免覆盖现有文件,代码会检查现有文件,找到以 img_<number>.png
格式提供的第一个文件名。
要了解更多信息,请访问调用 API 示例,使用 AWS SDK 构建应用程序以使用各种编程语言生成图像。
成果示例
以下是使用 Stable Diffusion 3.5 Large 创建的一些图像。
提示:一群全身入镜的大学生正在进行一个科技项目,前景中,Amazon Bedrock 中的 Stable Diffusion 3.5 几个字以欢快的草书字体呈现。 |
提示:三种药水的照片:第一种药水是蓝色的,标签为“MANA”,第二种药水是红色的,标签为“HEALTH”,第三种药水是绿色的,标签为“POISON”。年老的药剂师。 |
提示:摄影,黄昏中的粉红色玫瑰花散发着柔和的光芒,背景里是瓦屋。 |
提示:一个冒险家和他的宠物狗环游世界的 3D 动画场景。 |
立即使用
Stable Diffusion 3.5 Large 模型现已在美国西部(俄勒冈州)AWS 区域的 Amazon Bedrock 中正式推出。请查看完整区域列表,以了解将来的更新。要了解更多信息,请查看 Amazon Bedrock 中的 Stability AI 产品页面和 Amazon Bedrock 定价页面。
立即在 Amazon Bedrock 控制台中试用 Stable Diffusion 3.5 Large,并将反馈发送至 AWS re:Post for Amazon Bedrock 或通过常用的 AWS Support 联系人发送。
– Channy
*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您了解行业前沿技术和发展海外业务选择推介该服务。