亚马逊AWS官方博客
欢迎参加 2023 年 AWS 存储日
欢迎参加第五届 AWS 存储日! 该虚拟活动将于太平洋时间今天上午 9:00(美国东部时间中午 12:00)开始,您可以在 AWS On Air Twitch 频道上观看直播。第一届 AWS 存储日于 2019 年举办,该活动已发展成为我们期待每年举办的创新日。在去年的存储日文章中,我写了一篇关于 AWS 存储不断创新的文章,这些创新旨在帮助您在确保数据安全和受保护的同时将数据投入使用。今年的存储日活动侧重于人工智能/机器学习的存储、数据保护和弹性,以及迁移到云端的优势。
AWS 存储日的重要主题
谈及人工智能/机器学习的存储,当今的数据量正以前所未有的速度增长,从 TB 级爆炸式增长到 PB 级,甚至是 EB 级。借助 AWS 上的现代数据架构,您可以快速构建可扩展的数据湖,使用广泛而深入的专用数据服务集合,在不影响性能的情况下以低成本扩展系统,跨组织边界共享数据,以及管理合规性、安全性和治理,从而快速灵活地大规模制定决策。
为了训练机器学习模型和构建生成式人工智能应用程序,您必须制定正确的数据策略。因此,我很高兴地看到,在直播活动中值得期待的会议列表中,使用 AWS 基础设施优化生成式人工智能和机器学习会议讨论如何将数据转化为有意义的见解。
无论您是刚开始使用云、计划将应用程序迁移到 AWS,还是已经在 AWS 上构建应用程序,我们都提供资源帮助您保护数据并实现业务连续性目标。我们的数据保护和弹性功能以及解决方案可以帮助您实现业务连续性目标,并在数据丢失事件期间跨恢复点和时间目标(RPO 和 RTO)提供灾难恢复。随着当今世界的数据以前所未有的速度增长,确定您的数据存储在何处、如何保护数据以及谁有权访问数据更加凸显重要性。请务必参加在快速演变的网络格局中保护 AWS 中的数据会议,从中了解更多信息。
将数据迁移到云端时,您需要了解不同使用案例将数据移动到何处、正在移动的数据类型以及可用的网络资源等。迁移到云端有诸多原因,最近,企业战略小组(ESG)证实,组织通过将本地工作负载迁移到 AWS 云基础设施,可将计算、联网和存储成本降低多达 66%。ESG 证实,将本地工作负载迁移到 AWS 可以降低成本、提高性能、提升运营效率、缩短价值实现时间并改进业务灵活性。
我们召开的许多会议会根据您的使用案例讨论如何迁移到云端。我最期待混合云存储和边缘计算:AWS,应您所需会议,期间将讨论无法完全迁移到云端的工作负载的相关注意事项。
请注意收听专家关于 AWS 存储服务广泛产品组合的新声明、领导见解和教育内容,以及处理所有这些主题的功能。今天,我们发布了与 Amazon Simple Storage Service(Amazon S3)、Amazon FSx for Windows File Server、Amazon Elastic File System(Amazon EFS)、Amazon FSx for OpenZFS 等相关的公告。
我们来详细了解一下。
Amazon EBS 的 15 年
不久前,我拜读了 Jeff Barr 题为“AWS 博客的 15 年!”的文章 在这篇文章中,Jeff 提到他为最早期的 AWS 服务和功能撰写的几篇文章。Amazon Elastic Block Store(Amazon EBS)作为一项简化 Amazon EC2 使用的服务列入其中。
自宣布推出 Amazon EBS 以来已经过去 15 年,今天我们在此庆祝这项服务问世 15 周年。如果您是最初充分利用 Amazon EBS 的用户之一,并向我们提供非常有用的反馈,帮助我们发明、简化、迭代和改进此服务,那么我敢肯定,您简直不敢相信时间飞逝。如今,Amazon EBS 每天处理超过 100 万亿次的 I/O 操作,每天创建的 EBS 卷数量超过 3.9 亿。
如果您不熟悉 Amazon EBS,请加入我们,与 AWS 销售、营销和全球服务高级副总裁 Matt Garman 进行炉边交谈,了解 2008 年推出该服务背后的战略和当时客户面临的挑战。您还将从 EBS 的长期客户 Stripe 处听到自 12 年前 Stripe 创立以来其在 EBS 的发展。
Amazon EBS 不断提高其可扩展性和性能,以支持更多的客户工作负载(作为 Amazon EC2 实例的直接存储附件)。随着 8 月 2 日推出搭载定制第 4 代 Intel Xeon Scalable 处理器的 Amazon EC2 M7i 实例,您最多可以连接 128 个 Amazon EBS 卷,比上一代 M6i 实例的 28 个卷大幅度增加。随着卷附件数量的增多,您可以增加每个实例的存储密度并提升资源利用率,从而降低总体计算成本。
对于较大的数据库应用程序,您可以为每个实例托管多达 127 个容器,在需要预置更多实例时更经济地扩展这些容器,并且仅为所需的资源付费。随着数据库存储占用空间的增加,通过增加卷附件数量,您可以充分利用这些功能强大的 M7i 实例上可用的内存和 vCPU。EBS 还增加您可以为连接到实例的最多 128 个 EBS 卷创建的多卷快照数量,从而能够为连接到实例的所有卷创建崩溃一致性备份。
参加 Amazon EBS 的 15 年创新会议,讨论 Amazon EBS 最初的愿景如何演变以满足客户对云基础设施不断增长的需求。
适用于 Amazon S3 的 Mountpoint
适用于 Amazon S3 的 Mountpoint 现已正式推出,这是一款新的开源文件客户端,可提供高吞吐量访问权,从而降低 Amazon S3 上数据湖的计算成本。适用于 Amazon S3 的 Mountpoint 是一个文件客户端,用于将本地文件系统 API 调用转换为 S3 对象 API 调用。使用适用于 Amazon S3 的 Mountpoint,您可以将 Amazon S3 存储桶作为本地文件系统挂载到计算实例上,以便通过具有 Amazon S3 弹性存储和吞吐量的文件接口访问您的对象。适用于 Amazon S3 的 Mountpoint 支持对现有文件的顺序和随机读取操作,以及用于创建新文件的顺序写入操作。
深入了解和演示适用于 Amazon S3 的 Mountpoint 会议演示了如何使用文件客户端,通过文件 API 访问 Amazon S3 中的对象,从而更轻松地大规模存储数据,并通过分析和机器学习工作负载最大限度地提升数据的价值。阅读这篇博客文章,详细了解适用于 Amazon S3 的 Mountpoint 以及如何入门,包括演示。
借助 Amazon S3 Glacier Flexible Retrieval 让冷存储更快地运行
Amazon S3 Glacier Flexible Retrieval 可将数据恢复时间缩短多达 85%,无需支付额外费用。使用 Amazon S3 批量操作时,更快的数据恢复会自动应用于标准检索层。这些恢复操作将在几分钟内开始返回对象,因此您可以更快地处理恢复的数据。将恢复的数据与正在进行的恢复操作并行处理可帮助您加快数据工作流程并快速响应业务需求。现在,无论您是对媒体进行转码、恢复运营备份、训练机器学习模型,还是分析历史数据,都可以加快从归档中恢复数据的速度。
结合 S3 Glacier 将数百万个对象的恢复吞吐量提升高达 10 倍的改进(在 2022 年宣布推出),所有规模的 S3 Glacier 数据恢复现在都可受益于更快的启动速度和更短的完成时间。
参加使用 Amazon S3 Glacier 充分挖掘冷数据的价值会议,了解 Amazon S3 Glacier 如何帮助各行各业各种规模的组织实现数据存档转型,以释放商业价值、提高敏捷性并节省存储成本。阅读这篇博客文章,详细了解 Amazon S3 Glacier Flexible Retrieval 的性能改进,并且遵循分步指导以掌握如何开始从 S3 Glacier Flexible Retrieval 更快地进行标准检索。
支持广泛的文件工作负载
为了满足依赖文件系统的各种使用案例,我们提供了一系列文件系统服务,每种服务面向一组不同的需求。Amazon EFS 是一种无服务器文件系统,旨在为跨计算资源共享数据提供弹性体验。Amazon FSx 可让您更加轻松地以经济高效的方式在云端启动、运行和扩展功能丰富的高性能文件系统,并且无需更改代码、流程或数据管理方式即可顺利迁移到云端。
使用 Amazon EFS 为机器学习研究和大数据分析提供支持
Amazon EFS 提供完全可扩展的无服务器式文件存储,专为存储容量和吞吐量性能的高可扩展性而设计。就在上周,我们宣布增强对更快读写 IOPS 的支持,从而可以更轻松地为要求更高的工作负载提供支持。我们增加对每个文件系统高达 55,000 读取 IOPS 和高达 25,000 写入 IOPS 的支持,从而提高 Amazon EFS 的性能能力。这些性能增强可帮助您运行要求更高的工作流程,例如使用 KubeFlow 进行机器学习(ML)研究,使用 IBM Symphony 进行财务模拟,以及使用 Domino Data Lab、Hadoop 和 Spark 进行大数据处理。
参加大规模构建并运行分析和 SaaS 应用程序会议,了解最近推出的 Amazon EFS 性能改进如何协助支持更多工作负载。
Amazon FSx for OpenZFS 上的多可用区文件系统
现在,您可以在 Amazon FSx for OpenZFS 上创建文件系统时使用多可用区部署选项,从而更轻松地部署跨多个 AWS 可用区的文件存储,为业务关键型工作负载提供多可用区弹性。通过此次发布,您可以利用 Amazon FSX for OpenZFS 的强大功能、敏捷性和简单性来处理更广泛的工作负载,包括数据库、业务线和 Web 服务应用程序等业务关键型工作负载,这些工作负载需要跨多个可用区的高可用性共享存储。
新的多可用区文件系统旨在提供高水平的性能,从而服务各种工作负载,包括金融服务分析、媒体和娱乐工作流程、半导体芯片设计以及游戏开发和流式处理等性能密集型工作负载,为频繁访问的缓存数据提供高达每秒 21GB 的吞吐量和超过 1,000,000 IOPS,以及为从持久磁盘存储访问的数据提供高达每秒 10GB 的吞吐量和 350,000 IOPS。
参加将 NAS 迁移到 AWS 以降低 TCO 并获得敏捷性会议,详细了解采用 Amazon FSX for OpenZFS 的多可用区。
Amazon FSx for Windows File Server 上全新的更高吞吐能力级别
Amazon FSx for Windows File Server 的性能改进可帮助您缩短针对 SQL Server 数据库、媒体处理、云视频编辑和虚拟桌面基础设施(VDI)等性能密集型工作负载获得结果的时间。
我们新增四个更高的吞吐能力级别,将最大可用 I/O 从之前的每秒 2GB 提高到每秒 12GB。这些吞吐量提升伴随着相应更高级别的磁盘 IOPS,旨在提高至高达 350,000 IOPS。
此外,通过使用适用于 Windows File Server 的 FSx,您可以为 SSD 文件系统预置 IOPS,使其高于默认的每 GiB 3 IOPS。这样就可以独立于存储容量扩展 SSD IOPS,从而优化性能敏感型工作负载的成本。
参加将 NAS 迁移到 AWS 以降低 TCO 并获得敏捷性会议,详细了解 Amazon FSx for Windows File Server 的性能改进。
用于 AWS Backup 的逻辑无缝保管库
AWS Backup 是一种完全托管的、基于策略的数据保护解决方案,可让客户在 19 个 AWS 服务(涵盖计算、存储和数据库)和第三方应用程序(例如 AWS 和本地中的 VMware Cloud 以及 Amazon EC2 上的 SAP HANA)之间集中和自动进行备份恢复。
今天,我们宣布推出逻辑无缝保管库的预览版,这是一种新型的 AWS Backup 保管库,可作为额外的保护层来缓解恶意软件事件。借助逻辑无缝保管库,客户可以通过不同的可信账户恢复其应用程序数据。
参加深入了解勒索软件事件的数据恢复会议,详细了解 AWS Backup 的逻辑无缝保管库。
使用 AWS DataSync 将数据复制到其他云端或从其他云端复制数据
AWS DataSync 是一项在线数据移动和发现服务,可简化数据迁移,帮助您快速、轻松、安全地在 AWS 存储服务之间传输文件或对象数据。除了支持与 AWS 存储服务之间的数据迁移外,DataSync 还支持在 Google Cloud Storage、Azure Files 和 Azure Blob Storage 等其他云端之间进行复制。使用 DataSync,您可以在其他云端上的 Amazon S3 兼容存储和 Amazon S3 等 AWS 存储服务之间大规模移动对象数据。我们目前正在扩展 DataSync 对将数据复制到其他云端和从其他云端复制数据的支持,以包括 DigitalOcean Spaces、Wasabi Cloud Storage、Backblaze B2 Cloud Storage、Cloudflare R2 Storage 和 Oracle Cloud Storage。
参加大规模识别和加速数据迁移会议,详细了解 DataSync 的扩展支持。
在线加入我们
立即加入我们,参加 Twitch 上 AWS On Air 频道中的 AWS 存储日虚拟活动。该活动将于太平洋时间 8 月 9 日上午 9:00(美国东部时间中午 12:00)进行现场直播。所有会议均在存储日过后大约两天按需提供。
我们期待在 Twitch 上见到您!
– Veliswa