亚马逊AWS官方博客
使用 AWS Step Functions 和 AWS Glue 编排基于 Amazon Redshift 的 ETL 工作流
在本文中,我将展示如何使用 AWS Step Functions 和 AWS Glue Python Shell 以完全无服务器的方式为那些基于Amazon Redshift 的 ETL 工作流编排任务。AWS Glue Python Shell 是一个 Python 运行时环境,用于运行中小型 ETL 任务,例如提交 SQL 查询和等待响应。Step Functions 可让您将多个 AWS 服务协调到工作流中,从而可以轻松运行和监视一系列 ETL 任务。AWS Glue Python Shell 和 Step Functions 均无服务器,允许自动运行和扩展它们以响应定义的事件,而无需配置、扩展和管理服务器。
利用 DataSunrise Security 保护和审计 Amazon Redshift 中的 PII 数据
这篇文章重点介绍了 Amazon Redshift 的主动安全性,尤其是 DataSunrise 对个人身份信息 (PII) 的屏蔽和访问控制功能,您可以使用 DataSunrise 的被动安全性产品(如敏感信息访问审计)来支持这些功能。文章还讨论了 Amazon Redshift 的 DataSunrise 安全性、工作原理以及如何使用。
利用 Redshift 控制台简化 Amazon Redshift 集群的管理
这篇文章讨论了如何使用新控制台创建第一个集群,以及如何在您的 AWS 帐户中管理和监控集群。
如何在不停机的情况下将大型数据仓库从 IBM Netezza 迁移到 Amazon Redshift 中
在本文中,我们将说明此客户如何在不需要停机的情况下将大型数据仓库从 IBM Netezza 迁移到 Amazon Redshift,然后再说明如何遵照计划充分的迁移过程及利用 AWS Schema Conversion Tool (SCT) 和 Amazon Redshift 最佳实践。
如何为 Amazon S3 中的 AWS KMS 加密数据启用跨账户 Amazon Redshift COPY 和 Redshift Spectrum 查询
此博文显示了如何使用 Amazon S3 中的示例数据集设置跨账户 Amazon Redshift COPY 和 Spectrum 查询的逐步演练。示例数据集使用 AWS KMS 托管的密钥 (SSE-KMS) 进行静态加密。
使用 AWS CloudFormation 自动创建 Amazon Redshift 集群
在本博文中,我将介绍如何在 AWS 账户中自动部署 Amazon Redshift 集群。有关安全性和高可用性的 AWS 最佳实践有助于集群配置,并且您可以使用 AWS CloudFormation 快速创建集群。 我将向您介绍一组 CloudFormation 示例模板,您可以根据需要对其进行自定义。
为共享和协作而优化的现代分析平台 –使用 Mode 和 Amazon Redshift建设分析堆栈
通过本博文,您将了解:
1. 商业智能 (BI) 现代化的发展各个阶段。此部分将介绍组织在没有真正对分析平台进行现代化改造的情况下采用现代 BI 工具时会出现的问题。
2. 将使用仪表盘和notebook笔记本的解决方案与高效数据管道集于一体的云优先数据科学平台将会以何种方式呈现。
3. 对上述平台进行快速复制的步骤。可以将协作分析解决方案(例如 Mode,Amazon Redshift 合作伙伴之一)与基于 AWS 数据仓库、ETL 和数据探索服务的强大分析基础工具相结合。
授予对 Amazon Redshift 管理控制台的细粒度访问权限
Amazon Redshift 是一项完全托管的服务,它的设计宗旨是易于设置和使用。在本博文中,我们将演示如何为某一运营组中的用户授予访问权限,以便他们仅在 Amazon Redshift 管理控制台中执行特定操作。如果您实施自定义 IAM 策略,则可以对其进行设置,以便这些用户可以监控和终止正在运行的查询。同时,您可以防止这些用户执行其他需要更多权限的操作,例如修改、重启或删除 Amazon Redshift 集群。
利用 AWS Lake Formation 探索元数据:第 2 部分
在本博文系列的第 1 部分中,您学习了如何使用 Lake Formation 来创建和探索数据湖。本博文将引导您使用控制台中的 Lake Formation 的元数据搜索功能来发现数据,并了解受列权限限制的元数据搜索结果
使用 AWS Lake Formation 构建、保护和管理数据湖
传统上,组织将数据保存在固化、单一用途的系统中,例如本地数据仓库设备。同样,他们使用单一方法来分析数据,例如预定义的 BI 报告。在数据库之间移动数据以使用不同方法(例如机器学习 (ML) 或即兴使用的 SQL 查询)来分析数据时,需要在分析之前进行“提取、转换、加载” (ETL) 处理。这些传统方法即便再好,也是效率低下且存在延迟的。最糟糕的是存在复杂的安全性。