亚马逊AWS官方博客
Category: Analytics
基于Amazon Lambda 和 DuckDB 构建轻量 OLAP 引擎
基于AWS Lambda 和DuckDB构建轻量OLAP引擎
OPPO大数据平台在亚马逊云科技上的成本优化最佳实践
OPPO在大数据平台的成本优化最佳实践。
在 AWS 上使用 GraphQL 实现 API 现代化时的考虑事项
在接下来的数年内,各公司将构建超过 5 亿个新应用程序,超过之前 40 年中开发的应用程序近年来,GraphQL 已逐渐成为一种现代化的 API 方法。借助 GraphQL,各家公司可以提高应用程序的性能并加快开发团队构建应用程序的速度。在本帖子中,我们将讨论 GraphQL 的工作原理,以及将它与 AWS 服务集成对于帮助您构建现代应用程序能起到什么样的作用。我们将探讨在 AWS 上运行 GraphQL 的各种选项。
基于AWS Step Functions的通用负载编排框架
利用AWS Step Functions可以从正在运行的状态机开始新的状态机执行这一特性,可以构建基于AWS Step Functions的通用负载编排框架(Workload Orchestration Framework, WOF),使用嵌套工作流以实现降低主要流程的复杂性。为了更灵活的实现工作流,本方案开发了基于配置和Amazon EventBridge事件驱动的编排框架,可以通过配置文件而不是修改AWS Step Functions的JSON定义来编排工作流。
Data Analytics Foundations数据分析基座总览
亚马逊云科技大中华区专业服务团队(AWS Professional Services)发布了第一版数据分析基座快速部署解决方案(Data Analytics Foundations, DAF),提供一套解耦封装的功能模块,基于AWS的云原生服务进行了基础设施即代码IaC化的开发,功能面包括:数据整合、数据存储、数据处理、流程编排、目录和发现、资源监控、数据服务、数据管理和访问安全控制等,可以按需一键部署到AWS账号环境中。
借助Serverless服务实现EMR Instance Fleets集群自定义弹性伸缩
EMR Instance Fleets可实现费用和可用性自动选择的最佳组合,但目前不支持自定义弹性伸缩。通过此方案,客户针对EMR Instance Fleets集群基于自定义阈值进行弹性伸缩,可最大化的优化成本及精细化管理。
如何通过互联网安全地访问Amazon Managed Streaming for Apache Kafka (Amazon MSK) 集群(三)- SASL/SCRAM认证
本文手把手地介绍了如何配置Amazon MSK集群的Public Access选项,以及通过 SASL/SCRAM 身份验证的方式来安全地访问集群。Amazon MSK提供了三种可以公开访问集群的机制 – IAM 访问控制、SASL/SCRAM 以及 mTLS 身份验证,用户可以根据实际场景针对三种不同的认证方式进行选择并使用。
如何通过互联网安全地访问Amazon Managed Streaming for Apache Kafka (Amazon MSK) 集群(二)- mTLS认证
Amazon MSK提供了多种可以公开访问集群的机制,本文手把手地介绍了如何配置Amazon MSK集群的Public Access选项,以及通过 mTLS 身份验证的方式来安全地访问集群。
Amazon EMR 之 YARN Label 和 Amazon EC2 Spot 实例的天作之合
本文将会讨论如何对 EMR 进行配置,在集群的运行过程中,当 Spot 实例发生中断时,维持 EMR 集群的稳定性。
Redshift最佳实践之Aurora/DMS数据同步、无服务器架构以及权限管理
本博文以Redshift作为数仓,并使用 AWS Database Migration Service (AWS DMS) 及其更改数据捕获 (CDC) 功能将Aurora 数据库的数据同步到Redshift的方案来阐述系统实施过程中遇到痛点及解决办法,主要以围绕DMS数据同步,Redshift Serverless及权限控制来进行详细阐述。