Analytics | 亚马逊AWS官方博客

基于 IoT 数据平台案例看 EMR HBase GC 优化

在当今数字化时代，物联网（IoT）设备的普及使得数据的产生与处理变得愈加复杂。我们正在运营一个全球服务的 IoT 数据平台，面临着众多挑战。在这个平台上，数百万设备持续不断地上报数据，写入并发量高达 12,000 次每秒。为了满足实时读取的需求，我们希望保持与本地 HDFS 性能一致，同时分时任务能够异步返回。

基于 TLS 1.2 TLS 1.3 的 SAML ADFS 实现控制台及 Redshift 用户的安全单点登录（三）

客户端前面两章分别完成了 Windows 服务器以及亚马逊云平台的安装配置，本章我们将在另一台 EC2 实例 […]

基于 TLS 1.2 TLS 1.3 的 SAML ADFS 实现控制台及 Redshift 用户的安全单点登录（二）

亚马逊云控制台配置上一章我们已经配置了 AD 域及 ADFS 服务，在域中添加了用户 bob 并将他设置为组 […]

基于 TLS 1.2 TLS 1.3 的 SAML ADFS 实现控制台及 Redshift 用户的安全单点登录（一）

背景介绍很多企业都希望借助 Windows Active Directory Federation Serv […]

引入作业队列，扩展您的 Amazon Glue 工作负载

数据是业务的关键驱动力。随着时间的推移，数据量可能会显著增加，而这些数据通常需要同时消耗大量计算资源。随着越来 […]

基于开源工具构建 EMR 数据分析平台（二）使用 Dinky 进行 Flink 任务开发、管理

本文介绍了 Dinky 作为一个开源的实时计算平台，如何与 Amazon EMR Flink 集成部署，为数据分析平台提供易用且强大的实时在线任务处理能力。Dinky 凭借其先进的架构设计、完备的功能模块和便捷的开发运维体验，能够很好地弥补 Amazon EMR 在任务提交、管理、监控等方面的复杂度，使得构建实时数据分析平台的整个过程更加顺畅高效。

基于开源工具构建 EMR 数据分析平台（一）方案总体介绍

本文提出了一种结合开源组件与 AWS 服务的综合性解决方案，旨在利用 Amazon 的高性能计算资源，为客户提供一个易于使用、开源可控、低成本、且功能完备的数据平台。该方案涵盖了调度平台、Flink 作业平台、Spark SQL 执行网关、SQL 开发平台和元数据管理平台等多个关键组件，并通过实际案例展示了其在生产环境中的成功应用。

基于亚马逊云科技托管 Flink 的开发系列 — SSL 认证的 Kafka 读取篇

1. 概述上文讲述了如何建立在 Apache Flink 中将数据写入到 Amazon S3。这篇文章将继续 […]

Serverless 架构下的高并发分析查询最佳实践与解决方案

本文主要介绍了在基于亚马逊云科技的一系列 Serverless 托管服务下快速构建的最佳实践和多套解决方案，可以满足不同业务场景下的高并发、低延迟的分析查询需求，同时易于运维与构建。

利用 Amazon FinSpace 构建 Quant Data Analytics 应用

本文围绕 kdb+以及 Amazon 托管的 kdb+ insights 服务，即 Amazon FinSpace，展开对 kdb+，尤其是 Amazon FinSpace 的架构以及功能介绍，并详细描述了如何利用 Amazon FinSpace 构建一个 Quant Data Analytics 应用的操作过程。

亚马逊AWS官方博客

Category: Analytics