Analytics | 亚马逊AWS官方博客

Amazon EMR 上 Apache Hudi 0.9.0 提供的新功能

本博文介绍了Amazon EMR 支持新的Apache Hudi 0.9.0

使用 Amazon Glue、Amazon Neptune 和 Spline 为数据湖构建数据沿袭

随着数据环境复杂性的增加，客户在以经济高效且一致的方式捕获沿袭时，面临着巨大的可管理性挑战。在这篇文章中，我们将向您介绍为数据湖构建端到端的自动化数据沿袭解决方案的三个步骤：沿袭捕获、建模和存储，最后是可视化。

Amazon Redshift 继续保持在性价比方面的领先地位

这篇文章详细介绍了我们通过 Amazon Redshift 机群的遥测数据发现的分析工作负载趋势，我们为提高 Amazon Redshift 性价比而推出的新功能，以及通过源自 TPC-DS 和 TPC-H 的最新基准测试获得的结果，这些结果有力地支持了我们的领先地位。

IoT 数据摄入和可视化的 7 种模式 – 如何确定最适合您使用场景的模式

无论您是刚刚开始物联网（IoT）之旅，还是已经拥有数百万台互联的 IoT 设备，您可能都在寻求方法以最大限度地利用从 IoT 数据中提取的价值。IoT 设备数据所报告的遥测数据、元数据、状态以及命令和响应中包含了丰富的信息。但是，要想获得尽可能提升运营效率和交付业务成果所需的洞察，拥有正确的报告和可视化解决方案是关键所在。

利用QuickSight和AWS serverless服务创建跨账号的支持案例面板

对于任何一个客户或合作伙伴来说，集中查看所有用户打开的案例并了解其情况是很有价值的，能帮助他们方便的参考当前案例和过往案例的概况，同时也易于与组织内的其他人分享案例中的经验教训以提高生产力，而AWS的合作伙伴可以利用面板的观察，准确掌控案例开启和处理的状况来提高案例的处理质量。

无需订阅费! 手把手教你如何在Amazon OpenSearch Service中使用跨集群复制功能（Cross-Cluster Replication）

本文介绍了Amazon OpenSearch Service提供的跨集群复制CCR功能，通过CCR用户可以轻松快速地将数据索引的复制，以实现对集群读写分离、故障转移、跨区域同步、集中式管理等应用场景的支持。

使用 AWS Glue、Apache Hudi 和 Amazon S3 构建无服务器管道以分析串流数据

企业通常会积累海量数据，并继续生成越来越多的数据量，从 TB 级到 PB 级，有时甚至会生成 EB 级的数据。此类数据通常在不同的系统中生成，需要聚合到一个位置进行分析和生成洞察。借助数据湖架构，您可以聚合各个孤岛中的数据，将其存储在一个集中式存储库中，实施数据治理，并支持基于这些存储的数据进行分析和机器学习（ML）。

利用Amazon Redshift的流式摄取构建实时数仓

可将数据流摄取到云数据仓库中。流式摄取可以帮助用户以极低延迟，在几秒钟内将数百MB数据摄取到Amazon Redshift云数据仓库集群

使用AWS托管MSK Connector和EMR Flink从AWS RDS进行CDC数据消费

Flink MSK CDC consumption

自动驾驶数据湖（四）：可视化

云上自动驾驶数据湖参考架构和落地实践。

Category: Analytics