亚马逊AWS官方博客

Category: Analytics

使用 Alluxio 加速数据湖 ODS 写后读及 DWD 宽表性能

本文引入 Alluxio 集群缓存,对 S3,hdfs 等数据进行 warm up 或直写缓存透传,加速 ODS 数据入湖的写后读,以及 DWD 宽表的查询性能,通过测试比对,在实时数据湖场景中,通过引入 Alluxio 集群缓存,缩短了数据入湖时间,并大幅提升了数仓查询效率,本文中的示例脚本和代码,可以供感兴趣的小伙伴根据自己业务场景进行 Alluxio 的集成实施和优化。

StarRocks 3.0 存算分离版基于亚马逊云科技的最佳实践

StarRocks 致力于构建新一代极速全场景 MPP (Massively Parallel Processing)数据库,致力于帮助企业构建极速统一的湖仓分析新范式。从初创公司到企业,组织都在使用 StarRocks on AWS 解决方案进行数据分析和治理。 StarRocks on AWS 让我们的客户可以在全球各地快速可靠地构建自己的数据分析中心。现在,为了让更多用户以更低廉的成本进行数据分析和治理,我们推出了存算分离版本。让我们的用户可以提高资源利用率的同时优化成本。

通过 Amazon Clean Rooms 助力广告行业实现隐私保护的数据协作

本文介绍了 Clean Rooms 在面临广告行业隐私数据保护需求挑战时提供的解决方案,以及 Clean Rooms 中的分析规则、数据连接和最佳实践等。可以看到,Clean Rooms 为广告行业实现隐私保护的数据协作提供了重要支持,而随着服务的不断完善和新功能的增添,相信它将为企业开启更多高效、安全的协作新模式,实现隐私保护和商业价值的双赢。

基于 Flink on Kinesis Data Analytics 对数据进行流式处理

基于 KDA,用户可以通过使用 Flink 的流式处理引擎和 Kinesis Data Analytics 的实时数据分析和可视化工具来构建复杂的数据处理管道,这些管道可以从多个数据源中汇聚数据,并将其转换为有价值的信息。同时,基于 KDA 的解决方案还可以支持监控和告警等业务场景,以帮助用户快速识别和解决潜在的问题,并高效地处理和分析实时数据。