亚马逊AWS官方博客
Category: Analytics
如何在亚马逊云科技数据湖内删除用户数据
在本文中,我们将介绍一套框架,帮忙清除您组织中的亚马逊云科技托管数据湖内的各特定用户数据。此外,我们还将共同了解一套由多种不同亚马逊云科技存储层构成的分析解决方案,以及针对Amazon S3的示例代码。
Amazon Redshift十大性能调优技巧综述
在 Amazon Redshift 的协助下,客户得以顺利完成一系列业务目标,例如从加速现有数据库环境,到提取网络日志以进行大数据分析等等。
Amazon EMR在FreeWheel的应用与实践
FreeWheel大数据团队在搭建数据仓库的过程中,在EMR的使用上积累了大量的实践和运维经验,本文将从EMR实践的角度出发,讲述FreeWheel Transformer团队在搭建ETL pipeline的过程中是如何玩转EMR的,以期抛砖引玉。
在Amazon Kinesis Data Analytics中通过PyFlink实现Python流数据处理和分析
本文首先介绍了在亚马逊云科技平台上使用Apache Flink的快速方式 – Amazon Kinesis Data Analytics for Flink,然后通过一个无服务器架构的示例演示了如何在Amazon Kinesis Data Analytics for Flink通过PyFlink实现Python流数据处理和分析,并通过Glue和Athena对数据进行即席查询。
大道至简-使用Athena对数据ETL处理
This article introduces the use of Athena to crop, enrich, repartition, format conversion and other ETL operations
使用SQL Server原生备份与还原功能,将本地SQL Server数据库迁移至Amazon RDS on VMware
Amazon RDS on VMware支持在本地VMware环境下为用户提供托管SQL Server数据库服务。SQL Server的管理工作向来以复杂与耗时著称,但RDS on VMware足可以帮助大家在VMware vSphere集群上轻松的配置、扩展并运营SQL Server。您可以将原有的本地SQL Sever数据库迁移至RDS on VMware上,借此发挥托管服务的固有优势。
在Amazon RDS for MySQL数据库上提升MySQL只读副本的最佳实践
在本文中,我们将了解如何通过上述方法在Amazon RDS for MySQL数据库上执行主版本升级,以及与之相关的最佳实践。此外,我们还将探讨可供选择的其他操作步骤。
数据分析的技术源流
对于数据仓库、大数据、数据湖等技术源流的回顾与思考,厘清技术发展的脉络
通过 EventBridge+SNS+Lambda 实时捕获EMR集群的状态变化
通过结合EventBridge、消息主题(SNS),以及按事件调用触发的无服务器函数Lambda,可以实时捕获EMR集群的生命周期变化,如集群的创建和停止,扩容和缩容以及其他类型的集群状态变更等。 本文演示如何捕获EMR集群状态变更(我们以AWS的新加坡区域为例)并发送到当前常用的“企业微信”和“钉钉”手机客户端,其他AWS服务场景请酌情参考。
使用 Amazon Personalize 在 StockX 上拓展个性化用户体验
本文为StockX公司Sam Bean与Nic Roberts II撰写的客座文章。援引他们的表述,“StockX是一家来自底特律的初创公司,希望以独特的竞价/出价市场革新电子商务体系。我们平台的设计灵感源自纽约证券交易所,并将运动鞋与街头潮牌服饰等商品视为高价值可交易商品。凭借运营透明化的市场交易体验,StockX将帮助消费者以真实市场价购买备受追捧的真品。”