亚马逊AWS官方博客
Tag: Amazon Athena
利用 Amazon Glue、Amazon Kinesis Data Streams、Amazon DynamoDB 和 Amazon QuickSight 的零售无服务器运营数据湖
您想减少商店缺货情况吗? 您想改善订单配送时间表吗? 您想为客户提供精确到毫秒的产品供应吗? 零售运营数据湖可 […]
使用 Amazon MSK、Apache Flink 和 Apache Hudi 实现流批一体的数据湖架构
这篇文章中,我们使用 Lambda 架构,介绍如何分析业务,以及如何以数据湖为本来形成流批一体的架构。
如何在跨账户环境下安全地执行操作系统脚本
大型企业上云过程中,通常会设置多个账号开展业务,企业IT运维人员需要自主负责云端实例内操作系统的运维操作。本文提出了基于亚马逊云科技的云原生服务构建跨账户安全执行操作系统脚本的方案设计。
基于Amazon Serverless和SageMaker实现空气质量预测
本文介绍了通过Amazon Serverlss实现低成本数据采集,并通过Amazon SageMaker进行数据处理与机器学习,对时间序列数据如空气质量进行分析与预测。
基于 VPC Flow Logs 的 NAT Gateway 网络流量分析与可视化方案
本解决方案提供了一种对流经NAT Gateway的流量进行分析与可视化的方案。通过亚马逊云科技提供的网络流量分析工具VPC Flow Logs,以及Serverless的数据分析工具Amazon Athena、Amazon Glue与Amazon QuickSight,建立了一套方便网络运维人员日常观测网络流量,或查询与诊断经NAT的网络问题的解决方案。
通过 Amazon CloudFront 实时日志快速构建自定义的 CDN 监控
本文介绍了一个快速构建自定义CloudFront监控的解决方案,方便用户通过分析日志获取自定义的指标
在Amazon Athena 上使用 Partition Projection 与 Glue Partition Indexes 效能比较
Amazon Athena 分区投影相关的功能,透过分区投影中的值做匹配计算,得出位置,减少分区元数据检索方面受到限制的查询的运行时间。随着时间的推移,Glue 也推出了分区索引相关的功能,可以方便客户与其他服务,如EMR、Glue ETL、Redshift Specturm… 等等,做元数据的储存与查询。许多人会有一个疑问是,Athena分区投影 与 Glue分区索引效能再一定的分区数量时的比较,也是这篇部落格会探讨的议题。
使用 Athena Federated Query 为 Tableau Server 提供多种数据源的统一管理和联合查询能力
本文以 CentOS 版本的 Tableau Server 为例,主要介绍如何通过 Athena 集成 Tableau 并不支持的数据源 (如 ElasticSearch,DynamoDB),并且利用 Athena单一数据来源,实现多数据库跨表读取与查询。
使用 JDBC 访问 Amazon Athena 的参数调优实践
本文给出了 Athena JDBC 特殊的工作机制以及如何根据实际情况对 JDBC 的性能进行适当的调优。
使用 Amazon Athena 做漏斗分析
本文介绍了如何使用 Amazon Athena 做漏斗分析,并给出了完整 SQL 设计方案和思路。