亚马逊AWS官方博客
Tag: Amazon Athena
使用 Amazon AppFlow 与 Amazon Athena 分析 Google Analytics 数据
本文向大家介绍了如何使用Amazon AppFlow将Google Analytics数据传输至Amazon S3,并使用Amazon Athena对数据进行分析。利用这套架构,大家无需自主构建专门面向Google Analytics或者其他SaaS应用的数据提取应用程序。Amazon AppFlow使您能够一次性建立起全自动数据传输与转换工作流,以及与之配套的集成查询环境。
如何在 ADFS 与 AWS 之间建立信任,并通过 Active Directory 凭证配合 ODBC 驱动程序接入 Amazon Athena
本文展示了如何在Active Directory当中配置ADFS 3.0,并将其作为IdP以使用SAML实现与AWS的身份验证联动。本文还探讨了如何将Athena ODBC驱动程序集成至ADFS,以及如何直接使用Active Directory凭证接入Athena。通过将Active Directory与Athena ODBC驱动程序集成起来,我们可以更灵活地通过各类熟悉的商务智能工具访问Athena,使用SQL分析Amazon S3中的数据且完全无需创建单独的IAM用户。
S3 成本优化 – Part 2 常见问题以及解决方案
Series blog of introduction for S3 cost optimization best practices.
S3 成本优化 – Part 1 最佳优化实践
Series blog of introduction for S3 cost optimization best practices.
AWS 教您手把手玩转 Apache Superset 可视化 Amazon S3 里的数据
本篇博客会带您一步一步地在AWS上部署Apache Superset并在Superset上创建一个展示新冠肺炎情况的Dashboard(示例如下)。新冠肺炎数据存储于Amazon S3上并通过Amazon Athena来直接查询。
使用 Amazon Athena 的联合查询和由用户定义的函数简化 ETL 数据管道
Amazon Athena 最近在预览版中增加了对联合查询及由用户定义的函数 (UDF) 的支持。请参阅使用 Amazon Athena 的全新联合查询对任何数据源进行查询,以了解更多详细信息。Jornaya 帮助营销人员智能的与市场中购买大型生活用品(如房屋、抵押贷款、汽车、保险和教育等)的消费者建立联结。
使用 Amazon Athena 从您的 SageMaker 笔记本运行 SQL 查询
本博文将引导您完成构建数据管道所需的全部步骤—从使用 AWS Glue,为您在 Amazon S3 中的数据创建元数据爬取程序,进行数据发现与编目;到使用 Amazon Athena 检索表数据,以及通过 Amazon SageMaker Notebooks查询 Athena 表。
在生产中结合使用 Amazon Redshift Spectrum、Amazon Athena 和 AWS Glue 与 Node.js
在此博文中,我们解释了将带 Redshift Spectrum 的 Amazon Redshift 扩展为现代数据仓库的原因。我将介绍我们的数据增长及平衡成本和性能的需求如何促使我们采用 Redshift Spectrum。我还将分享我们的环境中的关键性能指标,并讨论提供可扩展和快速环境的额外 AWS 服务,并提供数据供我们日益增长的用户群进行立即查询。
使用 Amazon Athena 访问跨账户 AWS Glue 数据目录
很多 AWS 客户采用多账户策略。集中式的 AWS Glue 数据目录对于在最大程度上减少与不同账户之间元数据共享相关的管理工作来说非常重要。本文介绍了基于 Amazon Athena 在不同 AWS 账户之间查询集中式数据目录的功能。
Amazon Athena 的十大性能优化技巧
在本博文中,我们将回顾可以提高查询性能的十大技巧。我们将着重关注对存储在Amazon S3上的数据的查询优化。Amazon Athena 使用 Presto 运行 SQL 查询,因此,如果您在 Amazon EMR 上运行 Presto,那么某些建议也行之有效。