发布于: May 10, 2018
Amazon Kinesis Data Firehose 增加了对 Apache Parquet 和 Apache ORC 格式的支持,因此您可以将实时数据以流式处理的方式传输到 Amazon S3 中,享受成本高效的存储和分析服务。
Apache Parquet 和 Apache ORC 属于列数据格式,允许您以更高效、更经济的方式存储和查询数据。您现在可以配置自己的 Kinesis Data Firehose 传输流,以自动将数据转换为 Parquet 或 ORC 格式后再传输到您的 S3 存储桶。这无需任何编码,您可以使用 Amazon Athena 和 Amazon Redshift Spectrum 远远更快地查询 S3 数据,从而帮助您节约存储和查询成本。 基于使用量的计费模式适用于 Kinesis Data Firehose 中的数据格式转换。有关更多信息,请参阅定价页面。
Amazon Kinesis Data Firehose 是将流数据加载到 AWS 的最简单方式。如要开始使用 Kinesis Data Firehose,请访问控制台以及开发人员指南。
如需 Kinesis Data Firehose 可用区的列表,请参阅 AWS 区域表。