Amazon EMR 上的 Apache Hadoop
为什么选择 EMR 上的 Apache Hadoop?
Apache™ Hadoop® 是一个开源软件项目,可用于高效地处理大数据集。利用 Hadoop,您可以将商用硬件组成集群以便并行分析海量数据集,而不必使用一台大型计算机处理和存储数据。
Hadoop 生态系统中具有大量应用程序和执行引擎,提供了多种可满足您的分析工作负载需求的工具。 借助 Amazon EMR,您可以轻松创建和管理由 Amazon EC2 实例组成的配置完整的弹性集群,这些实例运行 Hadoop 及 Hadoop 生态系统中的其他应用程序。
Hadoop 与大数据有何关联?
Hadoop 高度可扩展,因而通常用于处理大数据工作负载。为了提升 Hadoop 集群的处理能力,可添加更多具备所需 CPU 和内存资源的服务器来满足您的需求。
Hadoop 具备出色的耐用性和可用性级别,同时仍能并行处理计算分析工作负载。处理能力高度可用、持久耐用且具备出色的可扩展性,这让 Hadoop 成为了适合用于处理大数据工作负载的绝佳方案。您可以使用 Amazon EMR 在几分钟内创建和配置一个运行 Hadoop 的 Amazon EC2 实例集群,然后开始从数据中获取价值。