Publicado: Feb 4, 2019
Agora você pode fazer o download do código-fonte do cliente do catálogo de dados do AWS Glue para o Apache Hive Metastore. Esse cliente pode usar qualquer cluster do Amazon EMR com o Apache Hive 2.x que utiliza o catálogo de dados do AWS Glue como um Hive Metastore externo.
O catálogo de dados do AWS Glue é um repositório de metadados compatível com o Apache Hive Metastore totalmente gerenciado. Os clientes podem usar o catálogo de dados como um repositório central para armazenar metadados estruturais e operacionais para seus dados. O AWS Glue fornece integração imediata com o Amazon EMR, que permite aos clientes utilizar o catálogo de dados do AWS Glue como um substituto para um Hive Metastore externo. Para saber mais, visite a nossa documentação.
Esse código serve como uma implementação de referência para a criação de um cliente compatível com o Hive Metastore, que se conecta ao catálogo de dados do AWS Glue. Com esta versão, os clientes e parceiros podem criar clientes personalizados que permitem que eles utilizem o catálogo de dados do AWS Glue com outras plataformas compatíveis com o Hive-Metastore, como outras distribuições do Hadoop e do Apache Spark. Para saber mais, visite nosso repositório GitHub.