Publié le: May 12, 2023
AWS Glue Crawler permet désormais aux clients d'apporter leurs propres pilotes JDBC personnalisés pour extraire des schémas de données à partir de sources de données et alimenter le catalogue de données AWS Glue. Les Glue Crawlers prennent déjà en charge les connexions JDBC Glue aux sources de données prises en charge sur AWS. Vous pouvez désormais utiliser vos propres versions de pilotes JDBC pour vous connecter à des sources de données dans Glue Crawlers. Ces sources de données incluent Postgres, MySQL, Oracle, SQL Server et Amazon Redshift.
Pour utiliser votre propre pilote JDBC, ajoutez le fichier du pilote à votre compartiment Amazon S3. Configurez ensuite la connexion Glue avec le chemin S3 du pilote JDBC et le nom de classe. À chaque exécution du Glue Crawler, une tâche Glue est lancée à l'aide du pilote JDBC fourni pour inspecter le schéma. Le Glue Crawler répertorie ensuite les informations du schéma, telles que les nouvelles tables, les suppressions et les mises à jour des schémas dans le catalogue de données AWS Glue. Avec AWS Glue, vous pouvez désormais utiliser le catalogue de données AWS Glue comme source pour extraire des données de ces sources et renseigner une cible Amazon S3.
La prise en charge des pilotes JDBC personnalisés par les AWS Glue Crawlers est généralement disponible dans toutes les régions commerciales où AWS Glue est disponible. Consultez le tableau des régions AWS. Pour en savoir plus, consultez la documentation de l'AWS Glue Crawler.