Publié le: Jun 5, 2023
AWS Glue for Ray, une option de moteur d'intégration de données sur AWS Glue, est désormais disponible pour tous. AWS Glue for Ray aide les ingénieurs de données et les développeurs ETL (extraction, transformation et chargement) à adapter leurs tâches Python. AWS Glue est un service évolutif d'intégration des données sans serveur utilisé dans le cadre de la découverte, la préparation, le déplacement et l'intégration des données depuis des sources multiples. AWS Glue for Ray combine cette capacité sans serveur pour l'intégration de données avec Ray (ray.io), un nouveau cadre de calcul open-source populaire qui vous aide à mettre à l'échelle les charges de travail Python.
À l'instar des moteurs Apache Spark et Python sur AWS Glue, vous ne payez que pour les ressources que vous utilisez lors de l'exécution du code, et vous n'avez pas besoin de configurer ou d'ajuster les ressources. AWS Glue for Ray facilite le traitement distribué de votre code Python sur des clusters multi-nœuds. Vous pouvez créer et exécuter des tâches Ray partout où vous pouvez exécuter des tâches ETL AWS Glue. Cela inclut les tâches AWS Glue existantes, l'interface de la ligne de commande (CLI) et les API. Vous pouvez sélectionner le moteur AWS Glue for Ray localement ou via des blocs-notes sur AWS Glue Studio et Amazon SageMaker Studio Notebook. Lorsque la tâche Ray est prête, vous pouvez l'exécuter à la demande ou selon un programme.
AWS Glue for Ray est généralement disponible dans les régions AWS suivantes : USA Est (Ohio), USA Est (Virginie du Nord), USA Ouest (Oregon), Asie-Pacifique (Tokyo) et Europe (Irlande).
Pour en savoir plus, consultez les moteurs d'intégration de données AWS Glue ou lisez le guide du développeur AWS Glue : AWS Glue for Ray.