Témoignages de clients / Services professionnels / États-Unis
Jobcase adapte ses flux de travail de machine learning pour prendre en charge des milliards de prévisions quotidiennes à l'aide d'Amazon Redshift ML
Jobcase, une communauté en ligne destinée aux travailleurs, utilise Amazon Redshift ML pour établir des milliards de prévisions en matière de machine learning par jour, améliorant ainsi l'engagement des membres de 5 % sans augmenter les coûts.
A obtenu une amélioration de 5 %
en taux d'engagement des membres sans augmentation des coûts
Temps de test réduit
de 1 à 2 mois à moins d'une semaine
Capacité de mise à l'échelle améliorée
pour soutenir plus de 110 millions de membres
Fait des milliards de prédictions
en 15 minutes environ au lieu de 4 à 5 heures
Suppression de la nécessité de déplacer des données
vers un environnement de machine learning distinct
Présentation
En tant que communauté en ligne pour les travailleurs et les demandeurs d'emploi, Jobcase utilise des modèles de machine learning (ML) pour analyser sa base de données contenant des millions d'offres d'emploi afin de mettre en relation les membres avec des recommandations d'emploi. Avec plus de 20 millions de visiteurs uniques par mois, le site enregistre des milliards de correspondances chaque jour. Pour faire face à cette charge de travail, l'entreprise devait améliorer la capacité de mise à l'échelle de son moteur de recommandation de recherche d'emploi basé sur le ML tout en restant rentable.
Jobcase utilisait déjà Amazon Web Services (AWS) pour ingérer et stocker plus de 100 To de données compressées. Mais l'entreprise souhaitait fortement réduire la nécessité de déplacer de grandes quantités de ces données entre Amazon Redshift, un entrepôt de données qui permet d'interroger et de combiner facilement des exaoctets de données structurées et semi-structurées, et son environnement de ML. Grâce à Amazon Redshift ML, que les analystes peuvent utiliser pour créer, entraîner et appliquer des modèles de ML à l'aide de commandes SQL familières dans Amazon Redshift, Jobcase peut effectuer des prévisions sur des milliards d'enregistrements en quelques minutes. Grâce à AWS, Jobcase a amélioré sa capacité de mise à l'échelle tout en réduisant son rapport coût-performance. L'entreprise peut désormais soutenir efficacement sa communauté croissante et tester de nouvelles fonctionnalités plus rapidement.
Opportunité | Réduction des coûts liés aux flux de travail de ML
Jobcase est une plateforme de travail soutenue par la communauté à laquelle plus de 110 millions de membres inscrits à travers les États-Unis se connectent pour s'entraider et trouver des opportunités. Alors que de nombreux sites web de recherche d'emploi privilégient les postes professionnels, les outils de recherche et les fonctionnalités sociales de Jobcase se concentrent sur un plus large éventail de postes quotidiens, dont les travailleurs horaires et de service, les ouvriers et les techniciens. L'identification de candidats solides permet à l'entreprise de proposer des emplois de qualité à ses membres et aide les employeurs à recruter des travailleurs qualifiés. Lorsque quelqu'un recherche des offres d'emploi sur Jobcase, l'entreprise analyse environ 30 millions d'annonces dans son annuaire, en comparant les qualités de chacune avec les préférences du membre. Son infrastructure doit être capable d'exécuter ces tâches de ML à grande échelle, en extrayant et en faisant des prévisions sur des milliards d'enregistrements par jour. Jobcase utilise Amazon Redshift depuis plus de 8 ans comme entrepôt de données principal qui sert de source de référence pour tous ses travaux d'analyse de données. « Notre base de données ingère des milliards d'événements chaque jour », explique Ajay Joshi, ingénieur émérite chez Jobcase. « Tous nos systèmes de production génèrent des données qui sont transmises à Amazon Redshift. L'entreprise en dépend. » L'ancien flux de travail de machine learning de l'entreprise, qui impliquait de déplacer des données d'Amazon Redshift vers un environnement distinct pour exécuter son logiciel de ML avant de renvoyer les données à la base de données, était inefficace, sujet aux erreurs et coûteux. Pour résoudre ces problèmes, Jobcase a migré vers Amazon Redshift ML afin de pouvoir exécuter ses fonctions de ML au sein de l'entrepôt de données, sans aucun déplacement de données. La société a commencé à tester Amazon Redshift ML en décembre 2020 et l'a déployé en production en juillet 2021. « Le nouveau système d'AWS s'intègre essentiellement tel quel dans notre pipeline, explique Ajay Joshi. Nous avons pu rapidement mettre en production plusieurs modèles qui ont immédiatement commencé à porter leurs fruits. »
Amazon Redshift est l'un des outils les plus importants dont nous disposons pour développer Jobcase en tant qu'entreprise ».
Ajay Joshi
Ingénieur émérite, Jobcase
Solution | Améliorer la capacité de mise à l'échelle et la rapidité à l'aide d'Amazon Redshift ML
L'utilisation d'Amazon Redshift ML simplifie la façon dont Jobcase génère des prévisions à partir de ses modèles de machine learning. « Grâce à Amazon Redshift ML, nous pouvons adapter un large éventail de classes de modèles de ML sophistiquées aux données directement dans notre entrepôt de données Amazon Redshift », explique Clay Martin, scientifique des données senior chez Jobcase. Quatre semaines seulement après le déploiement des nouveaux modèles sur Amazon Redshift ML, l'entreprise avait déjà constaté une amélioration de 5 % de ses indicateurs d'engagement pour des canaux spécifiques d'e-mail et de notification push. « Une amélioration de 5 % des indicateurs d'engagement se traduit par une amélioration de l'expérience et de la fidélisation des membres, ainsi qu'une augmentation correspondante des revenus », déclare Clay Martin. Jobcase peut désormais effectuer des inférences de modèles sur des milliards d'enregistrements en quelques minutes au lieu de 4 à 5 heures.
Le système de recommandation génère des recommandations d'offres d'emploi spécifiques, ainsi que des suggestions de recherche et des recommandations d'entreprises, pour chacun de ses millions de membres actifs. À mesure que la communauté s'agrandit, les coûts de maintenance de pipelines de données complexes augmentent. « Nous effectuons en moyenne cinq à six milliards de prévisions hors ligne chaque jour », explique Ajay Joshi. L'utilisation des fonctionnalités d'inférence locale intégrées à la base de données d'Amazon Redshift ML élimine le besoin de transférer des données entre des environnements distincts. Ainsi, Jobcase réalise des économies et réduit la complexité tout en augmentant l'ampleur de ses charges de travail de ML.
De plus, Jobcase peut effectuer des tests de grande envergure plus rapidement qu'auparavant. « Auparavant, nous devions effectuer des tests sur de petites cohortes d'utilisateurs pendant 1 à 2 mois, explique Clay Martin. Grâce à Amazon Redshift ML, nous pouvons exécuter des tests sur des jeux de données complets en moins d'une semaine. » Cela facilite la création et l'itération des modèles de l'entreprise à un rythme très élevé. En outre, la capacité du service à entraîner et à déployer automatiquement des modèles contribue à accroître la productivité des équipes de Jobcase. « Nous sommes une petite entreprise par rapport à la quantité de données que nous traitons, explique Ajay Joshi. Réaliser des prévisions rapidement et sans nécessiter beaucoup de travail pour déployer les modèles sur Amazon Redshift ML nous permet de nous concentrer sur la valeur ajoutée à d'autres aspects de notre produit. »
Tout aussi important, en utilisant Amazon Redshift ML, Jobcase peut mettre à l'échelle ses charges de travail de ML sans augmenter les coûts. « Pour atteindre des performances de cette envergure sur un système différent, nous devrions consacrer beaucoup de temps et d'argent à l'optimiser », explique Ajay Joshi. Au lieu de cela, l'entreprise n'a dû faire face à aucune augmentation de coûts lorsqu'elle a commencé à utiliser la fonctionnalité Amazon Redshift ML, car elle fonctionne au sein de son cluster Amazon Redshift existant. L'élasticité du travail dans le cloud permet à Jobcase de travailler facilement à grande échelle, même si la base d'utilisateurs de l'entreprise augmente. « Nous avons toujours été à la pointe de la technologie en matière de développement sur AWS, explique Ajay Joshi. Nous entretenons une excellente relation avec les équipes d'AWS, et cette collaboration a été exceptionnelle ».
Résultat | Réalisation d'analyses de données à grande échelle à l'aide d'AWS
Jobcase prévoit d'étendre son utilisation d'Amazon Redshift ML à d'autres équipes de l'organisation. « Nous constatons déjà que des membres d'autres équipes déploient des modèles Amazon Redshift, explique Clay Martin. Rendre cela accessible à l'ensemble de l'organisation est un autre aspect précieux de sa capacité de mise à l'échelle. » En acquérant la capacité de mettre à l'échelle son entrepôt de données et ses flux de travail de ML sans augmenter les coûts ni utiliser de ressources excessives, Jobcase peut apporter de la valeur à sa communauté croissante. « Amazon Redshift est l'un des outils les plus importants dont nous disposons pour développer Jobcase en tant qu'entreprise », déclare Ajay Joshi.
À propos de Jobcase
Jobcase est une communauté en ligne dédiée à l'autonomisation et à la défense des droits des travailleurs du monde entier. Sa technologie donne accès à des emplois, à des outils, à des ressources et à des connaissances issues de la communauté, aidant ainsi plus de 110 millions de membres à se préparer à n'importe quel poste.
Services AWS utilisés
Amazon Redshift
Amazon Redshift utilise SQL pour analyser les données structurées et semi-structurées à travers les entrepôts des données, les bases de données opérationnelles et les lacs de données ; la solution utilise un matériel conçu par AWS et le machine learning pour offrir le meilleur rendement réel, quelle que soit l'échelle.
Amazon Redshift ML
Amazon Redshift ML permet aux analystes de données et aux développeurs de bases de données de créer, d'entraîner et d'appliquer facilement des modèles de machine learning à l'aide de commandes SQL courantes dans les entrepôts des données Amazon Redshift.
En savoir plus »
Plus de témoignages client dans le secteur des services professionnels
Démarrer
Les organisations de toutes tailles et de tous secteurs transforment leur activité et exécutent leurs missions au quotidien à l'aide d'AWS. Contactez nos experts et démarrez votre transition vers AWS dès aujourd'hui.