Publié le: Apr 16, 2020
30 ensembles de données publiques AWS, nouveaux ou mis jour, provenant de Ford, de l’institut Allen Institute, de l’institut Howard Hughes Medical Institute Janelia, du National Cancer Institute américain et d'autres sources sont désormais disponibles dans les catégories suivantes :
Sciences de la vie :
- 14 nouveaux ensembles de données génomiques mis à disposition par le National Institutes of Health américain dans le cadre de l’Initiative STRIDES
- Ensemble de données de recherche ouverte : COVID-19 Open Research Dataset (CORD-19) de l’institut Allen Institute Artificial Intelligence (AI2)
- Ensemble de données sur le génome du tournesol : University of British Columbia Sunflower Genome Dataset de l’université de Colombie-Britannique
- Ensemble complet de données sur le séquençage du génome : iHART Whole Genome Sequencing Data Set de l’université de Stanford
- Ressources sur les espèces stdpopsim de l’université de l’Oregon
- Prédicteur d'effet de variante avec perte du plugin d'estimation de l'effet de transcription de fonction : Variant Effect Predictor with Loss of Function Transcript Effect Estimator Plugin de Privo
- Anatomie du cerveau des mouches : Fly Brain Anatomy: FlyLight Gen1 and Split-GAL4 Imagery du campus de recherche du Howard Hughes Medical Institute Janelia
- Segmentation des organites cellulaires en microscopie électronique : Cell Organelle Segmentation in Electron Microscopy du campus de recherche du Howard Hughes Medical Institute Janelia
- Atlas du cerveau des mouches de l’institut Allen Institute : Allen Institute Mouse Brain Atlas de l’institut Allen Institute for Brain Science
- Imagerie à résonance magnétique rapide : FastMRI du Langone Medical Center de l’université de New-York
Géolocalisation
- Ensembles de données d’analyse des quartiers de Geosnap : Geosnap Neighborhood Analysis Datasets de UCR
- Le programme d’imagerie de l’agriculture américaine -National Agriculture Imagery Program (NAIP) - a été mis à jour avec les dernières images disponibles
Machine Learning
- Ensemble de données saisonnières sur les voitures autonomes : Ford Multi-AV Seasonal Dataset de Ford Motor Company
Développement durable
- Analyse multi-échelle à ultra-haute résolution de la température de surface de la mer : Multi-scale Ultra-Higgs Resolution (MUR) Sea Surface Temperature (SST) Analysis du Farallon Institute
- Archivage de données sonar sur les colonnes d’eau : Water-Column Sonar Data Archive du NOAA
- Himawari-8 géré par le NOAA
Le programme AWS Public Dataset couvre les frais de stockage des ensembles de données de grande valeur optimisés pour le cloud et accessibles au public. Nous travaillons avec les fournisseurs de données qui souhaitent :
- Démocratiser l'accès aux données en les rendant disponibles à l'analyse sous AWS ;
- Développer de nouvelles techniques, formats et outils natifs cloud pour réduire le coût des travaux avec les données ;
- Encourager le développement de communautés à même de tirer avantage de l’accès à des ensembles de données partagés.
Découvrez comment proposer votre ensemble de données au programme AWS Public Dataset.