Publicado: Jul 15, 2021
Quarenta e quatro conjuntos de dados novos ou atualizados da National Library of Medicine, Digital Earth Africa, Amazon e outros estão disponíveis no Registry of Open Data nas seguintes categorias.
COVID-19:
- InRad COVID-19 X-Ray and CT Scans do Instituto de Radiologia (InRAd) da Faculdade de Medicina da Universidade de São Paulo
- REDASA COVID-19 Dataset da Imperial College London
Agricultura:
- iSDAsoil da Innovative Solutions for Decision Agriculture (iSDA)
Clima e tempo:
- Atualizado: Global Surface Summary of Day da National Oceanic and Atmospheric Administration
- Atualizado: Geostationary Operational Environmental Satellites (GOES) 16 & 17 da National Oceanic and Atmospheric Administration
- National Bathymetric Source Data da National Oceanic and Atmospheric Administration
- Rapid Refresh Forecast System (RRFS) Ensemble [Prototype] da National Oceanic and Atmospheric Administration
- Climate retrospective Analysis and Forecast Ensemble system: version 1 da Commonwealth Scientific and Industrial Research Organisation
Energia:
- Commercial Building Sector Stock model (ComStock) do National Renewable Energy Laboratory
Dados geoespaciais:
- Dados Landsat, Sentinel-2 e Sentinel-1 pela África gerenciados pela Digital Earth Africa
- Normalized Difference Urban Index (NDUI) do Remote Sensing Big Data Intelligent Application Laboratory, Sun Yat-sen University
Ciências biológicas:
- CIViC (Clinical Interpretation of Variants in Cancer) da Washington University School of Medicine
- GBIF Species Occurrences da Global Biodiversity Information Facility
- BossDB Open Neuroimagery Datasets do Johns Hopkins University Applied Physics Laboratory
- Conformational Space of Short Peptides da Toyoko e Universidad Nacional de Quilmes
- Ivy Glioblastoma Atlas do Allen Institute for Brain Sciences
Machine Learning:
- 12 conjuntos de dados de referência do Allen Institute for Artificial Intelligence (AI2)
- Amazon Berkeley Objects Dataset da Amazon
- Airborne Object Tracking Dataset da Amazon
- Helpful Sentences from Reviews da Amazon
- Low Context Name Entity Recognition (NER) Datasets with Gazetteer da Amazon
- Multilingual Name Entity Recognition (NER) Datasets with Gazetteer da Amazon
- Amazon-PQA da Amazon
- WikiSum: Coherent Summarization Dataset for Efficient Human-Evaluation da Amazon
- Pre- and post-purchase product questions da Amazon
- MWIS VR Instances da Amazon
- FashionLocalTriplets da Amazon
- PASS: Perturb-and-Select Summarizer for Product Reviews da Amazon
- Corn Kernel Counting Dataset da Intelinair, Inc.
- High-Order Accurate Direct Numerical Simulation of Flow over a MTU-T161 Low Pressure Turbine Blade do PyFR
- PubMedCentral Open Access Text Mining Datasets da National Library of Medicine
Deseja tornar seus dados disponíveis? O AWS Open Data Sponsorship Program cobre os custos de armazenamento de conjuntos de dados de alto valor otimizados para a nuvem e disponíveis para o público. Trabalhamos com provedores de dados que buscam:
- Democratizar o acesso aos dados, disponibilizando-os para análise na AWS
- Desenvolver novas técnicas, ferramentas e formatos nativos da nuvem que diminuam o custo de trabalhar com dados
- Incentivar o desenvolvimento de comunidades que se beneficiem do acesso a bancos de dados compartilhados