Publicado: Apr 16, 2020
Trinta conjuntos de dados públicos da AWS novos ou atualizados pela Ford, Allen Institute, Howard Hughes Medical Institute Janelia, National Cancer Institute e outros agora estão disponíveis nas seguintes categorias:
Ciências biológicas:
- 14 novos conjuntos de dados genômicos foram fornecidos pelo National Institutes of Health por meio da Iniciativa STRIDES
- Conjunto de dados de pesquisa aberta sobre a COVID-19 (CORD-19) do Allen Institute Artificial Intelligence (AI2)
- Conjunto de dados genômicos de girassóis da Universidade da Colúmbia Britânica da Universidade da Colúmbia Britânica
- Conjunto de dados de sequenciamento de genomas completos iHART da Universidade de Stanford
- Recursos de espécies stdpopsim da Universidade do Oregon
- Preditor do efeito de variação com plug-in estimador de efeito de transcrição de perda de função da Privo
- Anatomia do cérebro da mosca: imagens do FlyLight Gen1 e Split-GAL4 do Howard Hughes Medical Institute Janelia Research Campus
- Segmentação de organelas celulares em microscopia de elétrons do Howard Hughes Medical Institute Janelia Research Campus
- Atlas do cérebro do rato do Allen Institute do Allen Institute for Brain Science
- FastMRI do NYU Langone Center
Dados geoespaciais
- Conjuntos de análises de dados de vizinhanças de Geosnap do UCR
- O programa de imagens de agricultura nacional (NAIP – National Agriculture Imagery Program) foi atualizado com as imagens mais recentes disponíveis
Machine learning
- Ford Multi-AV Seasonal Dataset da Ford Motor Company
Sustentabilidade
- Análise de temperatura da superfície marítima (SST) em resolução ultra-alta (MUR) e multiescala do Farallon Institute
- Arquivo de dados sonares de colunas de água do NOAA
- Himawari-8 gerenciado pelo NOAA
O programa AWS Public Dataset cobre o custo de armazenamento de conjuntos de dados de alto valor otimizados para a nuvem e disponíveis para o público. Trabalhamos com provedores de dados que buscam:
- Democratizar o acesso aos dados, disponibilizando-os para análise na AWS.
- Desenvolver novas técnicas, ferramentas e formatos nativos da nuvem que diminuam o custo de trabalhar com dados.
- Incentivar o desenvolvimento de comunidades que se beneficiem do acesso a bancos de dados compartilhados.
Saiba como sugerir o seu banco de dados para o programa de bancos de dados públicos da AWS.