Publicado en: Apr 16, 2020
A partir de ahora, hay 30 conjuntos de datos públicos de AWS nuevos o actualizados de Ford, del Campus Janelia del Instituto Médico Howard Hughes y del Instituto Nacional del Cáncer, entre otros, disponibles en las siguientes categorías:
Ciencias biológicas:
- Los Institutos Nacionales de Salud ofrecen14 conjuntos de datos de genómica que forman parte de la Iniciativa STRIDES
- Conjunto de datos de investigación abiertos del COVID-19 (CORD-19), del Instituto Allen para la Inteligencia Artificial (AI2)
- Conjunto de datos del genoma del girasol, de la Universidad de Columbia Británica
- Conjunto de datos de secuenciación del genoma completo de iHART, de la Universidad de Stanford
- Recursos de especies de stdpopsim, de la Universidad de Oregon
- Predictor de efectos de variantes con complemento de estimación de pérdida de efecto de los factores de transcripción, de Privo
- Anatomía de la mosca de la fruta: Imágenes FlyLight Gen1 y Split-GAL4, del Campus de Investigación Janelia del Instituto Médico Howard Hughes
- Segmentación de orgánulos celulares en microscopio electrónico, del Campus de Investigación Janelia del Instituto Médico Howard Hughes
- Atlas del cerebro del ratón del Instituto Allen, del Instituto Allen de Ciencias Cerebrales
- FastMRI, del Centro Langone de la Universidad de Nueva York
Geoespacial
- Conjuntos de datos de análisis de vecindarios con Geosnap, de la UCR
- Programa Nacional de Imágenes Agrícolas (NAIP), actualizado con las imágenes más recientes
Machine Learning
- Conjunto de datos estacional Multi-AV de Ford, de la Ford Motor Company
Sostenibilidad
- Análisis de la temperatura de la superficie del mar (SST) en ultra alta resolución multiescala (MUR), del Instituto Farallon
- Archivo de datos de sónar de columna de agua, de NOAA
- Himawari-8, administrado por NOAA
El Programa de Conjuntos de Datos Públicos de AWS cubre el costo de almacenamiento de conjuntos de datos de alto valor optimizados para la nube que están disponibles públicamente. Trabajamos con proveedores de datos cuyo objetivo sea:
- Democratizar el acceso a los datos al ponerlos a disposición para su análisis en AWS
- Desarrollar técnicas, herramientas y formatos nuevos nativos en la nube que reduzcan el costo de trabajar con datos.
- Fomentar el desarrollo de las comunidades que se benefician del acceso a conjuntos de datos compartidos.