发布于: Apr 16, 2020
福特汽车、艾伦研究所、霍华德·休斯医学研究所-珍妮莉亚研究园区 、美国国家癌症研究所等机构现已在下列类别中推出 30 个全新或经过更新的 AWS 公用数据集:
生命科学:
- 美国国家卫生研究院根据 STRIDES 计划提供了 14 个全新的基因组数据集
- 艾伦人工智能研究所 (AI2) 的 COVID-19 开放研究数据集 (CORD-19)
- 不列颠哥伦比亚大学的不列颠哥伦比亚大学向日葵基因组数据集
- 斯坦福大学的 iHART 全面基因组测序数据集
- 俄勒冈大学的 stdpopsim 物种资源
- Privo 的变异影响预测器与功能缺失转录效果估算器插件
- 霍华德·休斯医学研究所-珍妮莉亚研究园区的苍蝇大脑解剖:FlyLight Gen1 和 Split-GAL4 影像
- 霍华德·休斯医学研究所-珍妮莉亚研究园区的电子显微镜下的细胞器官分割
- 艾伦脑科学研究所的艾伦研究所鼠脑图谱
- 纽约大学朗格尼中心的 FastMRI
地理空间
- 加州大学河滨分校的 Geosnap 邻域分析数据集
- 国家农业影像计划 (NAIP) 已更新最新的可用影像
机器学习
- 福特汽车公司的 Ford Multi-AV Seasonal 数据集
可持续性
- 法拉隆研究所的多尺度超高分辨率 (MUR) 海面温度 (SST) 分析
- NOAA 的水柱声纳数据存档
- NOAA 托管的 Himawari-8
AWS 公用数据集计划涵盖公开提供的高价值云优化型数据集的存储成本。我们与致力于以下目标的数据提供商合作:
- 让数据可在 AWS 上进行分析,以实现数据的普遍访问
- 开发新的原生云技术、格式和工具,以降低数据处理成本。
- 鼓励从访问共享数据集中获益的社区实现发展。