張貼日期: Apr 16, 2020
福特 (Ford)、艾倫腦科學研究所 (Allen Institute for Brain Science)、霍華休斯醫學研究所珍利亞園區 (Howard Hughes Medical Institute Janelia)、美國國家癌症研究所 (National Cancer Institute) 和其他單位共計 30 個全新或更新 AWS 公用資料集現起開放使用,類別如下:
生命科學
- 美國國家衛生研究院 (National Institutes of Health) 透過 STRIDES 計劃提供 14 個全新基因資料集
- 艾倫人工智慧研究所 (Allen Institute Artificial Intelligence,AI2) 的 COVID-19 Open Research Dataset (CORD-19)
- 英屬哥倫比亞大學 (University of British Columbia) 的 University of British Columbia Sunflower Genome Dataset
- 史丹佛大學 (Stanford University) 的 iHART Whole Genome Sequencing Data Set
- 奧勒岡大學 (University of Oregon) 的 stdpopsim 物種資源
- Privo 的 Variant Effect Predictor with Loss of Function Transcript Effect Estimator Plugin
- 霍華休斯醫學研究所珍利亞農場研究園區 (Howard Hughes Medical Institute Janelia Research Campus) 的 Fly Brain Anatomy: FlyLight Gen1 and Split-GAL4 Imagery
- 霍華休斯醫學研究所珍利亞農場研究園區 (Howard Hughes Medical Institute Janelia Research Campus) 的 Cell Organelle Segmentation in Electron Microscopy
- 艾倫腦科學研究所 (Allen Institute for Brain Science) 的 Allen Institute Mouse Brain Atlas
- 紐約大學朗格尼醫學中心 (NYU Langone Center) 的 FastMRI
地理空間
- 加州大學河濱分校 (UCR) 的 Geosnap Neighborhood Analysis Datasets
- National Agriculture Imagery Program (NAIP) 已完成最新影像更新
Machine Learning
- 福特汽車 (Ford Motor Company) 的 Ford Multi-AV Seasonal Dataset
永續發展
- 法拉倫研究所 (Farallon Institute) 的 Multi-scale Ultra-high Resolution (MUR) Sea Surface Temperature (SST) Analysis
- 美國國家海洋暨大氣總署 (NOAA) 的 Water-Column Sonar Data Archive
- 美國國家海洋暨大氣總署 (NOAA) 管理的Himawari-8
上述高價值雲端最佳化公開資料集的儲存費用由 AWS 公用資料集計劃負擔。我們合作的資料供應單位均追求以下目標:
- 開放資料自由存取,讓使用者可在 AWS 上自行分析
- 開發新雲端原生技術、格式和工具,降低資料使用成本。
- 以共用資料集的方式分享資源,促進社群發展。