投稿日: Apr 16, 2020
フォード、アレン研究所、ハワードヒューズ医学研究所 (ジャネリアリサーチキャンパス)、米国国立がん研究所などの 30 件以上の新しいまたは更新された AWS パブリックデータセットが次のカテゴリで利用できるようになりました。
ライフサイエンス:
- 米国国立衛生研究所が 14 件の新しいゲノムデータセットを STRIDES Initiative のもとで提供
- アレン人工知能研究所 (AI2) より COVID-19 Open Research Dataset (CORD-19)
- ブリティッシュコロンビア大学より University of British Columbia Sunflower Genome Dataset
- スタンフォード大学より iHART Whole Genome Sequencing Data Set
- オレゴン大学より stdpopsim species resources
- Privo より Variant Effect Predictor with Loss of Function Transcript Effect Estimator Plugin
- ハワードヒューズ医学研究所 (ジャネリアリサーチキャンパス) より Fly Brain Anatomy: FlyLight Gen1 and Split-GAL4 Imagery
- ハワードヒューズ医学研究所 (ジャネリアリサーチキャンパス) より Cell Organelle Segmentation in Electron Microscopy
- アレン脳科学研究所より Allen Institute Mouse Brain Atlas
- NYU ランゴーンセンターより FastMRI
地理空間
- UCRより Geosnap Neighborhood Analysis Datasets
- National Agriculture Imagery Program (NAIP) に使用される画像が最新のものに更新されました
機械学習
- Ford Motor Company より Ford Multi-AV Seasonal Dataset
持続可能性
- Farallon Institute より Multi-scale Ultra-high Resolution (MUR) Sea Surface Temperature (SST) Analysis
- NOAA より Water-Column Sonar Data Archive
- NOAA 管理下の Himawari-8
AWS パブリックデータセットプログラムでは、一般に利用できる高価値でクラウド向けに最適化されたデータセットのストレージコストを AWS が負担しています。私たちは、以下を追及しているデータプロバイダーと協力しています。
- AWS で分析できるようにすることで、誰でもデータにアクセスできるようにする。
- 新しいクラウドネイティブのテクニック、フォーマット、ツールを開発して、データ操作にかかるコストを削減する。
- 共有データセットへのアクセスからメリットを得るコミュニティの開発を奨励する。