게시된 날짜: Apr 16, 2020
Ford, Allen Institute, Howard Hughes Medical Institute Janelia, National Cancer Institute 등에서 신규 또는 업데이트된 30개의 AWS 퍼블릭 데이터 세트는 다음과 같은 카테고리로 제공됩니다.
생명 과학:
- 14개의 신규 게놈 데이터 세트가 STRIDES Initiative에 따라 National Institutes of Health에서 제공됩니다.
- Allen Institute Artificial Intelligence(AI2)의 COVID-19 공개 연구 데이터 세트(CORD-19)
- 브리티시 컬럼비아 대학교의 브리티시 컬럼비아 대학교 해바라기 게놈 데이터 세트
- 스탠포드 대학교의 iHART 전체 게놈 배열 데이터 세트
- 오레곤 대학교의 stdpopsim 종 리소스
- Privo의 기능 상실 전가 효과 추정기 플러그인을 사용하는 변이 효과 예측기
- Howard Hughes Medical Institute Janelia Research Campus의 Fly Brain Anatomy: FlyLight Gen1 및 Split-GAL4 이미지
- Howard Hughes Medical Institute Janelia Research Campus의 전자 현미경으로 세포 소기관 분할
- Allen Institute for Brain Science의 Allen Institute Mouse Brain Atlas
- NYU Langone Center의 FastMRI
지리 공간
- UCR의 Geosnap 환경 분석 데이터 세트
- National Agriculture Imagery Program(NAIP)이 사용 가능한 최신 이미지로 업데이트되었습니다.
기계 학습
- Ford Motor Company의 Ford 다중 AV 시즈널 데이터 세트
지속 가능성
- Farallon Institute의 Multi-scale Ultra-high Resolution(MUR) Sea Surface Temperature(SST) 분석
- NOAA의 수중 음파 탐지기 데이터 아카이브
- NOAA에서 관리하는 Himawari-8
AWS 퍼블릭 데이터 세트 프로그램은 공개적으로 사용 가능한 클라우드에 최적화된 고가치 데이터 세트에 대한 스토리지 비용을 부담합니다. 이 프로그램은 다음을 추구하는 데이터 공급자를 대상으로 합니다.
- AWS에서 데이터를 분석에 사용할 수 있도록 하여 데이터 액세스를 민주화합니다.
- 데이터 작업 비용을 낮추는 새로운 클라우드 네이티브 기술, 형식 및 도구를 개발합니다.
- 공유 데이터세트에 대한 액세스를 활용하는 커뮤니티의 개발을 장려합니다.