Sản phẩm ›  Máy học  › AWS HealthOmics  › Định giá AWS HealthOmics

 

 

Định giá AWS HealthOmics

Tổng quan

AWS HealthOmics giúp khách hàng đẩy nhanh những đột phá khoa học với cơ sở hạ tầng khám phá thuốc và tin sinh học được quản lý toàn phần được thiết kế để xử lý quy trình làm việc và lưu trữ ở quy mô lớn. Với HealthOmics, bạn chỉ trả tiền cho những gì bạn sử dụng và không có chi phí cấp phép của HealthOmics.

HealthOmics cung cấp hai loại quy trình làm việc. Quy trình làm việc riêng tư là quy trình làm việc tùy chỉnh do người dùng xác định cho phép bạn sử dụng các tập lệnh tin sinh học riêng của mình được viết bằng các ngôn ngữ quy trình làm việc được sử dụng phổ biến nhất. Định giá cho quy trình làm việc riêng tư dựa trên tài nguyên điện toán và hệ thống tệp được yêu cầu cho mỗi lần chạy. Quy trình làm việc Ready2Run là quy trình tin sinh học được dựng sẵn dựa trên các phân tích ngành phổ biến và bạn phải trả một chi phí cố định cho mỗi lần chạy.

HealthOmics cung cấp hai loại lưu trữ. Kho chứa tham chiếu và trình tự là kho chứa dữ liệu cho các đối tượng sử dụng phân bậc, nén và tạo danh mục siêu dữ liệu để cho phép lưu trữ và tổ chức dữ liệu tin sinh học tiết kiệm chi phí. Định giá dựa trên kích thước đối tượng được lưu trữ và bậc dữ liệu. Kho chứa biến thể và chú thích là kho chứa không ETL trích xuất dữ liệu chính từ dữ liệu tin sinh học để tạo hồ dữ liệu được tối ưu hóa để tìm kiếm và tạo nhóm. Định giá dựa trên kích thước lưu trữ của thông tin được trích xuất.

Bạn có thể sử dụng quy trình làm việc và kho chứa dữ liệu cùng nhau hoặc riêng biệt, nếu cần. Nếu bạn sẵn sàng cam kết sử dụng trong ba hoặc năm năm, vui lòng liên hệ với chúng tôi để hưởng mức giá chiết khấu.

Khám phá giá theo loại

Với AWS HealthOmics, bạn chỉ phải trả tiền cho những gì bạn sử dụng. Khám phá giá theo loại bên dưới.

Bậc miễn phí

Khi tham gia Bậc miễn phí của AWS, bạn có thể bắt đầu sử dụng AWS HealthOmics miễn phí. Sau khi đăng ký, khách hàng AWS mới nhận được tối đa 275 giờ sử dụng phiên bản omics.m.xlarge (hoặc tương đương) và 49.000 gigabyte-giờ lưu trữ chạy để chạy quy trình làm việc riêng tư, 1.500 gigabase-tháng lưu trữ ở trạng thái hoạt động và ở trạng thái lưu trữ trong kho chứa trình tự và 200 gigabyte-tháng lưu trữ trong kho chứa biến thể. Mức sử dụng của bạn cho Bậc miễn phí được tính từng tháng trên toàn bộ Khu vực (trừ Khu vực AWS GovCloud (Hoa Kỳ)) và tự động áp dụng cho hóa đơn của bạn; mức sử dụng hàng tháng chưa sử dụng sẽ không được chuyển sang tháng sau. Các giới hạn sẽ được áp dụng; tham khảo điều khoản để biết thêm chi tiết.

 

Sử dụng Bậc miễn phí mỗi tháng trong 2 tháng đầu tiên

Quy trình làm việc HealthOmics

Quy trình làm việc riêng tư: 275 giờ sử dụng phiên bản omics.m.xlarge hoặc các phiên bản điện toán tương đương và 49.000 GB-giờ đối với kho lưu trữ tác vụ chạy

Kho chứa dữ liệu HealthOmics Kho chứa trình tự: 1500 gigabase-tháng trong lớp lưu trữ ở trạng thái hoạt động và 1500 gigabase-tháng trong lớp lưu trữ ở trạng thái lưu trữ

Kho chứa biến thể: 200 gigabyte-tháng

Khách hàng của AWS sẽ nhận được tổng cộng 100 GB dung lượng dữ liệu truyền ra đến Internet miễn phí hàng tháng cho toàn bộ Dịch vụ và Khu vực của AWS (ngoại trừ Trung Quốc và GovCloud).

Định giá Quy trình làm việc riêng tư

Quy trình làm việc riêng tư là quy trình làm việc tùy chỉnh mà bạn xác định dựa trên ngôn ngữ quy trình làm việc mà bạn chọn để chạy các quy trình tin sinh học hoặc khám phá thuốc. Có hai thành phần cần chi phí: phiên bản tác vụ quy trình làm việc và dung lượng lưu trữ chạy.

Bạn sẽ phải trả phí cho phiên bản omics được sử dụng cho mỗi tác vụ trong quy trình làm việc của bạn. Mỗi tác vụ trong quy trình làm việc của bạn được ánh xạ đến phiên bản omics có sẵn nhỏ nhất đáp ứng các vCPU, bộ nhớ và/hoặc GPU được yêu cầu cho tác vụ. Ví dụ: một tác vụ được xác định sử dụng 8 CPU và 60 GiB RAM sẽ ánh xạ đến loại phiên bản omics.r.2xlarge để thực thi. HealthOmics luôn cung cấp chính xác các tài nguyên được yêu cầu. Trong ví dụ này, 8 CPU và 60 GiB RAM sẽ có sẵn cho tác vụ. Tác vụ được tính phí theo mức tăng 1 giây; tuy nhiên, có ngưỡng thanh toán tối thiểu là 60 giây cho mỗi tác vụ. Trong trường hợp bạn không chỉ định vCPU hoặc bộ nhớ cho một tác vụ, HealthOmics sẽ tự động cung cấp loại phiên bản có sẵn nhỏ nhất, omics.c.large, cho các tác vụ này. Bạn cũng không phải trả phí cho điện toán liên quan đến chuẩn bị dữ liệu (tức là nhập và xuất) và không mất phí liên Vùng sẵn sàng.

Đối với lưu trữ tác vụ chạy, bạn có thể chọn hệ thống tệp được cung cấp thống kê với thông lượng hệ thống tệp lớn hơn hoặc hệ thống tệp có khả năng điều chỉnh quy mô động. Lưu trữ tác vụ chạy tĩnh có sẵn các kích thước sau: 1200 GiB, 2400 GiB và sau đó với mức tăng 2400 GiB, với kích thước được cung cấp tối thiểu là 1200 GiB. Lưu trữ tác vụ chạy động có thể điều chỉnh quy mô theo mức sử dụng và không có yêu cầu cung cấp dung lượng lưu trữ tối thiểu.

Bạn chỉ phải trả phí cho tài nguyên trong khi quá trình chạy đang ở trạng thái chạy. Không có phí phát sinh cho các lần chạy ở trạng thái đang chờ xử lý, bắt đầu hoặc dừng. Đối với các lần chạy bị hủy hoặc thất bại, bạn sẽ phải trả phí cho bất kỳ tài nguyên nào đã được sử dụng cho đến thời điểm hủy hoặc thất bại.

Bạn có thể xem tổng chi phí cho mỗi lần chạy trên hóa đơn AWS của mình, giúp xác định chi phí nhanh chóng và dễ dàng. HealthOmics cũng cung cấp một công cụ trình phân tích chạy nguồn mở để giúp bạn tối ưu hóa tài nguyên, chi phí và hiệu năng chạy. Nếu bạn có kế hoạch chạy quy trình sản xuất trên quy mô lớn và sẵn sàng cam kết sử dụng ba hoặc năm năm, vui lòng liên hệ với chúng tôi để hưởng mức giá chiết khấu.

 

Định giá Quy trình làm việc Ready2Run

Quy trình làm việc Ready2Run là quy trình làm việc cấu hình sẵn được thiết kế bởi các công ty phần mềm bên thứ ba hàng đầu trong ngành như NVIDIA, Sentieon, Element Biosciences và Ultima cùng với các quy trình nguồn mở phổ biến như quy trình làm việc GATK của Broad Institute và AlphaFold cho dự đoán cấu trúc protein. Bạn chỉ cần sử dụng quy trình làm việc Ready2Run để xử lý dữ liệu của mình mà không cần phải quản lý các công cụ phần mềm hoặc tập lệnh quy trình làm việc. Quy trình làm việc Ready2Run sẽ tính phí trên mỗi lần chạy và bạn sẽ phải trả cùng mức phí cố định khi hoàn tất các lần chạy thành công, bất kể thời gian chạy. Nếu lần chạy bị hủy hoặc không thể hoàn tất thành công trong giờ đầu tiên, phí trên mỗi lần chạy được tính theo tỷ lệ dựa trên giờ sử dụng đầu tiên. Các lần chạy được thực hiện trong hơn 1 giờ sẽ được tính phí cho toàn bộ mức phí lần chạy. Quy trình làm việc Ready2Run của Sentieon yêu cầu đăng ký riêng được mua từ Sentieon. Đăng ký đánh giá hai tuần miễn phí được Sentieon tự động cung cấp mà không mất thêm chi phí cho người dùng Ready2Run của Sentieon lần đầu tiên. Để xem thông tin chi tiết về quy trình làm việc Ready2Run có sẵn, bao gồm các tham số đầu vào, sơ đồ quy trình làm việc và thời gian chạy ước tính, hãy truy cập bảng điều khiển HealthOmics.

Định giá kho chứa dữ liệu

Kho chứa dữ liệu HealthOmics là kho chứa được quản lý có thể tìm kiếm được, có thể truy cập được, tương tác được và tái sử dụng được (FAIR) dành cho dữ liệu mẫu quy mô lớn với tính năng nén dữ liệu tự động và khả năng truy vấn biến thể/chú thích được tối ưu hóa.

Kho chứa trình tự giúp tiết kiệm chi phí thông qua phân bậc và nén theo hướng mức sử dụng. Các đối tượng đã lưu trữ sẽ được nhóm lại theo các tập phục vụ việc đọc để sắp xếp và dễ dàng tìm thấy. Khi bạn lưu trữ dữ liệu trong kho chứa trình tự, bạn trả tiền cho mỗi gigabase mỗi tháng. Một gigabase tương đương với một tỷ base từ các tệp trình tự đã nhập của bạn (chẳng hạn như FASTQ, BAM và CRAM). Vì hóa đơn được tính theo mỗi gigabase, bạn không cần phải bận tâm về định dạng tệp hoặc kỹ thuật nén tệp tối ưu. AWS HealthOmics tối ưu hóa điều này cho bạn. Dữ liệu trong kho chứa trình tự có thể được truy cập theo hai cách: 1/ Thông qua các API HealthOmics đọc, ghi và cập nhật, cũng như đọc thông qua API S3. Khi truy cập qua API HealthOmics, bạn trả phí cho các yêu cầu GET được thực hiện cho các đối tượng tập phục vụ việc đọc. Mọi loại yêu cầu HealthOmics khác đối với tập phục vụ việc đọc đều không tính phí. 2/ Thông qua các API list và get S3. Khi truy cập qua API S3, bạn cần trả phí riêng cho các yêu cầu COPY và LIST từ mọi loại yêu cầu khác. Để xem chi phí của Kho chứa trình tự HealthOmics so với các tùy chọn lưu trữ thay thế như thế nào, hãy xem blog của chúng tôi: https://thinkwithwp.com/blogs/industries/store-omics-data-cost-effectively-at-any-scale-with-aws-healthomics/

Kho chứa biến thể và chú thích sử dụng không ETL để chuẩn bị dữ liệu biến thể và chú thích để truy vấn, nhóm và phân tích với các dịch vụ AWS như Amazon Athena và Amazon SageMaker. Các tệp đã tải nhập sẽ được HealthOmics xử lý và chuyển đổi thành các định dạng được tối ưu hóa truy vấn. Bạn có thể lưu trữ bất kỳ lượng dữ liệu biến thể và chú thích nào và bạn chỉ phải trả tiền cho những gì được lưu trữ. Kích thước dữ liệu được lập hóa đơn được định nghĩa là kích thước của dữ liệu sau khi tải nhập và chuyển đổi. Dữ liệu trong kho chứa biến thể và chú thích thường được truy cập thông qua các dịch vụ AWS khác. Khi bạn truy vấn và phân tích dữ liệu trong các dịch vụ khác, bạn sẽ phải thanh toán phí sử dụng những dịch vụ đó.

Dữ liệu được lưu trữ trong kho chứa dữ liệu AWS HealthOmics được tính phí thời hạn lưu trữ tối thiểu là 30 ngày. Dữ liệu bị xóa trước thời hạn 30 ngày sẽ phát sinh phí theo tỷ lệ tương đương với phí lưu trữ cho các ngày còn lại. 

Ví dụ định giá

  • Một nhà khoa học tin sinh học muốn chạy một quy trình làm việc Nextflow trong quy trình làm việc của AWS HealthOmics tại Khu vực Miền Đông Hoa Kỳ (Bắc Virginia). Quy trình làm việc của nhà khoa học đó gồm ba tác vụ. Tác vụ đầu tiên đặt trước 16 vCPU và bộ nhớ 30 GB, đồng thời cần 3 giờ để chạy tác vụ. Tác vụ thứ hai đặt trước 32 vCPU và bộ nhớ 160 GB, đồng thời cần 2 giờ để chạy tác vụ. Tác vụ thứ ba đặt trước 4 vCPU và bộ nhớ 10 GB, đồng thời cần 10 phút để chạy tác vụ. Khách hàng này đăng ký quy trình làm việc và thực hiện lệnh gọi API StartRun với hệ thống tệp mặc định có kích thước 1200 GB. Tổng thể chi phí của nhà khoa học là:
    Tác vụ 1 (omics.c.4xlarge): 0,9180 USD/giờ * 3 giờ = 2,754 USD
    Tác vụ 2 (omics.r.8xlarge): 2,7216 USD/giờ * 2 giờ = 5,4432 USD
    Tác vụ 3 (omics.m.xlarge): 0,2592 USD/giờ * 1/6 giờ = 0,0432 USD
    Kho lưu trữ tác vụ chạy tĩnh: 0,0001918 USD/GB-giờ * (1.200 GB * (3 giờ + 2 giờ + 1/6 giờ)) = 1,18916 USD
    Tổng: 9,42956 USD

  • Một nhà khoa học tin sinh học đang phát triển quy trình làm việc WDL mới trong AWS HealthOmics ở Khu vực Miền Đông Hoa Kỳ (Bắc Virginia). Quy trình làm việc của nhà khoa học đó gồm hai tác vụ. Tác vụ đầu tiên đặt trước 16 vCPU và bộ nhớ 30 GB, đồng thời cần 3,5 giờ để chạy tác vụ. Tác vụ thứ hai đặt trước 32 vCPU và bộ nhớ 160 GB, đồng thời cần 2,25 giờ để chạy tác vụ. Khách hàng này đăng ký quy trình làm việc và thực hiện lệnh gọi API StartRun với hệ thống tệp linh động. Trong 5,75 giờ chạy quy trình làm việc, hệ thống tệp mở rộng tuyến tính từ 0GB lên 1.043GB, tổng cộng là 3000 GB-giờ dung lượng lưu trữ tệp. Tổng thể chi phí của nhà khoa học là:
    Tác vụ 1 (omics.c.4xlarge): 0,9180 USD/giờ * 3,5 giờ = 3,213 USD
    Tác vụ 2 (omics.r.8xlarge): 2,7216 USD/giờ * 2,25 giờ = 6,1236 USD
    Kho lưu trữ tác vụ chạy động: 0,0004110 USD/GB-giờ * 3.000 GB-giờ = 1,233 USD
    Tổng: 10,5696 USD

  • Một nhà khoa học điện toán muốn chạy GATK-BP Germline fq2vcf cho quy trình làm việc 30x genome Ready2Run ở Khu vực Miền Đông Hoa Kỳ (Bắc Virginia) cho 3 mẫu. Khách hàng nhập dữ liệu của mình và thực hiện lệnh gọi API StartRun cho mỗi mẫu. Chi phí cho 3 lần chạy là:
    GATK-BP Germline fq2vcf cho quy trình làm việc 30x genome Ready2Run: 10,00 USD/lần chạy * 3 = 30,00 USD
    Tổng: 30,00 USD

  • Một sáng kiến giải trình tự quần thể đang bắt tay vào giải trình tự các cá thể từ ngân hàng sinh học đã thu thập được. Sáng kiến này được chọn triển khai tại Khu vực Miền Tây Châu Âu (Ireland). Họ tiến hành giải trình tự 100.000 cá thể, mỗi cá thể có 130 gigabase, 50 gigabyte, sau đó lưu trữ dữ liệu giải trình tự thô trong kho lưu trữ AWS HealthOmics. Trong 5 năm kế tiếp, dữ liệu này vẫn nằm trong lớp lưu trữ ở trạng thái lưu trữ sau 30 ngày kể từ khi nhập và được truy cập trung bình hai lần khi chuyển sang lớp lưu trữ ở trạng thái hoạt động trong 30 ngày. Họ sử dụng API S3 để truy cập các tệp. Mỗi bộ gen được tải xuống thành 500 phần, tạo ra 500 lệnh gọi API GET. Tổng chi phí trong 5 năm cho một bộ gen là:
    Lớp lưu trữ ở trạng thái hoạt động: 0,005769 USD gigabase/tháng * 130 gigabase * 90 ngày = 2,22 USD
    Lớp lưu trữ ở trạng thái lưu trữ: 0,001154 USD gigabase/tháng * 130 gigabase * (1825 – 90) ngày = 8,56 USD.
    API GET S3: 0,0004 USD / 1000 lệnh gọi API * (2 * 500 lệnh gọi API) = 0,0004 USD
    Tổng chi phí trong 5 năm: 2,22 USD + 8,56 USD + 0,0004 USD = 10,78 USD (hoặc 2,15 USD/năm)

  • Một nhà khoa học dữ liệu có 3.202 tệp định dạng lệnh gọi biến thể (VCF) và muốn phân tích số tệp này trong Amazon Athena tại Khu vực Miền Đông Hoa Kỳ (Bắc Virginia). Nhà khoa học đó tạo một kho chứa biến thể và tải nhập những tệp này bằng cách sử dụng các API của AWS HealthOmics. Dữ liệu đã tải nhập có kích thước 1,5 TB. Trong tháng tiếp theo, nhà khoa học thực thi 1.000 truy vấn trong Athena, tính tần số alen cho các quần thể nhận diện được khác nhau, mỗi quần thể tốn trung bình 50 GB. Tổng thể chi phí hàng tháng của nhà khoa học là:
    Kho chứa biến thể: 0,035 USD GB/tháng * (1024 GB/TB * 1,5 TB) = 53,76 USD
    Amazon Athena: 5 USD/TB * 1000 * 50 / 1024 = 244,14 USD

Mức giá truyền dữ liệu

Bạn trả tiền cho tất cả băng thông sử dụng ngoài HealthOmics. Phí truyền dữ liệu không áp dụng cho dữ liệu được truyền sang bất kỳ dịch vụ AWS nào trong cùng Khu vực AWS dưới dạng kho dữ liệu. Giá bên dưới căn cứ theo dữ liệu được truyền "in" và "out" của AWS HealthOmics (qua mạng Internet công cộng)†††. Tìm hiểu thêm về giá của AWS Direct Connect. Nếu bạn có nhu cầu truyền dữ liệu vượt quá 500 TB/tháng, vui lòng liên hệ với chúng tôi.

Các bậc giá có tính đến mức sử dụng tổng hợp của bạn cho tác vụ Truyền dữ liệu đi lên Internet đối với tất cả các dịch vụ AWS.

††† Dữ liệu truyền đi có thể khác với dữ liệu mà ứng dụng của bạn nhận được trong trường hợp bạn dừng kết nối sớm, ví dụ: nếu bạn yêu cầu đối tượng 10 GB và dừng kết nối sau khi nhận được 2 GB dữ liệu đầu tiên. AWS HealthOmics sẽ cố gắng dừng việc phát trực tuyến dữ liệu. Tuy nhiên, việc này không xảy ra ngay lập tức. Ở ví dụ này, Dữ liệu truyền đi có thể bằng 3 GB (nhiều hơn 1 GB so với 2 GB bạn đã nhận). Vì vậy, bạn sẽ bị tính phí cho 3 GB dữ liệu truyền ra.