Quantitative Biology Center Menggerakkan Penelitian Genom Baru Lebih Cepat Menggunakan AWS

QuadX

Menganalisis Perbedaan Ekspresi Genom

Setiap hari, para peneliti di Quantitative Biology Center (QBiC) menggunakan platform komputasi berperforma tinggi (HPC) untuk menganalisis data genom dan menentukan, misalnya, perbedaan ekspresi gen antara jaringan yang sakit dan normal. QBiC terletak di University of Tübingen, Jerman. QBic mendukung penelitian genom di universitas tersebut dan di organisasi penelitian lain di seluruh dunia.

Beban kerja HPC QBiC sebagian besar di-hosting di pusat data on-premise. Namun, volume data penelitian semakin cepat berkembang, QBiC memperkirakan akan kesulitan untuk menskalakan dengan cepat dan melakukan penghematan secara efektif. “Karena volume data kami semakin banyak, kami sadar bahwa kami butuh kapasitas komputasi yang lebih banyak daripada infrastruktur on-premise yang disediakan cloud,” kata Alex Pletzer, ilmuwan penelitian bioinformatika senior di QBiC. “Para peneliti yang menggunakan platform kami juga membutuhkan performa yang lebih baik, sehingga mereka dapat menganalisis lebih banyak data dan menyelesaikan penelitian lebih cepat.” Nilai tertinggi QBiC adalah pemrosesan data yang sesuai dengan prinsip data FAIR: findable (dapat dicari), accessible (dapat diakses), interoperable (dapat dioperasikan), dan reproducible (dapat diproduksi ulang). “Memenuhi persyaratan pemrosesan FAIR melibatkan kebutuhan untuk menskalakan secara efisien, yang tidak dapat kami lakukan dengan mudah,” kata Peltzer.

“Penyiapan yang dievaluasi berpotensi mempersingkat waktu penelitian hingga 50 persen karena otomatisasi dan orkestrasi yang kami dapatkan dari AWS Batch.”

Alex Peltzer, Ilmuwan Penelitian Biometrika, Quantitative Biology Center, University of Tübingen

  • Tentang Quantitative Biology Center
  • Quantitative Biology Center (QBiC) adalah unit penelitian yang merupakan bagian dari University of Tübingen, Jerman. QBiC meng-host platform penelitian HPC bagi peneliti internal dan eksternal untuk menganalisis dan memproses data genom.

  • Manfaat
    • Dapat memproses hingga 100.000 sampel gen dalam proyek penelitian tunggal
    • Mempersingkat waktu penelitian genom hingga 50%
    • Mempercepat penelitian tentang perbedaan ekspresi gen
    • Mengurangi biaya analisis
  • Layanan AWS yang Digunakan

Memanfaatkan Platform Penelitian HPC dan Komputasi Cloud Berbasis AWS

Kebutuhan QBiC akan skalabilitas dan performa membawanya ke Amazon Web Services (AWS) Cloud. “Kami tahu bahwa cloud tersebut akan memenuhi kebutuhan kami, dan AWS menawarkan teknologi yang lebih maju daripada penyedia lain yang kami temui,” kata Peltzer. AWS juga berintegrasi dengan Nextflow dan kerangka kerja nf-core, yang mendukung beban kerja ilmiah yang dapat diskalakan menggunakan kontainer perangkat lunak. “AWS bekerja dengan sangat baik dengan Nextflow, dan tidak ada penyedia lain yang mampu melakukannya,” kata Peltzer. “Tanpa integrasi tersebut, kami pasti akan menghabiskan banyak waktu dan uang untuk menulis ulang kemampuan penjadwalan kami sendiri.”

QBiC memilih untuk memanfaatkan instans Amazon Elastic Compute Cloud (Amazon EC2), yang didukung oleh prosesor Intel Xeon Scalable untuk infrastruktur on-premise yang ada. Sekarang QBiC menjalankan Nextflow pada AWS untuk manajemen beban kerja dan menggunakan AWS Batch untuk otomatisasi dan orkestrasi tugas batch Nextflow.

Organisasi juga menggunakan Instans Spot Amazon EC2 untuk mengurangi biaya analisis. Instans Spot EC2 adalah kapasitas komputasi terpisah di AWS yang tersedia dengan diskon hingga 90 persen dibandingkan dengan harga Instans Sesuai Permintaan. “Kami sedang mengurangi biaya analisis dengan menggunakan Instans Spot Amazon EC2,” kata Peltzer. “Hal ini mewakili penghematan biaya yang kami masukan ke dalam penelitian.”

Memproses 100.000 Sampel Gen

Menjalankan beban kerja analisis di Nextflow pada AWS, QBiC dapat memanfaatkan pemrosesan paralel dan menskalakan sesuai permintaan. “Menggunakan AWS, kami dapat menskalakan platform HPC kami ke atas atau ke bawah dengan cepat, baik memproses 30 sampel gen maupun 100.000 sampel dalam satu proyek penelitian,” kata Peltzer. Selain itu, QBiC dan pelanggan penelitiannya mengalami peningkatan keandalan untuk tugas pengurutan genom. “Sekarang kami sudah tidak lagi mengkhawatirkan pemadaman sistem atau performa lambat akibat banyaknya orang yang mengantri untuk melakukan tugas pemrosesan,” kata Peltzer. Meskipun saat ini penyiapan sedang berjalan di proyek penelitian teknis, hasil ini menunjukkan adanya penggunaan potensi produksi.

Mempersingkat Waktu Penelitian Genom hingga 50%

Dalam proyek benchmark, QBiC telah mempersingkat waktu penelitian dan pemrosesan untuk semua tugas menggunakan Amazon EC2 dan AWS Batch, untuk universitas dan organisasi penelitian privat yang berbagi sumber daya dengan pusat. “Penyiapan yang dievaluasi berpotensi mempersingkat waktu penelitian hingga 50 persen karena otomatisasi dan orkestrasi yang kami dapatkan dari AWS Batch,” kata Peltzer. “Kami dapat melakukan banyak hal dengan cepat dibandingkan dengan saat menggunakan lingkungan on-premise kami.

Akibatnya, QBiC dan institusi penelitian lain di seluruh Jerman melihat adanya potensi yang besar dalam menggunakan aplikasi AWS Cloud. Infrastruktur yang terdistribusi dapat membantu QBiC dengan cepat menyelesaikan penelitian tentang analisis ekpresi gen guna menemukan mutasi yang paling banyak terlibat dalam kanker. “Melakukan pengurutan genom di AWS, kami mencari data tumbuhan dan hewan untuk melihat cara perawatan eksperimental mengubah cara gen tertentu diekspresikan,” kata Peltzer.

QBiC akan terus mengevaluasi penggunaan layanan AWS seiring bertumbuhnya persyaratan penelitian. “Kami berharap dapat menjadi bagian dari salah satu pusat pengurutan genom publik terbesar di jerman dalam beberapa tahun mendatang,” kata Peltzer. “AWS akan membantu kami mewujudkannya.”

Pelajari Selengkapnya

Untuk mempelajari selengkapnya, kunjungi thinkwithwp.com/hpc.