Logo perusahaan Zoox

Zoox Menggunakan AWS untuk Komputasi Performa Tinggi yang Dapat Diskalakan guna Menguji Kendaraan Otonom dengan Cepat

2021

Anak perusahaan independen Amazon dan perusahaan kendaraan otonom, Zoox, harus melihat di luar infrastruktur on-premise mereka untuk menjalankan simulasi yang memastikan keamanan kendaraannya. Beban kerja simulasinya rentan terhadap lonjakan, yang berarti Zoox mengalami lebih banyak permintaan untuk daya komputasi dibandingkan yang dapat ditangani oleh mesinnya. Perusahaan ini memilih untuk membuat model infrastruktur hibrida, beralih ke Amazon Web Services (AWS) untuk komputasi performa tinggi guna melengkapi klaster superkomputer internalnya. 

Dengan memanfaatkan Amazon Elastic Compute Cloud (Amazon EC2)—yang menawarkan solusi komputasi ekstensif dengan pilihan prosesor, penyimpanan, jaringan, sistem operasi, dan model pembelian—paralel dengan manajer beban kerja sumber terbuka Slurm dari Partner AWS, SchedMD, Zoox mempercepat pengujian dan pengembangan untuk data dalam jumlah besar dan meningkatkan kecepatan pemasarannya. Pada akhir 2024, Zoox diperkirakan menggunakan ratusan petabita data di AWS.

Zoox Fully Autonomous Vehicle at Coit Tower San Francsico
kr_quotemark

“Kami dapat meningkatkan hingga 1.000 simpul dalam satu Wilayah AWS dan menjalankan pekerjaan dalam hitungan jam untuk mendapatkan hasil penelitian penting dan eksperimen pengembangan dengan cepat.”

Conrad Herrmann
Staf Rekayasawan Perangkat Lunak (Staff Software Engineer), Zoox

Memperluas Daya Komputasi secara Efisien

Didirikan pada 2014, Zoox membangun armada kendaraan listrik baterai, simetris, dan otonom yang akan digunakan untuk layanan tumpangan berkendara mereka, yang dirancang untuk mengurangi kemacetan dan polusi di lingkungan perkotaan. Kendaraannya memprioritaskan pengalaman penumpang daripada pengalaman pengemudi; tempat duduk mobil mempromosikan interaksi sosial karena penumpang saling berhadapan. Setiap kendaraan dua arah dapat melaju ke area parkir, menurunkan penumpangnya, dan kembali seolah-olah sedang melaju ke depan.  Menyimulasikan skenario mengemudi yang luas dan berbeda sangat penting untuk pengembangan dan produksi kendaraan ini guna memastikan keamanannya.

Zoox memiliki klaster on-premise yang mengirimkan daya komputasi yang diperlukan untuk berbagai beban kerja. Sebagian besar beban kerja tersebut adalah simulasi, tetapi juga machine learning untuk meningkatkan kemampuan persepsi, serta penyerapan data dan pemrosesan. Namun, seiring perusahaan terus berkembang, beban kerjanya berfluktuasi secara signifikan, beberapa melebihi kapasitas klaster on-premise mereka, yang sulit untuk diskalakan secara efisien. Zoox perlu menambah jumlah mesinnya untuk menangani volume komputasi.

Perusahaan ini memilih AWS karena memberikan skalabilitas dan fleksibilitas kepada Zoox untuk hanya menggunakan dan membayar daya komputasi ketika diperlukan. Zoox kemudian dapat mengalihkan sumber dayanya menuju proyek baru yang inovatif untuk mengatasi tantangan teknis yang rumit. “Kami menggunakan AWS untuk menangani beban kerja khusus yang terkait erat dengan data,” ucap Conrad Herrmann, Staf Rekayasawan Perangkat Lunak (Staff Software Engineer) di Zoox. Manajer beban kerja Slurm dari SchedMD—yang mengoptimalkan kecepatan, throughput, dan konsumsi sumber daya beban kerja misi penting untuk komputasi performa tinggi dan kecerdasan buatan—juga menggunakan AWS. “Hanya ada beberapa pengontrol pekerjaan yang digunakan orang di dunia komputasi performa tinggi, dan Slurm adalah yang dapat diandalkan,” ucap Herrmann. “Kami sangat percaya diri bahwa ini akan bermanfaat untuk kami.”

Menggunakan Model Hibrida untuk Meningkatkan Kecepatan, Kolaborasi, dan Penghematan

Untuk memulai, Zoox mulai menguji satu beban kerja di AWS yang menarik data dari Amazon Simple Storage Service (Amazon S3)—yang dapat digunakan pelanggan untuk menyimpan dan melindungi jumlah data apa pun untuk beragam kasus penggunaan—dan mulai mengindeksnya untuk mendeteksi masalah yang mungkin muncul. Kemudian, Zoox membangun versi eksperimental dari perangkat lunaknya, seperti tugas machine learning yang dirancang untuk berjalan di AWS, menyesuaikannya ke instans Amazon EC2 untuk mengukur seberapa baik performanya. Selanjutnya, Zoox membuat beban kerja produksi dan menjalankannya di AWS untuk menguji apakah mereka akan selesai dalam waktu yang ditentukan. “Alasan kami menggunakan AWS untuk situasi ini adalah untuk mendapatkan hasil yang lebih cepat sehingga kami dapat mempercepat pengembangan,” ucap Herrmann. “Jika kendaraan tidak melakukan yang harus dilakukan dalam simulasi keselamatan, kami akan mengubah perilaku sistem berkendaranya dan mencoba lagi sampai kami mendapatkan perilaku yang tepat pada jutaan situasi yang berbeda.”

Dengan bergantung pada AWS untuk daya komputasi, Zoox dapat memilih instans Amazon EC2 yang menyesuaikan harga, keandalan, dan kebutuhan ketersediaannya dengan berbagai skala mesin, memori, dan akses jaringan. “Kami harus menemukan arsitektur terbaik untuk lingkungan ini dalam hal biaya dan hasil,” ucap Herrmann. “Jika Anda mengurangi semua biaya lain tetapi harus menunggu hasilnya, ini akan meningkatkan total biaya bagi perusahaan. Di AWS, kami dapat menemukan cara yang efektif untuk mengembangkan kendaraan tanpa penundaan.” Fleksibilitas ini juga membantu tim Zoox untuk berkolaborasi lebih efektif: “Ada serangkaian interaksi yang rumit antara biaya, arsitektur, dan pekerjaan,” ucap Herrmann. “Kami harus bekerja sangat dekat dengan banyak disiplin guna menyeimbangkan semuanya. Menggunakan AWS membantu kami menyatukan semua hal untuk menjalankan pekerjaan ini secara efisien.”

Selain itu, Zoox menggunakan AWS untuk membantu mengelola periode intensif komputasi. “Ketika rekayasawan desain kendaraan membuat perubahan pada sistem kontrol mengemudi, perubahan tersebut harus divalidasi yang menghabiskan waktu CPU dan GPU hingga ratusan jam,” ucap Herrmann. “Menggunakan Slurm dan AWS, klaster kami mampu menggandakan lebih dari dua kali lipat jumlah CPU dan GPU yang tersedia untuk tugas komputasi. Kemampuan lonjakan ini mempercepat persepsi sensor, machine learning, dan simulasi skenario berkendara yang merupakan materi utama untuk menciptakan sistem berkendara yang aman dan nyaman.”

Untuk mengelola instans Amazon EC2 untuk layanan jangka waktu lama dan pekerjaan tertentu, Zoox menggunakan Amazon Elastic Kubernetes Service (Amazon EKS)—yang membantu perusahaan mengelola klaster dan aplikasi Kubernetes dalam lingkungan hibrida. Slurm menggunakan cloud privat virtual yang mengandung instans Amazon EC2 yang dialokasikan secara dinamis sesuai dengan permintaan. Ketika seseorang mengirimkan pekerjaan ke pengontrol Slurm, pengontrol tersebut dapat memilih untuk menjalankannya di cloud dan memilih berapa banyak instans yang perlu digunakan. “Kami dapat meningkatkan 1.000 simpul dalam satu Wilayah AWS dan menjalankan pekerjaan dalam hitungan jam untuk mendapatkan hasil dengan cepat pada eksperimen penelitian dan pengembangan penting—tanpa menunggu simpul tersebut tersedia di pusat data on-premise kami atau membangun pusat data lain,” ungkap Herrmann.

Zoox menyimpan puluhan petabita data di Amazon S3. “Penyimpanan kami perlu menskalakan data dalam ukuran petabita dengan sangat cepat saat kami meningkatkan jumlah kendaraan dan komputasi dan simulasi yang kami lakukan,” ungkap Herrmann. Slurm meluncurkan instans Amazon EC2 yang dapat mengakses data dengan cepat dan menjalankan komputasi secara efisien. Zoox memantau data di Amazon S3 menggunakan Amazon CloudWatch, yang mengumpulkan data pemantauan dan operasional, serta memberikan tampilan terpadu dari sumber daya, aplikasi, dan layanan AWS yang berjalan di AWS dan server on-premise. “Menggunakan Amazon CloudWatch membantu memahami apa yang sedang terjadi dan apa yang berfungsi,” ucap Herrmann.

Menskalakan untuk Menyimpan dan Menyimulasikan dengan Ratusan Petabita Data di AWS

Selama beberapa tahun ke depan, Zoox akan mendorong beban kerjanya dari tahap eksperimental ke tahap produksi, yang diperkirakan akan menggunakan ratusan petabita data. Di AWS, Zoox membuat infrastruktur hibrida yang dengan cepat dan hemat biaya menyerap data dalam jumlah banyak dan menjalankan simulasi besar, yang mempercepat pengujian dan pengembangan kendaraan otonomnya. “Menggunakan layanan AWS terkelola, kami dapat membuat sistem rumit yang membantu kami berfokus pada misi kami, tanpa mengkhawatirkan semua sistem lainnya,” ungkap Herrmann. “Jika kami menemukan masalah, AWS akan menyelesaikannya untuk kami.”


Tentang Zoox

Didirikan pada 2014, Zoox adalah perusahaan kendaraan otonom yang membangun kendaraan listrik baterai, otonom, simetris, dan dua arah yang akan digunakan untuk layanan tumpangan berkendara mereka, yang dirancang untuk mengurangi kemacetan dan polusi di area perkotaan.

Manfaat AWS

  • Menyimpan dan memproses puluhan petabita data
  • Meningkatkan hingga 1.000 simpul dengan cepat
  • Memfasilitasi infrastruktur hibrida
  • Meningkatkan kolaborasi di seluruh tim
  • Mengoptimalkan beban kerja menggunakan instans Amazon EC2
  • Diperkirakan akan menggunakan ratusan petabita data dalam beberapa tahun ke depan

Layanan AWS yang Digunakan

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) adalah layanan web yang memberikan kapasitas komputasi yang aman dan berukuran fleksibel di cloud. Amazon EC2 dirancang untuk membuat komputasi cloud berskala web lebih mudah bagi pengembang.

Pelajari selengkapnya »

Amazon S3

Amazon Simple Storage Service (Amazon S3) adalah layanan penyimpanan objek yang menawarkan skalabilitas, ketersediaan data, keamanan, dan performa terdepan di industri.

Pelajari selengkapnya »

Amazon EKS

Amazon Elastic Kubernetes Service (Amazon EKS) adalah layanan kontainer terkelola untuk menjalankan dan menskalakan aplikasi Kubernetes di cloud atau on-premise.

Pelajari selengkapnya »

Amazon CloudWatch

Amazon CloudWatch adalah layanan pemantauan dan pengamatan yang dibangun untuk teknisi DevOps, developer, teknisi keandalan situs (SRE), dan manajer IT.

Pelajari selengkapnya »


Memulai

Organisasi dari semua ukuran di semua industri mengubah bisnis mereka dan mewujudkan misi mereka setiap hari menggunakan AWS. Kontak ahli kami dan mulai perjalanan AWS Anda sendiri sekarang juga.