Astera Labs 使用 AWS 來加速晶片開發

QuadX

滿足流片期限

在半導體開發中,設計整合式晶片的過程主要集中在流片階段,此時會發佈晶片設計以用於晶圓製造。對於像 Astera Labs 這類的半導體公司來說,進入流片階段需要大量的運算容量來快速執行複雜的模擬,並放置和路由數百萬個實體上代表晶片的電晶體。Astera 於 2017 年在加州矽谷成立,是一家無晶圓廠半導體公司,為以資料為中心的系統開發專用連線解決方案。Astera Labs 商務長 Sanjay Gajendra 表示「我們必須能夠在開發過程中擴展我們的工作負載以便平行執行許多模擬,這樣我們才能驗證我們的晶片將按預期運作並實現客戶期望的高品質。」

如果 Astera 在晶片設計和驗證過程中無法執行足夠的模擬,公司就有可能發生潛在的設計缺失。「我們有一次機會,而如果我們犯了錯誤,需要 6 到 9 個月的時間來找出錯誤並解決問題。」Gajendra 表示,「這個過程非常昂貴且耗時,作為新創公司,我們負擔不起。」

「相較於使用內部部署 HPC 環境所需的時間,我們在 AWS 上不到一年就完成了晶片設計。」

Astera Labs 商務長 Sanjay Gajendra

  • Astera Labs 簡介
  • Astera Labs, Inc. 是一家總部位於加州矽谷的無晶圓廠半導體公司,為以資料為中心的系統開發專用連線解決方案。該公司的產品組合包括系統感知半導體積體電路、電路板和服務,以實現強大的 PCIe 連線。

  • Intel 簡介
  • Intel 是全球領先的伺服器、PC、物聯網裝置和行動裝置高效能處理器的設計者和製造商。AWS 和 Intel 工程師已經一起合作 10 多年,共同建置客製化硬體以確保能夠在針對客戶工作負載最佳化的平台上執行 AWS 服務,實現最卓越的價值。Intel Xeon 可擴充處理器為 Amazon EC2 執行個體提供支援,協助企業提高運算密集型工作負載的效能。

  • 優勢
    • 在 AWS 上一夜之間即可執行 1,000 多個晶片設計模擬
    • 不需要好幾年的時間,幾個月內即可完成晶片設計
    • 滿足流片流程的期限
    • 避免花費好幾個月和數百萬美元來修復晶片設計錯誤
  • 使用的 AWS 服務

在 AWS 上執行 HPC 工作負載

為了解決在滿足流片期限方面可能遇到的挑戰,Astera 自公司成立以來一直在 Amazon Web Services (AWS) 雲端中執行其 HPC 工作負載。「我們認為,和購買與維護伺服器農場相比,公有雲端將為我們提供更大的可擴展性並且成本更低廉。」Gajendra 表示,「我們之所以選擇 AWS,是因為我們認為它是雲端產業的領導者,並且相信 AWS 服務可以幫助我們將風險降到最低。」

Astera 和 Six Nines (AWS 合作夥伴網 (APN) 核心諮詢合作夥伴) 合作,建立了一個 HPC 環境,以支援晶片設計和驗證模擬。該平台在由 Intel Xeon 可擴充處理器所支援的數千個 Amazon Elastic Compute Cloud (Amazon EC2) R5C5z1d 執行個體上執行。該公司使用 R5 和 C5 執行個體執行實體設計和模擬任務,並使用 z1d 執行個體長期執行需要盡可能最快速虛擬機器的模擬。Astera 還利用 Amazon Simple Storage Service (Amazon S3) 儲存貯體存放 100 TB 以上的資料。

Six Nines 和 AWS 專業服務透過 AWS 專業服務設計和配置環境,協助 Astera 在短短兩週內即在 AWS 上實作 HPC 平台,原本預計 Astera 會需要三個月的時間才能在資料中心設定平台。

平行執行數百個晶片設計模擬

Astera 現在可以使用 AWS 平行執行數百個晶片設計模擬並加快設計驗證時間。「我們可以在 AWS 上實作非常複雜的晶片設計。」Gajendra 表示,「AWS 提升了我們的晶片設計和驗證環境,因此我們擁有在一夜之間執行 1,000 多個模擬所需的運算資源。考慮到資金需求,這在內部部署的資料中心很難辦到。」 憑藉其新功能,Astera 能夠完成實作 PCIe 5.0 規格的新晶片的流片,該規格達到在 x16 介面上有 2Tbits/sec 的頻寬。該晶片能滿足產業對高頻寬和低延遲互連的要求。

依靠 AWS,Astera 還可以在將晶片設計送去流片之前快速識別和修復虛擬環境中的錯誤。結果,儘管時間緊迫,該公司還是完成了新晶片的晶片設計和驗證流程。「相較於使用內部部署 HPC 環境所需的時間,我們在 AWS 上不到一年就完成了晶片設計。」Gajendra 表示,「使用 AWS 來實現雲端可擴展性並提供最新的執行個體類型,消除了我們設計人員的瓶頸,我們將設計驗證執行和實體實作的週期時間縮短了兩倍或更多。」 此外,由於 AWS 支援的運算可擴展性,Astera 可以生產比競爭對手更多的晶片設計和更高品質的產品。

避免數百萬美元的成本

利用其更高效的晶片開發流程,Astera 可避免在流片後花費好幾個月的時間來修正錯誤並投資數百萬美元徹底檢修新的晶片設計。「我們不希望我們的晶片在生產或客戶系統中發生故障,然後花費數月時間來解決問題。」Gajendra 表示,「我們可以透過使用 AWS 確保高品質的流片,從而避免這個問題。」

該公司還由於在設計和開發期間使用多個 AWS 可用區域來維持其 HPC 環境的高可用性而取得優勢。Gajendra 表示「總體而言,使用 AWS,我們可以滿足嚴格的產業期限,實現裝置效能期望,並繼續專注於創造我們可以建置的最佳晶片。」

進一步了解

若要進一步了解,請造訪 thinkwithwp.com/hpc