Amazon Lab126 entwickelt HPC-Lösung zur Beschleunigung von Entwicklung und Innovationen
2020
Einige der beliebtesten Verbrauchergeräte von heute wurden von Amazon Lab126 entwickelt. Die Forschungs- und Entwicklungsorganisation mit Sitz in Kalifornien hat so bekannte Geräte wie den Amazon Kindle-E-Reader und den intelligenten Lautsprecher Amazon Echo entwickelt.
Die Geräteteams von Amazon Lab126 nutzen High-Performance-Computing (HPC)-Kapazitäten und Machine-Learning-Funktionen, um die Designumgebungen zu skalieren, die Produktentwicklung zu beschleunigen, die Effizienz zu verbessern und die Markteinführungszeiten zu verkürzen. Die älter werdende, kostspielige On-Premises-HPC-Umgebung konnte jedoch nicht die vom Team benötigte Skalierbarkeit und Benutzerfreundlichkeit bereitstellen. „Wir führen umfangreiche Simulationen mit langen Laufzeiten aus, beispielsweise zur Untersuchung der mechanischen und thermischen Reaktionen von Verbrauchergeräten unter bestimmten Bedingungen“, erklärt Shankar Ganapathysubramanian, Senior Manager des Architekturteams bei Amazon Lab126. „Wir benötigten zusätzliche Rechenkapazitäten, um diese Workloads zu unterstützen.“ Amit Gaikwad, Senior Manager Wireless Engineering bei Amazon Lab126, bemerkt: „Wir entwickelten Architekturen für weitere kundenorientierte Lösungen und die On-Premises-HPC-Umgebung bot uns nicht die nötige Skalierbarkeit und Geschwindigkeit.“
Die Design- und Entwicklungsteams von Amazon führen Simulationen und Modellierungen für verschiedene Anwendungen aus, darunter computerbasierte Fluiddynamik, Finite-Elemente-Analysen, Electronic Design Automation und computerbasierte Elektromagnetik. Self-Service-Funktionen stellten eine wichtige Anforderung dar, um die verschiedenen Teams unterstützen zu können. Mickael Crozes, Senior System/Software Developer Engineer bei Amazon Lab126, erklärt: „Unterschiedliche Teams stellen unterschiedliche Anforderungen an die Rechenkapazitäten. Uns fehlte die nötige Flexibilität, um alle Anforderungen zu berücksichtigen. Wir wollten die HPC-Ressourcen zentralisieren, damit die einzelnen Teams wie notwendig auf ihre eigene Umgebung zugreifen konnten. Wir waren nicht in der Lage, für jedes Team neue HPC-Cluster zu starten, wenn sie benötigt wurden.
„Mit HPC in AWS können wir jetzt mehr Geräte unterstützen, neue Technologien untersuchen und besser verstehen, wie sich die Geräte bei den Verbrauchern verhalten.“
Amit Gaikwad
Senior Manager, Wireless Engineering, Amazon Lab126
Entwicklung eines skalierbaren HPC-Frameworks in AWS
Um die Anforderungen seiner internen Kunden zu erfüllen, erstellte das Team von Amazon Lab126 Ende 2017 eine neue cloudbasierte HPC-Umgebung in Amazon Web Services (AWS). „Wir evaluierten zwar auch HPC-Services von Drittanbietern. Letzten Endes bot AWS jedoch die optimale Technologie, was die Skalierbarkeit und Flexibilität von Computing-Instance-Typen angeht“, so Crozes. „Außerdem vertrauten wir AWS hinsichtlich der Ausführung unseres Computings und des Hostings unserer Daten.“
2018 entwickelte Amazon Lab126 ein flexibles HPC-Referenz-Framework in AWS. Dieses Framework ersetzt die On-Premises-HPC-Lösung und ermöglicht eine AWS-basierte Forschungs- und Entwicklungsumgebung, in der mehrere Benutzer arbeiten können und die umfangreiche Workloads wie HPC und Machine Learning unterstützt. Das neue Framework integriert und vereinfacht Computing-intensive Amazon Elastic Compute Cloud (Amazon EC2)-Instances durch einen schnellen Netzwerk-Backbone, unbegrenzten Speicherplatz und Funktionen zur Verwaltung von Kosten und Budget. Es nutzt Amazon Elastic Block Store (Amazon EBS) und Amazon Elastic File System (Amazon EFS) als Datenspeicher. Amazon Lab126 setzt außerdem für die meisten I/O-intensiven Workloads Amazon FSx for Lustre ein. Zur Verbesserung der Fehlerresilienz des Clusters wird AWS Backup verwendet. „AWS Backup war die perfekte Lösung für die Automatisierung des Schutzes der Produktionsumgebung“, so Crozes. Wir hätten zahlreiche Iterationen ausführen müssen, um eine Lösung zu entwickeln, die sämtliche Daten des Teams schützt, Datenaufbewahrung und Lebenszyklus verwaltet und benutzerfreundlich ist.“
Dreimal schnellere Ausführung von HPC-Aufträgen
Die Produktdesigner und Ingenieure von Lab126 konnten mit dem neuen HPC-Cluster Leistungsverbesserungen feststellen. Beispielsweise konnte das Wireless Device Connectivity-Team die Zykluszeiten für Simulationen verbessern, die das Verhalten von Mobiltelefonen untersuchen, wenn sie zu Boden fallen oder auf eine andere Oberfläche treffen. „Wir konnten mithilfe des skalierbaren HPC-Computing-Frameworks in AWS die Geschwindigkeit des gesamten Designzyklus um das Dreifache steigern“, so Ganapathysubramanian. „Wir können jetzt mehr Simulationen ausführen, da wir die Workloads einfacher parallelisieren können. Mit der On-Premises-HPC-Lösung hätte es häufig Wochen gedauert, bis wir Daten generiert hätten. Jetzt gelingt uns das in wenigen Stunden.“
Dank des neuen Frameworks in AWS können die Designer und Ingenieure von Amazon Devices die Lösung wie notwendig skalieren, um die Anforderungen bestimmter Workloads zu erfüllen. „Wir haben sehr umfangreiche Laufzeiten mit sehr hohen Computing-Anforderungen, nur um Daten im Zusammenhang mit der Drahtloskonnektivität zu analysieren“, erklärt Gaikwad. „Mit dieser Lösung können unsere weltweit verteilten Ingenieure die Lösung dreimal schneller als früher skalieren. Sie können sie auch genauso einfach herunterskalieren. Wenn sie also für einen Auftrag keine 100 GPUs benötigen, dann müssen sie diese auch nicht verwenden.“
Vereinfachung des Onboarding-Prozesses
Das Amazon Lab126 Design Technologies-Team kann jetzt neue Amazon Devices-Entwicklungsteams in den HPC-Cluster einführen und unterstützen, ohne Unterstützung von einer IT-Ressource zu benötigen. Und sie benötigen hierfür jetzt weniger als einen Tag, statt wie früher mehrere Wochen. „Wir verfügen jetzt über eine zentralisierte, flexible HPC-Umgebung, die problemlos für alle Benutzer funktioniert, unabhängig von ihren Workload-Anforderungen“ stellt Crozes fest. „Dies hat die Komplexität des Onboarding-Prozesses deutlich reduziert. Viele hier sind keine HPC-Experten, sodass sie sich jetzt auf ihre spezifischen Designkompetenzen konzentrieren können.“
Die Amazon Devices-Teams können jetzt einen vollständigen, computergestützten Entwicklungs-Workflow ausführen (Modelldesign/Meshing, Simulation und Nachverarbeitungsvisualisierung) – alles in AWS. Dies ist möglich, da jetzt Ingenieure und Designer, die von zu Hause arbeiten, mit nur einem Mausklick eigene, dedizierte Supercomputer und leistungsstarke cloudbasierte Workstations nutzen können.
Förderung von Produktinnovationen
Aufgrund der Skalierbarkeit und Einfachheit der AWS-basierten HPC-Umgebung verbringen Amazon Devices-Teams weniger Zeit mit der Verwaltung von Hardware und mehr Zeit mit der Einführung von Innovationen. „Mit HPC in AWS können wir jetzt mehr Geräte unterstützen, neue Technologien untersuchen und besser verstehen, wie sich die Geräte bei den Verbrauchern verhalten“, so Gaikwad. Beispielsweise gewann das Amazon Devices Wireless Connectivity-Team vor kurzem einen DesignCon Best Paper Award für seine Forschungen zur Optimierung von Drahtlossystemen bei minimalen Funkfrequenzstörungen.
Ganapathysubramanian erklärt: „Es ist sehr viel Arbeit erforderlich, bevor wir Simulationen ausführen können. Beispielsweise müssen wir Modelle anhand geometrischer Berechnungen entwickeln. Dank der Automatisierungsfunktionen des skalierbaren Computing-Frameworks in AWS konnten wir die Komplexität einiger dieser manuellen Vorarbeiten reduzieren. Daher können sich unsere Ingenieure auf höherwertige Aufgaben konzentrieren. HPC in AWS hilft uns, neue Chancen zu erkennen. Wir konnten beispielsweise in einige der neueren Amazon Echo-Produkte thermische Designstrukturen integrieren, da wir die verschiedenen, in AWS gespeicherten Daten einfacher verbinden und so das Design mehrerer Produktfunktionen optimieren konnten.“
Amazon Lab126 tritt jetzt in die nächste Phase seiner HPC-Lösung ein, unterstützt durch das skalierbare Computing-Framework in AWS. „Wir werden weiter die Anforderungen unserer Kunden lösen“, bemerkt Jake Boswell, Senior Manager of Design Technology bei Amazon Lab126. „Wir möchten die Referenzarchitektur noch weiter vereinfachen und das Framework auf zusätzliche Bereiche erweitern, um Innovationen zu unterstützen.“
Weitere Informationen finden Sie auf thinkwithwp.com/solutions/implementations/scale-out-computing-on-aws und thinkwithwp.com/hpc.
Über Amazon Lab126
Amazon Lab126 mit Sitz in Sunnyvale, Kalifornien, ist ein Forschungs- und Entwicklungsteam von Amazon, das Verbraucherelektronik für Amazon konzipiert und entwickelt. Das Labor, das auch Hardware, Software und Produktionsteams von Amazon Devices umfasst, hat so bekannte Produkte wie Amazon Echo und Amazon Kindle entwickelt.
Vorteile von AWS
- 3-mal schnellere Ausführung von HPC-Aufträgen und Skalierung von Workloads
- Onboarding neuer Benutzer in weniger als einem Tag statt in mehreren Wochen
- Starten neuer HPC-Cluster für jedes Team wie erforderlich
- Unterstützung innovativer Produktdesigns
Eingesetzte AWS-Services
Amazon EC2
Der Web-Service Amazon Elastic Compute Cloud (Amazon EC2) stellt sichere, skalierbare Rechenkapazitäten in der Cloud bereit. Der Service ist darauf ausgelegt, Web-Scale-Cloud-Computing für Entwickler zu erleichtern.
Amazon Elastic File System
Amazon Elastic File System (Amazon EFS) stellt ein einfaches, skalierbares, vollständig verwaltetes und elastisches NFS-Dateisystem für die Verwendung mit AWS-Cloud-Services und On-Premises-Ressourcen bereit.
Amazon Elastic Block Store
Amazon Elastic Block Store (EBS) ist ein einfach zu bedienender, leistungsstarker Block Storage-Dienst, der für die Verwendung mit Amazon Elastic Compute Cloud (EC2) sowohl für den Durchsatz als auch für transaktionsintensive Workloads in jeder Größenordnung entwickelt wurde.
AWS Backup
AWS Backup ist ein vollständig verwalteter Backup-Service, der die Zentralisierung und Automatisierung des Backups von Daten über verschiedene AWS-Services hinweg unterstützt.
Erste Schritte
Unternehmen jeder Größe und aus jeder Branche transformieren ihr Geschäft mit AWS. Kontaktieren Sie unsere Experten und begeben Sie sich noch heute auf Ihre eigene AWS-Cloud-Reise.