Die NVIDIA Ampere-Architektur ist Teil der vereinheitlichten NVIDIA EGX-Platform, die Bausteine für Hardware, Netzwerke, Software, Bibliotheken und optimierte KI-Modelle sowie -Anwendungen aus dem NVIDIA NGC-Katalog enthält. Sie repräsentiert die leistungsstärkste End-to-End-KI- und HPC-Plattform für Rechenzentren und ermöglicht es Forschern, realistische Ergebnisse schnell zu liefern und Lösungen in der entsprechenden Größenordnung bereitzustellen.
KI-Training - Bis zu 3-mal höherer Durchsatz als v100 und 6-mal höher als T4
Die Tensor Cores der NVIDIA A30 mit Tensor Float (TF32)-Präzision bieten bis zu 10-mal mehr Leistung gegenüber NVIDIA T4, erfordern dafür keine Code-Änderungen und bieten einen zusätzlichen 2-fachen Boost mit automatischer gemischter Präzision und FP16, wodurch ein 20-mal höherer gemischter Durchsatz möglich ist. In Kombination mit NVIDIA NVLink, PCIe Gen4, NVIDIA Mellanox-Networking und dem NVIDIA Magnum IO -SDK ist die Skalierung auf Tausende A100-Grafikprozessoren möglich. Tensor-Cores und MIG ermöglichen die dynamische Verwendung von A30 für Workloads im Laufe des gesamten Tages. Es kann für Produktionsinferenz bei Spitzenbedarf verwendet werden und ein Teil der GPU kann umfunktioniert werden, um genau diese Modelle außerhalb der Spitzenzeiten schnell umzutrainieren. NVIDIA stellte mehrere Leistungsrekorde in MLPerf auf, dem branchenweiten Benchmark für KI-Training.
Inferenz für Deep Learning
Mit der A30 werden bahnbrechende Funktionen zur Optimierung von Inferenzworkloads genutzt. Sie beschleunigt ein breites Spektrum von Präzisionen, von FP64 über TF32 bis hin zu INT4. Mit der Unterstützung von bis zu vier MIGs pro GPU ermöglicht die A30 den gleichzeitigen Betrieb mehrerer Netzwerke in sicheren Hardwarepartitionen mit garantierter Quality of Service (QoS). Zusätzlich zu den anderen Inferenzleistungssteigerungen der A30 bietet die strukturelle geringe Dichte bis zu 2-mal mehr Leistung.
Leistungsstarke Datenanalyse
Datenwissenschaftler müssen dazu in der Lage sein, umfangreiche Datensätze zu analysieren, zu visualisieren und Erkenntnisse aus ihnen zu gewinnen. Skalierungslösungen werden jedoch oft davon ausgebremst, dass Datensätze auf mehrere Server verteilt sind. Beschleunigte Server mit der A30 liefern die nötige Rechenleistung - zusammen mit gewaltigem HBM2-Arbeitsspeicher, einer Speicherbandbreite von 933 GB pro Sekunde sowie Skalierbarkeit über NVLink zur Bewältigung dieser gewaltigen Workloads. In Kombination mit InfiniBand, NVIDIA Magnum IO und der RAPIDS -Suite an Open-Source-Bibliotheken, einschließlich des RAPIDS Accelerator für Apache Spark, beschleunigt die Rechenzentrumsplattform von NVIDIA diese enormen Workloads mit unübertroffener Leistung und Effizienz.
Unternehmensfähige Auslastung
A30 mit MIG optimiert die Auslastung GPU-beschleunigter Infrastruktur. Mit MIG lässt sich eine A30-GPU in bis zu vier unabhängige Instanzen partitionieren, sodass mehrere Nutzer zeitgleich GPU-Beschleunigung nutzen können. MIG arbeitet mit Kubernetes, Containern und hypervisorbasierter Servervirtualisierung. MIG ermöglicht es der Infrastrukturverwaltung, jeder Aufgabe eine maßgeschneiderte GPU mit garantierter QoS zuzuweisen, wodurch jeder Nutzer Zugang zu den beschleunigten Computing Ressourcen erhält.
- Zustand: Neuware, Bulk
- Speicherkapazität: ab 18 GB
- Sonstige Features: Passivkühlung
- Zustand: Neuware, Bulk
- Speicherkapazität: ab 18 GB
- Sonstige Features: Passivkühlung