Die Leistung eines Clusters zu einem Zehntel der Kosten und bei einem Zwanzigstel des Stromverbrauchs im Vergleich zu CPU-basierten Systemen mit den aktuellsten Quad-Core CPUs.
448 CUDA Recheneinheiten
Bis zu 515 Gigaflops Double-Precision-Leistung pro Grafikprozessor. Eine Workstation kann mehr als ein Teraflop Leistung liefern. Die Single-Precision-Leistung beträgt über ein Teraflop pro Grafikprozessor.
ECC Speicher
Gewährleistet die benötigte Speichergenauigkeit und Zuverlässigkeit für Workstations. Schützt die gespeicherten Daten für bessere Datenintegrität und Zuverlässigkeit für Anwendungen. ECC-Schutz für Registerdateien, L1 und L2 Cache, gemeinsam genutzten Speicher und DRAM
Cluster-Leistung auf Desktop-PCs
Umfangreiche Berechnungen werden auf einer einzelnen Workstation mit mehreren Grafikprozessoren schneller als auf einem kleinen Servercluster durchgeführt.
Bis zu 6 GB GDDR5-Speicher pro Grafikprozessor
Maximiert die Leistung und vermindert Datentransfers durch Speichern größerer Datensätze im lokalen, direkt mit dem Grafikprozessor verbundenen Speicher.
NVIDIA Parallel DataCache Technologie
Beschleunigt Algorithmen wie Physik-Solver, Raytracing und Multiplikation dünnbesetzter Matrizen, wenn die Datenadressen im Vorfeld nicht bekannt sind. Hierzu dient ein konfigurierbarer L1-Cache pro Streaming-Multiprozessor Block und ein einheitlicher L2-Cache für sämtliche Recheneinheiten des Prozessors.
NVIDIA GigaThread Engine
Maximiert den Durchsatz durch bis zu 10x schnellere Kontextwechsel als bei der Vorgängerarchitektur, Concurrent Kernel Execution und verbessertes Thread-Block-Scheduling.
Asynchroner Datentransfer
Extreme Steigerung der Systemleistung durch Datenübertragung über den PCIe Bus, wobei die Recheneinheiten für andere Datenverarbeitungsaufgaben zur Verfügung stehen. Leistungssteigung durch effizientere Berechnungen auch bei Anwendungen mit massiven Datentransfers wie z. B. seismische Analysen, indem Daten vor der Verwendung an den lokalen Speicher übertragen werden.
CUDA-Programmierumgebung mit breiter Unterstützung von Programmiersprachen und APIs
Verwenden Sie C, C++, OpenCL, DirectCompute oder Fortran, um Anwendungsparallelität zu formulieren, und ziehen Sie Nutzen aus der innovativen Architektur des Grafikprozessors "Fermi". NVIDIA Parallel Nsight Tool ist für Entwickler mit Microsoft Visual Studio verfügbar.
High-Speed-Datenübertragung mit PCI-Express 2.0
Maximiert die Bandbreite zwischen dem Hostsystem und den Tesla Prozessoren. Ermöglicht die Kooperation zwischen Tesla Systemen und nahezu jedem PCIe-kompatiblen Hostsystem mit freiem PCIe x16 Steckplatz.
- Condition: Brand new, bulk
- : 6GB