NVLink

Hochgeschwindigkeits-Halbleiter-zu-Halbleiter-Verbindung

NVLink ist ein Hochgeschwindigkeits-Bus von Nvidia, der für den Datentransport zwischen GPU-Knoten und CPUs entwickelt wurde, etwa im Bereich der High-Performance-Workstations und bei Rack-basierten Supercomputern.[1] Er ersetzt bei neueren Computersystemen auch das SLI-System für die Direkt-Verbindung von Grafikkarten.[2]

Die folgende Tabelle liefert einen Überblick der Datenrate über eine einzelne Link-Verbindung in einer Richtung. Je nach Halbleiter und Leiterplattenausführung können mehrere solche Links zur Verfügung stehen und auch gebündelt werden.

Interconnect Transfer-
Rate
Datenrate
je Lane
und Richtung
Lanes
pro Link
(typisch)
Datenrate
je Link
und Richtung
Anzahl der Links
(Architektur)
Datenrate
(kumulativ,
bi-direktional)
NVLink 1.0 020 GT/s ~2.500 GByte/s 08 20 GByte/s 04 (Pascal) 160 GByte/s
NVLink 2.0 025 GT/s ~3.125 GByte/s 08 25 GByte/s 06 (Volta) 300 GByte/s
NVLink 3.0[3] 050 GT/s ~6.250 GByte/s 04 25 GByte/s 12 (Ampere) 600 GByte/s
NVLink 4.0[4] 050 GT/s ~6,250 GByte/s 04 25 GByte/s 18 (Hopper) 900 GByte/s
NVLink 5.0[4] 0100 GT/s ~6,250 GByte/s 04 25 GByte/s 18 (Blackwell) 1,8 TByte/s

Eine Bündelung von Lanes ist im Design bzw. den Implementierungen vorgesehen. Dadurch wird die Bandbreite entsprechend vervielfacht. Für die NVLink-Generation 2.0 gibt Nvidia die Volta basierte GPU-Serie mit bis zu 6 Links an, sowie passend eine als NVSwitch bezeichnete, der Generation zugehörige, für Rechenzentrumsanwendungen gedachte Switch-Fabrik für bis zu 16 GPUs. Die ebenfalls mit NVLink-Generation 2.0 ausgestattete Turing-Serie kommt mit bis zu 2 Links. Mit NVLink-Generation 3.0 ist die Ampere GPU-Serie verknüpft was bis zu 12 Links, sowie einen zugehörigen Switch für ebenfalls bis zu 16 GPUs.[4] Für den Halbleiter Nvidia GV100 mit 6 Lanes NVLink 2.0 ergeben sich in der Board-Ausführung für Rechenzentrum mit der Bezeichnung 'V100 SXM2' damit je 150 GByte/s für eingehende und ausgehende Transfers, also zusammen 300 GByte/s. Die Turing-basierten GPU-Top-Modelle bei denn PCIe-Grafikkarten auf Basis vom Halbleiter Nvidia TU102 bieten dagegen nur 2 Lanes mit entsprechend he 50 GByte/s. Für die Ampere Halbleiter-Generation steht der Halbleiter Nvidia GA100 (etwa verfügbar mit der A100 Karte) für 12 Lanes der NVLink-Generation 3.0 mit je Datenrichtung 300 GByte/s und somit 600 GByte/s gesamt. Derselben Halbleiter- und NVLink-Generation zugehörig ist der Halbleiter Nvidia GA102 wie er in den GPU-Top-Modellen bei den PCIe-Grafikkarten zum Einsatz kommt und dort mit 4 Lanes bei allerdings nur 28,125 GTransfers/s und somit Datenraten je Richtung 56,25 GByte/s oder gesamt 112,5 GByte/s realisiert. Da es sich bei den zuvor genannten Switches effektiv um eine quasi-passiv realisierte Durchleitungsfunktion handelt ist deren Datentransfer-Rate und somit deren Nutzen für den eigentlichen Anwender letztlich durch die daran angebundenen Datenquellen und Senken definiert, so dass sich erst durch ein konkretes Umfeld-Design sinnvolle Angaben zu deren Leistung im System ergeben können.

Einzelnachweise Bearbeiten

  1. NVLINK-FABRIC. Abgerufen am 20. August 2019.
  2. Multi-GPU in Spielen: Auch 2 × 16 PCIe-Lanes und NVLink retten SLI nicht. 29. März 2019, abgerufen am 20. August 2019.
  3. https://www.hardwareluxx.de/index.php/news/hardware/grafikkarten/53450-a100-pcie-nvidia-ga100-gpu-kommt-auch-als-pci-express-variante.html