|
17.03.2026
06:01 Uhr
|
Nvidias nächster KI-Beschleuniger Rubin Ultra bekommt eine neue Serverplattform ohne Kabel. Bis zu 144 kommen in ein System.

Firmenchef Jensen Huang schüttelte auf Nvidias Hausmesse GTC 2026 eine Fülle neuer Chips und Serverplattformen aus dem Ärmel. Ganz oben im Portfolio steht ab der zweiten Jahreshälfte 2027 Rubin Ultra. Wie schon beim Wechsel von Blackwell auf Blackwell Ultra verbessert Nvidia eine bestehende Architektur für KI-Rechenzentren.
Im Falle von Rubin Ultra verdoppelt das Unternehmen gegenüber der normalen Rubin-Version den Siliziumeinsatz: Eine GPU besteht dann aus vier statt zwei Compute-Dies, die jeweils über 800 mm² groß sind. Folglich soll sich die verfügbare Rechenleistung grob verdoppeln. Dazu gesellen sich 16 Speicherstapel vom Typ High-Bandwidth Memory (HBM4e), die gemeinsam auf eine Kapazität von einem Terabyte kommen.
Schon auf der GTC 2025 vor einem Jahr zeigte Huang ein Konzept aus 144 Rubin-Ultra-GPUs mit 72 selbst entworfenen Vera-Prozessoren. Damals hieß das System noch Rubin Ultra NVL576, angelehnt an die 144-mal vier Compute-Dies. Ob das finale System so heißen wird, ist allerdings fraglich.
Nvidia hat sich für diese Plattform einen neuen Aufbau überlegt: Statt CPUs und GPUs auf einen horizontalen Servereinschub zu satteln, kommen mehrere vertikale Ebenen zum Einsatz. Vermutlich ist der Umbau auch der steigenden elektrischen Leistungsaufnahme geschuldet. Die Ankündigung ist im Keynote-Video ab Minute 1:53:08 zu sehen.
Auf der vordersten Ebene sitzt die eigentliche Rechen-Hardware, unter anderem mit vier Rubin-Ultra-GPUs und zwei Vera-CPUs. Dahinter befindet sich ein sogenanntes Midplane, über das die Stromversorgung und die Datenverbindungen laufen. Ganz hinten kommt für mehrere Mainboards ein NVLink-Backplane mit Netzwerk-Switches, die alle Chips aneinanderkoppeln.
Midplanes, Backplane und das komplette Rack versieht Nvidia mit dem Zusatznamen Kyber. Die Bauweise hat einen entscheidenden Vorteil: Sie setzt auf feste Strom- und Datenleitungen, sodass keine aufwendige Verkabelung notwendig ist. Das soll die Installationszeit erheblich verkürzen.
Ein einzelner Rubin Ultra soll im kompaktesten Datenformat FP4 mit vierbittigen Gleitkommazahlen 100 Petaflops schaffen, also 100 Billiarden Berechnungen pro Sekunde. Ein komplettes System mit 144 Beschleunigern kommt auf 15 FP4-Exaflops oder alternativ 5 FP8-Exaflops.
(mma)