Nein zu Nvidia-Grafikkarten zu sagen und sich auf die Autarkie zu konzentrieren, ist keine leichte Aufgabe, aber China tut es, während der KI-Wettlauf weiter tobt. Um seine nationale Technologie zu stärken, hat das Land in vielen Bereichen erhebliche Fortschritte erzielt. Während die Herstellung einer Lithium-Metall-Batterie mit der doppelten Energiedichte und einer dreiminütigen Aufladung sicherlich beeindruckend ist, verblasst sie im Vergleich zu Chinas neuestem Supercomputer.
Der Supercomputer mit dem Namen LineShine kann mit seinen mehreren LX2-Prozessoren (basierend auf der Armv9-Architektur), die jeweils aus 304 Prozessorkernen bestehen, bis zu 1,54 Exaflops liefern. Obwohl die meisten Supercomputer für paralleles Rechnen stark auf GPUs angewiesen sind, kommt LineShine ohne GPU aus und setzt für die Koordination und allgemeine Rechenoperationen auf CPUs. Wie funktioniert der Supercomputer ohne GPU? Nun, alles läuft auf einen cleveren Workaround hinaus, der die GPUs durch eine ganze Armee von Kernen ersetzt. LineShine hostet 20.480 Rechenknoten und jeder enthält zwei Prozessoren, sodass sich die Kernzahl auf 2.451.840 erhöht.
Die SME (Scalable Matrix Extension) und die Arm SVE Scalable Vector Extension (beide in jedem Kern verfügbar) sorgen für einen zusätzlichen Schub, da sie Matrix- und Vektoroperationen für Computer und KI-Training unterstützen. Da jeder Kern über 32 KB Befehls- und Daten-L1-Caches verfügt (sowie Cluster, die sich 28,5 MB L2-Cache teilen), ist es kein Problem, Daten reibungslos an die CPU zu übertragen. Schließlich verbindet das Hochgeschwindigkeits-LQLink-Netzwerk mit 1,6 Tbit/s pro Knoten alle Kerne, sodass LineShine alle Vorgänge ohne GPU ausführen kann.
Wie schneidet LineShine im Vergleich zu Standard-Supercomputern ab?
Obwohl das Design des LineShine-Supercomputers ein wahres technologisches Wunderwerk ist, ist es nicht ohne Mängel. Ehre, wo Ehre gebührt: Das reine CPU-Design eliminiert jegliche GPU-Speicherbeschränkungen. Als reines CPU-System ist es jedoch einfach nicht so effizient wie heterogene CPU/GPU-Supercomputer. Es mag insgesamt effektiv sein, ist aber für einen KI-Durchsatz mit hoher Dichte nicht gut gerüstet.
Auch der reine CPU-Supercomputer verliert im Vergleich zu El Capitan etwas an Glanz. Während LineShine eine Leistung von 1,54 Exaflops unterstützen kann, übertrifft El Capitan (der nach wie vor der schnellste Supercomputer der Welt) ihn mit seinen 1,809 Exaflops bei weitem. Für sich genommen erscheint die Gesamtkernzahl von LineShine von 2,45 Millionen Kernen beeindruckend, bis man sie mit den 11,3 Millionen Kernen von El Capitan vergleicht.
In einer Zeit, in der Nvidia KI-fähige Personalcomputer ankündigt, könnte LineShine ein notwendiger Kompromiss sein. Er verfügt zwar nicht über die Leistung oder Effizienz westlicher Supercomputer, macht dies aber durch seine Anpassungsfähigkeit wett. Man fragt sich, welche Art von Maschinen Chinas National Supercomputing Center herstellen kann, wenn es einen Vorrat an im Inland hergestellten GPUs anlegt.
