> > > > ISC 2018: Intels Omni-Path mit 200 GBit/s – Fujitsu mit 56 ARM-Kernen

ISC 2018: Intels Omni-Path mit 200 GBit/s – Fujitsu mit 56 ARM-Kernen

Veröffentlicht am: von

supercomputerNeben einer neuen Liste der Top500-Supercomputer stellen einige Unternehmen auf der International Supercomputing Conference 2018 in Frankfurt auch noch einzelne Neuheiten vor. Intel ist in diesem Segment besonders stark und in 95 Prozent aller Supercomputer vertreten. Allerdings ist Intel nur noch an 27 Prozent der neuen Supercomputer beteiligt.

Dennoch arbeitet man bei Intel natürlich an zukünftiger Hardware für dieses Segment. Bereits heute spendiert Intel einigen Xeon-Prozessoren einen FPGA, zukünftig werden solche Produkte eine noch größere Rolle spielen. Cascade Lake-AP wird ein erstes MCM-Design von Intel sein und die aktuellen Xeon-Phi-Beschleuniger, deren Entwicklung abgeschlossen bzw. eingestellt wurde, werden in Form des Ice Lake Scalable Xeon zu Xeon H werden.

Im kommenden Jahr will Intel seinen Interconnect Omni-Path Architecture (Intel OPA200) beschleunigen. Dieser kommt unter anderem bei einen Xeon-Phi zum Einsatz, wird aber weiter in andere Produkte integriert werden. Intel will die Bandbreite von Omni-Path von 100 auf 200 GBit/s verdoppeln. Damit wäre Omni-Path ebenso schnell wie NVIDIAs NVLink 2.0.

ARM-Server leben weiter

Serverprozessoren mit ARM-Architektur wurde noch vor kurzer Zeit eine rosige Zukunft prophezeit. Von dieser Euphorie ist nicht mehr allzu viel übrig, auch wenn Cavium und Qualcomm inzwischen entsprechende Produkte auf dem Markt haben. Zwischenzeitlich war sogar von einer Einstellung des Geschäftsbereiches seitens Qualcomm die Rede. Großes Manko der ARM-Prozessoren für Server ist die fehlende Softwareunterstützung.

Fujitsu hat in groben Zügen nun ebenfalls einen Serverprozessor mit ARM-Architektur vorgestellt. Dieser ist auf Vektorberechnungen spezialisiert (Armv8-A SVE) und kann bis zu 56 Kerne anbieten. Diese maximale Anzahl wird man in der Praxis aber selten sehen. Wie auch bei den Xeon-Phi-Beschleunigern sind aufgrund der Fertigung nicht immer alle Kerne funktionsfähig und aktiv. Außerdem kommt es ganz auf den Anwendungsbereich des jeweiligen Knotens an, in welcher Konfiguration der Chip betrieben wird. Als reiner Compute-Knoten sollen die Prozessoren in einer 48+2-Konfiguration arbeiten, als I/O-Knoten in 48+4 - also mit 52 Kernen. Ob überhaupt jemals alle 56 Kerne aktiv sind, ist nicht bekannt. Allerdings hält sich Fujitsu mit technischen Daten auch noch stark zurück und will diese zu einem späteren Zeitpunkt veröffentlichen.

Japan will einen Supercomputer auf Basis des neuen Chips aufbauen. Dieser soll zwischen 30 und 40 MW verbrauchen und wäre damit deutlich stromhungriger, als andere Systeme aus der Top500-Liste. Wie schnell der entsprechende Supercomputer dann wird, hängt auch von seiner Effizienz und den weiteren Komponenten ab.

Social Links

Ihre Bewertung

Ø Bewertungen: 0

Tags

Kommentare (7)

#1
customavatars/avatar205758_1.gif
Registriert seit: 03.05.2014
Brasília - DF
Kapitänleutnant
Beiträge: 1961
Hmm, finde ich nicht so besonders, gibt ja schliesslich schon laenger 200GBit/s Ethernet
#2
customavatars/avatar3377_1.gif
Registriert seit: 15.11.2002
www.twitter.com/aschilling
[printed]-Redakteur
Tweety
Beiträge: 31430
Neben der Bandbreite spielen auch die Latenzen eine Rolle und auch diese will Intel mit OPA200 reduzieren.
#3
customavatars/avatar205758_1.gif
Registriert seit: 03.05.2014
Brasília - DF
Kapitänleutnant
Beiträge: 1961
Aber da gibt es ja auch den QPI Link als ehemalige Innovation, mit bis zu 320GBit/s, frage mich warum sowas nicht genutzt wird.
Frage mich warum sowas nicht genutzt wird, ist irgendwie ausgestorben nach Sockel 1366, und kam im Consumer Bereich, auch sonst nirgendwo mehr zum Einsatz.

Der war ja auch extrem Latenzarm, Robust und das Protokoll war auch sehr durchdacht.
#4
customavatars/avatar3377_1.gif
Registriert seit: 15.11.2002
www.twitter.com/aschilling
[printed]-Redakteur
Tweety
Beiträge: 31430
QPI und UPI funktionieren aber auch nur auf bestimmten Leitungslängen, während ich Omni-Path als eine Art Netzwerk auch über größere Strecken verwenden kann. Es gibt On-Die-Interconnects, On-Package-Interconnects und Off-Package-Interconnects.
#5
Registriert seit: 09.04.2011

Kapitänleutnant
Beiträge: 1698
Zitat Don;26380801
Neben der Bandbreite spielen auch die Latenzen eine Rolle und auch diese will Intel mit OPA200 reduzieren.

Mellanox hat schon länger Infiniband HDR am Markt. Omnipath ist nur Intels proprietäre Abwandlung von Infiniband, welches sie seit der Integration von QLogic in Intel anbieten. QLogic hat früher ebenfalls Infiniband Produkte angeboten.

[COLOR="red"]- - - Updated - - -[/COLOR]

Zitat Knogle;26380818
Aber da gibt es ja auch den QPI Link als ehemalige Innovation, mit bis zu 320GBit/s, frage mich warum sowas nicht genutzt wird.
Frage mich warum sowas nicht genutzt wird, ist irgendwie ausgestorben nach Sockel 1366, und kam im Consumer Bereich, auch sonst nirgendwo mehr zum Einsatz.

QPI bzw. UPI ist noch immer in den Intel Xeon SP Produkten erhältlich, aber es wird nur zum Verbinden von NUMA-Knoten in einem System benutzt. Infiniband bzw. Omnipath (Omnipath ist eine proprietäre Erweiterung von Infiniband) ist hingegen eine switch- und routing-fähige Technik, d.h. es ist ein echtes Netzwerkprotokoll und eignet sich dazu tausende von Knoten zu verbinden. Beim älteren QDR IB lag die Grenze bei 65536 Knoten ohne Router-Einsatz. Mit Router können es mehr sein.
#6
Registriert seit: 28.03.2008

Oberbootsmann
Beiträge: 895
OmniPath steht in Konkurent zu InfiniBand und anderen HighSpeed LowLatency intervonnects, das hat mit Ethernet wenig gemeinsam. Man stelle sich vor wie CSMACD oder andere über Etehrnet übliche Protokolle die Latenzen für massiv parallele Rechnungen ruinieren würden.

Ich habe bisher nur kleine OmniPath "Netze" im Betrieb, also einzelne switche mit 48Ports für kleine HPC Cluster. Ältere Installationen mit Infiniband QDR betreibe ich auch noch.
Der für mich größte Vorteil sind die 48Port Switches im Vergleich zu 36Port Infiniband. Darüber lassen sich non Blocking Netze deutlich günstiger realisieren.
Dabei werden die hälfte der Ports pro leaf switch für die Anbindung an die spine switches genutzt und nur die andere Hälfte kann für die Anbindung von Rechenknoten genutzt werden.

Im laufe des Jahres wird es hier eine weitere Installation mit ca. 90 Knoten geben, die über OmniPath kommunizieren werden. Selbst bei so verhältnismäßig kleinen Netzen ist OmniPath schon deutlich günstiger als Infiniband.

Kleines Beispiel: Ich habe hier eine Installation mit 144 Knoten über Infiniband. Dazu brauche ich bei 1:2 Blocking Faktor 8 36 Port Switches. Für non-blocking sind 16 36 Port Switches erforderlich. Oder eben 8 48 Port Switches.
Das spart viel Geld und Platz und das Netzwerk wird weniger Komplex.

Die Integration der OmniPath Schnitstelle direkt an die CPU ermöglicht es auch den Weg über PCI-E Steckkarten einzusparen, das kann schon praktisch sein.
#7
Registriert seit: 09.04.2011

Kapitänleutnant
Beiträge: 1698
Zitat [email protected];26385336

Kleines Beispiel: Ich habe hier eine Installation mit 144 Knoten über Infiniband. Dazu brauche ich bei 1:2 Blocking Faktor 8 36 Port Switches. Für non-blocking sind 16 36 Port Switches erforderlich. Oder eben 8 48 Port Switches.
Das spart viel Geld und Platz und das Netzwerk wird weniger Komplex.

Da es bisher für Intel Systeme kein PCIe 4.0 gibt, ist man effektiv auf 100Gbps an den Knoten limitiert. Für 144 Knoten reichen 6 HDR Edge-Switches aus (HDRs haben 40 Ports), dann braucht man noch 3 Spine-Switches. Die Fabric läuft dann mit HDR200 und die Knoten werden mit HDR100 versorgt.
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

  • Intel Core i9-9900K im Test: Acht Kerne mit Luxuszuschlag

    Logo von IMAGES/STORIES/2017/INTEL_CORE_I9-9900K

    Nach monatelangen Spekulationen und zahlreichen durchgesickerten Informationen hat Intel vor knapp zwei Wochen seine neunte Generation der Core-Prozessoren vorgestellt. Ins Rennen werden mit dem Core i5-9600K, Core i7-9700K und Core i9-9900K zunächst drei Modelle geschickt, die nicht nur... [mehr]

  • AMD Ryzen Threadripper 2990WX und 2950X im Test: Mit Vollgas an Intel vorbei

    Logo von IMAGES/STORIES/2017/AMD_THREADRIPPER_2950X

    Pünktlich zum ersten Geburtstag startet AMD den Ryzen-Threadripper-Generationswechsel. Und wie schon im Frühjahr beim Sprung von Ryzen 1 zu Ryzen 2 vertraut man auf zwei Dinge: mehr Kerne und einen geringeren Preis. Beide sollen dabei helfen, dem Dauerrivalen Intel im... [mehr]

  • Intel mit eigenen Benchmarks zum i9-9900K, i9-9980XE und i9-9900X (5. Update)

    Logo von IMAGES/STORIES/2017/INTEL

    Am gestrigen Nachmittag präsentierte Intel die kommenden Produktlinien bei den Desktop-Prozessoren. Besonders interessant sind dabei natürlich die Core-Prozessoren der 9. Generation, die mit dem Core i9-9900K nun auch ein Modell mit acht Kernen und 16 Threads beinhalten. Im November wird es... [mehr]

  • AMD soll Ryzen 7 2800X mit 10 Kernen in Vorbereitung haben

    Logo von IMAGES/STORIES/2017/AMD_RYZEN_TEASER_100

    Auf der spanischen Seite El chapuzas Informatico ist ein Bild aufgetaucht, welches die Cinebench-Ergebnisse eines Ryzen 7 2800X zeigen soll. Derzeit lässt sich die Echtheit des Screenshots nicht bestätigen und bisher sind auch noch keine weiteren Informationen zu einem Ryzen 7 2800X... [mehr]

  • AMD Ryzen 3000: Acht Zen-2-Kerne mit PCIe 4.0 ab Mitte 2019

    Logo von IMAGES/STORIES/2017/RYZEN3000-CES19

    Neben der Vorstellung der Radeon Vega 7 als erste Gaming-GPU aus der 7-nm-Fertigung hat AMD eine Vorschau auf die Ryzen-Prozessoren der 3000er-Serie gegeben. Die als Matisse geführten Desktop-Prozessoren werden im Sockel AM4 Platz finden, basieren aber auf der neuen Zen-2-Architektur und bieten... [mehr]

  • Intel Coffee Lake Refresh: Overclocking-Check

    Logo von IMAGES/STORIES/2017/INTEL_CORE_I9-9900K

    Nach dem Start der neuen Generation der Intel-Core-Prozessoren stellt sich die Frage, wie es um die Overclocking-Eigenschaften bestellt ist. Erste Ergebnisse lieferte bereits der Test des Core i9-9900K. Doch wie schon in den vergangenen Jahren soll ein umfangreicher Check zeigen, an welchen... [mehr]