> > > > Auf Larabees Spuren: Intel Xeon Phi

Auf Larabees Spuren: Intel Xeon Phi

DruckenE-Mail
Erstellt am: von

intel3Die heute veröffentlichte Liste der Top 500 Supercomputer weist auf Platz 150 auch einen solchen auf, der bei Intel selbst in den Laboren steht und als "Discovery - Intel Cluster, Xeon E5-2670 8C 2.600GHz, Infiniband FDR, Intel MIC" bezeichnet wird. Dahinter verbirgt sich eine Test-Plattform von Intel, auf der einer der Nachfolger des Projekts "Larabee" zum Einsatz kommt. Das nun von Intel offiziell vorgestellte Modell hört auf den Namen "Knights Corner", der eigentliche Produktname ist allerdings Xeon Phi.

phi coprocessor_TEASER1

Bei Xeon Phi handelt es sich um Erweiterungskarten mit PCI-Express-Steckplatz, die von einem in 22 nm gefertigten Chip Verwendung machen. Intel spricht davon, dass im gesamten System 9.800 Kerne eingesetzt werden. Der Stromverbrauch soll bei etwa 100 kW liegen. Die genaue Anzahl der Kerne pro "Knight Corner"-Chip verrät man allerdings nicht. Die Rede ist nur von mindestens 50, bei einer theoretischen Rechenleistung von einem TeraFLOP bei 64-Bit-Double-Precision-Berechnungen pro Karte. Der Recheneinheit zur Seite stehen jeweils 8 GB GDDR5-Speicher.

Intel Xeon_Phi_PCIe_Card-rs

Erste Produkte auf Basis von Xeon Phi will Intel noch in diesem Jahr ausliefern. 2013 soll dann auch der erste Supercomputer mit einer Rechenleistung von mehr als 10 PetaFLOPs aufgebaut werden. Für das Jahr 2018 verspricht man sich einen Supercomputer, der die ExaFLOP-Grenze durchbricht.

Social Links

Ihre Bewertung

Ø Bewertungen: 5

Tags

es liegen noch keine Tags vor.

Kommentare (18)

#9
customavatars/avatar38573_1.gif
Registriert seit: 13.04.2006
Nehr'esham
Kapitän zur See
Beiträge: 28764
Zitat scandal;19042793
Der Xeon Phi hatt 1 TeraFLOPS Rechenleistung und nur einen PCIe Anschluss.

"That teraflop, by the way, is provided by the Knights Corner card plus the two Xeon E5 host CPUs, so the MIC chip itself is likely delivering something in the neighborhood of 700 to 800 gigaflops."
Quelle: HPC Wire

Zitat Semtexx;19043436
Wo steht, dass es sich bei der Angabe um double-precision handelt?

"Intel claims the chip will achieve greater than a teraflop of double-precision compute throughput in Linpack."
Quelle: Intel, via Tech Report

Waren wir einfach die ersten unabhängigen Tests ab :)
#10
Registriert seit: 17.11.2010

Oberstabsgefreiter
Beiträge: 436
@semtexx

zufälligerweise war es 1997, als irgendeine Number One der Supercomputer 1 Teraflop erreichte, - mit einer Geräte-Anordnung, die einen ganzen Raum füllte
es hätte auch in 2000 oder 1989 sein können, aber es war in 1997, und deswegen reicht der Vergleich zurück ins Jahr 1997, ok?

Das soll nur zeigen, was die Entwicklung bei der Rechenleistung gebracht hat, jedenfalls bei Intel.
Intel reicht für 1 Teraflop in doppelter Genauigkeit ein einziger MIC-Chip.
Ob die 1 TFlop Rechenleistung der Number 1 in 1997 in single oder double precision war? Keine Ahnung, ist auch nicht so wichtig, falls nur single, ist das in der Zwischenzeit erreichte einfach umso beeindruckender. Ziemlich beeindruckend ist Xeon Phi aber allemal, schon deswegen, weil es keine Graka gibt die diese Leistung in double precision auch nur annähernd in einem
einzigen Chip erreicht.
AMD benötigt für diese Leistung z.B. schon zwei seiner Grafikchips der neuesten Generation, und das ist bloß eine Ankündigung. Und was "Ankündigung" beim Änkündigungsweltmeister heisst, das weiss man ja mittlerweile.
Ernstzunehmender wird da schon NVidia's GK110 bzw die entsprechende Profikarte sein.

solltest du ernsthaft bezweifeln, dass Xeon Phi diese double precision Leistung (wie sie schon vor geraumer Zeit auch von Intel selbst angesagt wurde) erbringt, müßtest du dir schon selbst über diese Zweifel hinweg helfen und entsprechende statements suchen, ich werd's bestimmt nicht tun, ok?
#11
Registriert seit: 03.10.2009

Obergefreiter
Beiträge: 88
@dv2130n
Das mit dem Supercomputer ist mir schon klar, nur ist es ziemlicher Murks dp mit sp zu vergleichen ;)

Zitat
AMD benötigt für diese Leistung z.B. schon zwei seiner Grafikchips der neuesten Generation, und das ist bloß eine Ankündigung. Und was "Ankündigung" beim Änkündigungsweltmeister heisst, das weiss man ja mittlerweile.
Ernstzunehmender wird da schon NVidia's GK110 bzw die entsprechende Profikarte sein.

AMD erreicht mit der 7979 jedenfalls annähernd 1TFlop DP Leistung. Intel hat da auch noch nicht mehr als angekündigt, ich bezweifle ja nicht, dass sie es nicht erreichen (irgendwann). Ich konnte nur in der Quelle keinen Hinweis entdecken, dass es sich bei der 1Tflop Angabe um DP handelt.

Zitat
solltest du ernsthaft bezweifeln, dass Xeon Phi diese double precision Leistung (wie sie schon vor geraumer Zeit auch von Intel selbst angesagt wurde) erbringt, müßtest du dir schon selbst über diese Zweifel hinweg helfen und entsprechende statements suchen, ich werd's bestimmt nicht tun, ok?

Ich habe auch kein Problem damit, dass du mir nicht die Statements suchst. Aber man darf doch wohl noch Zweifel an einer Aussage anbringen, zu der es keinen Anhaltspunkt in der Quelle gibt...
Aber wenn die 1TFlop DP natürlich vor geraumer Zeit von Intel angesagt wurde... will ich dem absoluten Wort Intels nichts entgegensetzen ;).
#12
Registriert seit: 17.11.2010

Oberstabsgefreiter
Beiträge: 436
knapp 1Tflops erreicht die 7970, es war wohl die 6970, die nur etwa die Hälfte davon erreichte (macht sich bemerkbar, dass ich amd nichts mehr zutraue), sieht also aktuell nicht ganz so mau aus mit den AMD Karten
die 7979 ist eine Ankündigung und will ca. 2 TFlops erreichen

Knights Corner wurde schon letztes Jahr bei einer Life Performance ausgemessen mittels DGEMM, und jetzt Xeon Phi auf der ISC'12 mit dem Industrie Standard Benchmark Linpack (Rmax)1.
#13
customavatars/avatar172838_1.gif
Registriert seit: 11.04.2012

Flottillenadmiral
Beiträge: 4566
Klingt wie eine amerikanische Studentenverbindung. Intel Xenon Phi :banana:
#14
customavatars/avatar139148_1.gif
Registriert seit: 19.08.2010

Bootsmann
Beiträge: 736
Zitat Semtexx;19044019
AMD erreicht mit der 7979 jedenfalls annähernd 1TFlop DP Leistung. Intel hat da auch noch nicht mehr als angekündigt, ich bezweifle ja nicht, dass sie es nicht erreichen (irgendwann). Ich konnte nur in der Quelle keinen Hinweis entdecken, dass es sich bei der 1Tflop Angabe um DP handelt.
Zitat
Made with Intel's innovative 22nm, 3-D tri-gate transistors, the Intel Xeon Phi coprocessor, available in a PCIe form factor, contains more than 50 cores and a minimum of 8GB of GDDR5 memory. It also features 512b wide SIMD support that improves performance by enabling multiple data elements to be processed with a single instruction. Last year Intel showed a live demonstration of the single Knights Corner coprocessor delivering over 1 TeraFLOPs (1 trillion floating point operations per second) of double precision real life performance, as measured by DGEMM. At ISC'12 Intel demonstrated the same effective performance of more than 1 TeraFLOPs per node but measured by the industry standard benchmark Linpack (Rmax)1. By comparison, in 1997, it took more than 9000 Intel® Pentium® processors inside the ASCII RED* supercomputer to break the 1 TeraFLOPs barrier.

Latest Intel® Xeon® Processors E5 Product Family Achieves Fastest Adoption of New Technology on Top500 List

Ansonsten kommt es dann eben darauf an, was die TFlops in der Praxis wert sind und da lässt sich Intels x86-Lösung sicher nicht ohne weiteres mit den AMD/NVidia Karten vergleichen.
#15
Registriert seit: 17.11.2010

Oberstabsgefreiter
Beiträge: 436
Zitat Elementarteilchen;19045064
Ansonsten kommt es dann eben darauf an, was die TFlops in der Praxis wert sind .....



es wird in der Praxis so viel wert sein, dass alles, was Rang und Namen hat im High Performance Computing - SGI, NEC, Cray, Bull, Dell, HP und IBM, insgesamt bereits 44 Hersteller -
entsprechende Systeme mit Xeon Phi bauen möchten. Und die müssen es ja wissen ...
Im investitionsfreudigen und margenträchtigen HCP-Umfeld wird Xeon Phi ganz prächtige Deckungsbeiträge für Intels R&D einfahren, schätze ich

die genaueren Spezifikationen von Xeon Phi würde man gerne mal erfahren, bisher sollen die Karten ja nur mit 50 von 64 Cores gelaufen sein, und zu Effizienz- und Verbrauchswerten weiss man noch nichts, die Anbindung von Xeon Phi wird aber letztlich wohl über PCIe 3.0 erfolgen, zumal die neuen Xeons ja sogar über einen eigenen PCIe 3.0 Root Komplex verfügen

zwar bieten die AMD grakas pcie 3 anbindung, aber der Rest der AMD Technik dümpelt mit pcie 2 rum, was daran liegt, dass AMDs Hyper Transport einfach nicht schnell genug ist;
was ja auch der Grund ist, weswegen es keine AMD chipsets mit pcie 3 gibt, aktuell nicht, und nach allem, was man so hört, wird es pcie 3 von AMD noch nicht mal für die nächste Prozessorgeneration (kaveri, vishera) geben. Fehlt eigentlich nur noch die AMD Folie und Ankündigung von pcie 3, dann weiss man, dass es noch lange dauert.

Interconnect-Technik ist aber eine ganz zentrale Technologie im Computing, vor allem im HPC. Das ist auch der Grund, weswegen Intel AMD kürzlich bei Cray eben mal vom Fahrrad geschubst hat, indem Intel wichtige Interconnect Technologie von Cray erworben hat fürs HPC Umfeld. AMD ist damit raus bei Cray.
(Intel hat sich ja auch Supermicro näher angesehen, und dankend abgelehnt, so ist dort amd zum Zug gekommen. Interessant wird es, wenn die Xeons und Atoms dort durch
amd cpus mit der hinlänglich bekannten Energiespar-Bulldozer-Technik ausgetauscht worden sind. Gut wahrscheinlich, dass Supermicro das nicht mehr unter eigenem Namen
vermarkten muss ...)

... und dass Intel sich auch beim interessierten SoHo-/Home-Technik Kunden um ordentlich Interconnect kümmert, das belegt die blitzschnelle und recht simple Thunderbolt Technik (aber das nur nebenbei)
#16
customavatars/avatar38507_1.gif
Registriert seit: 12.04.2006

Flottillenadmiral
Beiträge: 5834
Zitat dv2130n;19043123
Und was die Software-Anpassungen angeht, da macht es Intel den Programmierern einfach. Verrenkungen wie bei der Parallelprogrammierung von Grafikkarten sind bei Xeon Phi gerade nicht nötig.

Das glaubst aber auch nur du. Du wirst auch mit Xeon Phi auf Sonderlösungen ala OpenCL zurückgreifen müssen, um die Hardwareparallelität nutzen zu können. Dafür haben Hochsprachen wie C oder C++ nämlich keinen standardmässigen Support. In welche ISA der Compiler den Hochsprachencode dann übersetzt, ist für den Entwickler eher nebensächlich.

Versteh mich nicht falsch, Intels Tera Scale ist ansich eine interessante Sache. x86 basierte Kerne halte ich dafür aber nach wie vor für den falschen Ansatz. Softwareseitig sehe ich da keine wirklichen Vorteile. Du kannst eben nicht einfach so problemlos losprogrammieren, wie du das mit herkömmlichen x86 CPUs tun kannst, und bist trotzdem auf Sonderlösungen angewiesen. Und hardwareseitig sehe ich vor allem Nachteile in der Effizienz.
#17
customavatars/avatar51854_1.gif
Registriert seit: 19.11.2006
Magdeburg
Kapitänleutnant
Beiträge: 1914
Das Problem der Paralellisierbarkeit bleibt bestehen. Als ob man alles so extremm parallelisieren könnte. Irgendwann knallts und dann blebt der nicht-parallelisierbare Teil über ;-)
#18
customavatars/avatar49152_1.gif
Registriert seit: 11.10.2006
Österreich
Korvettenkapitän
Beiträge: 2469
Intel Xeon Phi 5110P, 8GB GDDR5 ECC (SC5110P) Preisvergleich | Geizhals Deutschland
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

Roundup: 5x GeForce GTX 1070 mit Custom-Design im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/5X-GTX1070/GTX1070_CUSTOM_ROUNDUP-TEASER

Nachdem wir bereits eine Reihe von Boardpartner-Karten der NVIDIA GeForce GTX 1080 ausführlich getestet haben, holen wir gleiches nun für das kleinere Schwestermodell nach, denn auch von der NVIDIA GeForce GTX 1070 gibt es viele Custom-Modelle mit höheren Taktraten, eigenen Kühlsystemen und... [mehr]

Drei Custom-Modelle der GeForce GTX 1060 im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/3X-GTX1060/GTX1060_ROUNDUP_TEST-TEASER

Anders als bei der GeForce GTX 1080 und GeForce GTX 1070 trudelten wenige Stunden nach unserem Test zur Founders Edition der NVIDIA GeForce GTX 1060 schon die ersten Boardpartner-Karten mit teils höheren Taktraten, eigenem Kühlsystem und überarbeitetem Platinenlayout ein. Sie dürften... [mehr]

NVIDIA GeForce GTX 1080 mit Pascal-Architektur im XXL-Test

Logo von IMAGES/STORIES/LOGOS-2016/GEFORCE-GTX-1080

Heute ist es soweit: NVIDIA läutet mit der GeForce GTX 1080 und GTX 1070 auf Basis der Pascal-Architektur den diesjährigen Neustart bei den Grafikkarten ein. In Kürze wird wohl auch AMD seinen Beitrag zu diesem Thema leisten. Vor zehn Tagen lud NVIDIA die gesammelte Fachpresse nach Austin ein... [mehr]

Roundup: 5x GeForce GTX 1080 im Custom-Design im Test

Logo von IMAGES/STORIES/LOGOS-2016/GEFORCE-GTX-1080

Nachdem wir uns die Founders Edition der GeForce GTX 1080 und GeForce GTX 1070 bereits angeschaut haben, folgen nun fünf Retail-Modelle, die wir in aller Ausführlichkeit unter die Lupe nehmen wollen. Aus den vielen Boardpartnern und unterschiedlichen Modellen haben wir uns solche von ASUS, EVGA,... [mehr]

AMD Radeon RX 480 im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/RADEON-RX480/RADEON-RX480-REFERENCE-LOGO

Es ist also soweit: AMD startet die großangelegte Zurückeroberung des Grafikkartenmarktes mit der Radeon RX 480, die als erste Grafikkarte der Polaris-Generation mit gleichnamiger Architektur erscheint und die wir uns genauer anschauen können. Dabei versucht sich AMD an einem anderen Ansatz im... [mehr]

PowerColor Radeon RX 480 Red Devil im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/POWERCOLOR-RX480/POWERCOLOR-RX480REDDEVIL-LOGO

Mit der Radeon RX 480 will AMD zurück zu alter Stärke und hat daher über Monate hinweg die PR-Trommel geschlagen. Letztendlich dabei herausgekommen ist eine sehr gute Karte für einen niedrigen Preis, die aber nicht in allen Bereichen zu überzeugen weiß. Wohl größtes Manko der Karte sollte... [mehr]