> > > > 1 Teraflops geknackt: Intel führt Larrabee auf der SC09 vor

1 Teraflops geknackt: Intel führt Larrabee auf der SC09 vor

Veröffentlicht am: von

intel3Nach langer Zeit gibt es wieder ein Lebenszeichen von Intels erstem GPU-Projekt namens Larrabee. Auf der gerade stattfindenden Supercomputing Conference 09 demonstrierte der Chiphersteller die Rechenleistung eines Larrabee-Prototypen, wie Heise.de berichtet. Die Karte erreichte bei der SGEMM-Berechnung (Single Precision General Matrix Multiply) eine Leistung von 1006 Gigaflops und konnte somit die Teraflops-Marke knapp überschreiten. Dieser Wert wurde allerdings im übertakteten Zustand erreicht, im Normalbetrieb kam man nur auf 417 Gigaflops Dauerleistung und maximal 712 GFlops. Zum Vergleich die Konkurrenz: Die messbare SGEMM-Rate bei NVIDIAS Tesla C1060 (vergleichbar mit GeForce GTX 280) soll bei 320 GFlops liegen. Die theoretischen Werte werden dabei oftmals weitaus höher angegeben. Somit soll die aktuelle ATI Radeon HD 5870 von AMD 2,72 Teraflops liefern können. Real dürfte die Radeon aber auch bei der SGEMM-Berechnung die Teraflops-Marke knacken, die gerade veröffentlichte Dual-GPU-Variante HD 5970 erst recht. Somit besitzt Larrabee bereits jetzt eine starke Konkurrenz.

larrabee1tflop

Angeblich halte man aber an der Roadmap fest. Demnach ist mit ersten Larrabee-Produkten in 2010 zu rechnen. Möglich ist dabei auch ein Einsatz als IGP. Weiterhin weist Intel darauf hin, dass Larrabee - im Vergleich zur Konkurrenz - über ein besseres Speichermanagement verfüge. Während bei herkömmlichen Grafikkarten die Daten zwischen Arbeits- und Video-Speicher hin und her geschaufelt werden müssten, soll Larrabee ein gemeinsames virtuelles Speichermodell (M-Y-O) bieten, das weitaus besser funktioniere. Wie Heise.de nebenbei bemerkt, sei dies aber erst wirklich effizient, wenn Larrabee später direkt über das QPI angebunden wäre und nicht über die PCI-Express-Schnittstelle.

Weiterführende Links:

Social Links

Ihre Bewertung

Ø Bewertungen: 0

Tags

es liegen noch keine Tags vor.

Kommentare (23)

#14
customavatars/avatar24340_1.gif
Registriert seit: 27.06.2005

Fregattenkapitän
Beiträge: 2824
Übertaktet wurde das Vorserienexemplar (im Sinne von mehr Takt als die Spec vorgibt). Was dann ausgeliefert wird, kann schneller oder langsamer sein.

Die praktischen Werte der 4870/GTX280 sind interessant! Der Benchmark dürfte ATI liegen, damit bringt eine 5870 sicher über 1 TFlop.
#15
customavatars/avatar38507_1.gif
Registriert seit: 12.04.2006

Vizeadmiral
Beiträge: 6261
Zitat X909;13361498
Im Jahr 2008 hat niemand 1 Tflop mit ner PCIe Karte oder ähnlichem erreicht.

Doch. Einfach mal in diesen Thread reinschauen. Da ist ein User schon mit einer HD 4870 auf einen solchen SGEMM Durchsatz gekommen. Wann wurde diese Grafikkarte nochmal gelauncht? :rolleyes:
Mit der 5000er Generation sollten sogar 2 TFLOPS drin sein. Diese ist übrigens schon auf dem Markt, Larrabee noch lange nicht. Wie ich schon mal vermutet hatte, Intel wird der Konkurrenz scheinbar mindestens 1-2 Generationen hinterherhinken. Wobei, für Fermi könnte es vermutlich reichen.
#16
customavatars/avatar45212_1.gif
Registriert seit: 17.08.2006
Wien
Banned
Beiträge: 4193
Naja

Intel macht viel Lärm um nichts besonders.
Würde mich nicht überraschen wenn die 1. Generation vom Larrabee ein Flop wird.
#17
customavatars/avatar107355_1.gif
Registriert seit: 26.01.2009

Sehfahrer
Beiträge: 1613
Apropos TFLOPS
Benchmark-Test der Ati Radeon HD 5970 im CrossfireX-Verbund: 9,28 TFLOPS in Action [tweaktown.com]
Da braucht es schon einige Larrabees um dahin zu kommen.
#18
Registriert seit: 01.06.2005

Stabsgefreiter
Beiträge: 301
In dem Benchmark, den Intel durchgeführt hat, werden die zwei HD 5970 ganz sicher keine 9 TFlops zusammenbringen, sondern eher 4 TFlops. Außerdem sollte man Einzel-GPUs vergleichen. Intel kann auch vier Larrabees zusammenschalten, wenn es sein muss.

@mr.dude: Er hat 880 GFlops erreicht bei einer Matrix-Größe von 4096x4096 (offenbar eine optimale Größe für die GPU). Bei 1024x1024-Matrizen lag der Wert mit einer HD 4870 nur bei 720 GFlops. Der Test mit einer anderen Implementierung brachte 540 GFlops. Letztendlich erscheint ein Vergleich kaum sinnvoll, wenn man nicht die genaue Matrixgröße kennt.
#19
customavatars/avatar107355_1.gif
Registriert seit: 26.01.2009

Sehfahrer
Beiträge: 1613
Zitat Spasstiger;13369432
In dem Benchmark, den Intel durchgeführt hat, werden die zwei HD 5970 ganz sicher keine 9 TFlops zusammenbringen, sondern eher 4 TFlops. Außerdem sollte man Einzel-GPUs vergleichen. Intel kann auch vier Larrabees zusammenschalten, wenn es sein muss.

@mr.dude: Er hat 880 GFlops erreicht bei einer Matrix-Größe von 4096x4096 (offenbar eine optimale Größe für die GPU). Bei 1024x1024-Matrizen lag der Wert mit einer HD 4870 nur bei 720 GFlops. Der Test mit einer anderen Implementierung brachte 540 GFlops. Letztendlich erscheint ein Vergleich kaum sinnvoll, wenn man nicht die genaue Matrixgröße kennt.


Das sollte auch nur ein "Extrem" darstellen und zeigen was [U]jetzt[/U] schon möglich ist. ;)
#20
Registriert seit: 01.06.2005

Stabsgefreiter
Beiträge: 301
Ok, der Cypress überflügelt Larrabee höchstwahrscheinlich in Sachen Peak-Rechenleistung, allerdings überflügelt der Cypress auch den Fermi bei den Single-Precision-TFlops - und zwar deutlich (HD 5870 = 2,72 TFlops peak, Tesla C2070 = 1,26 TFlops).
Larrabee kann x86-Code ausführen und dürfte damit für Entwickler wesentlich interessanter sein als Cypress.
#21
customavatars/avatar107355_1.gif
Registriert seit: 26.01.2009

Sehfahrer
Beiträge: 1613
Das wird sich zeigen. Derzeit müssen sich alle – wenn auch außergewöhnlich –mit ATI messen.
Wir werden sehen, was die nahe Zukunft bringt.
#22
customavatars/avatar120494_1.gif
Registriert seit: 27.09.2009

Matrose
Beiträge: 28
1. Larrabee besteht aus vielen vereinfachten Pentium-Cores, wobei die Menge längst noch nicht fix ist, welche sich schlussendlich auf dem Produkt wiederfinden wird. Somit ist die endgültige Leistung nicht ersichtlich und wird dem Markt noch angepasst werden.

2. Eben wegen der Architektur werden Spiele im \"Software-Modus\" berechnet , daher ist auch deshalb die Spiele-Leistung absolut ungewiss.

3. Larrabee wird stark von der Treiber- und Softwarequalität abhängig sein, deshalb sind Roh-Leistungstests nicht aussagefähig und daher unbedeutend. Einziger Wert dieser Benchmarks: \"Ja Larrabee gibt es und es macht was die Entwickler davon erwartet hatten\".

Fazit: Egal was ATI, Nvidia und Intel an Leistungsdaten und Benchmarks von nicht veröffentlichten Produkten zeigen, über die tatsächliche Leistung als Spiele-Grafikkarten werden wir uns erst überzeugen können, wenn alle den Markt in der finalen Version erreichen. ATI ging den klassischen Weg und hat eine Grafikkarte entwickelt, Fermi und Larrabee aber sind \"etwas anderes\", multifunctional processing units (MPU)s wenn man so will. ATI wartet ab was die beiden damit anstellen und wir dürfen gespannt sein.
#23
customavatars/avatar38507_1.gif
Registriert seit: 12.04.2006

Vizeadmiral
Beiträge: 6261
Zitat Spasstiger;13369563
Larrabee kann x86-Code ausführen und dürfte damit für Entwickler wesentlich interessanter sein als Cypress.

Nicht wirklich. Das ist eher Marketing. Entwickler programmieren ja sowieso nicht x86, sondern in Hochsprachen wie C oder C++. Und x86 ist hier nicht das Problem, sondern die nicht vorhandene Semantik für parallele Aufgabenverteilung. Deshalb auch Schnittstellen wie OpenCL oder DirectCompute. Intel braucht dies daher genauso. Sie haben sogar eine eigene Schnittstelle namens Ct dafür.
Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

Von ASUS bis ZOTAC: Vier Modelle der GeForce GTX 1050 Ti im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/NVIDIA-GTX1050TI-ROUNDUP/NVIDIA_GTX1050TI_4ER_ROUND_UP-TEASER

Seit Ende Oktober gibt es die aktuelle Pascal-Generation von NVIDIA auch für unter 200 Euro. Tatsächlich bekommt man hier nicht nur viel Leistung fürs Geld, sondern obendrein einen sehr effizienten 3D-Beschleuniger, wie unser Launch-Test zur NVIDIA GeForce GTX 1050 Ti pünktlich zum Marktstart... [mehr]

AMD Radeon RX Vega 56 und Vega 64 im Undervolting-Test

Logo von IMAGES/STORIES/2017/AMD_RADEON_RX_VEGA_64_56_TEST

Unser Test der Radeon RX Vega 64 und Vega 56 hat gezeigt: AMD liefert eine Leistung auf dem Niveau der GeForce GTX 1080 und GeForce GTX 1070, erkauft wird dies aber mit einer deutlich zu hohen Leistungsaufnahme. Derzeit hat AMD bei den Vega-Karten noch viele Baustellen, die vor allem den Treiber... [mehr]

Zwei Modelle der NVIDIA GeForce GTX 1050 Ti im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2016/EVGA-GTX-1050TI-SC/EVGA_ZOTAC_GTX1050TI_AUFMACHER

Am vergangenen Dienstag rundete NVIDIA sein Pascal-Aufgebot nach unten hin ab und kündigte mit der GeForce GTX 1050 Ti und GeForce GTX 1050 die bislang kleinsten Ableger unter den Pascal-Grafikkarten an. Ab heute werden die neuen Einsteiger-Karten zu Preisen ab 125 bzw. 155 Euro im Handel... [mehr]

AMD Radeon RX Vega 64 und RX Vega 56 im Test

Logo von IMAGES/STORIES/2017/AMD_RADEON_RX_VEGA_64_56_TEST

Nun endlich ist es soweit: Was vor gut einem Jahr mit einer ersten Ankündigung begann und ab Ende 2016 konkret wurde, findet nun sein finales Ende in den ersten Tests der Radeon RX Vega 64 und RX Vega 56. AMD ist als einziger Konkurrent zu NVIDIA geradezu zum Erfolg verdonnert. Die Ansprüche an... [mehr]

Neun Modelle der GeForce GTX 1080 Ti im Test

Logo von IMAGES/STORIES/LOGOS-2017/GTX1080TI-LOGO

Wenn es nach AMD geht, wird NVIDIA mit der Radeon RX Vega bald Konkurrenz im High-End-Segment bekommen. Derzeit ist die Informationslage aber noch etwas undurchsichtig und so bleibt die GeForce GTX 1080 Ti erst einmal die schnellste Grafikkarte am Markt. Einige Modelle haben wir uns schon... [mehr]

ASUS ROG GeForce GTX 1080 Ti Strix OC im Test

Logo von IMAGES/STORIES/GALLERIES/REVIEWS/2017/ASUS-ROG-GTX1080TI-STRIX-OC/ASUS_ROG_GEFORCE_GTX_1080_TI_STRIX_OC

Die Inno3D GeForce GTX 1080 Ti X3 Edition war eines der ersten Custom-Designs, welches wir in der Redaktion begrüßen und bereits ausführlich auf den Prüfstand stellen konnten. Während sie noch auf der Platine der Founders Edition basiert und lediglich ein eigenes Kühlsystem aufgeschnallt... [mehr]