Native Kerne vs SMT

I´exemple

Banned
Thread Starter
Mitglied seit
23.01.2007
Beiträge
8.470
Ort
Tokyo R246
Hi,


Ich würde gern wissen, ob die Hyperthreading (aka SMT) Technolgie mit nativen Kernen mithalten kann!

Sagen wir mal wir haben hier einen X6 1090T vs I7 ***. 6 Native Kerne, gegen 4 Kerne + 4 HT Threads.

Wisst ihr da, wie das zum beispiel die Spieleentwickler das sehen, oder Entwickler allgemein.

Was ist einfacher zuhand haben? Was bringt mehr Leistung?

Mein Traumproz ist der I7 980 - 6 Kerne@12threads ...
Das ist ein Prozessor von dem man sagen das der 2Jahre sicher hält und das auf hohem niveau durchgängig. Ich würde keinen anderen Intel Proz kaufen, da ich einen Q9550 hab.



mfg
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Tja was ist besser, Äpfel oder Birnen. ;) Grundsätzlich sind zwei Kerne natürlich schneller als ein identischer Kern nur mit SMT - nur reden wir in deinem Beispiel ja nicht über identische Kerne. Im Regelfall sehen aktuelle Reviews in ihren Gesamtratings beispielsweise einen X6 1090T auf Höhe des i7 860 (2,93GHz TM), teils auch knapp unter einem i7 870 (3,2GHz TM) - 6 K10.5 Kerne sind demzufolge fast ähnlich flott unterwegs wie 4 Lynnfield-Kerne mit SMT und ähnlicher Taktrate. SMT und höhere Pro-Takt-Leistung wiegen in diesem Fall also die höhere Kernzahl auf.
 
Äpfel oder Birnen ... Da haste nicht unrecht - nur sind die Brinen (in dem fall) fast so rund wie Äpfel^^ Die Birnen "lügen" ja Windows an und erklären sich zu Äpfel!

Ich hoffe du weist was ich meine,und deshalb frag ich! Du hast mir aber meine frage beantwortet. Mich wundert es das 4 + 4 HTs schneller bzw gleichschnell sind wie 6 Native Kerne!

Liegt das an der Lobbyarbeit von Intel? Oder ist die HT Technolgie echt so gut? Zumal, angeblich man bei gewissen spielen das HT ausmachen soll... In der theorie stell ich mir das so vor - Die Anwendung braucht sagen wir´mal 6Kerne, diese merkt dann das die HT threads keine echten Kerne sind - Da müsst es doch zu einbrüchen kommen!?
 
Wer sagt denn, dass die nativen Kerne von Intel und AMD gleich schnell sind? Das ist genauso ein Äpfel/Birnen-Vergleich. Die Intel Kerne sind in dem Fall einfach schneller. HT ist, je nach Anwendung, sicherlich nett, man sollte es aber nicht überschätzen.
 
Nun, effizient ist SMT auf jeden Fall: Mit geringstem Transistormehraufwand versucht man, zwei Threads durch die Pipeline zu pressen und damit Leertakte zu reduzieren - das verbessert die Energieeffizienz und natürlich auch die Gesamtleistung, in ausreichend parallelisierten Anwendungen für z.B. 8 Threads sind 20-25% Plus drin. Der andere Teil kommt dadurch, dass die Lynnfield-Architektur auch so schon mehr Instruktionen pro Takt ausführen kann, als z.B. der K10.5 - das kennen wir ja auch aus der Vergangenheit, Pentium 4 gegen Athlon XP bzw. später Athlon 64.

Damit SMT nicht zu Einbrüchen führt, muss das Betriebssystem (bzw. auch die Anwendung) schlau genug sein: SMT, also ein zweiter Thread pro Kern, darf erst genutzt werden, wenn bereits alle physisch vorhandenen Kerne in Benutzung sind. Damit das wirklich reibungsfrei klappt, sollte man Windows 7 benutzen. ;)
 
"Dann wäre es so wie bei der PS3" - diese hat 1 Nativen Kern (@3,2ghz) und 6 threads (eigentlich 7).

Ich weis auch hier hinkt der Vergleich, aber es ist nunmal so das eine Anwendung auf diese threads angepasst werden muss um einen Vorteil zuziehen! Somit müssten Spieleentwickler diese threads ansprechen. Da diese Arbeit aber mehr kostet, nutzen es nur die Sony entwickler Studios.

Wenn also ein Spiel/anwendung diese threads nicht ausnutzt, besteht "nur" der Vorteil der neuern Technologie der Kerne - mal im Vergleich zu meinen Q9550!

Haben die neuen Prozessoren (@ SandyBrige) von Intel auch HT? Und denkt AMD mal auch drüber nach einen 6Kerner @ 12thread raus zubringen. Die kommenden AMDs haben ja keine SMT/HT ähnliche Technologie!
 
"Dann wäre es so wie bei der PS3" - diese hat 1 Nativen Kern (@3,2ghz) und 6 threads (eigentlich 7).

Naja, das ist bisschen was anderes... ;) Die PS3 hat, ganz einfach gesagt, nur einen Kern (PPE) aber 7 physische Coprozessoren (SPEs). Google mal nach "Cell", so heißt der Chip.

Wenn also ein Spiel/anwendung diese threads nicht ausnutzt, besteht "nur" der Vorteil der neuern Technologie der Kerne - mal im Vergleich zu meinen Q9550!

Das ist grundsätzlich richtig. Allerdings haben die aktuellen CPUs noch einen weiteren Vorteil, nämlich den fehlenden FSB, der beim Core 2 Quad die Kommunikation der Kerne untereinander und zum Speicher doch ordentlich bremsen kann.

Haben die neuen Prozessoren (@ SandyBrige) von Intel auch HT?

Jep. In günstigeren Modellen allerdings teils deaktiviert.

Und denkt AMD mal auch drüber nach einen 6Kerner @ 12thread raus zubringen. Die kommenden AMDs haben ja keine SMT/HT ähnliche Technologie!

AMD bringt CMT. Auch hier wieder eine vereinfachte Zusammenfassung: Stell dir CMT wie SMT vor, nur das dort der zweite Thread nicht virtuell, sondern z.T. auch physisch vorhanden ist - das bringt mehr Leistung, kostet aber auch mehr Chipfläche. Also eine etwas andere Herangehensweise. ;)
 
Zuletzt bearbeitet:
Ok, hab Dank für die Erklärung - so versteh ich jetzt besser. Nur wie kommt es, das die I7 dem Qxxxx nich so sehr davon laufen können, ja im gegenteil sogar teils langsamer sind? (Nur Spiele gemeint)

Ich bin nicht jemand der sich sein eigen schön reden will. Gerade das mit dem FSB bei den Quads ist ein nachteil. Wieso macht der sich nicht bemerkbar? Ich kann mir gut vorstellen das die kommenden Spiele, sagen wir mal Rage oder Doom4 usw, viel schlechter laufen werden auf meinem Q9550!


AMD fällt damit für mich fast raus, grössere fläche könnte mehr Stromverbauch/wärme bedeuten ... Und die CMT´s sind doch dann so ähnliches wie die PPE´s der PS3? Ganz grob verglichen ... Wobei die PPEs der PS3 sich doch ganz gut für Physikberechnungen eignen.

Aber ich warte mal die Tests/benchmarks ab.
 
SMT ist für Spiele nicht wichtig soweit ich weiß
HT führt nur dazu das die vorhanden Kerne besser ausgenutzt werden.
HT bedeutet nicht 2 Kerne + 2 HT = 4 Kerne (die maximale Leistung die man rauskriegt bleibt die von 2!, man verschenkt im idealfall nur keine Leistung)
 
Zuletzt bearbeitet:
... Nur wie kommt es, das die I7 dem Qxxxx nich so sehr davon laufen können, ja im gegenteil sogar teils langsamer sind? (Nur Spiele gemeint)

Ich bin nicht jemand der sich sein eigen schön reden will. Gerade das mit dem FSB bei den Quads ist ein nachteil. Wieso macht der sich nicht bemerkbar?

CPU - Benchmarks werden häufig mit limitierenden Grafikkarten gemacht. CPU-Leistung jenseits des Limits der Grafikkarte kann so nicht sichtbar werden und alle CPU ab einem bestimmten Leistungsniveau sind scheinbar gleich performant. Sofern man den CPU nicht limitierende GPU zur Seite stellt, gelangt man zu anderen Ergebnissen. i5/i7- können sich dann i.d.R. recht deutlich von Q9xxx- und AM3-X4/X6-CPU absetzen, vgl. Radeon HD 5870 Crossfire CPU Scaling Performance Part 2 - Conclusion .

Darüber hinaus werden oft Timedemos zum benchen verwendet. Diese erzeugen i.d.R. eine viel geringere CPU-Last als der reale "Spielbetrieb" und lassen so leistungschwache CPU ebenfalls stärker erscheinen, vgl. 3DCenter - Timedemos - Das Maß aller Dinge? .
 
Es ist oft auch so, dass neue CPUs einen Teil ihres Geschwindigkeitsvorteils durch Befehlssatzerweiterungen und neuartige Kombi-Rechenoperationen erreichen.

Es ist zeimlich leicht, einem kleinen Videocodiertool eine entsprechende Handvoll Zeilen Code mitzugeben, die da sagt "Wenn du einen Core i7 im System findest, kannst du diesen schnelleren Algorithmus verwenden". Bei einem Videospiel ist das ganz anders.

Erstens muss das Spiel am besten alle in den letzten 15 Jahren auf dem Markt erhältlichen x86-CPUs gleichermaßen unterstützen - also sowohl die alten Kamellen die nichts können, als auch die neuen Muskelprotze, als auch die absichtlich kastrierten Atoms die wieder nix können, aber in jedem Netbook stecken und zwar zum Spielen nicht ausgelegt sind, die Anwender es aber trotzdem tun.

Zweitens wollen sich die Entwickler den oben genannten Aufwand sparen und entwickeln ihre Spiele stattdessen für Konsolen. Deren Hardware ist zwar im Vergleich zu Desktop-PCs hoffnungslos veraltet, aber allein dadurch dass es nur einen Typ Hardware gibt, lässt sich der Code bis auf's Letzte optimieren. Und dann nimmt man diesen Code und portiert ihn mithilfe halbautomatischer Recompiler so um, dass sämtliche Optimierungen komplett entfernt und durch ineffiziente Standard-Code-Muster ersetzt werden, und nennt das Ganze dann "PC-Version". Wunderschönes Beispiel: GTA IV.

Da kann natürlich auch eine hochmoderne CPU nur mit den Achseln zucken und stur Zeile für Zeile durch die Grundrechen-ALUs schieben, während viele Reserven ungenutzt bleiben.
 
Zuletzt bearbeitet:
Das liegt halt da dran das der PC als Spieleplattform immer uninteressanter wird...
 
Was ist einfacher zuhand haben? Was bringt mehr Leistung?
Einfacher zu handhaben sind "native" Kerne. SMT bedeutet für Softwareentwickler halt eine weitere Optimierungsebene, um maximale Performance zu erhalten. Was mehr bringt hängt von der konkreten Mikroarchitektur ab. Grundsätzlich hat man mit "nativen" Kernen aber mehr Leistungsressourcen, da eben auch mehr Ausführungseinheiten vorhanden sind. Sieht man auch gut wenn man X6 und i7 Quad bei gleicher Taktrate mit gleich gut optimierten Anwendungen vergleicht, die alle logischen Prozessoren auslasten können. Da liegt der X6 im Schnitt etwas vorn. SMT und die etwas höhere Thread IPC des i7 werden also mehr als wettgemacht. Letztendlich ist das aber nebensächlich. Entscheidend ist wie immer Flächen- und Energieeffizienz des jeweiligen Designs.

SMT arbeitet im Grunde kontraproduktiv. Es nutzt "Ausführungslöcher" im Backend der Pipeline, um diese mittels einem oder mehrerer weiterer Threads zu füllen. Bei einer optimal funktionierenden Pipeline, mit entsprechend ausbalanciertem Front- und Backend, versucht man solche Löcher aber erst gar nicht entstehen zu lassen. Das ist ja u.a. auch das, was AMD mit Bulldozer umzusetzen versucht.

Und nein, auch wenn das vorher behauptet wurde, stelle dir CMT bitte nicht wie SMT vor. Das sind zwei grundsätzlich verschiedene Designansätze. Im Grunde sind die Konzepte genau gegensätzlich. Bei SMT gibt es mehrere Frontends, die ein Backend füttern. Bei CMT gibt es ein Frontend, welches mehrere Backends füttert. Der Flächenaufwand für CMT mag zwar grösser sein, ist aber zu vernachlässigen. Laut AMD kostet CMT bei Orochi (8-Kern Bulldozer) 5% mehr Fläche. Bei Intel mögen es vielleicht nur 3% sein (genaue aktuelle Zahlen gibt es meines Wissens nicht), das macht für das gesamte Die aber keinen nennenswerten Unterschied. ZB ein 250 mm² Die bei Intel wäre dann bei AMD 255 mm² gross, wenn bis auf CMT und SMT alles andere identisch wäre. Es gibt letztendlich ganz andere Unterschiede, die die Fläche wesentlich mehr beeinflussen (Cache, Interconnects, usw). Ganz anders sieht es bei der Performance aus. AMD gibt 80% Speedup für den zweiten logischen Prozessor im Bulldozer Modul an. Bei Intels Hyperthreading sind es eher so 5-30%, je nach Anwendung. Es gibt sogar Fälle, wo Hyperthreading die Performance negativ beeinflusst (-> resource competition). Dies ist bei CMT nicht der Fall.
 
Zuletzt bearbeitet:
Das Thema gehört hier nicht her und gebilligt wird hier auch nicht alles.
Und wenn etwas nicht passt meldet es und diskutiert es hier nicht aus.
Betreffende Beiträge entfernt
 
Ich kann mich nur bedanken! Gibt da einiges was ich jetzt gepeilt hab ... ja, ich hätte es auch nachlesen können - also wo anderes.... Aber im gespräch empfind ich das viel besser - zumal die Hersteller ihre Produkte hart umwerben.


Mal sehen ob AMD weiter die Treppe hoch läuft, es geht aufwärts bei AMD ... Aber Intel ist auf der Pole mMn. Mal sehen wie die CMT technolgie abgeht - DIe neuen Intels haben vieleicht mehr Vertrauensvorschuss.

AM3+ hat denn Vorteil das es sich lange halten wird.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh