ahoi zusammen!
laut gamestarbericht (klick) ist hyperthreating in den meisten spielen eine bremse und lediglich beim multitasking interessant.
soll ich eurer meinung nach nun hyperthreating im bios deaktivieren, oder eingeschalten lassen?
danke schon mal für eure antwort.
+ Antworten
Ergebnis 1 bis 25 von 63
Thema: i7 920, hyperthreatingfrage
- 11.09.09, 11:49 #1Matrose
- Registriert seit
- 19.08.2009
- Beiträge
- 30
i7 920, hyperthreatingfrage
*wave* SleepySlow
-
11.09.09, 11:55 #2SuperModerator
Märchenonkel
Luxx Yoga-Labor
- Registriert seit
- 19.05.2006
- Ort
- unterwegs
- Beiträge
- 20.112
Hi,
Wenn du mit dem Rechner nur spielst, kann es je nach Spiel wirklich mehr fps bringen, wenn du das Hyperthreading bzw das SMT, wie Intel es nun nennt, abschaltest.
Wenn du das System noch nicht hast, würde ich an deiner Stelle auf einen i5/P55 setzen.post engine v5.23.1821 running on luxxOS 2.2
11.09.09, 11:57 #3Oberbootsmann
- Registriert seit
- 18.08.2008
- Beiträge
- 1.012
ist völlig banane, weil der unterschied nie und nimmer bei irgendeinem aktuellen game ins gewicht fällt.
(CoreI5-3550K@4.5Ghz@Megahalems@GB-Z77X-UD3H/8GB/HD4000/Vertex 3/Antec Ninehundred [email]Two@Scythe-S-Flex/1920*1200)
11.09.09, 12:23 #4
blogs: Dresdenboy, abinstein
The IPC Myths
die richtige Metrik entscheidet: Performance/Watt/Preis
Diese Nachricht wird nicht angezeigt, da sich Undertaker 1 auf deiner Ignorier-Liste befindet.
11.09.09, 12:25 #5
11.09.09, 12:31 #6
Und bei Windows 7 gibts auch keine nennenswerten Performanceeinbußen mehr wenn SMT = on.
12.09.09, 03:08 #7Matrose
- Registriert seit
- 19.08.2009
- Beiträge
- 30
Themenstarter
alles klar, vielen dank für eure antworten
*wave* SleepySlow
12.09.09, 14:08 #8
MEIN SYS 3570K@4GHz - Wakü - ASRock Z68 Extreme3 Gen3 - 16GB RAM - 7950 Windforce - Rest siehe Systeminfo
FRAU SYS Phenom II X4 965BE - ASRock - 6GB DDR3 - AMD 6780 - Samsung 22 LED
OFFICE SYS Intel E2140@2,5GHZ - GTS450 - 4GB - 250GB HDD - LG 22 Zoll
MULTIMEDIA PS60E6500 Plasma - Pioneer VSX 521 - A10 5700 Trinity - Asus F2A85 - 8GB DDR3 - DVB-C - 1x1TB F3 + 2x2TB F4 RAID 1
MOBIL1 Thinkpad E535 AMD A8-4500 - ATI 7670m - 8GB RAM - 120GB SSD
MOBIL2 Ich: GT-I9300 S3 - Frau: GT-I9000 S1 CM9 + GT-I9100 S2 + NEXUS 7 16GB
FAHRZEUGE Vectra B - BMW K1100LT - Gilera Runner SP 180 - Kymco Yup 50
12.09.09, 16:12 #9Vizeadmiral
- Registriert seit
- 10.02.2005
- Beiträge
- 6.568
Abschalten oder die Game Prozesse mit diversen Tools an die Kerne festzurren.
Diese Nachricht wird nicht angezeigt, da sich Undertaker 1 auf deiner Ignorier-Liste befindet.
14.09.09, 08:40 #10Matrose
- Registriert seit
- 19.08.2009
- Beiträge
- 30
Themenstarter
14.09.09, 08:45 #11
WoW nutzt nur standardmäßig die falschen Kerne (1 echten, 1 Virtuellen). Kein Wunder, das dann Einbußen entstehen.
http://www.wowwiki.com/CVar_processAffinityMask
mit
SET processAffinityMask "85"
werden z.B. alle 4 echten Kerne genutzt, da ist nichts mehr mit Einbußen.
Ebenso in Verbindung mit http://www.wowwiki.com/CVar_timingMethod
set timingMethod "2"
zu nutzen.Geändert von KOKOtm (14.09.09 um 08:48 Uhr)
<<< Systeminfo ist links
14.09.09, 10:40 #12Matrose
- Registriert seit
- 19.08.2009
- Beiträge
- 30
Themenstarter
ungeachtet der tatsache, dass sich dieser kleiner ausflug auf ein einziges spiel bezieht, meine frage jedoch wesentlich allgemeiner formuliert war, stellt sich mir die frage, wieso du [SET processAffinityMask "85"] angibst, obwohl auf wiki für i7 255 empfohlen wird?
und alle 4 echten kerne wiederrum, wie du schreibst, müssten also eigentlich mit "7" laufen.
oder habe ich da was falsch verstanden?*wave* SleepySlow
14.09.09, 12:54 #13
255 (dezimal) = 11111111 (binär)
Hier sind also alle logischen Prozessoren des i7 maskiert. Was dir nicht weiterhilft, da das sowieso das Standardverhalten ist.
Keine Ahnung, wie Windows die logischen Prozessoren ordnet. Nehmen wir mal an, sie sind entsprechend den Kernen geordnet, was wohl am wahrscheinlichsten ist. Also realer Prozessor -> fake Prozessor -> realer Prozessor -> fake Prozessor -> usw. Dementsprechend müsste die Affinity Mask wie folgt aussehen:
01010101 (binär) = 85 (dezimal)
Eben wie von KOKOtm bereits erwähnt.blogs: Dresdenboy, abinstein
The IPC Myths
die richtige Metrik entscheidet: Performance/Watt/Preis
Diese Nachricht wird nicht angezeigt, da sich Undertaker 1 auf deiner Ignorier-Liste befindet.
14.09.09, 13:01 #14
Wie bereits erwähnt, der Scheduler von Windows 7 ist da "geheilt" und lastet erst die CPU 0 und dann 2-4-6 aus, bevor er auf die 1-3-5-7 geht.
Ansosten helfen auch Easytoolz, ein kleines aber feines Progrämmchen. Weiß aber nicht wo man das noch her bekommen kann.
14.09.09, 13:16 #15
blogs: Dresdenboy, abinstein
The IPC Myths
die richtige Metrik entscheidet: Performance/Watt/Preis
Diese Nachricht wird nicht angezeigt, da sich Undertaker 1 auf deiner Ignorier-Liste befindet.
14.09.09, 14:41 #16
Warum? Damit wird die Last zuerst auf alle Kerne verteilt und HyperThreading dann genutzt, wenn es auch etwas bringt.
14.09.09, 16:02 #17Gefreiter
- Registriert seit
- 21.08.2009
- Beiträge
- 59
Was ist eigentlich Hyperthreating? Ist das das, was man tun muss, um ziel eines präventivschlags der Amerikaner zu werden?
14.09.09, 16:22 #18
Weil man für eine komplette Lösung die aktuelle Auslastung überwachen müsste. Nehalem kann das nicht. Und Windows 7 hat meines Wissens nach so etwas ebenfalls nicht implementiert. Bleibt am Ende zusätzlich das Problem, dass SMT halt keine wirklich optimale Lösung für Hardware Multithreading ist. Die Execution Units sind eben nur einmal vorhanden pro Kern. Da kann der Thread Scheduler noch so clever sein. Im schlimmsten Fall klauen sich die Pipelines die Execution Units weg und behindern sich gegenseitig.
blogs: Dresdenboy, abinstein
The IPC Myths
die richtige Metrik entscheidet: Performance/Watt/Preis
Diese Nachricht wird nicht angezeigt, da sich Undertaker 1 auf deiner Ignorier-Liste befindet.
14.09.09, 16:24 #19
14.09.09, 17:47 #20
Wenn ein Programm natürlich von Haus aus eine CPU-Affinity mitbringt, kann das nachteilig sein. Das ist richtig.
@ mr.dude
Deine "Nachteile" von HT sind keine, denn diese Effekte treten bei sauberer Lastverteilung durch Windows nur dann ein, wenn tatsächlich mehr Threads als physische Kerne Last erzeugen. Und genau dann erhöht HT den Durchsatz. Die Execution Units sind i.d.R. zu maximal etwa 30% ausgelastet, die "Breite" des Backends reicht locker für 2 Threads aus.
14.09.09, 17:57 #21
Also ich kann keinen wirklichen unterschied merken wenns an ist.
14.09.09, 19:02 #22
Nein. Erstens, wie gesagt, so intelligent, dass der Thread Scheduler immer auf die richtigen logischen Prozessoren verteilt, ist Windows nicht. Auch nicht Windows 7. Denn dafür müsstest du eine ausgiebige Last Analyse durchführen. Das macht weder die Hardware noch die Software. Und zweitens, völlig unabhängig davon, wenn 2 Threads auf einen Kern und damit die gleichen Execution gleichzeitig zugreifen, sperren sie sich gegenseitig. Gut zu beobachten bei HPC Workloads. SMT ist ja dafür da, die Execution Units besser auszunutzen. Sind diese schon gut ausgelastet, kann das auch nach hinten losgehen. Diese Nachteile sind also sehr real und in Studien nachgewiesen.
Allerdings sollte man auch dazu sagen, die Intel Implementierung ist relativ mies. IBMs SMT Implementierung ist zB um einiges besser. Es kommt auch nicht von ungefähr, dass AMD kein SMT implementieren wird. Das inkonsistente Performance Profil ist eben ein gewichtiger Nachteil.blogs: Dresdenboy, abinstein
The IPC Myths
die richtige Metrik entscheidet: Performance/Watt/Preis
Diese Nachricht wird nicht angezeigt, da sich Undertaker 1 auf deiner Ignorier-Liste befindet.
14.09.09, 20:13 #23
Seit längerem eine nachvollziehbare Antwort.
SMT oder HT wie man es auch nennen mag hatte aus Intel Sicht nur einen wirklichen Sinn: Die Programme auf Multithreading vorzubereiten.
Erst kam mit dem P4 HT. Als dann die ersten "echten" 2 Kerner auf dem Markt kamen, verschwand HTwieder.
Jetzt da Dualcore sich etabliert hat ist der nächste Schritt auf 8 oder gar 16 Cores. Deswegen SMT.MEIN SYS 3570K@4GHz - Wakü - ASRock Z68 Extreme3 Gen3 - 16GB RAM - 7950 Windforce - Rest siehe Systeminfo
FRAU SYS Phenom II X4 965BE - ASRock - 6GB DDR3 - AMD 6780 - Samsung 22 LED
OFFICE SYS Intel E2140@2,5GHZ - GTS450 - 4GB - 250GB HDD - LG 22 Zoll
MULTIMEDIA PS60E6500 Plasma - Pioneer VSX 521 - A10 5700 Trinity - Asus F2A85 - 8GB DDR3 - DVB-C - 1x1TB F3 + 2x2TB F4 RAID 1
MOBIL1 Thinkpad E535 AMD A8-4500 - ATI 7670m - 8GB RAM - 120GB SSD
MOBIL2 Ich: GT-I9300 S3 - Frau: GT-I9000 S1 CM9 + GT-I9100 S2 + NEXUS 7 16GB
FAHRZEUGE Vectra B - BMW K1100LT - Gilera Runner SP 180 - Kymco Yup 50
14.09.09, 20:14 #24
Windows 7 verteilt so lange auf je eine logische CPU jedes Kerns, bis genügend Parallelität möglich ist um (am Beispiel des i7) 4 logische CPUs auszulasten. Stehen beispielsweise genug Threads für 5 CPUs zur Verfügung, nutzt der Scheduler die freien Ressourcen der übrigen logischen Threads.
Sie sperren sich nicht gegenseitig sondern sie werden intern abwechselnd abgearbeitet. Dabei werden "Lücken" im µOP-Strom bzw. Stalls gefüllt (wenn ein Thread warten muss, läuft der andere) und dadurch kann der Durchsatz bei Vollast um etwa 30% gesteigert werden.
Es gibt tatsächlich auch Ressourcen, die geteilt werden müssen. Daher ist keine 100%ige Skalierung möglich.
Ob Intels Implementierung mieß ist liegt nicht in meinem (unserem?) Ermessen. Intel gibt nur sehr wenig zusätzliche Ressourcen (Transistoren = DIE-Fläche = Stromverbrauch) für SMT aus. Es geht darum, brach liegende Ressourcen noch zu nutzen. Bei IBM ist die Intention eine andere, daher wird auch anders Designed.
SMT ist eine der wirtschaftlichsten Methoden mehr Durchsatz aus einer CPU zu quetschen! Klar gibt es bestimmte (seltene) Fälle, in denen HT etwas Performance kostet - dann i.d.R. 1-3%. Echte Nachteile hat man aber nur, wenn ein Scheduler a la Vista oder älter benutzt wird. Die Vorteile wenn man hohe Parallelität hat, ist wesentlich durchschlagender.
Immer dann wenn z.B. 8 Statt 4 logische CPUs des i7 genutzt werden, kann ich deutlich bessere Leistungswerte bei verhältnissmäßig geringem Mehrverbrauch messen.
Wusstest Du, dass Prime etwa 30% zulegt? Folding@Home ein viertel schneller arbeitet und man beim Encoden/Packen/Ver-/Entschlüsseln deutliche Performancezuwächse verzeichnen kann?
Nicht umsonst wird in Reviews üblicherweise betont, dass der i7 gerade bei starkem Multithreading besonders davonzieht.
---------- Beitrag hinzugefügt um 20:17 ---------- Vorheriger Beitrag war um 20:14 ----------
HT wurde bis zuletzt in Extreme und Xeon CPUs genutzt. Dann musste man mit dem Core2 technologisch neu ansetzen, da das HT-fähige Netburst Design aufgegeben wurde.
Als nächster logischer Schritt wurde Core2 HT-fähig gemacht und zusammen mit vielen weiteren Änderungen als i7 verkauft
Geändert von X909 (14.09.09 um 20:19 Uhr)
14.09.09, 22:31 #25
Quelle? Ich glaube eher, dass du dir da zu viel ausdenkst bzw zu viel Wunschdenken im Spiel ist.

Nein. Du scheinst dich mit CPU Frontend und Backend nicht wirklich auszukennen. Wie wollen sich zwei Frontends im selben Takt eine Execution Unit teilen? Es geht schlichtweg nicht. Es ist Fakt, dass sich mehrere Pipelines gegenseitig Execution Units wegnehmen können, je nach Anwendung. Da brauchst du nichts gegenteiliges erfinden. Ich habe eher das Gefühl, hier wird wieder mal versucht, sich den i7 schön zu reden anstatt Tatsachen zu akzeptieren.
Grob rechnet man bei Intels SMT Implementierung mit -10% bis +30%. Aber du scheinst es immer noch nicht verstanden zu haben. Wenn SMT Performance kostet, muss das nicht unbedingt am Thread Scheduler liegen. Es liegt teilweise an der SMT Implementierung selbst.
Btw, ich würde empfehlen, dir mal Dresdenboys Blog anzuschauen. Da findest du auch einiges zu den Problemen von SMT.Geändert von mr.dude (14.09.09 um 22:58 Uhr)
blogs: Dresdenboy, abinstein
The IPC Myths
die richtige Metrik entscheidet: Performance/Watt/Preis
Diese Nachricht wird nicht angezeigt, da sich Undertaker 1 auf deiner Ignorier-Liste befindet.

LinkBack URL
About LinkBacks
Zitieren




