Integrierte Grafik von AMDs Fusion-CPUs auf Niveau einer Radeon HD 5500?

SileX86

Neuling
Thread Starter
Mitglied seit
02.03.2006
Beiträge
477
Ort
Zelt
<p><img style="margin: 10px; float: left;" alt="amd_fusion_logo" src="images/stories/logos/amd_fusion_logo.png" width="100" height="100" />Etwa ein halbes Jahr bevor die ersten Fusion-CPUs von <a target="_blank" href="http://www.amd.com">AMD</a> das Licht der öffentlichen Welt erblicken sollten, mehren sich Informationen und Gerüchte um die Chips, die der Hersteller Accelerated Processing Units (APU) taufte. Nun gibt es neue Hinweise auf die integrierte Grafikeinheit der Prozessoren. Angeblich kommen dabei AMDs DirectX-11-GPUs der "Redwood"-Klasse zum Einsatz, so berichtet zumindest fudzilla.com. Redwood-GPUs werden bei den aktuellen Mainstream-Grafikkarten-Serien ATI Radeon HD 5550, HD 5570 und <a target="_blank"...<p><a href="/index.php?option=com_content&view=article&id=15994&catid=34&Itemid=99" style="font-weight:bold;">... weiterlesen</a></p>
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.

mr.dude

Urgestein
Mitglied seit
12.04.2006
Beiträge
6.456
Fudo ist irgendwie nicht mehr der schnellste. Es ist schon seit vergangenem Jahr bekannt (Analyst Day iirc), dass Llano eine GPU auf Redwood Level haben wird. Für Ontario darf man sicherlich weniger erwarten aufgrund der TDP.
 

Opteron

Semiprofi
Mitglied seit
10.02.2005
Beiträge
6.624
Schließe mich an, Fudo als AMD Quelle ist nur 2te Wahl. In nem anderen Artikel schrieb er erst kürzlich, dass Ontario mit 32nm hergestellt werden würde.
 

Nimrais

Enthusiast
Mitglied seit
29.01.2010
Beiträge
3.632
Ort
CH
Klingt doch super! Jetzt noch anständiges Hybrid CF mit unterschiedlichen GPU\'s (58xx oder 57xx und Onchip) und ich bin glücklich und habe meine erste ATI Karte :-P
 

Ero Sennin

Enthusiast
Mitglied seit
13.04.2003
Beiträge
4.064
Das wäre in der Tat eine nette Beigabe. Auch wenn ich solche CPUs (Intel genauso) eher in Notebooks verwenden würde. Aber warum nicht. Wenn das anständig funzt in jedem Fall eine Bereicherung.
 

Duplex

Urgestein
Mitglied seit
11.02.2008
Beiträge
10.258
ist doch schon sehr lange bekannt das die IGP auf Redwood Level ist.
die CPU Leistung von SB schätze ich in Single Thread bis 40% schneller als Llano ein.

wenn man die CPUs gesamt betrachtet, ist ein Llano in Grafik Power schneller, in CPU Auslastungen ist SB schneller.
 
Zuletzt bearbeitet:

sTOrM41

Admiral , HWLUXX Superstar
Mitglied seit
13.10.2005
Beiträge
22.096
geil,
nen mobilen ableger davon will ich dann in meinem nächsten subnotebook!
 

Undertaker 1

Enthusiast
Mitglied seit
23.08.2004
Beiträge
5.705
Die Frage ist vor allem, was der fehlende L3 Cache an Leistung kostet, und was davon durch mögliche Tweaks im Kern abgefedert werden kann. Ich tippe mal darauf, dass man im Schnitt irgendwo zwischen Propus und Deneb landet, ergo pro Takt etwa 25-30% hinter Lynnfield. Was damit zu Sandy Bridge fehlt, müsste man dann abwarten (je nach dem, wieviel dort dazu kommt). Und die Taktraten stehen ja eh noch etwas in den Sternen.

Letztlich muss man auch etwas darauf schauen, was man hier vergleicht. Sandy Bridge wird wohl maximal mit Modellen mit 2 Kernen + SMT mit Llano konkurrieren, gegen die 4-Kerner muss dann später Bulldozer antreten.
 

mr.dude

Urgestein
Mitglied seit
12.04.2006
Beiträge
6.456
Llano scheint nach aktuellen Infos pro Takt sogar schneller als Deneb zu werden. Die Optimierungen am Kern und der doppelt so grosse L2 (8T statt 6T) scheinen jedenfalls gewichtiger als der fehlende L3. Und Deneb liegt pro Thread gerade mal 10% hinter Lynnfield. Wenn Sandy Bridge nun etwa 10% pro Takt schneller als Lynnfield wird, sind, wie ich schon sagte, um die 25% mehr Takt notwendig.
 
Zuletzt bearbeitet:

Undertaker 1

Enthusiast
Mitglied seit
23.08.2004
Beiträge
5.705
Der größere L2 macht vermutlich kaum etwas aus, die Singlethreadleistung von Propus und Regor ist nahezu identisch. Genaueres zu möglichen Optimierungen (8T zu 6T beim L1 bei gleicher Latenz ist afair eine der wenigen bisher) ist bisher nicht bekannt. Wie wohl jedes Review im Netz bestätigt, liegt ein X4 965BE im Schnitt knapp auf Höhe eines i5 750 - das sind inkl. erster Turbostufe 21,4% Differenz. Da müssten es schon sehr sehr hohe Taktraten werden, selbst wenn die Pro-MHe Leistung eines Deneb erreicht würde. Zumal wir noch nicht sicher sind, wie stark genau die SB-Taktraten und IPC steigen, die letzten Anhaltspunkte sind da ja recht überraschend stark gewesen.

Aber wie gesagt: Vermutlich wird Llano wie aktuell Propus gegen einen Gegner mit nur halber Kernzahl, dafür aber SMT antreten müssen. Für die Multithreadleistung ist also auch ein größerer IPC-Rückstand durchaus einholbar.
 
Zuletzt bearbeitet:

mr.dude

Urgestein
Mitglied seit
12.04.2006
Beiträge
6.456
Du solltest genauer lesen. Duplex sprach von "Single Thread". Und da sind es nur ~10% Rückstand rein hardwareseitig. Das kann dir jeder gute Vergleich bestätigen. Llano hat einige doch tiefgreifendere Änderungen am Kern. Hinzu kommt der L2 Cache, der nicht nur aufgrund von 32 nm schon schneller sein sollte, sondern eben auch doppelt so gross ist und dank 8T Design zusätzlich performanter sein sollte. Daher tippe ich darauf, dass Llano sogar schneller als Deneb pro Takt sein wird, trotz fehlendem L3 Cache. Wie gesagt, um die 25% sind daher eine realistische Schätzung.
 

Undertaker 1

Enthusiast
Mitglied seit
23.08.2004
Beiträge
5.705
Du solltest genauer lesen. Duplex sprach von "Single Thread". Und da sind es nur ~10% Rückstand rein hardwareseitig.

Und du solltest besser mal überlegen. ;) Da ein i5 750 und ein X4 965 beide 4 Kerne und Threads haben, ist es völlig egal ob wir die taktbereinigte Leistung von einem Thread oder allen vieren vergleichen. Ein beliebiges Beispiel:

Test: Intel Core i5-750, Core i7-860 und Core i7-870 (Seite 10) - 08.09.2009 - ComputerBase

i7 860 ohne Turbo und SMT vs. X4 965BE: 1% schneller im Multi-Test, 1% schneller im Single-Test. Da tut sich also nichts. ;) Auch im Mittel des Performanceratings liegt der 2,8GHz Lynnfield ohne SMT und Turbo 1% vorne, was bei einem Taktunterschied von 21,4% die erwähnten 20-25% durchschnittlichen Leistungsrückstand pro Takt ergibt.

Also, nochmal den Bogen zum Thema: Wie wird Llano im Vergleich zu Deneb performen?

- L3-Cache, der kostet vor allem in Spielen erheblich Leistung
+ L2-Cache Verdoppelung, habe allerdings bisher keinen Benchmark finden können, wo sich ein Regor-Kern mit 1MB L2 von einem gleichgetakteten Propus-Kern mit nur 512KB L2 absetzen konnte
+ mögliche Tweaks, hier kann man nur abwarten

Summiert sehe ich die Pro-MHz Leistung von Llano damit irgendwo zwischen Propus und Deneb, genaueres gilt es abzuwarten.
Btw: Nach meiner oben verlinkten Quelle wird nur der L1 Cache von 6T auf 8T umgestellt, allerdings ohne die Latenzen zu senken. Das bringt also keine Mehrleistung, sondern soll nur für eine bessere Taktbarkeit sorgen.
Damit wären wir bei ~25% Leistungsrückstand bei gleicher Kern-/Threadzahl und gleichem Takt auf Lynnfield, zzgl. der IPC-Gewinne von SB. Taktraten gilt es abzuwarten.

Edit:

Aber da wir ja alle so gerne spekulieren, hier mal mein Versuch.
Meine Ausgangspunkte:

1. IPC von Llano zwischen Propus und Deneb
2. IPC von SB ~10% über Lynnfield
3. IPC von Lynnfield ~20-25% über Deneb (siehe oben)
-> IPC von SB ~35% über Llano
4. SMT +~25%

Wie könnte damit jetzt die Leistung am 100€ Preispunkt im Jahr 2011 aussehen:
3,2GHz Sandy Bridge (2 Kerne, 4 Threads) vs. 3,0GHz Llano (4 Kerne)

Betriebsmodus | Kernzahl | Takt | SMT | IPC
Singlethread Sandy Bridge: 1 * 3,2 * 1 * 1,35 = 4,32
Singlethread Llano: 1 * 3,0 * 1 * 1= 3,0
Multithread Sandy Bridge: 2 * 3,2 * 1,25 * 1,35 = 10,8
Multithread Llano: 4 * 3,0 * 1 * 1= 12,0

Der Sandy Bridge wäre um 44% in der Singlethreadleistung überlegen, Llano würde Multithreaded um etwa 11% führen. Eine recht ähnliche Situation, wie wir sie aktuell zwischen Propus und Clarkdale sehen. Beide CPUs hätte je nach Situation ihre Stärke.
 
Zuletzt bearbeitet:

mr.dude

Urgestein
Mitglied seit
12.04.2006
Beiträge
6.456
Ein Vergleich von i5 750 und X4 965 ist schlichtweg Unfug. Das habe ich glaube ich schon etliche Male erwähnt. Das wäre maximal ein Fall für CPI, jedoch nicht IPC. Ausserdem sprach ich von "rein hardwareseitig". Wer die Softwarenachteile für AMD unter Windows berücksichtigen will, dann würde ich hier maximal noch 5% hinzurechnen. Das ist für die Hardware selbst aber irrelevant. Es gibt schliesslich auch andere Plattformen, wo AMD diese Nachteile nicht hat oder zumindest weitaus weniger. Hier geht es um Hardware und deshalb sollten wir auch nur diese vergleichen und nicht Softwareoptimierungen.

Wenn man sich also Llano mal bei Anwendungen anschaut, so kostet der L3 nicht besonders viel Performance. Bei CB sind es zB nur ~3%. Das sollte Llano pro Takt eigentlich problemlos gutmachen können und noch mehr. Er wird damit also recht wahrscheinlich schneller als Deneb pro Takt. Für Sandy Bridge sind vermutlich 10% zusätzlich zu erwarten. Rechnet man das alles zusammen, kommt man zu dem Schluss, für 40% mehr Performance bräuchte Sandy Bridge mehr als 20% Takt gegenüber Llano. Da die Skalierung pro Takt auch nicht linear verläuft, rechne ich mit etwa 25%. Wichtiger ist aber sowieso, was pro Thread und pro Watt letztendlich rauskommt. Und da wir weder wissen, wie hoch Llano takten wird, noch was Turbo bringt, sind Spekulationen an dieser Stelle ziemlich unbrauchbar.
 

Undertaker 1

Enthusiast
Mitglied seit
23.08.2004
Beiträge
5.705
Ein Vergleich von i5 750 und X4 965 ist schlichtweg Unfug. Das habe ich glaube ich schon etliche Male erwähnt. Das wäre maximal ein Fall für CPI, jedoch nicht IPC. Ausserdem sprach ich von "rein hardwareseitig".

Hardware lässt sich ohne Software nicht testen. Auch sprach Duplex ganz allgemein von der Singlethread-Performance, also nicht schon wieder sinnlose Optimierungsdiskussionen. Und natürlich ist ein Vergleich von i5 750 oder i7 860 (ohne SMT/Turbo jeweils versteht sich) und X4 965 zur Bestimmung des Leistungsunterschiedes pro Takt absolut relevant. Wenn wir hier die identische Leistung erhalten, entspricht die Taktdifferenz der Differenz der Leistung pro Takt - ganz einfach. :) Nötig sind 2,66-2,8GHz für identische Performace zu einem 3,4GHz Deneb -> 21-28% Unterschied in der Leistung pro Takt in einem durchschnittlichen Programmumfeld. :)

Wenn man sich also Llano mal bei Anwendungen anschaut, so kostet der L3 nicht besonders viel Performance. Bei CB sind es zB nur ~3%. Das sollte Llano pro Takt eigentlich problemlos gutmachen können und noch mehr.

Was der L3 an Performance kostet, ist extrem anwendungsabhängig. In CPU-limitierten Spielen teils um die 30%, in anderen Anwendungen teils gar nichts. Im Mittel von Anwendungen und CPU-limitierten Spielen:

5% zwischen X3 720 (2,8GHz) und X3 435 (2,9GHz)

Taktbereinigt also grob ~7%. Nun, womit soll Llano die gut machen? Wenn ich mir den X2 250 vs. X2 550 ansehe, bringt der doppelte L2 Cache gar nichts. Der L1 Cache bleibt trotz 8T Design bei 3 Takten Latenz, die Vorteile werden also nur für die Taktbarkeit eingesetzt. Was bleibt da noch an bekannten Tweaks, die hier nennenswert Leistung bringen sollen? :confused: Es bleibt wohl ein weitgehend schlicht geshrinkter K10.5 Kern.

Ich verwette mal meinen Hut, dass wir am Ende ziemlich genau auf das Bild kommen, was ich bzgl. Leistung und Taktraten in meinem letzten Posting ausgemalt habe. Darf zum Launch gerne zitiert und auseinandergenommen werden. :)
 
Zuletzt bearbeitet:

Duplex

Urgestein
Mitglied seit
11.02.2008
Beiträge
10.258
vielleicht hat Llano 5% mehr IPC als Deneb, außerdem kommt 32nm mit HighK+lowK zum einsatz, AMD könnte die Turbo Funktion verbessert haben, die CPU könnte wenn AMD will in bestimmten Anwednungen deutlich höher Takten als Deneb.

Deneb 3,4Ghz @125w TDP (4 Cores)
Thuban 3,2 Ghz @125w TDP (6 Cores) LowK Einsatz

Llano bekommt zusätzlich HighK, was Deneb & Thuban nicht haben, durch LowK braucht die CPU auch weniger Strom (vorbild Thuban, 2 Cores mehr bei gleicher TDP)

vielleicht erlaubt die Turbo Mode bei Llano 4 Ghz in Single Thread und wir liegen falsch...
 
Zuletzt bearbeitet:

Undertaker 1

Enthusiast
Mitglied seit
23.08.2004
Beiträge
5.705
Der Turbo könnte sicherlich speziell in Fällen, wo die IGP kaum arbeitet, sehr stark einschlagen - nur habe ich so den Verdacht, dass man ihn das nur bedingt lässt. Llano wird einige Monate lang die Einstiegs-CPU unter Thuban bleiben, den man folglich nicht zu stark kanibalisieren darf. Singlethreaded hätte Llano sicher das Zeug dazu.
 

mr.dude

Urgestein
Mitglied seit
12.04.2006
Beiträge
6.456
Ein Vergleich von i5 750 und X4 965 zur Bestimmung des Leistungsunterschiedes pro Takt ist immer noch absolut irrelevant, solange man diese nicht identisch taktet. Die Basis ist identischer Takt und kann hinterher nicht einfach hinzu gemogelt werden. Zumal hier das Thema Taktskalierung ins Spiel kommt. Der Unterschied ergibt sich dann aus der Anzahl der ausgeführten Instruktionen im gleichen Zeitintervall. Und wenn man K10.5 und Nehalem hier vergleicht, sind es etwa 10% Unterschied. Wer unter Windows vergleicht mit all den softwareseitigen Nachteilen für AMD, darf gerne noch 5% hinzu rechnen. Alles andere ist kompletter Unfug.

Einen X2 250 und X2 550 bezüglich L2 zu vergleichen, ist natürlich genauso wenig hilfreich. Wenn, dann muss hier die Taktrate auf gleiche Weise normalisiert werden. Und dann werden aus den angesprochenen 7% zwischen kastriertem Propus und Deneb nur noch die Hälfte. Der L2 bringt also sehr ordentlich etwas. Mit den zusätzlichen Verbesserungen des L2 in Llano sollte der L3 des Deneb praktisch schon egalisiert werden. Mit den weiteren Verbesserungen der Architektur sind durchaus noch weitere 5% drin. Das 8T Design bezieht sich übrigens vor allem auf den L2. Die 15 Zyklen momentan sollten sich also verringern. Heisst im Endeffekt geringere Latenz für den L2. Ob der L1 ebenfalls auf 8T geändert wird, kann ich momentan gar nicht sagen. Auch ist noch unklar, ob es Verbesserungen bezüglich Durchsatz gibt.

Dass sich in Spielen Cache stärker auswirkt, sollte klar sein. Nur ist es ziemlich abwegig, den Vergleich von Llano und Sandy Bridge auf Spielen aufzubauen. Wer da mehr FPS pro Takt aufgrund der integrierten GPU generieren wird, sollte auch klar sein. Seltsam, sonst wurde auch immer mit Anwendungen bezüglich CPUs argumentiert, gerade um das SMT beim i7 besser dastehen zu lassen. Ich sehe daher keinen Grund, das zu ändern. Auch Llano wird sich bezüglich Performance erstmal in Anwendungen beweisen müssen. Und dort ist der Cache eben nicht so ausschlaggebend. Die 3% von CB sind also ein guter Richtwert. Gelegenheitsspieler dürfen so oder so keine neuen FPS Rekorde erwarten. Richtige Zocker dürften eh auf Bulldozer warten.
 
Zuletzt bearbeitet:

y33H@

Enthusiast
Mitglied seit
14.05.2007
Beiträge
2.709
mr.dude schrieb:
Und wenn man K10.5 und Nehalem hier vergleicht, sind es etwa 10% Unterschied. Wer unter Windows vergleicht mit all den softwareseitigen Nachteilen für AMD, darf gerne noch 5% hinzu rechnen. Alles andere ist kompletter Unfug.
Es sind nach wie vor 20-30%, wie oft gezeigt.
 

Undertaker 1

Enthusiast
Mitglied seit
23.08.2004
Beiträge
5.705
Exakt.

Aber dennoch mal die Erläuterung, wie man diese Differenz möglichst exakt bestimmt:
Ein Vergleich der Leistungsdifferenz bei gleicher Taktrate ist nur dann möglich, wenn ein absolut vollständiges und durch alle Tests durchgängiges CPU-Limit gesichert werden kann - bei CB z.B. im Cinebench der Fall. Hier sieht man auch: In einem vollständigen CPU-Limit skaliert die Taktrate zu 100%. Es ist also unerheblich, ob ich den Taktratenunterschied für gleiche Leistung betrachte oder den Leistungsunterschied bei gleicher Taktrate - das Ergebnis ist das selbe.

Etwas anders stellt sich die Problematik dar, wenn keine reine CPU-Limitierung mehr besteht, sondern z.B. ein 50%iges GPU-Limit herrscht: Während wir im obigen Beispiel den Fall hatten, dass CPU A bei gleichem Takt z.B. 25% vor CPU B liegt bzw. CPU B für gleiche Leistung 25% mehr Takt als CPU A braucht, sieht es jetzt beispielsweise folgendermaßen aus: CPU A liegt nur noch 12,5% vor CPU B, dennoch erreicht CPU B mit 12,5% Mehrtakt noch nicht die Leistung von CPU A - es sind weiterhin 25% Mehrtakt nötig.

Man erkennt: Nur wenn man ein 100%iges CPU Limit absichern kann, kann man die Mehrleistung bei gleichem Takt als Kriterium für den IPC-Vergleich heranziehen. Besser, da auch in Fällen mit teilweisen sonstigen Limitierungen wirksam, ist die Betrachtung, welcher Takt für identische Leistung notwendig ist.

Damit nocheinmal zu Llano: Das 8T-Design betrifft den L1 Cache, nicht den L2 Cache. Quelle. Der L1 verbleibt bei gleicher Latenz, wird nicht schneller. Am L2 gibt es außer der Verdoppelung keine bekannten Änderungen. Der doppelte L2 Cache bei gestrichenem L3 Cache kostet Leistung. Quelle. In Anwendungen ist ein 3,3% höher getakteter X2 550 7% schneller als ein X2 250. In Spielen gar 9%. Ein doppelter L2 Cache kann zunächst also keinen fehlenden L3 Cache kompensieren, sondern die Leistung sinkt. Im Falle von einem 2-Kern Deneb vs. Regor wären ~5% Mehrtakt notwendig, um im Schnitt die gleiche Leistung zu erzielen.
 

Hadan_P

Enthusiast
Mitglied seit
04.08.2006
Beiträge
1.662
Ort
Wien
Grüß euch!

Ich lass die CPU-Diskusion (die mir eh schon zu hoch ist) mal aussen vor, eine Frage die mich interessiert ist die "Anbindung" des Videospeichers.
Die Grafikeinheit greift ja auf den RAM zu.
Geht da nicht sehr viel Leistung verloren aufgrund der sehr viel geringeren Bandbreite von DDR3 ggüber GDDR5? Da würde ja von "Leistung einer HD5500" nicht mehr ganz soviel übrig bleiben.
Gibts dazu irgendwelche Lösungsansätze?

Mir ist klar das der Chip nicht für Highend-Gaming gemacht ist, aber etwas mehr als mit einer "normalen" IGP sollte schon möglich sein & da kommt dann ja das Problem mit dem VRAM ins Spiel.

mfg
Hadan
 

Undertaker 1

Enthusiast
Mitglied seit
23.08.2004
Beiträge
5.705
Absolut korrekt erklärt und begründet. Bei Llano sollte man allerdings zwei Punkte beachten.

1. Was ist Fusion?
Neben Kosteneinsparungen soll die integrierte GPU in erster Linie für spätere GPGPU Anwendungen dienen. Diese brauchen zwar eine hohe Rechenleistung, aber weniger eine hohe Bandbreite wie übliche Spieleengines. Fusion zielt nicht auf Spiele ab. Auch wenn wir im IGP-Bereich sicher seit langem mal wieder eine spürbare Leistungssteigerung erfahren. ;)

2. In welcher Preisklasse spiel Fusion?
Voraussichtlich bewegen wir uns etwa im 100€ Segment. Die Möglichkeiten die man hätte, die Bandbreite nennenswert zu steigern - EDRAM, Triple-/Quadchannel Speicherinterfaces - wäre hier nicht realisierbar.

Was bleibt letztlich? Ein Dualchannel-Speicherinterface mit z.B. DDR3-1600 erreicht ~25GB/s Bandbreite. Diese Bandbreite teilt sich dabei auf CPU und GPU auf, wobei der L3-lose Kern recht bandbreitenhungrig sein könnte.

Zum Vergleich: Eine HD5570 kommt mit 900MHz DDR3 an einem 128Bit Interface auf ~28GB/s exklusiv. Auf deren Leistungsniveau wird man ohne deutlich höhere Taktraten also nur schwerlich kommen.

Soweit eine grobe Prognose, mehr ist momentan leider noch schwer abschätzbar. :wink:
 

lord86

Bienchen, Graue Eminenz
Mitglied seit
06.03.2006
Beiträge
5.964
Ort
Da wo es kein Sleeve gibt
ich denke wir werden für Llano auch mainboards mit siedeport memory sehen, fraglich dabei ist dann eben nur die anbindung, pci-e oder über HT?! dann könnte das evtl. auftauchende bandbreitenproblem erst gar nicht auftreten
 

mr.dude

Urgestein
Mitglied seit
12.04.2006
Beiträge
6.456
Es sind nach wie vor 20-30%, wie oft gezeigt.
Es sind nach wie vor 10-15%, wie gezeigt. Aber da du dich eh nur auf Spiele beziehst, kannst du das natürlich nicht wissen. Mit Spielen kann man jedenfalls die Leistungsfähigkeit von CPUs nicht nachweisen. Das ist ein bekannter Fakt. Deine Annahme ist daher nicht korrekt.

Ich lass die CPU-Diskusion (die mir eh schon zu hoch ist) mal aussen vor, eine Frage die mich interessiert ist die "Anbindung" des Videospeichers.
Die Grafikeinheit greift ja auf den RAM zu.
Geht da nicht sehr viel Leistung verloren aufgrund der sehr viel geringeren Bandbreite von DDR3 ggüber GDDR5? Da würde ja von "Leistung einer HD5500" nicht mehr ganz soviel übrig bleiben.
Gibts dazu irgendwelche Lösungsansätze?
Die Sorgen sind unbegründet. Es geht ja im Endeffekt nur um die Bandbreite, nicht um den verwendeten Speicher. Für Llano wird eh maximal mit Redwood Level spekuliert. Und schau dir die Bandbreite einer HD 5570 an. Die ist auch nicht höher als Dual-Channel DDR3-1866. Und das wird Llano mindestens unterstützen. Inwiefern die Plattform (FM1) zusätzlich überarbeitet wurde, kann bisher nur spekuliert werden.


Nochmal zu Llano. Hans de Vries hat ebenfalls zu Llano eine Die Shot Analyse gemacht. Der Kern schrumpft in 32 nm von ~15,3 mm² auf 9,69 mm², also ~37% weniger. 1 MiB L2 schrumpft von ~7,5 mm² auf ~6,31 mm², also nur ~16% weniger. Das ist nicht möglich ohne grundsätzliche Änderungen am Cache. Und neben Assoziativität ist bisher am wahrscheinlichsten, dass hier ebenfalls auf ein 8T Design gesetzt wird. Wie auch immer. Es dürfte klar sein, dass AMD damit den Cache performanter und energieeffizienter machen will, sowohl L1 als auch L2. Ohne Grund nimmt man schlisslich keine zusätzlichen Transistoren in Kauf. Damit dürfte alleine L1 und L2 schon den fehlenden L3 in Anwendungen kompensieren.
 
Zuletzt bearbeitet:

Undertaker 1

Enthusiast
Mitglied seit
23.08.2004
Beiträge
5.705
Bei Spielen geht es eher Richtung 30-40% IPC-Differenz, natürlich wenn man korrekt im CPU-Limit bencht. In Anwendungen geht es eher Richtung 20%, da kann ich mich mit den 20-30% von y33h@ gut anfreunden.

ich denke wir werden für Llano auch mainboards mit siedeport memory sehen, fraglich dabei ist dann eben nur die anbindung, pci-e oder über HT?! dann könnte das evtl. auftauchende bandbreitenproblem erst gar nicht auftreten

Ein Sideport ist gut denkbar, worüber er nun angebunden wird, ist dabei relativ egal. Problem ist: Ein einzelner Speicherbaustein, wie er bei aktuellen Modellen im Regelfall verbaut wird, ist mit gigantischen 16Bit angeschlossen - viel herausreißen kann man damit nicht.

Vergleich zu einer aktuellen Mainstreamlösung, z.B. einem X4 640 + DDR3-1333 und einer HD5570/HD5670:

Propus + HD5570: ~50GB/s
Propus + HD5670: ~85GB/s
Llano + DDR3-1600: ~25GB/s
Llano + DDR3-1866 + DDR3-1600 Sideport: ~33GB/s

Wie man sieht, hat Llano nur ~29-66% der Speicherbandbreite einer aktuellen CPU-GPU Kombination mit ähnlicher Rechenleistung.
 

Hadan_P

Enthusiast
Mitglied seit
04.08.2006
Beiträge
1.662
Ort
Wien
Guten Morgen!

Besten Dank für die Antworten & die kurzen Rechenbeispiele.
Ich denke mal für das wofür ich Fusion einsetzen will (HTPC, Retro-Emulatoren) wirds trotz allem der perfekte Chip, für das eine oder andere ältere Spielchen wirds auch reichen.

mfg
Hadan
 

Undertaker 1

Enthusiast
Mitglied seit
23.08.2004
Beiträge
5.705
Joa das sicherlich, schneller als aktuelle IGPs wird man schon werden. Aufpassen würde ich bei deinem Anwendungsgebiet Retro-Simulatoren: Die sind afair weitgehend schlecht parallelisiert. Hier wäre womöglich ein sehr schneller Dualcore sinnvoller.
 

Hadan_P

Enthusiast
Mitglied seit
04.08.2006
Beiträge
1.662
Ort
Wien
Naja, die sind aber generell nicht so leistungshungrig, bis auf den Saturn-Emu krieg ich auf nem X2 3800+ alles halbwegs zum laufen, da kommt dann auch ein Kern einer aktuellen CPU nicht ins Schwitzen. Wir reden von Emulatoren bis max PS1, N64 etc.
Core 2-x kommen dann vor allem beim Echtzeit-Upscaling bei der Video-Wiedergabe ins Spiel.

mfg
Hadan
 

mr.dude

Urgestein
Mitglied seit
12.04.2006
Beiträge
6.456
Auf "neutralen" Systemen sind es ~10% in Anwendungen. Wenn man die Nachteile unter Windows hinzurechnen will, dann auch gerne ~15%. Nur hat das dann eben nicht mehr ausschliesslich etwas mit der Hardware zu tun, über die wir ja diskutieren. Spiele sind irrelevant, da sie CPUs eh nicht voll auslasten und so gut wie keine Rückschlüsse auf die Leistungskapazitäten zulassen. Hier gibt ein komplettes Setup den Ausschlag, nicht eine einzelne Komponente. Auch wenn mancher meint, mit dem Ausschliessen eines "GPU-Limits" läge alles nur noch an der CPU. Das ist ein fataler Irrglauben. 20-30% sind jedenfalls nicht richtig.

Besten Dank für die Antworten & die kurzen Rechenbeispiele.
Ich denke mal für das wofür ich Fusion einsetzen will (HTPC, Retro-Emulatoren) wirds trotz allem der perfekte Chip, für das eine oder andere ältere Spielchen wirds auch reichen.
Du wirst zumindest gegenüber aktuellen Setups keine Nachteile haben. Eine HD 5570 bietet aktuell eine Speicherbandbreite von 28,8 GB/s. Alleine mit DDR3-1866 hätte die GPU in Llano knapp 30 GB/s, also sogar minimal mehr. Selbst niedrig getakteter Speicher wie DDR3-1600 dürfte völlig ausreichen.
Und ja, bezüglich Emulatoren braucht man sich keine Sorgen machen. Ich habe auch diverse auf meinem System. Damit kommen selbst ältere CPUs problemlos zurecht. Hinzu kommt der Turbo bei Llano, der gegenüber den aktuellen X6 CPUs verbessert wurde. Also selbst wenn nur ein Kern genutzt wird, ist da mehr als genug Rechenkapazität vorhanden.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Oben Unten