Seite 5 von 6 ErsteErste 1 2 3 4 5 6 LetzteLetzte
Ergebnis 101 bis 125 von 130
  1. #101
    jdl
    jdl ist offline
    Kapitänleutnant
    Registriert seit
    09.04.2011
    Beiträge
    1.781


    • Systeminfo
      • Motherboard:
      • ASUS P8B WS
      • CPU:
      • Xeon E3 1240
      • RAM:
      • 4x4GB 1333MHz
      • Betriebssystem:
      • Ubuntu

    Standard

    Zitat Zitat von fortunes Beitrag anzeigen
    Das zeigt nur das Paradoxon, in dem Intel festhängt.

    Sie machen groß Werbung mit AVX512, aber keiner interessiert sich dafür.
    Das ist eindeutig falsch. Im HPC Umfeld ist AVX512 sehr wichtig. Allerdings hat Intel momentan das Problem, dass AMD sowohl bei der AVX2 Implementierung wie auch bei der Zahl der Cores deutlich besser geworden ist. D.h. wenn man die theoretische Leistungssteigerung von EPYC zu EPYC2 betrachtet, hat sich die Leistung vervierfacht. Einmal durch die Verdoppelung der Cores, einmal durch die bessere Implementation von AVX2, d.h. ein AVX2 Befehl pro Takt anstatt einen pro zwei Takte. Das bringt je Faktor zwei. Dadurch ist AMD nun im Bereich von Intel vorgestoßen. Da durch die höhere Corezahl AMD bei Integerrechnungen Vorteile hat, ist es unterm Strich zurzeit so, dass AMD das bessere Angebot macht. Allerdings muss man das ganze komplett durchrechnen. Hier im Forum wird gerne nur der CPU-Preis genommen, der ist aber nahezu unwichtig, weil man immer komplette Knoten benötigt. Braucht man viel RAM, spielt der CPU Preis faktisch keinerlei Rolle mehr.

    Zitat Zitat von fortunes Beitrag anzeigen
    Und von der GPU-Seite kommt auch Gegenwind. Und eine RTX8000 mit ihren 48GB hat trotz "RAM-Limit" eine brutale Geschwindigkeit bei wissenschaftlichen Berechnungen.
    Eine RTX8000 ist extrem langsam bei HPC Rechnungen, man kann nur bestimmte HPC-Rechnungen darauf ausführen, die mit einfacher oder halber Genauigkeit laufen. Für etliche Problem bräuchte man aber QuadruplePrecision (128Bit), die gibt es aber bisher nur in Software für CPUs, wenn man einmal von den alten HP-PAs absieht, die QuadruplePrecision in Hardware rechnen konnten. Für DoublePrecision (das ist der Standard im HPC) muss man die nVidia GV100 nehmen. Wenn man das RAM Problem in Zusammenhang mit den GP100 bzw. GV100 verringern will, muss man zu einer POWER9 Maschine greifen, weil bei der es möglich ist die CPU und die GPU per NVLink zu koppeln und so deutlich mehr Bandbreite zwischen Hostspeicher und GPU-Speicher bekommt.

    GV100 (NVLink) DP: 8,7TFlops; SP: 15,7TFlops; HF (ich habe keine Zahlen auf die schnelle gefunden, es müsste aber das doppelt der SP Leistung sein)
    RTX8000 DP: 0,5TFlops; SP 16,3TFlops; HP 32,6TFlops

    Nachtrag: Die RTX Karten sind im Gegensatz zu früher bei DP nicht verkrüppelt, die Karte haben nur sehr wenige DP Einheiten drauf.

    - - - Updated - - -

    Zitat Zitat von Jaimewolf3060 Beitrag anzeigen
    @fortunes
    Nicht um sonst möchte Intel im HPC GPU Bereich mitmischen!
    Aber der Holt512 weiß das besser....
    Nicht nur Intel denkt so.

    - - - Updated - - -

    Zitat Zitat von Holt Beitrag anzeigen
    Ich wetter der hat nie Leben eine Zeile Quellcode für GPUs geschrieben, sonst wäre ihm der nächste Nachteile nämlich auch sofort aufgefallen, denn während man AVX512 durch Compilerflags aktivieren kann, geht dies bei der GPU Programmierung nicht so einfach.
    Man merkt in diesem im Forum stark an, dass die meisten keinerlei Erfahrung mit HPC Programmierung haben, und wohl mit Programmierung im allgemeinen auch nicht. Dazu wissen sie nicht wie man HPC-Knoten kauft, und überbewerten die CPU-Preise maßlos. Ich kann mich an ein Gespräch mit einem Admin aus einer Arbeitsgruppe eines MPIs erinnern, in dem dieser erklärte weshalb sie Quadsocket Opterons gekauft hatten, obwohl die damaligen Xeon E5 drastisch schneller gerechnet haben. Diese Gruppe machte Gensequenzierung und musste anschließend die Gene mit einer Datenbank abgleichen. Die Opterons konnten ausreichend RAM (1TB!) aufnehmen, so dass die komplette DB im RAM gecached werden konnte. Das lief dann trotz der deutlich langsameren AMD CPU Faktor 50 o.ä. schneller als auf den Xeon E5, weil in die nicht ausreichend RAM reinpaßte und die Festplatten zu langsam waren. Das sind aber so Dinge, die hier keiner verstehen will. Wichtig ist nur AMD gut, Intel schlecht.
    Geändert von jdl (18.11.19 um 09:41 Uhr) Grund: Ergänzung

  2. Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.

  3. #102
    Bootsmann Avatar von Gamer1969
    Registriert seit
    14.03.2017
    Beiträge
    585


    • Systeminfo
      • Motherboard:
      • MSI B 450 M Mortar
      • CPU:
      • AMD Ryzen 5 3600
      • Systemname:
      • AMD R 5 3600
      • Kühlung:
      • Thermalright ARO M14
      • Gehäuse:
      • MSI MAG Pylon
      • RAM:
      • 16 GB 3600er Team Group
      • Grafik:
      • MSI Radeon RX 480 Gaming X 8G
      • Storage:
      • WD Black NVMe PCIe M.2 SSD 256GB
      • Monitor:
      • Philips 24“ 247E4LHA FHD 1980x1080 60 Hz
      • Sound:
      • Onboard
      • Netzteil:
      • BeQuiet pure Power 10 400W CM
      • Betriebssystem:
      • Windows 10 Home
      • Handy:
      • Xiaomi Mi A1

    Standard

    Ein interessanter Artikel, mit diesem Patch müsste man mal neue Benchmarks machen.

    Zitat: ( Mal die Übersetzung des Artikels. )

    „MATLAB ist eine beliebte mathematische Computerumgebung, die von Ingenieurbüros, Universitäten und anderen Forschungseinrichtungen genutzt wird. Einige seiner Operationen können durchgeführt werden, um Intel MKL (Math Kernel Library) zu nutzen, die schlecht für AMD Ryzen-Prozessoren optimiert ist und bekanntlich langsam ist. Der Reddit-Benutzer Nedflanders1976 entwickelte eine Möglichkeit, die Leistung der Ryzen- und Ryzen-Threadripper-Prozessoren zwischen 20 und 300 Prozent wiederherzustellen, indem er MATLAB zwang, erweiterte Befehlssätze wie AVX2 zu verwenden. Standardmäßig fragt MKL die Hersteller-ID Ihres Prozessors ab, und wenn er etwas anderes als "GenuineIntel..." sieht, fällt sie auf SSE zurück und stellt einen erheblichen Leistungsnachteil für "AuthenticAMD" Ryzen-Prozessoren dar, die eine vollständige IA SSE4, AVX und AVX2-Implementierung haben.

    Der Optimierungsprozess, der dazu gedacht ist, von AMD Ryzen-Benutzern manuell angewendet zu werden, zwingt MKL, AVX2 unabhängig vom Ergebnis der CPU-Anbieter-ID-Abfrage zu verwenden. Die Optimierung ist so einfach wie wirkungsvoll. Eine einfache 4-zeilige Windows-Batchdatei mit einer Reihe von Argumenten startet MKL im AVX2-Modus. Sie können die Anpassung auch "permanent" vornehmen, indem Sie eine Systemumgebungsvariable erstellen. Die Umgebungsvariable gilt für alle Instanzen von MATLAB und nicht nur für die, die durch die Batch-Datei erzeugt werden. Nedflanders1976 hat auch ein Benchmark-Skript veröffentlicht, das die Auswirkungen von AVX2 auf die Leistung hervorhebt, aber Sie können auch Ihre eigenen Skripte verwenden und Ergebnisse veröffentlichen.“

    Übersetzt mit DeepL Translator

    Quelle:
    MATLAB MKL Codepath Tweak Boosts AMD Ryzen MKL Performance Significantly | TechPowerUp

  4. #103
    Admiral Avatar von fortunes
    Registriert seit
    13.06.2003
    Ort
    RheinMain
    Beiträge
    10.777


    • Systeminfo
      • Motherboard:
      • Epox MVP4A
      • CPU:
      • Pentium 200 MMX
      • Kühlung:
      • 08/15
      • Gehäuse:
      • Vobis Highscreen Midi
      • RAM:
      • 64MB PC100
      • Grafik:
      • 8MB Trident 3D AGP + Voodoo2
      • Storage:
      • 2x CF-IDE-Adapter via SD-Card
      • Monitor:
      • 19" Philips TFT
      • Netzwerk:
      • INTEL PRO/100
      • Sound:
      • Logitech 2.0
      • Netzteil:
      • LC Power 300W
      • Betriebssystem:
      • DOS 6.22 / Win98SE
      • Notebook:
      • SurfTab duo W1 3G
      • Photoequipment:
      • Panasonic Lumix DMC-FT5
      • Handy:
      • Samsung Galaxy A3 (2017)

    Standard

    Daran anschließend:

    Und jetzt muss man bei Tests, insbesondere Intel, ganz genau hinschauen, ob Intel-Bibliotheken beim Compilen/Testen genutzt wurden. Denn nicht immer geht es fair zu.

    Intel MKL: Workaround erhöht Leistung auf AMD Ryzen signifikant - ComputerBase

    Bis zu 400% Mehrleistung auf AMD-CPUs - weil die Intel-Bibliothek eine Nicht-Intel-CPU erkannt und deswegen AVX(2) deaktiviert, stattdessen simples SSE zugelassen hat. Top!

    Wen erinnert das noch an...
    Does Intels compiler cripple AMD performance? - The Tech Report


    Retro-Station
    Pentium 200 MMX @ 133MHz @ 1.8V @ passiv | Epox MVP4A | 8MB Trident3D AGP | 64MB PC100 | 2x CF-IDE-Adapter via SD-Card | USB-Floppy EMU | LS-120 SuperDisk | Toshiba DVD-ROM
    (finishing in progress...)

  5. #104
    Bootsmann Avatar von Gamer1969
    Registriert seit
    14.03.2017
    Beiträge
    585


    • Systeminfo
      • Motherboard:
      • MSI B 450 M Mortar
      • CPU:
      • AMD Ryzen 5 3600
      • Systemname:
      • AMD R 5 3600
      • Kühlung:
      • Thermalright ARO M14
      • Gehäuse:
      • MSI MAG Pylon
      • RAM:
      • 16 GB 3600er Team Group
      • Grafik:
      • MSI Radeon RX 480 Gaming X 8G
      • Storage:
      • WD Black NVMe PCIe M.2 SSD 256GB
      • Monitor:
      • Philips 24“ 247E4LHA FHD 1980x1080 60 Hz
      • Sound:
      • Onboard
      • Netzteil:
      • BeQuiet pure Power 10 400W CM
      • Betriebssystem:
      • Windows 10 Home
      • Handy:
      • Xiaomi Mi A1

    Standard

    Na ja bei Spielen interessiert das nicht oder sind da auch Beschränkungen versteckt welche CPU genutzt wird?
    Das ist ein Problem bei wissenschaftlichen Berechnungen oder werden damit andere Programme und Anwendungen auch ausgebremst?

    Solches Problem gab es ja schon früher mal. Hier mal was aus 2009.

    https://www.agner.org/optimize/blog/read.php?i=49#49

    Intel macht sich in letzter Zeit nicht viel Freunde, sollte so was auch in Gamecodes gefunden werden, müssten alle aber wirklich alle Benchmarks neu erstellt werden. Wie würde es dann mit dem Intel Vorsprung im Gaming aussehen.

    Jetzt muss man so ziemlich jeden Benchmark unter Vorbehalt betrachten. Glaube das hier wird kein Sturm im Wasserglas, eher ein ausgewachsener Orkan.

  6. #105
    jdl
    jdl ist offline
    Kapitänleutnant
    Registriert seit
    09.04.2011
    Beiträge
    1.781


    • Systeminfo
      • Motherboard:
      • ASUS P8B WS
      • CPU:
      • Xeon E3 1240
      • RAM:
      • 4x4GB 1333MHz
      • Betriebssystem:
      • Ubuntu

    Standard

    Zitat Zitat von Gamer1969 Beitrag anzeigen
    Ein interessanter Artikel, mit diesem Patch müsste man mal neue Benchmarks machen.
    Die Benchmarks aus der Original Meldung sind so aufgebaut, dass sie sich auf jeder Zielplattform aus Sourcecode übersetzen (mit dem Compiler und den Compilerflags der Wahl des CPU Herstellers!) und mit einer optimierten Version (die sollte auch vom CPU Hersteller kommen!) der BLAS und LAPACK nutzen kann. Die Intel MKL stellt BLAS, LAPACK und einiges mehr in einer für Intel CPUs hochoptimierten Version bereit. Wie der von Dir angeführte Artikel erläutert verwendet das kommerzielle Produkt Matlab fest verlinkte Versionen der MKL Library. Das ist nur dann ein Problem, wenn man auf einem Computer arbeitet. Wenn man auf Cluster geht, bekommt man mit Matlab ohnehin ein großes Problem, weil man für jeden Knoten eine Matlab Lizenz benötigen würde. Das kann man mit dem Matlab Compiler oder der Umstellung auf GNU Octave umgehen. Da GNU Octave FOSS ist, kann man es auch hochoptimiert für AMD CPUs übersetzen und binden.

    - - - Updated - - -

    Zitat Zitat von fortunes Beitrag anzeigen
    Und jetzt muss man bei Tests, insbesondere Intel, ganz genau hinschauen, ob Intel-Bibliotheken beim Compilen/Testen genutzt wurden.
    Das ist ein altbekanntes Problem. Die Liste an Problemen mit Intel Composer XE auf AMD Hardware ist lang. Das der VTune Amplifier nicht läuft, das kann man noch verstehen, weil Intel und AMD unterschiedliche Hardware in den CPUs integriert hat, um die Performance zu messen.

  7. #106
    The Saint Avatar von Holzmann
    Registriert seit
    02.05.2017
    Ort
    Luzern
    Beiträge
    13.805


    • Systeminfo
      • Motherboard:
      • ASUS ROG Crosshair VIII Formula, x570
      • CPU:
      • AMD R9 3900x Zen2
      • Kühlung:
      • Corsair Hydro H115i Platinum
      • Gehäuse:
      • Corsair 460x
      • RAM:
      • Corsair Dominator Platinum
      • Grafik:
      • AMD Radeon7 by MSI
      • Storage:
      • Corsair NX 500 PCI SSD 400 GB
      • Monitor:
      • Dell
      • Netzteil:
      • Corsair AX 860i
      • Betriebssystem:
      • Win10
    "Niemals aufgeben, niemals kapitulieren!"
    Jason Nesmith, Commander NSEA Protector

    Verkaufe:
    Forum de Luxx

    Neu:
    [Sammelthread] Historischer Benchmark (Spiele) Teil I

  8. #107
    Admiral
    Registriert seit
    05.07.2010
    Beiträge
    19.227


    Standard

    Daraus wollte ich noch mal zitieren, da die wenigsten hier bis so weit unten gelesen haben dürften:
    Für den Einsatz in Supercomputern sind die Scalable Vector Extentions (SVE) gedacht, die zu zweit in jedem Rechenkern sitzen und ähnlich wie Intels AVX-512 512-Bit-Werte verarbeiten.
    Zitat Zitat von jdl Beitrag anzeigen
    Man merkt in diesem im Forum stark an, dass die meisten keinerlei Erfahrung mit HPC Programmierung haben, und wohl mit Programmierung im allgemeinen auch nicht.
    Ja und leider sind diese Leute sich trotzdem nicht zu schade dumme Kommentare wie es wäre nur die Dummheit oder Faulheit der Entwickler, wenn nicht alle Programme perfekt für ganz viele Kerne skalieren würden.
    Zitat Zitat von jdl Beitrag anzeigen
    Wichtig ist nur AMD gut, Intel schlecht.
    Das ist leider bei den meisten hier der Tenor, Sachlichkeit ist bei denen nicht gefragt und dann wundern sie sich am Ende, wieso so bei mir auf der Ignoreliste stehen, aber ich habe einfach keine Lust Zeit zu verschwenden um Leuten etwas beibringen zu wollen, die gar nicht lernwillig sind.

    Zitat Zitat von Gamer1969 Beitrag anzeigen
    Ein interessanter Artikel, mit diesem Patch müsste man mal neue Benchmarks machen.
    Das Thema ist uralt und von AMD gibt es die AMD Math Library (LibM). Die MKL wird von Intel auch klar als für Intel System beworben: Für AMD gibt es die AMD Lib oder Alternativen wie OpenBLAS.

    Die Intel MKL ist halt auf Intel Systemen viel schneller als z.B. OpenBLAS, während AMD Zen2 mit OpenBLAS eben schneller als mit der MKL ist:

    Am Ende ist die Anleitung wie man OpenBLAS einbindet und das alles ist vom August, also rund 3 Monate alt.
    Je mehr ich in Foren lese, umso mehr stelle ich fest: Geist addiert sich nicht, Dummheit schon!

    "Früher benutzte man im Diskurs sogenannte Argumente, heute wird man im Internet mit Scheiße beworfen, beschimpft, bedroht" Dieter Nuhr (Nuhr im Ersten vom 2. Mai 2019 ab 6:00)

  9. #108
    Admiral
    Registriert seit
    05.07.2010
    Beiträge
    19.227


    Je mehr ich in Foren lese, umso mehr stelle ich fest: Geist addiert sich nicht, Dummheit schon!

    "Früher benutzte man im Diskurs sogenannte Argumente, heute wird man im Internet mit Scheiße beworfen, beschimpft, bedroht" Dieter Nuhr (Nuhr im Ersten vom 2. Mai 2019 ab 6:00)

  10. #109
    Admiral Avatar von fortunes
    Registriert seit
    13.06.2003
    Ort
    RheinMain
    Beiträge
    10.777


    • Systeminfo
      • Motherboard:
      • Epox MVP4A
      • CPU:
      • Pentium 200 MMX
      • Kühlung:
      • 08/15
      • Gehäuse:
      • Vobis Highscreen Midi
      • RAM:
      • 64MB PC100
      • Grafik:
      • 8MB Trident 3D AGP + Voodoo2
      • Storage:
      • 2x CF-IDE-Adapter via SD-Card
      • Monitor:
      • 19" Philips TFT
      • Netzwerk:
      • INTEL PRO/100
      • Sound:
      • Logitech 2.0
      • Netzteil:
      • LC Power 300W
      • Betriebssystem:
      • DOS 6.22 / Win98SE
      • Notebook:
      • SurfTab duo W1 3G
      • Photoequipment:
      • Panasonic Lumix DMC-FT5
      • Handy:
      • Samsung Galaxy A3 (2017)

    Standard

    Zitat Zitat von Holt Beitrag anzeigen
    Das Thema ist uralt und von AMD gibt es die AMD Math Library (LibM). Die MKL wird von Intel auch klar als für Intel System beworben: Für AMD gibt es die AMD Lib oder Alternativen wie OpenBLAS.

    Die Intel MKL ist halt auf Intel Systemen viel schneller als z.B. OpenBLAS, während AMD Zen2 mit OpenBLAS eben schneller als mit der MKL ist:

    Am Ende ist die Anleitung wie man OpenBLAS einbindet und das alles ist vom August, also rund 3 Monate alt.
    Entweder willst du nicht verstehen oder stellst dich absichtlich blöd.

    Intel hat nicht mehr gemacht, als eine Routine einzubauen, die auf Intel-CPUs prüft und bei Nicht-Vorhandensein die kompletten AVX-Befehlssätze deaktiviert.

    Das hat nichts mit "auf Intel optimiert", sondern mit "ich benachteilige Konkurrenz bewusst" zu tun.

    Wenn man jetzt hergehen und sagen würde "hey, die MKL arbeitet auf AMD schnell, aber OpenBLAS ist ca. 5% schneller" - ok. Aber das was hier abgeht, ist mal wieder Intels Trauerspiel, die Konkurrenz an allen Ecken und Ende zu behindern, wo es nur geht.

    Intel hat seit 2005 nichts gelernt.


    Retro-Station
    Pentium 200 MMX @ 133MHz @ 1.8V @ passiv | Epox MVP4A | 8MB Trident3D AGP | 64MB PC100 | 2x CF-IDE-Adapter via SD-Card | USB-Floppy EMU | LS-120 SuperDisk | Toshiba DVD-ROM
    (finishing in progress...)

  11. #110
    Leutnant zur See
    Registriert seit
    18.07.2016
    Beiträge
    1.273


    • Systeminfo
      • Betriebssystem:
      • Fedora 30, Gentoo
      • Notebook:
      • Thinkpad W520

    Standard

    Zitat Zitat von fortunes Beitrag anzeigen
    Entweder willst du nicht verstehen oder stellst dich absichtlich blöd.

    Intel hat nicht mehr gemacht, als eine Routine einzubauen, die auf Intel-CPUs prüft und bei Nicht-Vorhandensein die kompletten AVX-Befehlssätze deaktiviert.

    Das hat nichts mit "auf Intel optimiert", sondern mit "ich benachteilige Konkurrenz bewusst" zu tun.

    Wenn man jetzt hergehen und sagen würde "hey, die MKL arbeitet auf AMD schnell, aber OpenBLAS ist ca. 5% schneller" - ok. Aber das was hier abgeht, ist mal wieder Intels Trauerspiel, die Konkurrenz an allen Ecken und Ende zu behindern, wo es nur geht.

    Intel hat seit 2005 nichts gelernt.
    Bullshit. Ich optimiere doch nix an meiner eigenen Library für die Konkurrenz, ohne zu wissen ob meine Library dann noch zuverlässige Ergebnisse liefert und nicht evtl. sogar crasht, was viel schlimmer ist als eine miese Performance.
    Wenn sich AMD benachteiligt fühlt, können sie ja den Rechtsweg bestreiten, das "Problem", das hier wieder einige aufbauschen, scheint wohl schon länger bekannt zu sein, zumindest für die Leute die es wissen müssen, also keine Tastaturhelden im CB/HWLuxx.

    AMD Epyc 7351P|Noctua NH-U14S|Asus KNPA-U16|4x 32GB Samsung DDR4-2666 RDIMM|LSI SAS9300-8i|8x HUS726040AL421 4TB 4Kn RAID-Z2|Samsung 970 Evo 1 TB|Intel Optane 900p 280GB SLOG/L2ARC|Intel X520-DA2|Mellanox ConnectX-3 VPI 354A-FCBT|ESXi 6.7u2|napp-it Pro Complete dev. @ Solaris 11.4

  12. #111
    Admiral Avatar von fortunes
    Registriert seit
    13.06.2003
    Ort
    RheinMain
    Beiträge
    10.777


    • Systeminfo
      • Motherboard:
      • Epox MVP4A
      • CPU:
      • Pentium 200 MMX
      • Kühlung:
      • 08/15
      • Gehäuse:
      • Vobis Highscreen Midi
      • RAM:
      • 64MB PC100
      • Grafik:
      • 8MB Trident 3D AGP + Voodoo2
      • Storage:
      • 2x CF-IDE-Adapter via SD-Card
      • Monitor:
      • 19" Philips TFT
      • Netzwerk:
      • INTEL PRO/100
      • Sound:
      • Logitech 2.0
      • Netzteil:
      • LC Power 300W
      • Betriebssystem:
      • DOS 6.22 / Win98SE
      • Notebook:
      • SurfTab duo W1 3G
      • Photoequipment:
      • Panasonic Lumix DMC-FT5
      • Handy:
      • Samsung Galaxy A3 (2017)

    Standard

    Zitat Zitat von sch4kal Beitrag anzeigen
    Bullshit. Ich optimiere doch nix an meiner eigenen Library für die Konkurrenz, ohne zu wissen ob meine Library dann noch zuverlässige Ergebnisse liefert und nicht evtl. sogar crasht, was viel schlimmer ist als eine miese Performance.
    Genau, ich baue eine Flag ein, die fremde CPUs von Befehlserweiterungen ausschließt, statt eine Warnmeldung zu bringen, dass keine Intel-CPU genutzt wird und es deswegen zu Problemen oder Leistungseinbußen kommen kann.

    Eine Intel-"Optimierung" wäre es, wenn die Bibliothek nur noch mit AVX512 funktioniert. Dann hätte das Flag einen Sinn gemacht.

    Oh wait, dann wären ja über 70% aller Intel-CPUs auf einen Schlag unbrauchbar gewesen.

    "Optimierung" for my ***. Was soll denn da crashen.


    Retro-Station
    Pentium 200 MMX @ 133MHz @ 1.8V @ passiv | Epox MVP4A | 8MB Trident3D AGP | 64MB PC100 | 2x CF-IDE-Adapter via SD-Card | USB-Floppy EMU | LS-120 SuperDisk | Toshiba DVD-ROM
    (finishing in progress...)

  13. #112
    Oberleutnant zur See
    Registriert seit
    23.08.2010
    Beiträge
    1.380


    Standard

    Zitat Zitat von fortunes Beitrag anzeigen
    Intel hat nicht mehr gemacht, als eine Routine einzubauen, die auf Intel-CPUs prüft und bei Nicht-Vorhandensein die kompletten AVX-Befehlssätze deaktiviert.
    Das ist komplett falsch. Standardmäßig wird AVX und AVX2 von der Library nicht genutzt. Diese werden bei einer passenden CPU als zusätzliche Leistungsoptimierungen aktiviert. Nur prüft Intel halt nicht, was die CPU an Features unterstützt, sondern macht Intel dies anhand der CPUID fest. Bei deren Hardware wissen die eben, was unterstützt wird und was nicht. Bei anderen Herstellern kann dies nicht garantiert werden und diese werden von Intel auch gar nicht supportet. Die Library ist nur für die eignen CPUs gedacht.

    Zudem ist der Workaround schon länger bekannt und nichts neues. Aber jetzt hat man wieder was, um ein Fass aufzumachen..
    Geändert von Paddy92 (19.11.19 um 10:20 Uhr)

  14. #113
    Leutnant zur See
    Registriert seit
    03.05.2013
    Beiträge
    1.109


    Standard

    sch4kal
    Wenn du als Tastaturheld anderen deine Eigenart vorwirfst, ist dies maximal beschämend.
    Inwiefern wäre die Prüfung eines AVX Befehlsatzes eine Optimierung für die Konkurrezn? Diese Prüfung findet nämlich nicht statt.
    Es gibt nur eine Prüfung, keine Intel CPU, also SSE Befehlsatz.

    Wieso soll eine Library keine zuverlässigen Ergebnisse bringen oder abstürzen, wenn diese eine AVX Prüfung vorher macht?
    Wieso soll dann diese Library keine zuverlässigen Ergebnisse bringen, oder abstürzen, wenn AVX Befehlsätze vorhanden sind?
    Durch das Abkommen, welches AMD und Intel abgeschlossen haben, ist AVX bei beiden Hersteller eben AVX. Intel bietet nur eine noch höhere Beschleunigung, deren Nutzen aktuell unbedeutend ist. Trotzdem bleibt AVX eben AVX. Ob nun AVX, oder AVX2, oder AVX512. Wieso soll laut deiner Expertise des Tastaturheldes nun eine Library abstürzen, oder keine zuverlässigen Ergebnisse bringen?
    i5 4670K . ASRock Z97 Anniversary. 2x 8GB Kit . INNO3D GTX 1070 Twin X2.
    AMD X4 760K (Richland) - Gigabyte FM2+ F2A88XN-WIFI - 8GB Kit DDR3 1600 - Geforce GT 710 - (Media PC)
    Auf Holts Liste zu sein, ist der Ritterschlag für kompetente Argumente. Danke Holt, du darfst mich jetzt Sir nennen.

  15. #114
    Oberleutnant zur See
    Registriert seit
    23.08.2010
    Beiträge
    1.380


    Standard

    Zitat Zitat von DTX xxx Beitrag anzeigen
    Es gibt nur eine Prüfung, keine Intel CPU, also SSE Befehlsatz.
    Die CPUID liefert neben der Vendor ID noch weitere Informationen (u.a. Familie und Model) über eine CPU. Intel kann daran die CPU genau einordnen und weiß dann welche Features von der jeweiligen CPU unterstützt werden, zum Beispiel wird dann nur AVX-512 genutzt, wenn die CPU das auch unterstützt.

    CPUID – Thomas-Krenn-Wiki


    Zitat Zitat von DTX xxx Beitrag anzeigen
    Intel bietet nur eine noch höhere Beschleunigung, deren Nutzen aktuell unbedeutend ist. Trotzdem bleibt AVX eben AVX. Ob nun AVX, oder AVX2, oder AVX512. Wieso soll laut deiner Expertise des Tastaturheldes nun eine Library abstürzen, oder keine zuverlässigen Ergebnisse bringen?
    Dir ist aber schon bewusst, dass bei den Schritten AVX -> AVX2 -> AVX512 nicht nur die Register aufgebohrt wurden, sondern auch neue Instruktionen hinzugefügt wurden?

  16. #115
    Leutnant zur See
    Registriert seit
    18.07.2016
    Beiträge
    1.273


    • Systeminfo
      • Betriebssystem:
      • Fedora 30, Gentoo
      • Notebook:
      • Thinkpad W520

    Standard

    Zitat Zitat von Paddy92 Beitrag anzeigen
    Dir ist aber schon bewusst, dass bei den Schritten AVX -> AVX2 -> AVX512 nicht nur die Register aufgebohrt wurden, sondern auch neue Instruktionen hinzugefügt wurden?
    Wird's ihm nicht, sowas lässt man natürlich immer gerne unter den Tisch fallen, neben der Erwähnung der Bedeutungslosigkeit des gesamten AVX512 IA-Satzes.
    Die Zitatfunktion der Forensoftware kennt er ja schließlich ebenso wenig

    AMD Epyc 7351P|Noctua NH-U14S|Asus KNPA-U16|4x 32GB Samsung DDR4-2666 RDIMM|LSI SAS9300-8i|8x HUS726040AL421 4TB 4Kn RAID-Z2|Samsung 970 Evo 1 TB|Intel Optane 900p 280GB SLOG/L2ARC|Intel X520-DA2|Mellanox ConnectX-3 VPI 354A-FCBT|ESXi 6.7u2|napp-it Pro Complete dev. @ Solaris 11.4

  17. #116
    Leutnant zur See
    Registriert seit
    03.05.2013
    Beiträge
    1.109


    Standard

    Die CPUID liefert neben der Vendor ID noch weitere Informationen (u.a. Familie und Model) über eine CPU. Intel kann daran die CPU genau einordnen und weiß dann welche Features von der jeweiligen CPU unterstützt werden, zum Beispiel wird dann nur AVX-512 genutzt, wenn die CPU das auch unterstützt.
    Und wenn die CPU nur AVX unterstützt, wird eben AVX genutzt, anstatt AVX512. Warum soll es dann zu unzuverlässigen Ergebnissen kommen, oder zu Abstürzen?
    Denn AVX ist sowohl bei Intel, als auch bei AMD gleich. AVX2 ist sowohl bei Intel, als auch bei AMD gleich. Nicht jede Intel CPU bietet alle AVX Befehlsätze.
    Dir ist aber schon bewusst, dass bei den Schritten AVX -> AVX2 -> AVX512 nicht nur die Register aufgebohrt wurden, sondern auch neue Instruktionen hinzugefügt wurden?
    Dies gilt sowohl für Intel CPUs, als auch für AMD CPUs. Nochmal, nicht jede Intel CPU bietet AVX, AVX2, AVX512. Dies gilt auch für AMD CPUs. Denn Intel AVX ist auch AMD AVX und umgekehrt.
    Warum soll es dann zu Unzuverlässigkeiten und oder Abstürzen kommen?

    Da du zwar meinen Kommentar zitiert hast, diese Fragen von mir nicht beantwortet hast, gehe ich davon aus, dass du nicht diese behaupteten Szenarien von sch4kal einem Fakt näher bringen kannst. Im Gegenteil, weder kannst du diese bestätigen, noch verneinen. Also auch nur so wie sch4kal schrieb, ein Tastaturheld, wie wir alle, einschließlich sch4kal.

    Nachtrag:
    sch4kal
    Warum ist es dir nicht möglich die Fragen zu beantworten?
    Geändert von DTX xxx (19.11.19 um 12:04 Uhr)
    i5 4670K . ASRock Z97 Anniversary. 2x 8GB Kit . INNO3D GTX 1070 Twin X2.
    AMD X4 760K (Richland) - Gigabyte FM2+ F2A88XN-WIFI - 8GB Kit DDR3 1600 - Geforce GT 710 - (Media PC)
    Auf Holts Liste zu sein, ist der Ritterschlag für kompetente Argumente. Danke Holt, du darfst mich jetzt Sir nennen.

  18. #117
    Oberleutnant zur See
    Registriert seit
    23.08.2010
    Beiträge
    1.380


    Standard

    Zitat Zitat von DTX xxx Beitrag anzeigen
    Warum soll es dann zu Unzuverlässigkeiten und oder Abstürzen kommen?
    Wer garantiert, dass andere Hersteller sich an die Vorgaben halten und auch wirklich jede Instruktion zur Verfügung stellen?

    Auch stimmt deine Behauptung nicht, dass AVX bei AMD und Intel gleich wären, denn gerade bei AVX2 gab es Unterschiede in der Hardware. Intel verbaut seit Haswell 256bit Register und AMD erst seit Zen2. Bei Zen hat AMD nur 128bit Register verbaut und dementsprechend werden für 256bit breite Befehle zwei von diesen 128bit Registern benötigt.

  19. #118
    Admiral Avatar von fortunes
    Registriert seit
    13.06.2003
    Ort
    RheinMain
    Beiträge
    10.777


    • Systeminfo
      • Motherboard:
      • Epox MVP4A
      • CPU:
      • Pentium 200 MMX
      • Kühlung:
      • 08/15
      • Gehäuse:
      • Vobis Highscreen Midi
      • RAM:
      • 64MB PC100
      • Grafik:
      • 8MB Trident 3D AGP + Voodoo2
      • Storage:
      • 2x CF-IDE-Adapter via SD-Card
      • Monitor:
      • 19" Philips TFT
      • Netzwerk:
      • INTEL PRO/100
      • Sound:
      • Logitech 2.0
      • Netzteil:
      • LC Power 300W
      • Betriebssystem:
      • DOS 6.22 / Win98SE
      • Notebook:
      • SurfTab duo W1 3G
      • Photoequipment:
      • Panasonic Lumix DMC-FT5
      • Handy:
      • Samsung Galaxy A3 (2017)

    Standard

    Zitat Zitat von Paddy92 Beitrag anzeigen
    Das ist komplett falsch. Standardmäßig wird AVX und AVX2 von der Library nicht genutzt.
    Du erzählst einen Schmarrn.

    Natürlich können wir uns darüber streiten, ob es jetzt standardmäßig "an" oder "aus" ist. Das ändert aber nichts an der Tatsache, dass Intel AVX bei non-Intel-CPUIDs abschaltet oder abgeschaltet lässt.

    Dabei ist AVX(1) seit SandyBridge & Bulldozer dabei. AVX2 seit Haswell und Excavator, also schon vor AMDs Zen!


    Retro-Station
    Pentium 200 MMX @ 133MHz @ 1.8V @ passiv | Epox MVP4A | 8MB Trident3D AGP | 64MB PC100 | 2x CF-IDE-Adapter via SD-Card | USB-Floppy EMU | LS-120 SuperDisk | Toshiba DVD-ROM
    (finishing in progress...)

  20. #119
    Oberleutnant zur See
    Registriert seit
    23.08.2010
    Beiträge
    1.380


    Standard

    Zitat Zitat von fortunes Beitrag anzeigen
    Natürlich können wir uns darüber streiten, ob es jetzt standardmäßig "an" oder "aus" ist. Das ändert aber nichts an der Tatsache, dass Intel AVX bei non-Intel-CPUIDs abschaltet oder abgeschaltet lässt.
    Darüber gibt es nichts zu streiten, da es ganz einfach ist. Es gibt neben dem möglichst kompatiblen Basisweg - wobei dies nicht einmal unbedingt SSE2 sein muss, das wurde einfach nur behauptet - noch weitere optimierte Wege. Diese Optimierungen und die daraus resultierenden Speedups werden durch die Verwendung von entsprechenden Instruktionen erzielt. Da es sich um einen Library von Intel für Intel CPUs handelt, mit keinerlei Gewährung von offiziellem Support für Hardware von anderen Herstellern, ist es relativ selbstverständlich, dass diese auch keine Optimierungen erfahren und dementsprechend über den Basisweg geschickt werden.

  21. #120
    Admiral Avatar von fortunes
    Registriert seit
    13.06.2003
    Ort
    RheinMain
    Beiträge
    10.777


    • Systeminfo
      • Motherboard:
      • Epox MVP4A
      • CPU:
      • Pentium 200 MMX
      • Kühlung:
      • 08/15
      • Gehäuse:
      • Vobis Highscreen Midi
      • RAM:
      • 64MB PC100
      • Grafik:
      • 8MB Trident 3D AGP + Voodoo2
      • Storage:
      • 2x CF-IDE-Adapter via SD-Card
      • Monitor:
      • 19" Philips TFT
      • Netzwerk:
      • INTEL PRO/100
      • Sound:
      • Logitech 2.0
      • Netzteil:
      • LC Power 300W
      • Betriebssystem:
      • DOS 6.22 / Win98SE
      • Notebook:
      • SurfTab duo W1 3G
      • Photoequipment:
      • Panasonic Lumix DMC-FT5
      • Handy:
      • Samsung Galaxy A3 (2017)

    Standard

    Ich kann bei deinen Ausreden nur mit dem Kopf schütteln.

    AMD und Intel haben ein Abkommen über Patentaustausch.

    Die AVX-, SSE- und weiteren Befehlssätze sind bei beiden Herstellern in Hardware identisch. Es gibt da nur ein "an" oder "aus", also "Haben" oder "nicht Haben". Die einzigen Vorteile können in der Architektur selbst begründet liegen, wie schnell die implementierten Befehlssätze abgearbeitet werden.

    Das ist das gleiche Spiel wie DirectX bei Grafikkarten. Entweder die GPU unterstützt die DX11-Befehlssätze oder nicht.

    Intel kann bei den Befehlssätzen nichts "optimieren". Und Intel hat lediglich die Befehlssätze abgeschaltet. Wenn die Optimierungen auf Intels Architektur dazu geführt hätten, dass die MKL gar nicht erst auf AMD lauffähig ist - ok.

    Aber man hat einfach nur AVX deaktiviert. Das ist keine Optimierung, sondern ein simples "Abschalten".


    Retro-Station
    Pentium 200 MMX @ 133MHz @ 1.8V @ passiv | Epox MVP4A | 8MB Trident3D AGP | 64MB PC100 | 2x CF-IDE-Adapter via SD-Card | USB-Floppy EMU | LS-120 SuperDisk | Toshiba DVD-ROM
    (finishing in progress...)

  22. #121
    Oberleutnant zur See
    Registriert seit
    23.08.2010
    Beiträge
    1.380


    Standard

    Zitat Zitat von fortunes Beitrag anzeigen
    Ich kann bei deinen Ausreden nur mit dem Kopf schütteln.
    Nur das ich es nicht nötig habe für irgendetwas Ausreden zu finden. Warum sollte ich auch?
    Ich diskutiere nur über ein Thema.


    Zitat Zitat von fortunes Beitrag anzeigen
    Das ist das gleiche Spiel wie DirectX bei Grafikkarten. Entweder die GPU unterstützt die DX11-Befehlssätze oder nicht.
    Nur dass es bei DirectX unterschiedliche Feature Level gibt, mit je vorgeschriebenen und optionalen Features..


    Zitat Zitat von fortunes Beitrag anzeigen
    Aber man hat einfach nur AVX deaktiviert. Das ist keine Optimierung, sondern ein simples "Abschalten".
    Es wird nichts abgeschaltet. Man nutzt einfach den Basisweg und wendet keine Optimierungen an, da man sich nicht die Mühe macht, bei nicht supporteten Produkten genauer zu unterscheiden, welche Instruktionen diese denn unterstützen.

  23. #122
    Admiral Avatar von fortunes
    Registriert seit
    13.06.2003
    Ort
    RheinMain
    Beiträge
    10.777


    • Systeminfo
      • Motherboard:
      • Epox MVP4A
      • CPU:
      • Pentium 200 MMX
      • Kühlung:
      • 08/15
      • Gehäuse:
      • Vobis Highscreen Midi
      • RAM:
      • 64MB PC100
      • Grafik:
      • 8MB Trident 3D AGP + Voodoo2
      • Storage:
      • 2x CF-IDE-Adapter via SD-Card
      • Monitor:
      • 19" Philips TFT
      • Netzwerk:
      • INTEL PRO/100
      • Sound:
      • Logitech 2.0
      • Netzteil:
      • LC Power 300W
      • Betriebssystem:
      • DOS 6.22 / Win98SE
      • Notebook:
      • SurfTab duo W1 3G
      • Photoequipment:
      • Panasonic Lumix DMC-FT5
      • Handy:
      • Samsung Galaxy A3 (2017)

    Standard

    Zitat Zitat von Paddy92 Beitrag anzeigen
    Nur dass es bei DirectX unterschiedliche Feature Level gibt, mit je vorgeschriebenen und optionalen Features..
    Gibt es auch bei AVX. Bspw. AVX512:
    Advanced Vector Extensions 512 (AVX-512) - x86 - WikiChip
    Nur weil eine AVX512-CPU AVX512 kann, heißt das nicht automatisch, dass sie auch AVX512 kann. Aber genau das kann man in Software prüfen lassen. Das ist ein "on" oder "off"-Flag in Hardware. Das ist keine Optimierung.

    Zitat Zitat von Paddy92 Beitrag anzeigen
    Es wird nichts abgeschaltet. Man nutzt einfach den Basisweg und wendet keine Optimierungen an, da man sich nicht die Mühe macht, bei nicht supporteten Produkten genauer zu unterscheiden, welche Instruktionen diese denn unterstützen.
    Du willst mich doch vera*schen.

    AVX ist ein Befehlssatz, keine Optimierung.

    Entweder der Befehlssatz wird unterstützt oder nicht. Dann wird der Befehlssatz in der Software aktiviert oder deaktiviert.

    Du machst dich hier gerade lächerlich. Was willst du denn bei einem Befehlssatz, der nur "an" oder "aus" kennt, optimieren?


    Retro-Station
    Pentium 200 MMX @ 133MHz @ 1.8V @ passiv | Epox MVP4A | 8MB Trident3D AGP | 64MB PC100 | 2x CF-IDE-Adapter via SD-Card | USB-Floppy EMU | LS-120 SuperDisk | Toshiba DVD-ROM
    (finishing in progress...)

  24. #123
    Oberleutnant zur See
    Registriert seit
    23.08.2010
    Beiträge
    1.380


    Standard

    Zitat Zitat von fortunes Beitrag anzeigen
    AVX ist ein Befehlssatz, keine Optimierung.
    Ich sage ja auch gar nicht, dass AVX in eine Optimierung ist. Ich sage, dass die Nutzung von den Befehlssätzen wie AVX eine Optimierung darstellt.

  25. #124
    Admiral Avatar von ElBlindo
    Registriert seit
    31.01.2009
    Ort
    Dortmund
    Beiträge
    9.050


    • Systeminfo
      • Motherboard:
      • Asus ROG Strix X570-F
      • CPU:
      • Ryzen7 3700X
      • Systemname:
      • Gamer
      • Kühlung:
      • Asus ROG RYUJIN 240
      • Gehäuse:
      • Corsair Carbide Air 540 white
      • RAM:
      • 16GB G.Skill TridentZ RGB 3200
      • Grafik:
      • Asus ROG RTX 2070 Strix OC
      • Storage:
      • Samsung 850 EVO 120GB+Crucial MX500 2000GB
      • Monitor:
      • LG 34UC88-B
      • Netzwerk:
      • Fritz Box 7590
      • Sound:
      • Corsair VOID
      • Netzteil:
      • Corsair AX 860i
      • Betriebssystem:
      • Win 10 Pro
      • Notebook:
      • 1x Lenovo Yoga 510/1x Lenovo TP Yoga Ultrabook
      • Handy:
      • Samsung S9

    Standard

    Fremdschämen inklusive: AMD's 3000er reihe doch nicht so gut. INTEL bleibt vorne..


    Ja, auch ich bin auf Holt´s Ignore Liste!

  26. #125
    Admiral Avatar von fortunes
    Registriert seit
    13.06.2003
    Ort
    RheinMain
    Beiträge
    10.777


    • Systeminfo
      • Motherboard:
      • Epox MVP4A
      • CPU:
      • Pentium 200 MMX
      • Kühlung:
      • 08/15
      • Gehäuse:
      • Vobis Highscreen Midi
      • RAM:
      • 64MB PC100
      • Grafik:
      • 8MB Trident 3D AGP + Voodoo2
      • Storage:
      • 2x CF-IDE-Adapter via SD-Card
      • Monitor:
      • 19" Philips TFT
      • Netzwerk:
      • INTEL PRO/100
      • Sound:
      • Logitech 2.0
      • Netzteil:
      • LC Power 300W
      • Betriebssystem:
      • DOS 6.22 / Win98SE
      • Notebook:
      • SurfTab duo W1 3G
      • Photoequipment:
      • Panasonic Lumix DMC-FT5
      • Handy:
      • Samsung Galaxy A3 (2017)

    Standard

    Zitat Zitat von Paddy92 Beitrag anzeigen
    Ich sage, dass die Nutzung von den Befehlssätzen wie AVX eine Optimierung darstellt.
    Da kann ich mitgehen und das auch so verstehen.

    Nur ist es dann eindeutig, dass Intel Mitbewerber zu behindern versucht, indem die Software mittels Vendorstring Softwarebestandteile deaktiviert.

    Denn die Deaktivierung der Optimierung ist keine Optimierung der Software, sondern ein reines Abschalten.

    Auch Intel prüft in der Software, was die vorhandene (Intel-)CPU als Befehlssätze draufhat. Diese Prüfung umgeht Intel aber im Vorfeld, indem sie fremde CPUs ausklammert.

    Du kannst dir also raussuchen:
    Entweder Intel optimiert seine Software und schließt die Konkurrenz bewusst davon aus (was ja momentan von der Berichterstattung angeprangert wird) oder es ist keine Optimierung sondern ein simples An- und Abschalten.

    - - - Updated - - -

    Um das ganze abzukürzen, ob Optimierung oder nicht, geht es ja eher wieder einmal um das Verhalten von Intel:

    Anwendungen mit Intel MKL lassen AMD-CPUs oft schlecht darstehen


    Retro-Station
    Pentium 200 MMX @ 133MHz @ 1.8V @ passiv | Epox MVP4A | 8MB Trident3D AGP | 64MB PC100 | 2x CF-IDE-Adapter via SD-Card | USB-Floppy EMU | LS-120 SuperDisk | Toshiba DVD-ROM
    (finishing in progress...)

Seite 5 von 6 ErsteErste 1 2 3 4 5 6 LetzteLetzte

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •