Aktuelles

Bruteforce Benchmark (Update V0.11 released )

Janchu88

Kapitän zur See , HWLUXX Vize-Superstar
Thread Starter
Mitglied seit
29.11.2005
Beiträge
5.179
Ort
irgendwo im Nirvana...
Im Falle Passmark wird aber auch AVX-512 integriert, welches quasi doppelt so große Vektoren unterstützt und momentan nur von Intel CPUs Supported wird. Den Befehlssatz unterstützt .net core (noch) nicht!

Ist btw auch ein cooler nebeneffekt der Architektur, grundätzlich könnte ein neuerer JIT Compiler dazu führen, dass der Befehlssatz mal genutzt wird, ohne das der Quellcode als solcher angepasst werden würde
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.

Kullberg

Computer Schach Freak
Mitglied seit
18.02.2005
Beiträge
4.056
Die Version, die Du mir geschickt hast, stürzt nach wenigen Sekunden ab und erkennt nur 32 Cores
brute2.jpg
 

Bullseye13

Well-known member
Mitglied seit
05.05.2015
Beiträge
2.094
Ort
Steiamoak
System
Desktop System
Jonsbo RM4 - Custom
Details zu meinem Desktop
Prozessor
AMD R7 2700 @ 4200MHz @ EK-WB Monoblock
Mainboard
ASUS CH6
Kühler
Wasserkühlung: Intern: 2x280mm + 1x240mm | Extern: Mora2 + 2x200mm
Speicher
4x8GB G.Skill Trident-Z 3600 C15 @ 3533 C14 @ Barrow WB
Grafikprozessor
XFX Radeon VII @ 2050/1220 @ Bykski WB
Display
MSI Optix MAG341CQ
SSD
Samsung SSD 960 EVO 250GB, M.2 | Crucial MX500 1TB, SATA
HDD
2x Seagate Desktop HDD 3TB
Soundkarte
Onboard
Gehäuse
Jonsbo RM4
Netzteil
Seasonic Platinum Series 860W ATX 2.3
Keyboard
Logitech G910 Orion Spectrum
Mouse
Logitech G502 SE Hero
Betriebssystem
Windows 10
Neues Ergebnis:
Bruteforce_0.11.JPG



143,891Ryzen 27004,2GHz @ 1,4V mit WaKü4 x 8GB DDR3600 CL153533MHz 14-15-14-30-44Bullseye13
 

AG1M

Well-known member
Mitglied seit
19.04.2012
Beiträge
3.671
System
Details zu meinem Desktop
Prozessor
Intel 8700k @ 5 Ghz Core / 5 Ghz Cache
Mainboard
MSI MPG Z390I GAMING EDGE AC
Kühler
CPU & GPU @ MO-RA3 420 WaKü
Speicher
2x16 GB G.Skill DDR4 @ 3800 CL16
Grafikprozessor
EVGA GTX 1070 @ 2050 Mhz / 4500 Mhz
Display
AOC Agon AG241QX (WQHD @ 144 Hz)
SSD
1.5 TB PCIe NVMe SSDs
Soundkarte
M-Audio Micro DAC
Gehäuse
Ncase M1 v5
Netzteil
Corsair SF450 450W
Keyboard
DIY JD40 MK2 @ MX Speed Silver + DSA PBT Keycaps
Mouse
Logitech G305 @ 800 DPI @ 1000 Hz
Betriebssystem
Windows 10 Pro 1909 x64
Sonstiges
DSLR: Nikon D3300
Yeah satte 11 Punkte mehr mit der neuen Version 0.11 :ROFLMAO:

brute_ag1m.png


111,097i7 8700K5 GHz @ 1,336v (load) mit WaKü2 x 16GB DDR4 3200 CL153800MHz CL16-17-17-32AG1M
 

matthias80

Member
Mitglied seit
12.01.2003
Beiträge
211
Nein das meinte ich nicht.
Fand das auch ehr fragwürdig was passmark da gemacht hat...
War für mich immer eine Anlaufstelle um Single thread Leistung zu vergleichen.
Hier denke ich, habe es so verstanden das im besten Fall immer die beste Technologie der CPU genutzt wird. Kann nirgens beeinflusst werden. Die Werte sind so gut über takt und Speicher vergleichbar. Ist ja auch mal ein richtiger multi thread test!

Mfg
 

Phantomias88

Active member
Mitglied seit
19.04.2008
Beiträge
7.601
Ort
StuggiTown
Im Falle Passmark wird aber auch AVX-512 integriert, welches quasi doppelt so große Vektoren unterstützt und momentan nur von Intel CPUs Supported wird. Den Befehlssatz unterstützt .net core (noch) nicht!

Ist btw auch ein cooler nebeneffekt der Architektur, grundätzlich könnte ein neuerer JIT Compiler dazu führen, dass der Befehlssatz mal genutzt wird, ohne das der Quellcode als solcher angepasst werden würde
Ist den AVX512 stark genug um mit GPUs gleich zu ziehen?
Kannst du den Bench auch Fit für GPU Nutzung machen?

FX-8350 @ HPC Mode 4x DDR3-1866 unbuffered ECC enabled

Finished after 1529,03 sec
Average Speed: 50,606 Mega Hashes per Second
 

Janchu88

Kapitän zur See , HWLUXX Vize-Superstar
Thread Starter
Mitglied seit
29.11.2005
Beiträge
5.179
Ort
irgendwo im Nirvana...
Nein das meinte ich nicht.
Fand das auch ehr fragwürdig was passmark da gemacht hat...
War für mich immer eine Anlaufstelle um Single thread Leistung zu vergleichen.
Hier denke ich, habe es so verstanden das im besten Fall immer die beste Technologie der CPU genutzt wird. Kann nirgens beeinflusst werden. Die Werte sind so gut über takt und Speicher vergleichbar. Ist ja auch mal ein richtiger multi thread test!

Mfg
Kann schon beeinflusst werden, dafür müsste ich aber ekantante Teile neu schreiben und die Nutzung manuell festschreiben - sehe ich keinen Sinn drin ;)

Ist den AVX512 stark genug um mit GPUs gleich zu ziehen?
Kannst du den Bench auch Fit für GPU Nutzung machen?
Durch diese enorme Parallelisierung geht es auf jeden Fall etwas in Richtung einer Fähigkeit die eigentlich GPUs vorbehalten ist. Wenn die CPUs in Zukunft noch stärker in Richtung Multithreading gehen und zusätzlich solche Befehlssätze implementiert werden, könnte es je nach Anwendungsfall tatsächlich Interessant werden wofür man sich entscheidet. Momentan sehe ich die GPUs dort aber noch klar vorne. Just my 2 cents.

Wenn dann würde ich ein eigenständiges Modul draus machen, dass die selbe Aufgabe erfüllt und den CPU Part unangetastet lassen. Grundsätzlich ist das auf jeden Fall möglich, aber ich habe noch nie mit OpenCL gearbeitet und erachte es auch nicht als ganz trivial auf Basis dessen was ich bisher zur Implementierung gelesen habe. Das wären mehrere Tage Arbeit um erstmal in die Grundlagen einzusteigen, die habe ich momentan leider nicht über.

Edit: Btw hat hier jemand ein ARM basiertes Tablet mit Windows? Könnte dafür auch ne Version bereitstellen. Würde mich mal interessieren, wie sich das ganze im Vergleich dann so schlägt :)
 

Janchu88

Kapitän zur See , HWLUXX Vize-Superstar
Thread Starter
Mitglied seit
29.11.2005
Beiträge
5.179
Ort
irgendwo im Nirvana...
Interessiert hats mich ja schon lange... hier erste Gehversuche mit OpenCL. Ist über eine in C geschriebene API eingebunden. Spiele etwas mit der API herum, um zu gucken was ich so an Performance darüber raus bekomme und die Ergebnisse sind viel versprechend :)

De Operationen sind hochgradig trivial, im Endeffekt nur einfache Additionen mit den entsprechenden Datentypen, aber paar Interessante Erkenntnisse für mich gewonnen, wie zum beispielsweise welche Größe an von CPU an GPU übergeben Daten zu einer guten Auslastung führt etc. GPU geht sauber auf 100% Load und taktet auch hoch etc.

Unbenannt.png


Warum die Double Geschwindigkeit so extrem in den Keller geht ist mir ein Rätsel, entweder liegt es an meiner rudimentären Implementierung (sehr wahrscheinlich) oder an der API (eher unwahrscheinlich)... ist für eine potentielle Implementierung aber zweitrangig, da ich primär mit Ganzzahlen arbeite. Mal gucken, ob ich darauf aufbauend was sinnvolles stricken kann.
 

Holzmann

The Saint
Mitglied seit
02.05.2017
Beiträge
15.844
Ort
Exil
System
Desktop System
Todesstern
Details zu meinem Desktop
Prozessor
AMD 3950x
Mainboard
Asus Crosshair VIII Formular X570
Kühler
Alphacool Wakü Eiswand 360er und 280er Radi mit XPX pro Aura RGB Eisblock Kühler mit AM4-Kit
Speicher
Corsair Dominator 32 GB 3600/3600 cl18 oder G Skill 16GB 3800/3800
Grafikprozessor
AMD Sapphire Nitro+SE 5700XT
Display
Dell 21:9
SSD
PCIE4 Corsair MP600
Gehäuse
Corsair 680X
Netzteil
Corsair AXI 860i
Betriebssystem
win10

Kullberg

Computer Schach Freak
Mitglied seit
18.02.2005
Beiträge
4.056
Ich hab mal nen 3970X laufen lassen - alles auf stock, nur XMP geladen und IF 1:1
577 MH/s | Threadripper 3970X | stock - ca. 3900 MHz Lukü | 4x16 GB DDR4 3600 CL16 | 3600 IF 1:1 | Kullberg
brute3970.jpg
Sind übrigens diese RAMs, die aufgrund des Tests von Reous kaufen musste ;)
Das Gigabyte TRX40 Aourus Master macht übrigens keine Freude - deshalb kein OC.
 

Janchu88

Kapitän zur See , HWLUXX Vize-Superstar
Thread Starter
Mitglied seit
29.11.2005
Beiträge
5.179
Ort
irgendwo im Nirvana...
Wow, danke für den Beitrag :)

freut mich, dass die Skalierung sich nochmal so arg verbessert hat. Kann mal ein 3950X Besitzer nen Vergleichsrun mit 3,9GHz machen? Würde mich mal interessieren.

Ich hab parallel den ganzen Tag mit OpenCL zugebracht. Die potentielle Performance ist schon krass, die Herausforderung ist aber der super schmale Befehlssatz. Letztendlich muss man alles bis auf kleinste herunterbrechen. Ist als wolle man ein Auto bauen und hat nur nen Hammer und nen Schraubenzieher, sowie jede Menge Rohmetall zur Verfügung.

Die Kryptographischen Funktionen müssen demnach auch von Grund auf neu geschrieben werden... Unter enormen Zeitaufwand wäre das für einzelne Funktionen evtl machbar. Allerdings fehlt dann jegliche Optimierung... Ich versuche gerade aus nem GitHub Repository was zu übersetzen... ob das klappt, keine Ahnung
 

Kullberg

Computer Schach Freak
Mitglied seit
18.02.2005
Beiträge
4.056
Ich hab es nochmal beobachtet - er fängt mit 4 GHz an und geht dann mit steigender Temperatur auf 3,925 GHz runter. Durchschnittlich sind es ca. 3,95 GHz. VCore liegt durchschnittlich bei 1,22 V. Der Taskmanager zeigt 100% Auslastung an - also viel besser als bei der ersten Version.
Die Version, die Du mir zuletzt geschickt hast, stürzt übrigens auch auf dem 32 Core Threadripper ab. Kann es sein, dass Du für bitMask ne 32 Bit Variable genommen hast? Die muss 64 Bit haben.
 

Phantomias88

Active member
Mitglied seit
19.04.2008
Beiträge
7.601
Ort
StuggiTown
Warum die Double Geschwindigkeit so extrem in den Keller geht ist mir ein Rätsel, entweder liegt es an meiner rudimentären Implementierung (sehr wahrscheinlich) oder an der API (eher unwahrscheinlich)... ist für eine potentielle Implementierung aber zweitrangig, da ich primär mit Ganzzahlen arbeite. Mal gucken, ob ich darauf aufbauend was sinnvolles stricken kann.
Bei nvidia sind es bei Double precision 1:32 gegenüber Single precision, das ist Hardwareseitig gelockt, nur die Quadro Reihe kann 1:2.

Meine zwei Tahiti haben jeweils 1TFlops Double Precision ;)

Das liegt also nicht an deinem Code. ;)
 

Kullberg

Computer Schach Freak
Mitglied seit
18.02.2005
Beiträge
4.056
Und so sieht ein 3990X ohne SMT bei 3,6 GHz aus:
809 MH/s | Threadripper 3990X | 3600 MHz @ 0.968V Lukü | 4x16 GB DDR4 3200 CL22 | 3200 IF 1:1
brute3990.jpg
 

Janchu88

Kapitän zur See , HWLUXX Vize-Superstar
Thread Starter
Mitglied seit
29.11.2005
Beiträge
5.179
Ort
irgendwo im Nirvana...
Liste updated

Könnte mir gut vorstellen, dass der mit HT jenseits der 900MH/s landet :)

Aber einfach krass, was für eine rohe Compute Power die Dinger haben. Btw hat man einfach so 3970X und 3990X rumliegen? Wenn ja wo sind meine?! :fresse:
 

Holzmann

The Saint
Mitglied seit
02.05.2017
Beiträge
15.844
Ort
Exil
System
Desktop System
Todesstern
Details zu meinem Desktop
Prozessor
AMD 3950x
Mainboard
Asus Crosshair VIII Formular X570
Kühler
Alphacool Wakü Eiswand 360er und 280er Radi mit XPX pro Aura RGB Eisblock Kühler mit AM4-Kit
Speicher
Corsair Dominator 32 GB 3600/3600 cl18 oder G Skill 16GB 3800/3800
Grafikprozessor
AMD Sapphire Nitro+SE 5700XT
Display
Dell 21:9
SSD
PCIE4 Corsair MP600
Gehäuse
Corsair 680X
Netzteil
Corsair AXI 860i
Betriebssystem
win10
@Kullberg
Dein Ergebnis mit dem 3990X ist atemberaubend! :hail:
 

Kullberg

Computer Schach Freak
Mitglied seit
18.02.2005
Beiträge
4.056
@Janchu88
Ich habe als kleine Nebentätigkeit ein Gewerbe, was sich mit Computerschach beschäftigt. Und da zählt nur maximale Rechenleistung. Ich hab 2 3970X und 4 3990X. Und einige 2 Sockel Xeons. Und einige CUDA Rechner. Wenn Interesse besteht, kann ich mal den Benchmark auf ein paar Xeons laufen lassen.
 

Helle53

New member
Mitglied seit
20.06.2013
Beiträge
12
@Janchu88: Bevor die "Mega Hashes per Second"-Werte durch die Decke schießen ersetze mal bei der Berechnung "100000" durch "1000000" :-) !
 

sonnyboy

Ü35 - Waküclub
Mitglied seit
08.04.2005
Beiträge
11.051
Ort
bei Oleg Popow
@Janchu88
Ich habe als kleine Nebentätigkeit ein Gewerbe, was sich mit Computerschach beschäftigt. Und da zählt nur maximale Rechenleistung. Ich hab 2 3970X und 4 3990X. Und einige 2 Sockel Xeons. Und einige CUDA Rechner. Wenn Interesse besteht, kann ich mal den Benchmark auf ein paar Xeons laufen lassen.
Du hast rund 20.000 Euro (nur) in CPUs investiert für ein kleines Nebengewerbe??? Hut ab! :eek:
 

Kullberg

Computer Schach Freak
Mitglied seit
18.02.2005
Beiträge
4.056
Naja, es waren ca. 19000, oder ca. 16000 ohne MWSt. Dafür werde ich den Rest des Jahres keine CPUs mehr kaufen, höchstens noch nen Schwung Grakas 3080 Ti, falls die auf den Markt kommen und gut für CUDA sind. Einnahmen hatte ich im ersten Quartal von 14000 incl. MWSt. Das war allerdings positiv beeinflusst durch das Kandidatenturnier für die Schach WM, was gestern allerdings leider wegen Corona abgebrochen wurde. Viel Gewinn bleibt allerdings übers Jahr betrachtet nicht. Von daher ist es eine kleine Nebentätigkeit trotz gar nicht so kleiner Umsätze.
 

Janchu88

Kapitän zur See , HWLUXX Vize-Superstar
Thread Starter
Mitglied seit
29.11.2005
Beiträge
5.179
Ort
irgendwo im Nirvana...
@Janchu88: Bevor die "Mega Hashes per Second"-Werte durch die Decke schießen ersetze mal bei der Berechnung "100000" durch "1000000" :-) !
Hahaha... Ja...

The benefits of open source :fresse:

Bin die nächsten Tage unterwegs, aber werde das bei nächster Gelegenheit korrigieren. Liste anpassen sollte nicht so schwer sein ;)
 

sonnyboy

Ü35 - Waküclub
Mitglied seit
08.04.2005
Beiträge
11.051
Ort
bei Oleg Popow
Naja, es waren ca. 19000, oder ca. 16000 ohne MWSt. Dafür werde ich den Rest des Jahres keine CPUs mehr kaufen, höchstens noch nen Schwung Grakas 3080 Ti, falls die auf den Markt kommen und gut für CUDA sind. Einnahmen hatte ich im ersten Quartal von 14000 incl. MWSt. Das war allerdings positiv beeinflusst durch das Kandidatenturnier für die Schach WM, was gestern allerdings leider wegen Corona abgebrochen wurde. Viel Gewinn bleibt allerdings übers Jahr betrachtet nicht. Von daher ist es eine kleine Nebentätigkeit trotz gar nicht so kleiner Umsätze.
Danke für die Info! Hätt ich so nicht gedacht. :wink:
 
Oben Unten