[Kaufberatung] Local AI Computer PC/Server [Anfänger]

Schenk dir das OC, bringt dir nicht viel, du bist ja eher Speicherbeschränkt. Klar, 5% schneller sind 5% schneller, ist aber den Aufwand erstmal nicht wert. Zudem... Afterburner unter Linux?
Kann irgendwie nur das NT sein, aber mh...
Das Klackern kann von den Spannungswandlern bei Mainboards oder den Spawas bei GPUs kommen.
Mh... glaub nicht.

Wars über den Audio Line Out? Oder echt der PC? Aber hm, recht egal...
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Ja das war wirklich mittig aus dem PC. Da ist nur noch das ziemlich lehre Mainboard -nachdem die Grafikkarte raus ist. Das NT hatte ich ja getauscht nach dem Vorfall. Die Lüfter habe ich allesamt mehrfach überprüft. Zumal das Klackern ja jedesmal nach dem Neustart kam. Und einmal in Kombo mit Blitz aus richtung PCIe-Slot. Wobei ich das nicht auf den Zentimeter genau sagen kann.

Wie gesagt: Mainboard bleibt als einziges übrig, was solch ein Geräusch verursachen kann.

1743615134029.jpeg

*Beispielbild meines Rechners zu einem älteren Zeitpunkt
 
Lüfter?
oder welche art von "klackern" sprechen wir hier?


Naja....
Mal andere GPU getestet?
Du kannst von nVidia nicht erwarten das sie bei so billig Grafikkarten Qualitätskontrolle vornehmen.
Wie ich oben schrieb klackern. Ja. Man könnte meinen da wäre etwas in den Lüfter gekommen, ein Kabel oder ein Stecker. Aber nein. Klackern von Spannungswandlern. Oder wie bei einem Lichtbogen.

Wie hier der Fall bei reddit.
1743616187058.png

 
Ich schmeiß mal imho ne gute Alternative in den Raum, ist aber ein wenig mit Basteln verbunden.

AMD Radeon Instinct MI50 mit 32GB HBM2 (gibt es als 16GB und auch als 32GB Version)

1757873940673.png



Die Karte wird gerade aus diversen Rechenzentren / Super Computern entsorgt (BigData) und entspricht weitestgehend einer VEGA VII 16GB bzw. Radeon Pro VII (bzw. V420 als 32GB Version) nur halt ohne Display Output. Dank HBM Speicher lassen sich die Karten mit überschaubarem Aufwand z.B. auf eine 120er AIO (CPU Version) umrüsten oder man klemmt einen gedruckten FAN Adapter dahinter.


Die Karte verfügt über einen MiniDiplay Port welcher aber ohne Funktion ist, es lässt sich aber das Radeon Pro VII Bios flashen und dann läuft die Karte auch unter Windows mit passenden Windows Treibern und mit Display Output! Unter Linux läuft die Karte auch so (ohne Bios Flash) via Ubuntu und AMD ROCm!

16GB Hier: https://www.ebay.de/itm/146072789356
32GB Hier: https://www.ebay.de/itm/136249976781

Mit eBay Rabatt Gutscheinen kommt man aktuell für die 16GB Version auf ~83€ und für die 32GB Version auf ~182€

Der MSRP einer Instinct MI50-16 und 32GB lag mal zwischen 3000 - 5000USD.

Da es diese Infinity Fabric Link (IFL) Bridge aktuell nicht zu kaufen gibt, würde ich direkt zur 32GB Version greifen! Ein Set aus mehren Karten ist möglich, aber die Performance leidet etwas darunter ohne die IFL Bridge. Die Kommunikation (Overhead) muss dann über den PCIe Bus.

Ich habe jeweils eine Instinct MI50-16GB und eine 32GB Version hier, die Performance unter Windows + Vulkan support im LM Studio ist in etwa identisch solang das Sprachmodel in den Speicher der Karte passt! Beispiel: Mit gpt-oss-20b erreicht die MI50 etwa ~65 tok/sec, meine RTX 5070Ti 16GB etwa ~160 tok/sec. Ist das Sprachmodel größer sieht die RTX 5070TI mit 16GB kein Land da großzügig ausgelagert werden muss.

Edit: Man könnte über zwei MI50 nachdenken und hätte dann 64GB, aber ohne IFL wird es etwas langsamer, aber immer noch besser als in den Hauptspeicher der CPU auslagern. Mit dem Bios Flash zur Radeon Pro VII / V420 lässt sich darauf sogar auch noch gut zocken (dual use). :bigok:

Edit2: Ich habe hier auch noch eine nVidia Tesla M60 mit 16GB (Dual GPU mit 2x8GB), aber die ist nur halb so schnell bevor du dir weitere Gedanken zu einer K80 machst.

Edit3: Hat Jemand Kontakte nach Taiwan?


1757873030533.png

1757871904490.png

1757871889846.png
 
Zuletzt bearbeitet:
Weißt du, wie viel eine MI50 im Leerlauf verbraucht? Habs schon gefunden 20w-25w.
 
Zuletzt bearbeitet:
Wie genau willst du es wissen? Mit oder ohne Monitor angeschlossen? Im Windows und idle und reicht dir ein Screenshot aus GPU-Z von den Sensoren oder HWInfo? :)
 
Es sind wohl 25 W Idle, ohne Monitor. Ich überlege, ob ich die Karte in meinen „Server” stecke. Dann würde sie aber 24/7 mitlaufen. Die Alternative wäre mein Desktop-PC als Zweitkarte, dann müsste ich aber beim Netzteil schauen.
 
1758028088811.png

Ich habe da mal was vorbereitet, mal sehen wie brauchbar der Umbau dann ist. :)
Eine wird nur auf Luft umgebaut, die andere mit AIO + Luft für die VRMs.

Unter Linux mit ROCm lässt sich die MI50 Karte recht einfach etwas einbremsen auf z.B. ~125W und ist dabei nur wenig langsamer als bei offenem PL von ~300W. Unter Windows gibt es vermutlich auch Möglichkeiten.

Code:
sudo rocm-smi --setpoweroverdrive 125


Edit: So gesehen ist die Instinct MI50 32GB fast alternativlos, sobald man ein Sprachmodel auswählt = größer 16GB oder welches gerade so in die 32GB Speicher einer MI50 passen ist der einzige Konkurrent eine RTX 5090 für ~2000€ statt der 200€ für die MI50. Die nächst günstige Möglichkeit wären zwei RTX3060 mit 12GB (falls 24GB reichen) oder eine RTX3090, wenn 24GB nicht reichen müssen es schon 3x RTX3060 12GB sein und da ist der Overhead schon so groß, das die "eine" MI50 vermutlich sogar schneller ist und der Unterbau muss dafür auch geeignet sein (Anzahl PCIe Steckplätze und Lanes).

200€ = 1x AMD Instinct MI50-32GB (used)
400€ = 2x AMD Instinct MI50-32GB -> 64GB (used)
400€ = 2x nVidia RTX 3060 12GB -> 24GB (used)
500€ = 1x nVidia RTX 3090 24GB (used)
600€ = 3x nVidia RTX 3060 12GB -> 32GB (used)
800€ = 2x nVidia RTX 5060 Ti 16GB -> 32GB (used)
999€ = 2x nVidia RTX 3090 24GB -> 48GB (used)
2000€ = 1x nVidia RTX 5090 32GB (used / new)

*gibt natürlich noch die Profi Lösungen mit mehr Speicher von nVidia wie RTX5000 und RTX6000 Series aber es wird dabei auch deutlich teurer.

Edit: ~25W idle mit Bildschirm angeschlossen kommt wohl in etwa hin. :)

1758059226395.png
 
Zuletzt bearbeitet:
Alternativ los nicht ganz :) . Token bei OpenRouter oder anderen sind nicht teuer. Mit 200€ kommt man da schon sehr weit.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh