Ist das hier "unser" LLM Thread? Falls nicht sorry fürs reingrätschen.
Jein, ich würde sagen, unser "wie bekomm ich das LLM am Server zum laufen", gibt ja ein Unterforum für AI Zeugs, finde aber, dass die Art der Implementierung im Homelab hier her gehört.
Ich habe eine 7900XTX gekauft um damit lokal herumzuspielen. 32GB DDR5 RAM und ein Netzteil hab ich noch da.
Aufpassen, neben dem Modell muss noch noch der KV Cache (quasi der Arbeitsspeicher, der benötigt wird, damit das Modell laufen und "denken" kann anhand der Grunddaten, die das Modell selber hat)in dem VRAM, typischer Anfängerfehler. Heisst also, deine Modelle sollten etwa 50-75% Größe des VRAM haben bei dir, also 12-18gb, ich würde mit Gemma/Gwen/Mistral beginnen im Bereich grob 25-30b, quantisiert auf eine entsprechende Größe (ist ein eigenes Thema). Ich tät mitm UD_Q_4_K_XL von Unsloth beginnen (
https://huggingface.co/unsloth/gemma-4-26B-A4B-it-GGUF ), imho ist das erstmal ganz okay (ohne das jetzt genauer auszuführen).
Gibt es bezogen auf lokale KI einen Vorteil bei Intel 1851 oder AM5. Evtl. wegen der Speicher Anbindung oder so?
Jein, bei Intel ist ggf. die iGPU ganz interessant.
Allgemein ist die Sache so, gerade beim rumspielen, dass man eigentlich schnellen SSD Speicher will, zum Laden der Modelle (wenn du häufiger Modelle wechselst). Was jetzt "schnell" ist, ist ne andere Sache (ob nun Gen4, Gen5, Gen5 Raid 0...).
Ich würde das ProArt B850 Creator wollen (weil da ein sinnvoller DualGPU Betrieb möglich ist und man 2x Gen5 M.2 hat). Ist halt vom Preis her happig.
Realistisch tuts jede Kackplattform, irgend ein aberanztes AM4/1200/1700 System tuts genau so am Ende.
Ich würde dann einfach wieder Proxmox installieren und dort ollama laufen lassen wollen. Oder gibt es schon ein KI Linux oder sowas?
Ist alles Pain in the Ass, am Ende gehts in dem Thread aber genau darum.
tl,dr:
Such irgend eine halbwegs flotte SSD (die auch nicht zu klein ist, die Modelle sammeln sich schnell auf der Festplatte) und irgend ein Host-System, kann gern irgend ein Bestand sein.
Wenn du was kaufen musst, überleg dir, was du kaufst, damit eine "Nachnutzung" auch noch sinnvoll möglich ist.
245k + Intel B-Board wäre z.B. sowas, fürn Alltags-PC ist das eine super Basis.
AMD geht auch, würd aber nur was mit iGPU nehmen... ist halt die Frage, wie ernst dir das alles ist (B850 Pro Art Creator + 9900X/9950X hat over all ein nettes P/L und bietet ne vielseitige Zukunft, ist aber schon eher hochpreisig im Vergleich).
Mir fehlt @Desktop die iGPU etwas beim 5900X, wsl. wäre es in dem Fall smoother die iGPU als primäre GPU zu verwenden, so dass der ganze Render vom Betriebssystem und diverses Hardware-Offloading darauf läuft (was du remote ja nicht so hast, das Thema).
Trotzdem würd ich nix ohne iGPU kaufen.
Thema iGPU, Intel kann wohl SR-IOV auf der iGPU (konnte ich nie testen).
Bei Intel ist das billigste Dual-GPU Board das (NanoKVM/JetKVM oder so für Fernzugriff wenn nötig):
✔ Preisvergleich für GIGABYTE Z890 Aero G ✔ Bewertungen ✔ Produktinfo ⇒ Formfaktor: ATX • Sockel: Intel 1851 (LGA1851) • Chipsatz: Intel Z890 • CPU-Kompatibilität: Core Ultra 20… ✔ Mainboards ✔ Testberichte ✔ Günstig kaufen
geizhals.at
Oder mit IPMI:
245k reicht imho eigentlich, der hat schon die "beste" iGPU, 270k hat halt mehr Cores, mehr €..
Musst du wissen was es kosten darf, ein B350 Mainbaord mit einem Ryzen 1600 reicht am Ende auch zum probieren.