Neuer AI-Server

besterino · 29.04.2025

Die Kunst liegt im Prompt (aber selbst dann funktioniert manches trotzdem nicht

)… ich hab aber null Erfahrung mit den frei verfügbaren Modellen…

Weltherrscher · 30.04.2025

die kleinen sind fast alle furchtbar, gestern wollte mir gemma3:4b weis machen, 4 * 4 wäre 14...

Bigdog71 · 30.04.2025

Also Gemma3:27b ist schon ganz nett, aber haloziniert dann auch wenn es ans Kino-Programm geht 😅

Hier mal mein Low Budget KI-Server:

Basis mein altes NAS Pentium Gold Dual-Core, 16GB RAM auf einem Asroch H570mitx (LGA1200), hätte da gerne einen i5 wenn ich mal einen gebraucht finde. Und das Herzstück eine NVIDIA Tesla P40 mit 24GB VRAM. Vor über einem Jahr noch für 220€ gebraucht bekommen.

Daher passen 27b und auch 32b Modelle komplett in den VRAM und gehen auch sehr flott. Nur muss man aufpassen dass man kein FP16 modell erwischt wie das Mistral 3.1, da ist die Performance unterirdisch und nicht zu gebrauchen. Aber alles in allen hat Home Assistant Voice (mit Piper und Whisper auf einem anderen Server) durch diesen KI-Rechner unseren Kindern eine Geschichte erzählt. Mit Open Webui hab ich ganz gut gechattet.

Anschalten per Wake up on LAN und ausschalten per Script (Schalter) in Home Assistant klapppt Prima ohne zum Rack zu müssen.

Achso ich hab das billigste Gehäuse genommen was es gab^^

Weltherrscher · 01.05.2025

Wo hast du dir den (Spannungs-)Adapter für die P40 geholt?
Ich hab echt lange in der Bucht gesucht, für die M60, mich dann für ein all inclusive-Angebot entschieden, weil die Adapter alle suspekt waren... =)

Luckysh0t · 01.05.2025

Bigdog71 schrieb:
durch diesen KI-Rechner unseren Kindern eine Geschichte erzählt

Stelle ich mir spannend vor…also vor allem das, was dabei herauskommen kann. Nicht das da auf einmal Grimms Märchen oder ähnliches im Original vorgelesen werden.

Bigdog71 · 01.05.2025

@Weltherrscher

Der Spannungsadapter war dabei, da hatte ich darauf geachtet.

@Luckysh0t

Die Geschichte ging um Nussi das Eichhörnchen, selbst im Englischen finde ich nix passendes auf die schnelle.

AliManali · 02.05.2025

tcg schrieb:
Mal kurz ein ganz anderes Thema:
Wollen wir mal einen KI-Laberthread aufmachen ?

Gerade entdeckt:

AI - Alles um das Thema künstliche Intelligenz

Machine Learning, Deep Learning, Künstliche neuronale Netze, etc...

www.hardwareluxx.de

tonythebuilder · 05.05.2025

Ja man sieht wie dort im AI Bereich der Bär steppt. Ob es wirklich einen eigenen Bereich braucht, daran habe ich so meine Zweifel.

Vielleicht doch intelligenter als gedacht? https://www.golem.de/news/kuenstliche-intelligenz-grok-3-veraergert-maga-anhaenger-2505-195906.html

AliManali · 05.05.2025

Vielleicht kann unserer frischgebackener Supermod @extasyinseln den Fred hier mal verschieben, falls das für den TE ok ist.

tcg · 07.05.2025

AliManali schrieb:
falls das für den TE ok ist.

passt

Luckysh0t · 28.06.2025

Es beginnt ^^

Kleiner Dämpfer, wenn man es so sehen mag, ist, dass der RAM bei den AMD Systemen kein "unified shared ram" ist, dem Video nach ist das 50:50 zwischen CPU und GPU aufgeteilt. Was beim kauf, definitiv beachtet werden soll, wenn man es für Ki Zwecke nutzen mag. Man hat also beim 128 GB Modell "nur" 64 GB für die GPU..etc.

Haldi · 29.06.2025

War nicht mal die rede vom Framework desktop das von den 128gb 96gb für GPU eingeteilt werden können?
Das wäre ja nur eine Bios Einstellung oder nicht?

Luckysh0t · 29.06.2025

Das weiß ich nicht, zu dem Gerät, was er da hat, wird leider auch nicht aufs UEFI eingegangen und ob es dort Änderungsmöglichkeiten gibt. Wäre natürlich auch wieder so ein Punkt, der von Hersteller zu Hersteller unterschiedlich sein könnte.

Haldi · 07.08.2025

Fazit:
Clustering funktioniert Softwaretechnisch noch nicht optimal. Mit 4x Framework Desktop.

Aber das ding braucht 10W Idle!

Lobsi79 · 15.08.2025

Haldi schrieb:
Woot.
Was ist denn das für ein Geiles Ding.

ich tippe mal so auf 800-1200$
Eher oben...

Ich hab's jetzt getan und mir dieses geile Ding inkl. 96GB Ram mal bestellt.
Bezahlt habe ich irgendwas mit CHF 1500.- ungerade, ich hatte noch einen Rabatt Coupon erhalten.

Ich bin mal gespannt auf das gute Ding 😁

Gruss Lobsi

Haldi · 15.08.2025

Bitte Berichte über Stromverbrauch im Idle und unter normaler täglicher Last

Lobsi79 · 20.08.2025

@Haldi kann ich machen, leider wird's wohl noch ein wenig dauern, die gute Büx wird erst Mitte Monat versandt.

Was ich vor habe:
Aufteilung des Ram 50:50 (System/GPU),
Einrichten von Unraid + Umzug HDDs meines alten Servers (spendiere neue Party Disk), einrichten LLM, wahrscheinlich 70b q4, einrichten einer Schnittstelle für TTS/ STT zwecks Anbindung meines für Home Assistent genutzten Raspi 5, Immich unterstützt durch lokale KI einrichten etc...

Weltherrscher · Dienstag um 17:39

Welche ollen Server-GPUs kann man eigentlich sinnvoll für KI und vGPU nutzen?
Aktuell habe ich ne M60 drin, aber die wird absehbar Stress machen, weil es bereits jetzt schon keine Treiber für Kernel > 6.14 gibt...
Aktuell im Auge habe ich als Ersatz ne China-V100 (SXM-Modul auf PCIe-Adpater) mit 16 GB.
In der Range bis V100 mit 32 GB (ca. 800 €) liegen allerdings auch noch Tesla T4, T10 und A2.
Bei denen scheint die Performance aber eher schwach zu sein, verglichen mit der V100.

Frage an euch:
Ist das so oder sind die Cores der Turings und Amperes einfach so viel besser, dass sie für hauptsächlich KI die geeignetere Wahl sind?
vGPU, aka Games steht nur für low end Kram an.

tonythebuilder · Gestern um 15:18

Warum für so etwas altes (V100) noch 800€ ausgeben?
Da würde ich mir lieber eine Arc Pro B60 holen, von Sparkle gibts die gerade für 724€. Hat aber nur 24 GB RAM. Oder wenn du genug Platz im Rechner hast. Zweimal Arc Pro B50, da hast du dann auch 32 GB RAM (2x 16GB) und bist mit etwas über 700€ noch günstiger. Es wird auch deutlich schneller sein, du hast Garantie drauf und eine Restwert wenn du sie mal verkaufst. Oder schon mal nach Gebrauchten Radeon 7900XT gesucht, zwar nur 20 GB RAM. Aber wenn genug PCIe Lanes vorhanden sind, zwei Stück davon.

Ich selbst möchte gerne eine Senao Genesis haben. Da nur single Slot. Nur leider verkauft Senao diese nicht an Privatkunden. Laut deren Aussage, überlegen sie es sich eventuell es im Jahr 2026 zu ermöglichen.

pwnbert · Gestern um 15:40

Hab letztens auch mit der Arc Pro B... gustiert... aber solang damit kein SR-IOV läuft, ist das nix.

Von den TOPS her ist soe schon deutlich langsamer als so ne 5090 oder so. Aber ja... der VRAM ist schon nice. Wsl wird man bei 3090 vs B60 pro 24gb ähnlich sein... mitm Unterschied, dass die B60 halt dann doch sparsamer ist.

Wenn der Kram endlich SR-IOV kann, was angeblich ja im Q4 kommen soll (also jetzt...)... dann wird die Sache interessant - sehr interessant.

Weltherrscher · Gestern um 16:15

Hmm, kommt mir nicht mit Wahrheiten.
Lanes und Platz sind dank X10DRU-i+ en masse vorhanden, wichtig ist halt GPU passthrough an mehrere VMs.
Wenn das nur mit SR-IOV geht und das nicht geht, ist sie leider raus.

//Edith:
Mit der B50 scheint SR-IOV mit 6.17 zu gehen:

Intel Arc Pro B50, SR-IOV, and me

Mine also has some WICKED coil whine at idle. honestly… I hadn’t noticed if it was only at idle but I think it was… I’ll have to look into that.

forum.level1techs.com

Wichtig wäre jetzt noch flexibles VRAM provisioning auf den VFs.
Ich bräuchte 1x 2..4GB für die Windows VM und den Rest für die KI-VM...

//Edith2:

Proxmox 9.0 + Intel B50 SR-IOV -- finally its almost here! Early Adopter's Guide

Hey, that worked. Thank you!

forum.level1techs.com

scheint zu lüppen.
Mein X10 braucht aber nen UEFI-Patch.
Na das wird wieder geil, hab ich schonmal hinter mir, um Boot von NVMe zu ermöglichen...

pwnbert · Gestern um 19:36

Weltherrscher schrieb:
scheint zu lüppen.

Na dann hoppihoppi, ich drück dir die Daumen und bin auf nen Bericht gespannt.

Ich hab grad einfach nicht die Kapazität für sowas.. die B50 wär ja finanziell nicht das Thema...

Weltherrscher · Heute um 13:39

Erst mal Weihnachtsgeld und T-ZUG abwarten, danach die Kosten der B60 mit denen der Geschenke zu Weihnachten kaschieren, um tieffliegende Nudelhölzer zu vermeiden. :fresse:

MrWahoo · Heute um 14:34

Ach was, einfach auf Raten kaufen! Die coolen Kids machen das so! :fresse2:

Weltherrscher · Vor 46 Minuten

genau davon rede ich doch.

Neuer AI-Server

Legende

Enthusiast

Profi

Enthusiast

Enthusiast

Profi

cpt sunday flyer

Experte

cpt sunday flyer

Enthusiast

Enthusiast

Datenschutzhinweis für Youtube

Enthusiast

Enthusiast

Enthusiast

Datenschutzhinweis für Youtube

Profi

Enthusiast

Profi

Enthusiast

Experte

Legende

Enthusiast

Legende

Enthusiast

Motivator

Enthusiast

Ähnliche Themen