Hoto
Legende
Thread Starter
- Mitglied seit
- 18.04.2009
- Beiträge
- 6.979
- Ort
- Aincrad
- Desktop System
- Main: Chii | [KI Server: Cardinal]
- Details zu meinem Desktop
- Prozessor
- Intel i7-14700KF | [8700K]
- Mainboard
- AsRock Z790 Steel Legend WiFi | [AsRock Z370 Extreme 4]
- Kühler
- be quiet! Dark Rock Pro 5
- Speicher
- 2x32GB G.Skill Trident Z5 DDR5-6000 CL30 | [4x8 GB DDR4]
- Grafikprozessor
- PNY RTX 4090 XLR8 Gaming Verto Epic-X Aktiv | [MSI RTX 5080 Ventus 3x OC]
- Display
- Samsung Odyssey OLED G8 G80SD / LU28R55 IPS (2x 4k)
- SSD
- Samsung 970 Evo Plus 2TB (m.2) / 870 Evo 4TB (SATA) / 850 Evo 250GB (SATA)
- HDD
- WD 2TB / WD 4TB
- Opt. Laufwerk
- BluRay
- Soundkarte
- OnBoard (Realtek ALC897 - 5.1)
- Gehäuse
- Fractal Design Pop XL
- Netzteil
- be quiet! Straight Power 12 1000w | [be quiet! 700w]
- Keyboard
- Wooting One
- Mouse
- Logitech G9
- Betriebssystem
- Window 10 Pro | [CachyOS]
- Webbrowser
- Firefox, Chrome
- Sonstiges
- Oculus Rift DK2 / CV1, HP Rev G2, Pico Neo 3 Link + HTC Facial Tracker + Index Controller inkl. 3x BaseStation 2.0, Tobii EyeTracker 4C, Leap Motion, [Sonoff Zigbee USB Stick 3.0]
- Internet
- ▼250 MBit ▲40 MBit
Falls noch Jemand ein kleines lokales Text to Speech Modell sucht. Chatterbox TTS hat jetzt Unterstützung für 23 Sprache, auch Deutsch ist dabei. Funktioniert ganz solide und braucht ~7GB VRAM. Hat Voice Cloning per Reference Stimme (6-30 Sekunden), lässt auch für eine Stimme Finetunen (ob auch für das Multilanguage Modell weiß ich noch nicht) und ist auch recht schnell (~2x Realtime auf einer RTX 4090 - Also 1 Sekunde Sprach in 0,5 Sekunden generiert).
Die neue Version ist noch recht neu, daher ist sie noch nicht überall eingebaut. Mit Quantisierung auf 8Bit, was bei TTS Modellen quasi keinen Qualitätsunterschied macht, sollte sich der nötige VRAM ordentlich nach unten drücken lassen die Geschwindigkeit noch mal hoch gehen.
P.S. wollte erst ein Thread nur für das TTS machen, aber ich denke ein Sammelthread wäre vielleicht sinnvoller. Vielleicht liste ich hier mal eine Übersicht, aber noch ist hier im KI Bereich wenig los. Nur eines sollte klar sein: keine Diskussionen zu illegaler Nutzung.
Die neue Version ist noch recht neu, daher ist sie noch nicht überall eingebaut. Mit Quantisierung auf 8Bit, was bei TTS Modellen quasi keinen Qualitätsunterschied macht, sollte sich der nötige VRAM ordentlich nach unten drücken lassen die Geschwindigkeit noch mal hoch gehen.
P.S. wollte erst ein Thread nur für das TTS machen, aber ich denke ein Sammelthread wäre vielleicht sinnvoller. Vielleicht liste ich hier mal eine Übersicht, aber noch ist hier im KI Bereich wenig los. Nur eines sollte klar sein: keine Diskussionen zu illegaler Nutzung.