> > > > Google Assistant klingt dank neuraler Netzwerke von DeepMind natürlicher

Google Assistant klingt dank neuraler Netzwerke von DeepMind natürlicher

Veröffentlicht am: von

Sprachsteuerungen klingen mittlerweile bereits deutlich natürlicher als noch vor einigen Jahren. Allerdings gibt es immer noch Möglichkeiten, die Betonung und auch den Klang näher an normale, menschliche Stimmen zu rücken. DeepMind versucht dies mit dem Projekt WaveNet, einem Deep Neural Network, das dafür sorgt, dass die durch digitale Assistenten kreierte Sprache menschlicher klingen soll. Mittlerweile hat Google an WaveNet Gefallen gefunden und setzt die Techniken des neuralen Netzwerks für seinen Google Assistant ein.

Allerdings betrifft das im ersten Schritt nur die englischen und japanischen Versionen. Auf der Website bietet DeepMind auch Vergleichs-Samples an, welche die Ansagen einmal mit und einmal ohne den Einsatz von WaveNet demonstrieren. Tatsächlich ist leicht zu hören, dass die Varianten mit WaveNet hörbar ausgewogener klingen.

WaveNet weicht dabei laut DeepMind von traditionellen TTS-Techniken (Text-to-Speech) ab, da man sich nicht nur auf eine feste Datenbank mit Sprachsamples von Sprechern verlassen muss, sondern über maschinelles Lernen die typische Struktur von Sprache replizieren kann und die passenden Wellenformen generiert. Auf diese Weise lässt sich die Betonung in ganzen Sätzen besser anpassen, als beim bloßen Zusammensetzen von Bausteinen einer Sprachdatenbank. Wie man sich vorstellen kann, hat diese Technik aber noch zu Anfang sehr viel Rechenzeit benötigt und hohe Kosten verursacht. Mittlerweile ist man aber so weit, dass WaveNet für den Google Assistant in den Einsatz gehen kann. Es handelt sich sogar um das erste Produkt, das Googles neue TPU-Cloud-Infrastruktur nutzt.

Um eine Sekunde an Sprachwiedergabe zu erzeugen, benötigt WaveNet aktuell 50 Millisekunden. Die Wellenformen nutzt 24.000 Samples pro Sekunde und kann mit einer Auflösung von 16-bit arbeiten, also in CD-Qualität. Dass die Ergebnisse von Zuhörern besser bewertet werden, zeigen die obigen Mean-Opinion-Scores (MOS). Man darf gespannt sein, wann Google das Modell nun auch auf weitere Sprachen überträgt. Die Ergebnisse, die es bisher in englischer Sprache zu hören gibt, sprechen im wahrsten Sinne des Worte fürs sich.

Social Links

Kommentare (0)

Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

Filmstudios erwirken Einstellung umstrittener aber beliebter Add-Ons für Kodi

Logo von IMAGES/STORIES/2017/KODI_LOGO

Die Multimedia-Software Kodi ist bei vielen Nutzern beliebt: Sie steht für unzählige TV-Boxen wie die NVIDIA Shield Android TV zur Verfügung und erlaubt es, sowohl lokale Medienbibliotheken zu verwalten als auch mit der Cloud oder sogar externen Streaming-Angeboten zu arbeiten. Letzteres ist... [mehr]

Stabilitätstest: CPU-ID PowerMax lastet CPU und GPU vollständig aus

Logo von IMAGES/STORIES/2017/CPUID

Die Macher von CPU-Z, einer Software zur Anzeige aller wichtigen Informationen des Prozessors, haben ein Tool vorgestellt, welches dem Testen der Stabilität dienen soll. PowerMax wird für Windows in einer 32- und 64-Bit-Version angeboten und soll GPU und CPU gleichzeitig vollständig auslasten... [mehr]

Netflix: Neues Ultra-Abo für 19,99 Euro im Monat (Update)

Logo von IMAGES/STORIES/2017/NETFLIX_100

Kunden des Videostreaming-Dienstes Netflix können künftig wohl aus vier verschiedenen Abo-Modellen auswählen. Bislang standen mit „Basis“, „Standard“ und „Premium“ lediglich drei verschiedene Pakete zur Auswahl. Das neue „Ultra“-Paket wird vermutlich 19,99 Euro im Monat kosten... [mehr]

Unity 2018 skaliert von Low-End bis fotorealistisch

Logo von IMAGES/STORIES/2017/UNITY

Unity hat in der aktuellen Version der gleichnamigen Programmierplattform, der 2018.1 Public Beta, zahlreiche neue Funktionen eingeführt, welche in Unity programmierte Projekte auf der einen Seite leicht skalierbar und damit auch auf schwächeren Systemen und Plattformen lauffähig machen,... [mehr]

Office 2019: Windows 10 wird vorausgesetzt

Logo von IMAGES/STORIES/2017/MICROSOFT_2

Microsoft hält sich mit Informationen rund um Office 2019 weiterhin sehr zurück. Jedoch gab der Softwareriese nun bekannt, dass für die Nutzung des kommenden Office-Pakets zwingend das hauseigene Betriebssystem Windows 10 vorausgesetzt wird. Somit werden Nutzer von Windows 8.1 und älter... [mehr]

WhatsApp startet seine Business-App (Update)

Logo von IMAGES/STORIES/2017/WHATSAPP

Dass WhatsApp an einer Business-Version seines bekannten Messaging-Dienstes arbeitet, war längst bekannt. Nun hat die Facebook-Tochter ihren Business-Ableger offiziell vorgestellt. Die App gibt es aber zunächst nur für Android-Geräte und ist bislang nur in Indonesien, Italien, Mexiko,... [mehr]