> > > > Google Assistant klingt dank neuraler Netzwerke von DeepMind natürlicher

Google Assistant klingt dank neuraler Netzwerke von DeepMind natürlicher

Veröffentlicht am: von

Sprachsteuerungen klingen mittlerweile bereits deutlich natürlicher als noch vor einigen Jahren. Allerdings gibt es immer noch Möglichkeiten, die Betonung und auch den Klang näher an normale, menschliche Stimmen zu rücken. DeepMind versucht dies mit dem Projekt WaveNet, einem Deep Neural Network, das dafür sorgt, dass die durch digitale Assistenten kreierte Sprache menschlicher klingen soll. Mittlerweile hat Google an WaveNet Gefallen gefunden und setzt die Techniken des neuralen Netzwerks für seinen Google Assistant ein.

Allerdings betrifft das im ersten Schritt nur die englischen und japanischen Versionen. Auf der Website bietet DeepMind auch Vergleichs-Samples an, welche die Ansagen einmal mit und einmal ohne den Einsatz von WaveNet demonstrieren. Tatsächlich ist leicht zu hören, dass die Varianten mit WaveNet hörbar ausgewogener klingen.

WaveNet weicht dabei laut DeepMind von traditionellen TTS-Techniken (Text-to-Speech) ab, da man sich nicht nur auf eine feste Datenbank mit Sprachsamples von Sprechern verlassen muss, sondern über maschinelles Lernen die typische Struktur von Sprache replizieren kann und die passenden Wellenformen generiert. Auf diese Weise lässt sich die Betonung in ganzen Sätzen besser anpassen, als beim bloßen Zusammensetzen von Bausteinen einer Sprachdatenbank. Wie man sich vorstellen kann, hat diese Technik aber noch zu Anfang sehr viel Rechenzeit benötigt und hohe Kosten verursacht. Mittlerweile ist man aber so weit, dass WaveNet für den Google Assistant in den Einsatz gehen kann. Es handelt sich sogar um das erste Produkt, das Googles neue TPU-Cloud-Infrastruktur nutzt.

Um eine Sekunde an Sprachwiedergabe zu erzeugen, benötigt WaveNet aktuell 50 Millisekunden. Die Wellenformen nutzt 24.000 Samples pro Sekunde und kann mit einer Auflösung von 16-bit arbeiten, also in CD-Qualität. Dass die Ergebnisse von Zuhörern besser bewertet werden, zeigen die obigen Mean-Opinion-Scores (MOS). Man darf gespannt sein, wann Google das Modell nun auch auf weitere Sprachen überträgt. Die Ergebnisse, die es bisher in englischer Sprache zu hören gibt, sprechen im wahrsten Sinne des Worte fürs sich.

Social Links

Kommentare (0)

Um Kommentare schreiben zu können, musst Du eingeloggt sein!

Das könnte Sie auch interessieren:

  • Netflix: Neues Ultra-Abo für 19,99 Euro im Monat (Update)

    Logo von IMAGES/STORIES/2017/NETFLIX_100

    Kunden des Videostreaming-Dienstes Netflix können künftig wohl aus vier verschiedenen Abo-Modellen auswählen. Bislang standen mit „Basis“, „Standard“ und „Premium“ lediglich drei verschiedene Pakete zur Auswahl. Das neue „Ultra“-Paket wird vermutlich 19,99 Euro im Monat kosten... [mehr]

  • Stabilitätstest: CPU-ID PowerMax lastet CPU und GPU vollständig aus

    Logo von IMAGES/STORIES/2017/CPUID

    Die Macher von CPU-Z, einer Software zur Anzeige aller wichtigen Informationen des Prozessors, haben ein Tool vorgestellt, welches dem Testen der Stabilität dienen soll. PowerMax wird für Windows in einer 32- und 64-Bit-Version angeboten und soll GPU und CPU gleichzeitig vollständig auslasten... [mehr]

  • Fragmentierung: Steam verliert zunehmend große Blockbuster-Titel

    Logo von IMAGES/STORIES/2017/STEAM

    Lange Zeit war Steam die digitale Vertriebsplattform für PC-Spiele schlechthin, in der man als Kunde einen Großteil seiner gekauften Spieletitel zentral in einer einzigen Bibliothek aufbewahren und zu jeder Zeit erneut herunterladen konnte. Doch die Plattform kränkelt und scheint ihre einstige... [mehr]

  • Unity 2018 skaliert von Low-End bis fotorealistisch

    Logo von IMAGES/STORIES/2017/UNITY

    Unity hat in der aktuellen Version der gleichnamigen Programmierplattform, der 2018.1 Public Beta, zahlreiche neue Funktionen eingeführt, welche in Unity programmierte Projekte auf der einen Seite leicht skalierbar und damit auch auf schwächeren Systemen und Plattformen lauffähig machen,... [mehr]

  • Office 2019: Windows 10 wird vorausgesetzt

    Logo von IMAGES/STORIES/2017/MICROSOFT_2

    Microsoft hält sich mit Informationen rund um Office 2019 weiterhin sehr zurück. Jedoch gab der Softwareriese nun bekannt, dass für die Nutzung des kommenden Office-Pakets zwingend das hauseigene Betriebssystem Windows 10 vorausgesetzt wird. Somit werden Nutzer von Windows 8.1 und älter... [mehr]

  • Client-Update: Steam überarbeitet den Chat

    Logo von IMAGES/STORIES/2017/STEAM

    Nach der großen VAC-Bannwelle in der vergangenen Woche hat Valve ein neues Client-Update für Steam veröffentlicht, das umfangreiche Änderungen am Chat-System der Plattform vornimmt. Im Rahmen eines Open-Beta-Programms hatte Valve die neuen Funktionen seit dem 12. Juni ausführlich getestet, ab... [mehr]