Inhalt
newsletter Newsletter

Kurz vor Googles 20-jährigem Jubiläum sprach Suchmaschinen-Chef Ben Gomes über die Rolle Künstlicher Intelligenz für sprechende Computer und Spracherkennung.

Googles Sprachsuche-App startete im Jahr 2011 mit Android 2.2 als Mindestvoraussetzung. Seitdem hat sich die darin integrierte Sprach-KI stetig weiterentwickelt. Mittlerweile ist sie über Googles KI-Assistenten weltweit auf Millionen Smartphones verbreitet. Die nächste Ausbaustufe ragt in das Leben anderer Menschen hinein: Die Telefon-KI Duplex erledigt täuschend echte Anrufe.

Für Google sind verbesserte Sprachdienste der nächste große Schritt in der KI-Entwicklung. Gomes geht noch weiter: Fortschritte in der maschinellen Verarbeitung natürlicher Sprache seien essenziell für die Zukunft des Internets, betont er im Interview mit dem Guardian.

„Spracherkennung und Sprachverständnis sind für die Zukunft von Suche und Information von zentraler Bedeutung", sagt Gomes. "Aber es gibt viele komplexe Herausforderungen."

Anzeige
Anzeige

Es sei zum Beispiel schwierig zu erkennen, worauf sich ein „er“, „sie“ oder „es“ in einem Satz bezieht – und in der Sprache existierten Millionen solcher komplexer Kontextformulierungen.

Sprachdienste in Entwicklungsländern bereits Alltag

Spracherkennung sei gerade in Entwicklungsländern mit geringer Alphabetisierungsrate ein wichtiger Teil des täglichen Lebens. Denn für viele Sprachen, die in Ländern wie Indien gesprochen werden, gebe es keine Standardtastatur.

„Ich habe zehn Jahre lang Hindi gelernt, aber ich wüsste nicht, wie man es schreibt – es ist also viel einfacher, seine Stimme zu nutzen, als zu schreiben“, sagt Gomes.

Spracherkennung werde im Westen immer noch als neue Technologie verstanden. Aber in Ländern wie Indien sei sie bereits so selbstverständlich und notwendig wie hier Smartphone-Tastaturen.

Im Gespräch mit Herrn Google

Damit Sprach-KIs die Erwartungen erfüllen, müssten noch viele Hürden genommen werden. Zum Beispiel würden Menschen mit Expertenwissen ganz anders suchen als ohne.

Empfehlung

Um dem Nutzer Zugang zu den richtigen Informationen zu geben, muss Google daher die Suchanfrage des Laien mit der des Experten verknüpfen können. Laut Gomes hat es etwa fünf Jahre gedauert, bis Google mit dem Ergebnis zufrieden war.

Für ein echtes maschinelles Verständnis von menschlicher Sprache müsse noch viel geforscht und entwickelt werden. Erst mit diesem Verständnis werde es einfacher, mit Sprache bestimmte Informationen zu finden.

„Wir werden in der Lage sein, wesentlich komplexere Anfragen auf vielfältigeren Wegen zu stellen. Irgendwann kann man ein Gespräch mit Google führen“, so Gomes

Bemerkenswerte Fortschritte in der Forschung

Jüngste Fortschritte in der Entwicklung von Sprach-KIs könnte Gomes Vorhersage schneller Realität werden lassen als erwartet.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

KI-Sprachforscher haben sich in den letzten Jahren vermehrt dem unüberwachten Lernen zugewandt und eine neue Generation Sprach-KIs geschaffen.

Beim unüberwachten Lernen müssen Trainingsdaten nicht aufwendig durch Menschen vorbereitet werden - das war bislang der Flaschenhals der Spracherkennungsforschung.

Mit dieser Lernmethode können neuronale Netze aus großen Textmengen - zum Beispiel Texte aus dem Internet - eigenständig ein Sprachmodell erstellen. Das Sprachmodell wird anschließend als Grundlage für die Lösung verschiedenster Spracherkennungsprobleme genutzt.

Für Open-AI Mitgründer Ilya Sutskever ist diese Entwicklung ein Durchbruch bei der Entwicklung sprechender Computer: „Unser Modell ist eine der größten Innovationen in der Erforschung neuronaler Netze in den letzten Jahren.“

Die Einführung dieser Methode hat bei manchen Sprachaufgaben zu einer um 25 Prozent verbesserten Erfolgsquote geführt. Das ist ein großer Sprung für ein Forschungsfeld, das lange Zeit auf der Stelle trat.

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!