Google hat mit NotebookLM ein KI-gestütztes Recherchewerkzeug entwickelt, das Nutzerinnen und Nutzern dabei helfen soll, komplexe Informationen besser zu verstehen. Mit dem neuen „Audio Overview“ Feature können nun Podcasts zwischen zwei KI-Moderatoren erzeugt werden.
Im Gegensatz zu herkömmlichen KI-Chatbots greift NotebookLM ausschließlich auf vom Nutzer bereitgestellte Quellen zurück, anstatt auf ein breites Trainingsmaterial. Dadurch soll das Risiko von Halluzinationen, also faktisch falschen Aussagen der KI, minimiert werden.
Mit dem neuen "Audio Overview"-Feature können die hochgeladenen Dokumente mit nur einem Klick in eine Diskussion zwischen zwei KI-Moderatoren verwandelt werden. Diese fassen die Inhalte zusammen, stellen Verbindungen zwischen Themen her und tauschen sich in einem lockeren Gespräch aus.
(Google "Audio Overview" des Fraunhofer KI-Prüfkatalogs)
Die generierten Podcasts können heruntergeladen und unterwegs angehört werden. Laut Google eignet sich das Audio-Format besonders für Menschen, die durch Zuhören besser lernen und sich Inhalte merken können.
Das "Audio Overview"-Feature befindet sich noch in der Experimentierphase und weist einige Einschränkungen auf. Es erinnert an das Google Experiment "Google Illuminate", welches Audio-Gespräche aus wissenschaftlichen Papieren erzeugt. So kann die Generierung bei umfangreichen Dokumenten mehrere Minuten dauern. Zudem sprechen die KI-Moderatoren bisher nur Englisch, neigen gelegentlich zu Ungenauigkeiten und lassen sich bisher nicht unterbrechen.
Google erweitert NotebookLM
NotebookLM ist Teil einer Reihe von KI-Produkten, die Google auf der diesjährigen Entwicklerkonferenz I/O vorgestellt hat. Dank der Multimodal-Fähigkeiten des Sprachmodells Gemini 1.5 unterstützt NotebookLM neben Google Docs auch Präsentationen, Webseiten und weitere Formate. Zudem wurden Funktionen zum Erstellen von Lernhilfen und Zusammenfassungen integriert.
Google verspricht, dass die in NotebookLM hochgeladenen Daten nicht für das Training anderer Modelle verwendet und nicht für Dritte einsehbar sind. Damit positioniert sich das Unternehmen im Wettbewerb mit OpenAI, die ebenfalls an personalisierbaren KI-Modellen arbeiten.
Nach meinem ersten kleinen Test kann ich sagen: Die Podcasts sind unterhaltsam und könnten einen interessanten Einstiegspunkt in fremde Themengebiete geben, vor allem für Menschen, die besser durch Sprache lernen als durch Text. Ausprobieren kann man das Feature auf Notebooklm.