Auf der Google I/O kündigt Google neue KI-Integrationen und Produkte an. Eine Übersicht.
Gmail "Help me write"
Google integriert im Rahmen der Workspace-Updates eine generative Text-KI in Gmail, die detaillierte Antwortvorschläge generieren kann. Google demonstriert dies am Beispiel einer Rückerstattungsanfrage an eine Fluggesellschaft mit einer elaborierten und detaillierten E-Mail, die die Chancen auf eine vollständige Rückerstattung erhöhen soll.
Immersive View Routen für Google Maps
Im vergangenen Jahr stellte Google Immersive View vor, eine KI-generierte 3D-Ansicht berühmter Orte auf der Welt. Diese Ansicht rollt Google jetzt weitläufiger für 3D-Routen in Städten aus. Der Service soll bis Jahresende für Amsterdam, Berlin, Dublin, Florenz, Las Vegas, London, Los Angeles, New York, Miami, Paris, Seattle, San Francisco, San Jose, Tokyo und Venedig verfügbar sein.
Magic Editor für Google Photos
Der Magic Editor ist eine generative Bild-KI für eure eigenen Fotos. Er ermöglicht es, Elemente im Bild zu verschieben und fehlende Bildinformationen zu ergänzen. Google zeigt dies am Beispiel eines Fotos eines Kindes mit Luftballons in der Hand, die am Bildrand abgeschnitten sind. Zieht man das Kind in die Mitte, werden die Luftballons am Rand automatisch ergänzt.
Der neue Editor soll im Laufe des Jahres für ausgewählte Pixel-Smartphones erscheinen und Google sei sich ob der generativen Natur der Funktion bewusst, dass diese wohl nicht immer die erwarteten Ergebnisse liefern würde.
Bard bekommt PaLM-2-Unterstützung und neue Funktionen
Google hat Verbesserungen für seinen Chatbot Bard angekündigt, darunter Funktionen für Bilder, Codierung und Anwendungsintegration sowie eine Erweiterung des weltweiten Zugangs. Bard wird auf PaLM 2 umgestellt, ein umfangreiches Sprachmodell mit erweiterten mathematischen, logischen und Programmierfähigkeiten. PaLM 2 soll laut Google signifikant besser sein als das 2022 angekündigte PaLM-Modell.
Das KI-Tool, das bisher nur in den USA und Großbritannien verfügbar war, wird nun in mehr als 180 Ländern und Territorien angeboten. Die Unterstützung für Japanisch und Koreanisch wurde hinzugefügt, und in Kürze werden 40 Sprachen unterstützt.
Bard wird bald in der Lage sein, Antworten und Prompts mit Bildern zu verarbeiten. Ermöglicht wird dies durch die Integration von Google Lens in Bard, die es den Benutzern erlaubt, Bilder zusammen mit Text in ihren Prompts zu verwenden.
Zu den neuen Code-Upgrades und Exportfunktionen gehören genauere Quellenangaben, ein dunkles Design und eine Exportschaltfläche, mit der Entwickler Code mit Replit exportieren und ausführen können, beginnend mit Python. Außerdem können Benutzer E-Mails und Dokumente direkt in Gmail und Docs erstellen.
Zukünftige Pläne für Bard umfassen die Integration mit Google-Anwendungen und -Diensten wie Docs, Drive, Gmail und Maps sowie mit Diensten aus dem gesamten Web, darunter Adobe Firefly, Adobes generatives KI-Modell, und anderen Partnern wie Kayak, OpenTable, ZipRecruiter, Instacart, Wolfram und Khan Academy.
"AI Snapshot": KI-Antworten in der Google Suche
Wie bereits angekündigt, integriert Google KI-generierte Antworten direkt in die Google-Suche. Die experimentellen Antworten werden vor den traditionellen Google Suchergebnissen angezeigt. Die neue Suchoberfläche ermöglicht Folgefragen und Chatbot-Gespräche auf Basis von KI-Vorschlägen und integriert Links von Verlagen, Unternehmen und sozialen Medien.
"Wir wissen, dass Menschen die Meinung anderer Menschen schätzen", sagt Google-Suchchefin Cathy Edwards. Die neue KI-Suchansicht nimmt allerdings einen Großteil des Bildschirmes ein und dürfte so Traffic-Ströme beeinflussen.
Generative KI beim Einkaufen: Die Funktionen der generativen KI werden auch auf die Shopping-Suche von Google ausgeweitet. Die KI bietet eine umfassende Momentaufnahme von Produkten, einschließlich bemerkenswerter Faktoren, relevanter Bewertungen, Rezensionen, Preise und Produktbilder, die alle auf dem Google Shopping Graph mit über 35 Milliarden Produktangeboten basieren.
KI-Antworten werden nur ausgegeben, wenn der Google-Algorithmus es für sinnvoll hält. Sensible Themen wie Gesundheit und Finanzen soll das System zunächst vermeiden. Den Zugang zu AI Snapshots gibt es nach Beitritt in das Programm "Search Generative Experience", das wiederum Teil der neuen Funktion "Search Labs" ist. Der Zugang zum SGE-Programm soll in den nächsten Wochen möglich sein.
Universal Translator
Der Universal Translator ist ein audiovisuelles Übersetzungswerkzeug, das laut Google auf den neuesten KI-Übersetzungsmodellen basiert. Es kann gesprochene Sprache in einem Video übersetzen und als Stimme ausgeben, indem es die Lippenbewegungen der sprechenden Person synchronisiert. Aufgrund des Deepfake-Risikos stellt Google das Tool zunächst nur ausgewählten Partnern zur Verfügung.
Generative KI für Android: Nachrichten und Wallpaper
Für Android kündigt Google "Magic Compose" an, eine Art ausführliche Autovervollständigung für Messaging. Die generative KI verwendet dafür den Kontext des Gesprächs und soll auch bestimmte Stile übernehmen kommen, etwa Kommunikation, die nach Business, Shakespeare oder besonders entspannt klingt.
Mit dem Emoji-Wallpaper können Nutzer den Hintergrund ihres Geräts mit ihren bevorzugten Emoji-Kombinationen, Mustern und Farben anpassen. Die Cinematic Wallpaper-Funktion nutzt die lokale KI auf dem Gerät, um vom Nutzer ausgewählte Fotos in bewegte Bilder umzuwandeln, die zum Leben erwachen, wenn das Gerät entsperrt oder gekippt wird.
Neu ist auch die Funktion für generative KI-Hintergrundbilder. Der Nutzer kann seine kreative Vision beschreiben, und das Telefon generiert einzigartige Hintergrundbilder mithilfe des Text-zu-Bild-Diffusionsmodells von Google.
Diese neuen Hintergrundbilder werden erstmals im nächsten Monat auf Pixel-Geräten verfügbar sein. Sie basieren auf dem Material You Design-Framework von Google und passen die Farbpalette des Geräts automatisch an das ausgewählte Hintergrundbild an.
MusicLM rollt aus
Im Januar kündigte Google das Text-zu-Musik-Modell "MusicLM" an, das jetzt im AI Test Kitchen für Web, Android und iOS ausrollt. Auf eine Textbeschreibung eines bestimmten Musikstils generiert MusicLM zwei Songs, von denen einer als besser bewertet werden kann für weiteres KI-Training.