Google I/O 2023 - die wichtigsten KI-Ankündigungen

Auf der Google I/O kündigt Google neue KI-Integrationen und Produkte an. Eine Übersicht.

Gmail "Help me write"

Google integriert im Rahmen der Workspace-Updates eine generative Text-KI in Gmail, die detaillierte Antwortvorschläge generieren kann. Google demonstriert dies am Beispiel einer Rückerstattungsanfrage an eine Fluggesellschaft mit einer elaborierten und detaillierten E-Mail, die die Chancen auf eine vollständige Rückerstattung erhöhen soll.

Immersive View Routen für Google Maps

Im vergangenen Jahr stellte Google Immersive View vor, eine KI-generierte 3D-Ansicht berühmter Orte auf der Welt. Diese Ansicht rollt Google jetzt weitläufiger für 3D-Routen in Städten aus. Der Service soll bis Jahresende für Amsterdam, Berlin, Dublin, Florenz, Las Vegas, London, Los Angeles, New York, Miami, Paris, Seattle, San Francisco, San Jose, Tokyo und Venedig verfügbar sein.

Magic Editor für Google Photos

Der Magic Editor ist eine generative Bild-KI für eure eigenen Fotos. Er ermöglicht es, Elemente im Bild zu verschieben und fehlende Bildinformationen zu ergänzen. Google zeigt dies am Beispiel eines Fotos eines Kindes mit Luftballons in der Hand, die am Bildrand abgeschnitten sind. Zieht man das Kind in die Mitte, werden die Luftballons am Rand automatisch ergänzt.

Der neue Editor soll im Laufe des Jahres für ausgewählte Pixel-Smartphones erscheinen und Google sei sich ob der generativen Natur der Funktion bewusst, dass diese wohl nicht immer die erwarteten Ergebnisse liefern würde.

Bard bekommt PaLM-2-Unterstützung und neue Funktionen

Google hat Verbesserungen für seinen Chatbot Bard angekündigt, darunter Funktionen für Bilder, Codierung und Anwendungsintegration sowie eine Erweiterung des weltweiten Zugangs. Bard wird auf PaLM 2 umgestellt, ein umfangreiches Sprachmodell mit erweiterten mathematischen, logischen und Programmierfähigkeiten. PaLM 2 soll laut Google signifikant besser sein als das 2022 angekündigte PaLM-Modell.

Das KI-Tool, das bisher nur in den USA und Großbritannien verfügbar war, wird nun in mehr als 180 Ländern und Territorien angeboten. Die Unterstützung für Japanisch und Koreanisch wurde hinzugefügt, und in Kürze werden 40 Sprachen unterstützt.

Bard wird bald in der Lage sein, Antworten und Prompts mit Bildern zu verarbeiten. Ermöglicht wird dies durch die Integration von Google Lens in Bard, die es den Benutzern erlaubt, Bilder zusammen mit Text in ihren Prompts zu verwenden.

Zu den neuen Code-Upgrades und Exportfunktionen gehören genauere Quellenangaben, ein dunkles Design und eine Exportschaltfläche, mit der Entwickler Code mit Replit exportieren und ausführen können, beginnend mit Python. Außerdem können Benutzer E-Mails und Dokumente direkt in Gmail und Docs erstellen.

Empfehlung

KI in der Praxis

Konkurrenz für Midjourney: Ideogram stellt neues, stark verbessertes KI-Bildmodell vor

Zukünftige Pläne für Bard umfassen die Integration mit Google-Anwendungen und -Diensten wie Docs, Drive, Gmail und Maps sowie mit Diensten aus dem gesamten Web, darunter Adobe Firefly, Adobes generatives KI-Modell, und anderen Partnern wie Kayak, OpenTable, ZipRecruiter, Instacart, Wolfram und Khan Academy.

"AI Snapshot": KI-Antworten in der Google Suche

Wie bereits angekündigt, integriert Google KI-generierte Antworten direkt in die Google-Suche. Die experimentellen Antworten werden vor den traditionellen Google Suchergebnissen angezeigt. Die neue Suchoberfläche ermöglicht Folgefragen und Chatbot-Gespräche auf Basis von KI-Vorschlägen und integriert Links von Verlagen, Unternehmen und sozialen Medien.

"Wir wissen, dass Menschen die Meinung anderer Menschen schätzen", sagt Google-Suchchefin Cathy Edwards. Die neue KI-Suchansicht nimmt allerdings einen Großteil des Bildschirmes ein und dürfte so Traffic-Ströme beeinflussen.

Generative KI beim Einkaufen: Die Funktionen der generativen KI werden auch auf die Shopping-Suche von Google ausgeweitet. Die KI bietet eine umfassende Momentaufnahme von Produkten, einschließlich bemerkenswerter Faktoren, relevanter Bewertungen, Rezensionen, Preise und Produktbilder, die alle auf dem Google Shopping Graph mit über 35 Milliarden Produktangeboten basieren.

Community beitreten

Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

KI-Antworten werden nur ausgegeben, wenn der Google-Algorithmus es für sinnvoll hält. Sensible Themen wie Gesundheit und Finanzen soll das System zunächst vermeiden. Den Zugang zu AI Snapshots gibt es nach Beitritt in das Programm "Search Generative Experience", das wiederum Teil der neuen Funktion "Search Labs" ist. Der Zugang zum SGE-Programm soll in den nächsten Wochen möglich sein.

Universal Translator

Der Universal Translator ist ein audiovisuelles Übersetzungswerkzeug, das laut Google auf den neuesten KI-Übersetzungsmodellen basiert. Es kann gesprochene Sprache in einem Video übersetzen und als Stimme ausgeben, indem es die Lippenbewegungen der sprechenden Person synchronisiert. Aufgrund des Deepfake-Risikos stellt Google das Tool zunächst nur ausgewählten Partnern zur Verfügung.

Generative KI für Android: Nachrichten und Wallpaper

Für Android kündigt Google "Magic Compose" an, eine Art ausführliche Autovervollständigung für Messaging. Die generative KI verwendet dafür den Kontext des Gesprächs und soll auch bestimmte Stile übernehmen kommen, etwa Kommunikation, die nach Business, Shakespeare oder besonders entspannt klingt.

Mit dem Emoji-Wallpaper können Nutzer den Hintergrund ihres Geräts mit ihren bevorzugten Emoji-Kombinationen, Mustern und Farben anpassen. Die Cinematic Wallpaper-Funktion nutzt die lokale KI auf dem Gerät, um vom Nutzer ausgewählte Fotos in bewegte Bilder umzuwandeln, die zum Leben erwachen, wenn das Gerät entsperrt oder gekippt wird.

Neu ist auch die Funktion für generative KI-Hintergrundbilder. Der Nutzer kann seine kreative Vision beschreiben, und das Telefon generiert einzigartige Hintergrundbilder mithilfe des Text-zu-Bild-Diffusionsmodells von Google.

Diese neuen Hintergrundbilder werden erstmals im nächsten Monat auf Pixel-Geräten verfügbar sein. Sie basieren auf dem Material You Design-Framework von Google und passen die Farbpalette des Geräts automatisch an das ausgewählte Hintergrundbild an.

MusicLM rollt aus

Im Januar kündigte Google das Text-zu-Musik-Modell "MusicLM" an, das jetzt im AI Test Kitchen für Web, Android und iOS ausrollt. Auf eine Textbeschreibung eines bestimmten Musikstils generiert MusicLM zwei Songs, von denen einer als besser bewertet werden kann für weiteres KI-Training.

Google I/O 2023 - die wichtigsten KI-Ankündigungen

Gmail "Help me write"

Immersive View Routen für Google Maps

Magic Editor für Google Photos

Bard bekommt PaLM-2-Unterstützung und neue Funktionen

Konkurrenz für Midjourney: Ideogram stellt neues, stark verbessertes KI-Bildmodell vor

"AI Snapshot": KI-Antworten in der Google Suche

Universal Translator

Generative KI für Android: Nachrichten und Wallpaper

MusicLM rollt aus

Google stellt multimodales KI-Modell Gemini 2.0 mit Fokus auf agentische KI vor

Google drängt FTC zur Aufhebung von Microsofts exklusivem OpenAI-Cloud-Deal

Google stellt neues Open Source Vision-Sprachmodell PaliGemma 2 vor

Google stellt multimodales KI-Modell Gemini 2.0 mit Fokus auf agentische KI vor

OpenAI veröffentlicht KI-Videogenerator Sora für ChatGPT-Abonnenten

OpenAI veröffentlicht o1-Vollversion und ChatGPT Pro für 200 US-Dollar pro Monat

Google I/O 2023 - die wichtigsten KI-Ankündigungen

Gmail "Help me write"

Immersive View Routen für Google Maps

Magic Editor für Google Photos

Bard bekommt PaLM-2-Unterstützung und neue Funktionen

"AI Snapshot": KI-Antworten in der Google Suche

Universal Translator

Generative KI für Android: Nachrichten und Wallpaper

MusicLM rollt aus

Artikel teilen

Bankverbindung