Inhalt
summary Zusammenfassung

Am 10. Mai startet Googles Entwicklerkonferenz I/O 2023. Im Vorfeld sind einige Informationen durchgesickert.

Laut CNBC plant Google die Vorstellung von PaLM 2, der Nachfolgeversion von Googles großem Sprachmodell PaLM. Das neue Modell soll mehr als 100 Sprachen unterstützen und trägt intern den Codenamen "Unified Language Model". PaLM 2 soll ein breites Spektrum an Programmier- und Mathematikaufgaben lösen sowie kreatives Schreiben und Textanalyse beherrschen.

Das erste PaLM-Modell stellte Google im April 2022 vor. Mit 530 Milliarden Parametern war es eines der größten und wohl auch leistungsfähigsten Modelle, das sogar einfache Witze erklären konnte. Der Name steht für "Pathways Language Model". Pathways wiederum ist Googles langfristige Vision für vielseitige KI-Modelle. Googles Chatbot Bard basiert auf PaLM, das seit März 2023 über eine API verfügbar ist.

Das eigene Potenzial mit generativer KI ausschöpfen

Google präsentiert das neue PaLM-Modell und weitere generative KI-Neuheiten unter dem Motto "Menschen helfen, ihr volles Potenzial auszuschöpfen". Neben PaLM 2 soll Google "generative Erfahrungen" für den Chatbot Bard und die Google Suche ausrollen.

Anzeige
Anzeige

Für Bard soll laut CNBC künftig ein KI-Bildgenerator direkt im Chat zur Verfügung stehen. Google könnte hier auf das schon länger vorgestellte, aber noch nicht ausgerollte Bildmodell Imagen zurückgreifen, das in der Vergangenheit in Benchmarks Bestwerte erzielt hat. Bild- und Template-Generierung soll Google auch in den "AI Workspace Collaborator" implementieren, Googles KI-Lösung für die eigene Office Suite.

Microsoft bietet im Bing Chatbot eine Implementierung einer neueren Version von Open AIs Bildsystem DALL-E 2 an, dessen Ergebnisse jedoch nicht mit Midjourney v5 oder hochwertigen Stable Diffusion Implementierungen mithalten können.

Multi-Bard, Big-Bard, Giant-Bard

Intern soll Google bereits mit einer multimodalen Version von Bard experimentieren, die auf mehr Daten basiert und komplexe mathematische und Kodierungsprobleme lösen kann. Auch OpenAI hat eine multimodale Version für GPT-4 und ChatGPT angekündigt, die Bilder lesen und beschreiben kann. Bislang ist diese GPT-4 Version jedoch nur in einem kleinen Kreis verfügbar.

Neben diesem "Multi-Bard"-Modell soll Google an "Big Bard" und "Giant Bard" arbeiten. Aus der Namensgebung lässt sich ableiten, dass Google an unterschiedlich leistungsfähigen Bard-Modellen arbeitet, die nach dem Kosten-Nutzen-Prinzip implementiert werden dürften.

Google-CEO Sundar Pichai bezeichnete die aktuelle Bard-Version kürzlich als "getunten Honda Civic", ein echter Sportwagen werde erst noch kommen. "Wir trainieren schnell. Und wir haben viel bessere Modelle."

Empfehlung

In einem geleakten internen Dokument skizzierte Senior AI Engineer Luke Sernau Googles KI-Vorsprung gegenüber Open Source als gering. Er sieht die Open-Source-Bewegung im Vorteil, unter anderem weil sie kleinere Modelle mit qualitativ hochwertigen Daten schneller optimieren könne. Auch OpenAI habe dieses Problem.

Google solle sich lieber an die Spitze der Open-Source-Bewegung setzen und mit ihr kooperieren, wie es bei Android der Fall gewesen sei. Die Beherrschung des Ökosystems sei wichtiger als die Bereitstellung der leistungsfähigsten Modelle. Das Dokument wurde intern laut Bloomberg tausende Male geteilt.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Googles Entwicklerkonferenz am 10. Mai steht ganz im Zeichen der KI. Im Vorfeld sind Informationen durchgesickert.
  • So soll Google mit PaLM 2 ein neues großes Sprachmodell vorstellen, das mehr als 100 Sprachen unterstützt.
  • Außerdem soll es generative KI-Updates für Bard und den "Workspace AI Collaborator" für Google Slides und Google Sheets geben.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!