Inhalt
summary Zusammenfassung

Googles Gemini soll laut Alphabet-CEO nur der Auftakt zu einer Reihe von KI-Modellen der nächsten Generation sein, die Google 2024 auf den Markt bringen will.

Mit dem multimodalen KI-Modell Gemini will Google mindestens mit OpenAIs GPT-4 gleichziehen. Das Modell soll noch in diesem Jahr auf den Markt kommen. In einem Interview zu den aktuellen Quartalszahlen sagt Alphabet-CEO Sundar Pichai, dass Gemini kurz vor der Fertigstellung stehe.

Gemini soll in verschiedenen Größen und mit unterschiedlichen Funktionen erscheinen und ab sofort für alle hauseigenen Produkte eingesetzt werden, also voraussichtlich Googles aktuelles Sprachmodell PaLM 2 ablösen. Entwickler und Cloud-Kunden sollen über Vertex AI Zugang erhalten.

Vor allem aber lege Google "die Grundlagen für die nächste Generation von Modellen", die im Laufe des nächsten Jahres auf den Markt kommen sollen.

Anzeige
Anzeige

"Das Innovationstempo ist beeindruckend. Wir schaffen von Grund auf eine multimodale, hocheffiziente Tool- und API-Integration und, was noch wichtiger ist, wir schaffen die Plattform für zukünftige Innovationen", sagt Pichai.

Mit Bild-Text-Prompt zur App: Gemini für KI-gestützte No-Code-App-Entwicklung in "Stubbs"

Der Entwickler Bedros Pamboukian berichtet bei Medium über ein neues KI-Tool "Stubbs", das bei Google in Arbeit ist und von Gemini angetrieben werden soll. Pamboukian sieht in Stubbs die "größte Veröffentlichung" von Google in diesem Jahr.

Stubbs soll das Prototyping von Apps oder KI-Modellen erleichtern, indem es aus einer Textbeschreibung oder einem Bild App-Prototypen generiert, die dann ähnlich wie Figma-Prototypen veröffentlicht und geteilt werden können. Die genaue Funktion konnte Pamboukian anhand von Codeauszügen bislang nicht bestimmen, aber er zeigt erste Screenshots der mutmaßlichen Benutzeroberfläche.

Das Interface von "Stubbs": Hier kann man mit einem kombinierten Text-Bild-Prompt einen App-Prototyp generieren. | Bild: Google via Bedros Pamboukian

Bei seinen Recherchen stieß Pamboukian auch auf das KI-Modell "Multimodal IT M", das eine Variante von Gemini sein könnte. Das Modell kann neben Texten auch Bilder verarbeiten und etwa Untertitel für Bilder schreiben. Diese Funktionen bieten auch Google Bard oder GPT-4V.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Google plant, mit seinem multimodalen KI-Modell Gemini, das noch in diesem Jahr auf den Markt kommen soll, mindestens mit OpenAIs GPT-4 gleichzuziehen. Alphabet-CEO Sundar Pichai kündigte an, dass Gemini kurz vor der Fertigstellung stehe.
  • Das Modell soll in verschiedenen Größen und Funktionen für alle hauseigenen Produkte erscheinen und damit Googles aktuelles Sprachmodell PaLM 2 ablösen. Entwickler und Cloud-Kunden sollen über Vertex AI darauf zugreifen können.
  • Ein neues KI-Tool namens "Stubbs", das von Gemini angetrieben wird, ist in der Entwicklung und soll das Prototyping von Apps oder KI-Modellen erleichtern, indem es App-Prototypen aus einem Text-Bild-Prompt generiert.
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!