Googles Gemini soll laut Alphabet-CEO nur der Auftakt zu einer Reihe von KI-Modellen der nächsten Generation sein, die Google 2024 auf den Markt bringen will.
Mit dem multimodalen KI-Modell Gemini will Google mindestens mit OpenAIs GPT-4 gleichziehen. Das Modell soll noch in diesem Jahr auf den Markt kommen. In einem Interview zu den aktuellen Quartalszahlen sagt Alphabet-CEO Sundar Pichai, dass Gemini kurz vor der Fertigstellung stehe.
Gemini soll in verschiedenen Größen und mit unterschiedlichen Funktionen erscheinen und ab sofort für alle hauseigenen Produkte eingesetzt werden, also voraussichtlich Googles aktuelles Sprachmodell PaLM 2 ablösen. Entwickler und Cloud-Kunden sollen über Vertex AI Zugang erhalten.
Vor allem aber lege Google "die Grundlagen für die nächste Generation von Modellen", die im Laufe des nächsten Jahres auf den Markt kommen sollen.
"Das Innovationstempo ist beeindruckend. Wir schaffen von Grund auf eine multimodale, hocheffiziente Tool- und API-Integration und, was noch wichtiger ist, wir schaffen die Plattform für zukünftige Innovationen", sagt Pichai.
Mit Bild-Text-Prompt zur App: Gemini für KI-gestützte No-Code-App-Entwicklung in "Stubbs"
Der Entwickler Bedros Pamboukian berichtet bei Medium über ein neues KI-Tool "Stubbs", das bei Google in Arbeit ist und von Gemini angetrieben werden soll. Pamboukian sieht in Stubbs die "größte Veröffentlichung" von Google in diesem Jahr.
Stubbs soll das Prototyping von Apps oder KI-Modellen erleichtern, indem es aus einer Textbeschreibung oder einem Bild App-Prototypen generiert, die dann ähnlich wie Figma-Prototypen veröffentlicht und geteilt werden können. Die genaue Funktion konnte Pamboukian anhand von Codeauszügen bislang nicht bestimmen, aber er zeigt erste Screenshots der mutmaßlichen Benutzeroberfläche.
Bei seinen Recherchen stieß Pamboukian auch auf das KI-Modell "Multimodal IT M", das eine Variante von Gemini sein könnte. Das Modell kann neben Texten auch Bilder verarbeiten und etwa Untertitel für Bilder schreiben. Diese Funktionen bieten auch Google Bard oder GPT-4V.