Inhalt
summary Zusammenfassung

Google bietet Entwicklern Zugang zu Gemini Pro, seiner neuen multimodalen KI, die Text- und Bildeingaben verarbeiten kann.

Anzeige

Das Modell, das in den Rechenzentren von Google läuft, ist über die Gemini-API zugänglich und kann mit dem Google AI SDK, einem Client-SDK für Android, integriert werden. Das SDK befreit Entwickler laut Google von der Notwendigkeit, eine eigene Backend-Infrastruktur aufzubauen.

Entwickler können Gemini Pro integrieren, API-Schlüssel generieren und KI-Anwendungen über das Google AI Studio erstellen. Google hat nach eigenen Angaben die Nutzung der Gemini-API für Entwickler mit einer neuen Projektvorlage in der neuesten Vorschau von Android Studio vereinfacht.

In der vergangenen Woche hat Google bereits den Zugang zu Gemini Nano freigegeben, einem On-Device-Modell, das auf ausgewählten Geräten über AICore verfügbar ist. Nano wird auf dem neuen Google Pixel 8 laufen.

Anzeige
Anzeige

Die MLLM-Benchmark-Kriege sind eröffnet

Die Leistung von Gemini Pro entspricht in etwa der von GPT-3.5. Laut Google übertrifft Gemini Pro das OpenAI-Modell in sechs von acht Benchmarks. Google hat auch seinen ChatGPT-Konkurrenten Bard mit Gemini Pro aktualisiert.

Googles GPT-4-Konkurrent Ultra wird Anfang nächsten Jahres folgen. Google hat gezeigt, dass es mit speziellen Prompting-Methoden GPT-4 in wichtigen Benchmarks wie MMLU schlagen kann. Microsoft hat inzwischen geantwortet, dass GPT-4, ebenfalls durch spezielle Prompting-Methoden gesteuert, in Benchmarks genauso gut, wenn nicht sogar besser ist.

Microsoft hat kürzlich zudem Phi-2 vorgestellt, wie Nano ein kleines, großes Sprachmodell, das für die Leistung auf dem Gerät optimiert ist. Phi-2 übertrifft Googles Gemini Nano in allen von Microsoft vorgestellten Benchmarks.

Interessanter wird sein, wie sich das Modell in realen Szenarien verhält. Hier zählt die Leistung, und kann von den in Benchmarks gemessenen Werten abweichen.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Google hat den Entwicklerzugang zu Gemini Pro gestartet, einer multimodalen KI, die sowohl Text- als auch Bildeingaben verarbeiten kann und über das Google AI SDK für Android integriert werden kann. Gemini Nano ist ebenfalls für mobile Geräte verfügbar.
  • Die Leistung von Gemini Pro ist ähnlich der von GPT-3.5 und Google behauptet, dass es das OpenAI-Modell in sechs von acht Benchmarks übertrifft. Google hat auch seinen ChatGPT-Konkurrenten Bard mit Gemini Pro aktualisiert.
  • Microsoft hat zudem Phi-2 vorgestellt, ein kleines, großes Sprachmodell, das für die Leistung auf dem Gerät optimiert ist und das Googles Gemini Nano in allen von Microsoft vorgestellten Benchmarks übertrifft.
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!