Skip to content

YouTuber baut Googles inszenierte Gemini-Demo in Echtzeit mit GPT-4 Vision nach

Der YouTuber "Greg Technology" hat Googles kritisierte multimodale Gemini-KI-Demonstration mit OpenAIs GPT-4 Vision nachgestellt, um kombinierte Sprach- und Bildprompts in Echtzeit zu demonstrieren. Das ursprüngliche Video der Gemini-KI-Demonstration wurde kritisiert, weil es inszeniert und nicht in Echtzeit aufgenommen war. Das Video von Greg Technology mit GPT-4V zeigt, wie er über eine Zeichnung diskutiert, nach Emoticons fragt und die KI ein Spiel identifizieren lässt - alles in Echtzeit. Natürlich ist die Demo nicht so ausgefeilt wie Googles Video, aber: Sie ist echt. Greg hat seinen Demo-Code auf GitHub veröffentlicht.

Quelle: YouTube

KI-News ohne Hype
Von Menschen kuratiert.

  • Mehr als 20 Prozent Launch-Rabatt.
  • Lesen ohne Ablenkung – keine Google-Werbebanner.
  • Zugang zum Kommentarsystem und Austausch mit der Community.
  • Wöchentlicher KI-Newsletter.
  • 6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
  • Bis zu 25 % Rabatt auf KI Pro Online-Events.
  • Zugang zum kompletten Archiv der letzten zehn Jahre.
  • Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.
The Decoder abonnieren