Skip to content

Baidu stellt LLM-Smart-Brille und neuen Bild- und Code-Generator vor

Image description
via Technode / Baidu

Kurz & Knapp

  • Baidu-CEO Robin Li stellte auf der Baidu World Conference neue KI-Produkte vor, darunter den Bildgenerator I-RAG, der mithilfe von Suchfunktionen und Retrieval-Augmented Generation (RAG) präzisere Bilder erzeugen soll als bisherige Systeme.
  • Die KI-Plattform Ernie, die Baidu als chinesische Alternative zu ChatGPT sieht, verarbeitet mittlerweile 1,5 Milliarden Nutzeranfragen pro Tag.
  • Baidus Hardware-Sparte Xiaodu präsentierte eine Kamera-Brille mit integriertem KI-Assistenten auf Basis des Sprachmodells Ernie, die als persönlicher Assistent dienen soll.

Der chinesische Technologiekonzern Baidu hat auf seiner World Conference neue KI-Produkte vorgestellt. Im Mittelpunkt stehen eine Kamera-Brille auf LLM-Basis und ein Bildgenerator, der präziser arbeiten soll als bisherige Systeme.

Baidu-CEO Robin Li stellte auf der Baidu World Conference mehrere neue KI-Produkte vor. Eines davon ist I-RAG, eine Text-zu-Bild-Technologie, die laut Li das Problem von "Halluzinationen" bei der Bilderzeugung reduzieren soll, bei denen Bilder vom Eingabetext abweichen oder nicht vorhandene Elemente enthalten.

Wie Reuters und die Financial Times berichten, soll I-RAG mit Hilfe von Baidus Suchfunktionen und Retrieval-Augmented Generation (RAG) die Genauigkeit der erzeugten Bilder verbessern. Dabei geht es vor allem um eine bessere Übereinstimmung zwischen eingegebenem Text und generiertem Bild.

Li verwendet den Begriff Halluzinationen hier offenbar im Sinne dessen, was Hersteller von Bildmodellen normalerweise als "Prompt Alignment" beschreiben, also wie gut ein Modell einen Prompt versteht und visualisiert. Im Zusammenhang mit KI werden unter Halluzinationen in der Regel Falschaussagen von Textgeneratoren verstanden, die als Fakten präsentiert werden.

Li präsentierte auch aktuelle Nutzungszahlen der KI-Plattform Ernie, die das Unternehmen als chinesische Alternative zu ChatGPT sieht: Das System verarbeitet mittlerweile 1,5 Milliarden Nutzeranfragen pro Tag.

Ob und wie viel Wachstum sich dahinter verbirgt, ist schwer zu sagen: Im Mai war die Rede von 200 Millionen Aufrufen pro Tag die Rede. In jedem Fall ist es eine viel geringere Nutzung als bei ChatGPT. Neben dem Angebot für Endnutzer will Baidu mit KI-Diensten auch das eigene Cloud- und API-Angebot stärken.

KI-Brille soll als persönlicher Assistent dienen

Baidus Hardware-Sparte Xiaodu stellte eine neue Brille mit integriertem KI-Assistenten vor. Nach Angaben von Xiaodu-Chef Li Ying soll die mit Kameras ausgestattete und auf dem Sprachmodell Ernie basierende Brille als "persönlicher Assistent" dienen.

Das Gerät ermöglicht es den Trägern, Fotos und Videos aufzunehmen sowie per Sprache zu interagieren. Zu den Funktionen gehören die Verfolgung des Kalorienverbrauchs, Musikwiedergabe und die Beantwortung von Fragen zur Umgebung. Das Konzept erinnert an die KI-Funktionen in Metas Smart-Brillen.

Produktdetailaufnahme der AR-Brille mit integrierter Leiterplatte und blauer LED-Beleuchtung im transparenten Brillenbügel.
Bild: via Technode / Baidu

Die vollständige Baidu World 2024 Show kann man hier ansehen. Der Trailer für das Gerät beginnt bei 02:05:26.

Überdies kündigte Baidu den Code-Generator Miaoda an, der ebenfalls auf dem hauseigenen Sprachmodell basiert. Das Tool soll die Entwicklung von Softwareanwendungen ohne umfangreiche Programmierkenntnisse ermöglichen.

KI-News ohne Hype
Von Menschen kuratiert.

  • Mehr als 20 Prozent Launch-Rabatt.
  • Lesen ohne Ablenkung – keine Google-Werbebanner.
  • Zugang zum Kommentarsystem und Austausch mit der Community.
  • Wöchentlicher KI-Newsletter.
  • 6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
  • Bis zu 25 % Rabatt auf KI Pro Online-Events.
  • Zugang zum kompletten Archiv der letzten zehn Jahre.
  • Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.
The Decoder abonnieren