Inhalt
summary Zusammenfassung

Der chinesische Technologiekonzern Baidu hat auf seiner Entwicklerkonferenz Create 2025 in Wuhan zwei neue KI-Sprachmodelle präsentiert.

Anzeige

Die Modelle Ernie 4.5 Turbo und Ernie X1 Turbo sollen Texte und Bilder verarbeiten, logisch argumentieren und dabei weniger kosten als ihre Vorgänger.

Nach Angaben von Baidu arbeitet Ernie 4.5 Turbo schneller als bisherige Versionen und macht weniger Fehler bei der Textgenerierung. Die Leistung bei der Verarbeitung von Texten und Bildern liege auf dem Niveau von GPT-4.1 und übertreffe und GPT-4o.

Zwei Balkendiagramme: Vergleich von ERNIE 4.5 Turbo mit GPT-4.1/4o in Text- und multimodalen Benchmarks wie MMLU und DocVQA.
Ernie 4.5 Turbo konkurriert laut Benchmarks bei Text- und multimodalen Aufgaben auf Augenhöhe mit GPT-4.1 und GPT-4o. Dabei sollen Ernie 4.5 schneller und günstiger sein. | Bild: Baidu

Baidu berechnet für das Modell 0,8 RMB (etwa 11 US-Cent) pro Million eingegebener Textzeichen und 3,2 RMB (etwa 44 US-Cent) pro Million generierter Zeichen. Das sei 80 Prozent günstiger als beim Vorgänger.

Anzeige
Anzeige

Ebenfalls neu ist die Turbo-Variante von Baidus Reasoning-Modell Ernie X1, das der Konzern bereits Mitte März vorgestellt hatte. Laut Baidu übertrifft es die Konkurrenzmodelle Deepseek-R1 und Deepseek-V3.

Baidus Reasoning-Modell Ernie X1 Turbo zeigt in verschiedenen Benchmarks eine starke Leistung im Vergleich zu Konkurrenzmodellen wie Deepseek und OpenAI o1. Laut Baidu ist es zudem deutlich günstiger. | Bild: Baidu

Auch hier hebt Baidu Geschwindigkeit und geringe Kosten hervor. Die Nutzung kostet 1 RMB (etwa 14 US-Cent) pro Million Eingabezeichen und 4 RMB (etwa 55 US-Cent) pro Million Ausgabezeichen – ein Viertel der Kosten von Deepseek R1.

Video: Baidu

Baidu stellt beide Modelle kostenlos im Ernie Bot bereit. Die Baidu-Veranstaltung stand unter dem Motto "Models Lead, APPs Rule". Passend dazu betonte Baidu-Chef Robin Li auf der Konferenz die Bedeutung praktischer Anwendungen: KI-Modelle und Chips seien wertlos ohne gute Apps. Damit stimmt er einer kürzlichen Aussage eines OpenAI-Produktmanagers zu, wonach die Wertschöpfung von KI-Unternehmen über die gesamte Kette erfolge.

Digitale Menschen und Multi-Agenten als neue KI-Front

Neben den Sprachmodellen präsentiert Baidu neue KI-Anwendungen. Die Plattform Huiboxing erstellt aus kurzen Videoaufnahmen digitale Avatare mit realistischem Aussehen und natürlicher Stimme. Und die neue Multi-Agenten-App Xinxiang soll als übergeordneter Agent komplexe Aufgaben lösen.

Empfehlung

Video: Baidu

Aktuell beherrscht Xinxiang laut Baidu 200 verschiedene Aufgabentypen wie Wissensanalyse, Reiseplanung und Büroarbeit. Baidu plant eine Erweiterung auf mehr als 100.000 Aufgabentypen und Entwickler-Zugriff. Xinxiang ist derzeit für Android verfügbar, eine iOS-Version ist in der Prüfung.

Mit der "AI Open Initiative" richtet sich Baidu zudem verstärkt an Entwickler. Die Plattform ermöglicht ihnen, KI-Agenten, Mini-Programme und Apps zu vermarkten. Sie nutzt das Model Context Protocol (MCP) von Anthropic für die technische Integration.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Der chinesische Technologiekonzern Baidu hat zwei neue KI-Sprachmodelle, Ernie 4.5 Turbo und Ernie X1 Turbo, vorgestellt, die Texte sowie Bilder verarbeiten, logisch schlussfolgern und dabei weniger kosten sollen.
  • Laut Baidu arbeitet Ernie 4.5 Turbo schneller und mit weniger Fehlern als frühere Versionen, erreicht bei Text- und Bildaufgaben das Leistungsniveau von GPT-4.1, übertrifft GPT-4o und ist 80 Prozent günstiger als sein Vorgänger.
  • Die Reasoning-Variante Ernie X1 Turbo soll Konkurrenzmodelle wie Deepseek übertreffen und nur ein Viertel der Kosten von Deepseek R1 verursachen; Baidu stellte zudem neue Anwendungen wie die Avatar-Plattform Huiboxing und die Multi-Agenten-App Xinxiang vor.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!