Anzeige
Skip to content
Read full article about: Meta verschiebt neues KI-Modell Avocado nach enttäuschenden internen Testergebnissen

Meta hat angeblich die Veröffentlichung seines neuen KI-Modells mit dem Codenamen "Avocado" verschoben. Ursprünglich für Mitte März 2026 geplant, soll es nun frühestens im Mai erscheinen, berichtet die New York Times unter Berufung auf drei informierte Personen.

In internen Tests schnitt Avocado bei logischem Denken, Programmieren und Schreiben schlechter ab als führende Modelle von Google, OpenAI und Anthropic. Es übertraf zwar Metas Vorgängermodell und Googles Gemini 2.5, erreichte aber nicht das Niveau von Gemini 3.0. Metas Führung diskutierte laut dem Bericht sogar, vorübergehend Gemini zu lizenzieren. Eine Entscheidung sei aber nicht getroffen worden.

Die nächste Generation mit dem Codenamen "Watermelon" sei bereits in Planung. Zudem ist ein Bild- und Videogenerator mit dem Codenamen Mango in Arbeit.

Meta betont, man sei auf einem guten Weg und werde "sehr bald" Updates liefern. Im Laufe des Jahres sollen weitere Modelle erscheinen. Nachdem Meta anfangs mit den offenen Llama-Modellen sehr erfolgreich war, verlor der Konzern mit Llama 4 den Anschluss.

CEO Mark Zuckerberg investierte daraufhin Milliarden in KI, darunter 14,3 Milliarden Dollar in das Startup Scale AI, dessen Chef Alexandr Wang nun Metas KI-Abteilung leitet. Im Raum steht auch eine Abkehr von der bisherigen Open-Source-Strategie.

Read full article about: xAIs Grok 4.20 hängt in Benchmarks zurück und glänzt dennoch mit niedrigster Halluzinationsrate

xAIs aktuelles KI-Modell Grok 4.20 hängt in Benchmarks deutlich hinterher. Das zeigt die Auswertung von Artificial Analysis, einem unabhängigen Bewertungsdienst für KI-Modelle. Grok 4.20 Beta erreicht mit aktiviertem Reasoning-Modus 48 Punkte im Artificial Analysis Intelligence Index – die Spitzenmodelle Gemini 3.1 Pro Preview und GPT-5.4 liegen bei 57 Punkten. Gegenüber dem Vorgänger Grok 4 ist das dennoch ein Plus von 6 Punkten.

Grok hängt den neuesten Modellen der großen KI-Labore hinterher. | Bild: Artificial Analysis
Grok hängt den neuesten Modellen der großen KI-Labore hinterher. | Bild: Artificial Analysis

xAI veröffentlichte drei Varianten in der API: mit Reasoning, ohne Reasoning und einen Multi-Agenten-Modus. Das Modell bietet ein Kontextfenster von 2 Millionen Token und ist mit 2 bzw. 6 Dollar pro Million Token günstiger als Grok 4 und recht günstig für westliche Modelle.

Eine Stärke hat das Modell allerdings: Es erfindet so selten falsche Antworten wie kein anderes getestetes Modell. Im AA-Omniscience-Test erreicht Grok 4.20 eine Nicht-Halluzinationsrate von 78 Prozent, laut Artificial Analysis ein Rekordwert. Der Test prüft, wie oft ein Modell etwas Falsches behauptet, wenn es die Antwort eigentlich nicht kennt. Grok 4.20 gibt in solchen Fällen nur etwa bei jeder fünften Frage trotzdem eine (falsche) Antwort.

Read full article about: Technikchef des US-Militärs: Anthropics KI-Modelle "verschmutzen" die Lieferkette

Emil Michael, der Technikchef des US-Kriegsministeriums, macht mit seiner Begründung für die Einstufung von Anthropic als Lieferkettenrisiko deutlich, dass es sich um eine ideologisch motivierte Maßnahme handelt. Claude-Modelle würden die Lieferkette "verschmutzen", weil in ihnen eine "andere Richtlinien-Präferenz" verankert sei, sagte Michael bei CNBC. Er verwies auf Anthropics "Verfassung", ein Regelwerk, das Ethik und Sicherheit betont. Dies könne dazu führen, dass Soldaten unwirksame Ausrüstung erhalten. Die Maßnahme sei "nicht als Strafe gedacht".

Anthropic ist das erste US-Unternehmen mit dieser Einstufung, die eigentlich ausländischen Gegnern vorbehalten ist. Die KI-Firma klagt dagegen und erhält Unterstützung von Microsoft-, OpenAI- und Google-Angestellten sowie Ex-US-Militärs. Anthropic wehrte sich zuvor dagegen, dass die eigenen KI-Modelle für US-Massenüberwachung und autonome Waffen genutzt werden.

Die Trump-Regierung zeigte bereits zuvor, dass sie KI ideologisch steuern möchte, indem sie Regulierungen gegen sogenannte "woke AI" erließ – kommuniziert als Verpflichtung zu politischer Neutralität. Das Vorgehen erinnert an die chinesische Regierung, die ebenfalls versucht, KI-Modelle politisch zu steuern.

Anzeige

Microsoft startet mit Copilot Health einen eigenen KI-Gesundheitsbereich

Microsoft bringt mit Copilot Health einen KI-Gesundheitsassistenten, der Daten aus Wearables, Krankenakten und Labortests zusammenführt und personalisierte Hinweise liefert. Langfristig will das Unternehmen eine „medizinische Superintelligenz“ aufbauen.

Read full article about: Anthropics Claude erstellt jetzt interaktive Diagramme und Grafiken direkt im Chat

Anthropic hat eine neue Beta-Funktion für seinen KI-Chatbot Claude vorgestellt: Claude kann jetzt direkt im Chat interaktive Diagramme, Grafiken und Visualisierungen erstellen. Die Funktion basiert auf einer Vorschau namens "Imagine with Claude" vom vergangenen Herbst und verbindet sie mit den bereits bekannten "Artifacts" - nur eben direkt im Gesprächsverlauf, statt im Seitenpanel und "temporär" wie Anthropic schreibt.

Claude entscheidet selbst, wann eine Visualisierung sinnvoll ist, oder Nutzer können sie gezielt anfordern. Beispiele sind interaktive Zinseszins-Kurven, ein interaktiver Entscheidungsbaum oder ein klickbares Periodensystem. Die Funktion ist für alle Tarife verfügbar.

Read full article about: ChatGPT verliert Marktanteile: Google Gemini vervierfacht seinen KI-Traffic

ChatGPT dominiert den Chatbot-Markt weiter, hat aber an Marktanteilen eingebüßt. Das zeigen die neuesten Zahlen von Similarweb, nach denen OpenAIs Chatbot im Februar 2026 nur noch 61,7 Prozent des weltweiten KI-Traffics auf sich vereint. Vor zwölf Monaten waren es noch 75,7 Prozent. Größter Gewinner ist Google Gemini, das seinen Anteil im selben Zeitraum von 5,7 auf 24,4 Prozent mehr als vervierfacht hat. Grok (3,4 %) und Claude (3,3 %) haben laut Similarweb erstmals DeepSeek (3,2 %) überholt und belegen nun Platz drei und vier. Claude überschritt im Februar zum ersten Mal die Drei-Prozent-Marke, ist aber laut einer anderen Studie im B2B-Markt deutlich stärker.

ChatGPT dominiert weiter, aber Google hat mit Gemini kräftig aufgeholt. Die Statistik bezieht sich nur auf Webtraffic. | Bild: Similarweb

In absoluten Zahlen verzeichnete ChatGPT im Februar 5,35 Milliarden Besuche, Gemini 2,11 Milliarden. Grok kam auf 298,5 Millionen, Claude auf 290,3 Millionen, DeepSeek auf 246,4 Millionen und Perplexity auf 153,8 Millionen Besuche. Microsofts Copilot stagniert bei 1,1 Prozent Marktanteil, das bezieht sich allerdings nur auf die Web-Version. Im Enterprise-Markt dürfte der Anteil von Microsoft viel höher sein.

Anzeige
Read full article about: Google Maps bekommt eine neue KI-Frage-Funktion

Google hat "Ask Maps" vorgestellt, eine Gesprächs-Funktion auf Basis der Gemini-Modelle. Nutzer können Fragen in natürlicher Sprache stellen, etwa nach "Smartphone-Ladestationen ohne lange Warteschlangen" oder "beleuchteten Tennisplätzen in der Nähe". Die Funktion greift laut Google auf Daten von mehr als 300 Millionen Orten und Bewertungen von mehr als 500 Millionen Mitwirkenden zu.

Ergebnisse werden auf einer angepassten Karte angezeigt und anhand bisheriger Suchanfragen und gespeicherter Orte personalisiert. Nutzer können direkt Tischreservierungen vornehmen, Orte speichern oder teilen und zur Navigation wechseln. Ask Maps startet zunächst in den USA und Indien auf Android und iOS, eine Desktop-Version soll folgen.

Ebenfalls neu ist "Immersive Navigation", eine überarbeitete Routenführung mit 3D-Ansicht der Umgebung, die Gebäude, Überführungen und Fahrspuren darstellt. Gemini-Modelle analysieren dafür Street-View- und Luftbilder.

Die Funktion wird zunächst in den USA ausgerollt und soll in den kommenden Monaten auf weitere iOS- und Android-Geräte, CarPlay, Android Auto sowie Autos mit integriertem Google ausgeweitet werden.

Forscher testen alternatives KI-Verfahren von Meta an 18 Millionen Herzultraschallvideos

Forscher haben ein KI-Modell für Herzultraschall vorgestellt, das auf Metas JEPA-Architektur basiert und laut ihren Benchmarks gängige Verfahren wie Masked Autoencoder oder kontrastives Lernen übertrifft.

Anzeige
Read full article about: OpenAI plant angeblich Integration von Video-KI Sora in ChatGPT

OpenAI plant angeblich, seine Video-KI Sora in ChatGPT zu integrieren. Bisher war Sora nur als eigene Mobile- und als Web-App mit ChatGPT-Subdomain verfügbar. Über die App wollte OpenAI Sora als virales Phänomen und TikTok-Alternative vermarkten, was zumindest anfangs gelang, auch wegen massiver Copyright-Verstöße.

Doch laut The Information rutschte die App im Apple App Store seit dem Launch im vergangenen Herbst von Platz 1 auf Platz 165 ab. CEO Sam Altman räumte intern ein, dass nur wenige Nutzer ihre Videos öffentlich in der App teilten. Mit der Integration in ChatGPT will OpenAI die Nutzerzahlen steigern: Aktuell liegt ChatGPT bei rund 920 Millionen wöchentlich aktiven Nutzern. Wäre Sora hier verfügbar, würden zwangsläufig mehr Videos generiert. Die Sora-App soll vorerst weiterbestehen.

Auch Google bietet in seiner Gemini-App bereits Videogenerierung an, allerdings mit stark limitierten Kapazitäten und nur für Bezahlaccounts. Ähnlich dürfte OpenAI vorgehen; das Unternehmen hat ohnehin schon nur knappe Rechenleistung zur Verfügung, verbrennt viel Geld an 95 Prozent kostenlosen ChatGPT-Accounts und Videogenerierung ist besonders rechenintensiv.