Meta hat angeblich die Veröffentlichung seines neuen KI-Modells mit dem Codenamen "Avocado" verschoben. Ursprünglich für Mitte März 2026 geplant, soll es nun frühestens im Mai erscheinen, berichtet die New York Times unter Berufung auf drei informierte Personen.
In internen Tests schnitt Avocado bei logischem Denken, Programmieren und Schreiben schlechter ab als führende Modelle von Google, OpenAI und Anthropic. Es übertraf zwar Metas Vorgängermodell und Googles Gemini 2.5, erreichte aber nicht das Niveau von Gemini 3.0. Metas Führung diskutierte laut dem Bericht sogar, vorübergehend Gemini zu lizenzieren. Eine Entscheidung sei aber nicht getroffen worden.
Meta betont, man sei auf einem guten Weg und werde "sehr bald" Updates liefern. Im Laufe des Jahres sollen weitere Modelle erscheinen. Nachdem Meta anfangs mit den offenen Llama-Modellen sehr erfolgreich war, verlor der Konzern mit Llama 4 den Anschluss.
CEO Mark Zuckerberg investierte daraufhin Milliarden in KI, darunter 14,3 Milliarden Dollar in das Startup Scale AI, dessen Chef Alexandr Wang nun Metas KI-Abteilung leitet. Im Raum steht auch eine Abkehr von der bisherigen Open-Source-Strategie.
xAIs aktuelles KI-Modell Grok 4.20 hängt in Benchmarks deutlich hinterher. Das zeigt die Auswertung von Artificial Analysis, einem unabhängigen Bewertungsdienst für KI-Modelle. Grok 4.20 Beta erreicht mit aktiviertem Reasoning-Modus 48 Punkte im Artificial Analysis Intelligence Index – die Spitzenmodelle Gemini 3.1 Pro Preview und GPT-5.4 liegen bei 57 Punkten. Gegenüber dem Vorgänger Grok 4 ist das dennoch ein Plus von 6 Punkten.
Grok hängt den neuesten Modellen der großen KI-Labore hinterher. | Bild: Artificial Analysis
xAI veröffentlichte drei Varianten in der API: mit Reasoning, ohne Reasoning und einen Multi-Agenten-Modus. Das Modell bietet ein Kontextfenster von 2 Millionen Token und ist mit 2 bzw. 6 Dollar pro Million Token günstiger als Grok 4 und recht günstig für westliche Modelle.
Eine Stärke hat das Modell allerdings: Es erfindet so selten falsche Antworten wie kein anderes getestetes Modell. Im AA-Omniscience-Test erreicht Grok 4.20 eine Nicht-Halluzinationsrate von 78 Prozent, laut Artificial Analysis ein Rekordwert. Der Test prüft, wie oft ein Modell etwas Falsches behauptet, wenn es die Antwort eigentlich nicht kennt. Grok 4.20 gibt in solchen Fällen nur etwa bei jeder fünften Frage trotzdem eine (falsche) Antwort.
Emil Michael, der Technikchef des US-Kriegsministeriums, macht mit seiner Begründung für die Einstufung von Anthropic als Lieferkettenrisiko deutlich, dass es sich um eine ideologisch motivierte Maßnahme handelt. Claude-Modelle würden die Lieferkette "verschmutzen", weil in ihnen eine "andere Richtlinien-Präferenz" verankert sei, sagte Michael bei CNBC. Er verwies auf Anthropics "Verfassung", ein Regelwerk, das Ethik und Sicherheit betont. Dies könne dazu führen, dass Soldaten unwirksame Ausrüstung erhalten. Die Maßnahme sei "nicht als Strafe gedacht".
Microsoft startet mit Copilot Health einen eigenen KI-Gesundheitsbereich
Microsoft bringt mit Copilot Health einen KI-Gesundheitsassistenten, der Daten aus Wearables, Krankenakten und Labortests zusammenführt und personalisierte Hinweise liefert. Langfristig will das Unternehmen eine „medizinische Superintelligenz“ aufbauen.
Anthropic hat eine neue Beta-Funktion für seinen KI-Chatbot Claude vorgestellt: Claude kann jetzt direkt im Chat interaktive Diagramme, Grafiken und Visualisierungen erstellen. Die Funktion basiert auf einer Vorschau namens "Imagine with Claude" vom vergangenen Herbst und verbindet sie mit den bereits bekannten "Artifacts" - nur eben direkt im Gesprächsverlauf, statt im Seitenpanel und "temporär" wie Anthropic schreibt.
Claude entscheidet selbst, wann eine Visualisierung sinnvoll ist, oder Nutzer können sie gezielt anfordern. Beispiele sind interaktive Zinseszins-Kurven, ein interaktiver Entscheidungsbaum oder ein klickbares Periodensystem. Die Funktion ist für alle Tarife verfügbar.
ChatGPT dominiert den Chatbot-Markt weiter, hat aber an Marktanteilen eingebüßt. Das zeigen die neuesten Zahlen von Similarweb, nach denen OpenAIs Chatbot im Februar 2026 nur noch 61,7 Prozent des weltweiten KI-Traffics auf sich vereint. Vor zwölf Monaten waren es noch 75,7 Prozent. Größter Gewinner ist Google Gemini, das seinen Anteil im selben Zeitraum von 5,7 auf 24,4 Prozent mehr als vervierfacht hat. Grok (3,4 %) und Claude (3,3 %) haben laut Similarweb erstmals DeepSeek (3,2 %) überholt und belegen nun Platz drei und vier. Claude überschritt im Februar zum ersten Mal die Drei-Prozent-Marke, ist aber laut einer anderen Studie im B2B-Markt deutlich stärker.
ChatGPT dominiert weiter, aber Google hat mit Gemini kräftig aufgeholt. Die Statistik bezieht sich nur auf Webtraffic. | Bild: Similarweb
In absoluten Zahlen verzeichnete ChatGPT im Februar 5,35 Milliarden Besuche, Gemini 2,11 Milliarden. Grok kam auf 298,5 Millionen, Claude auf 290,3 Millionen, DeepSeek auf 246,4 Millionen und Perplexity auf 153,8 Millionen Besuche. Microsofts Copilot stagniert bei 1,1 Prozent Marktanteil, das bezieht sich allerdings nur auf die Web-Version. Im Enterprise-Markt dürfte der Anteil von Microsoft viel höher sein.
Google hat "Ask Maps" vorgestellt, eine Gesprächs-Funktion auf Basis der Gemini-Modelle. Nutzer können Fragen in natürlicher Sprache stellen, etwa nach "Smartphone-Ladestationen ohne lange Warteschlangen" oder "beleuchteten Tennisplätzen in der Nähe". Die Funktion greift laut Google auf Daten von mehr als 300 Millionen Orten und Bewertungen von mehr als 500 Millionen Mitwirkenden zu.
Ergebnisse werden auf einer angepassten Karte angezeigt und anhand bisheriger Suchanfragen und gespeicherter Orte personalisiert. Nutzer können direkt Tischreservierungen vornehmen, Orte speichern oder teilen und zur Navigation wechseln. Ask Maps startet zunächst in den USA und Indien auf Android und iOS, eine Desktop-Version soll folgen.
Ebenfalls neu ist "Immersive Navigation", eine überarbeitete Routenführung mit 3D-Ansicht der Umgebung, die Gebäude, Überführungen und Fahrspuren darstellt. Gemini-Modelle analysieren dafür Street-View- und Luftbilder.
Die Funktion wird zunächst in den USA ausgerollt und soll in den kommenden Monaten auf weitere iOS- und Android-Geräte, CarPlay, Android Auto sowie Autos mit integriertem Google ausgeweitet werden.
Forscher testen alternatives KI-Verfahren von Meta an 18 Millionen Herzultraschallvideos
Forscher haben ein KI-Modell für Herzultraschall vorgestellt, das auf Metas JEPA-Architektur basiert und laut ihren Benchmarks gängige Verfahren wie Masked Autoencoder oder kontrastives Lernen übertrifft.