Künstliche Intelligenz

28. März 2026

Google hat einen sogenannten "Agent Skill" für die Gemini-API entwickelt, der die Wissenslücke von Sprachmodellen bei schnelllebigen SDK-Änderungen schließen soll. Das Problem: KI-Modelle kennen nach dem Training weder ihre eigenen Updates noch aktuelle beste Lösungen. Der neue Skill liefert Coding-Agenten Informationen zu aktuellen Modellen, SDKs und Beispielcode. In Tests mit 117 Aufgaben stieg die Erfolgsrate des besten Modells (Gemini 3.1 Pro Preview) von 28,2 auf 96,6 Prozent.

Erfolgsrate von Gemini-Modellen mit und ohne Agent-Skill bei 117 Coding-Aufgaben: Neuere Modelle der 3er-Reihe profitieren dank stärkerem Reasoning mehr vom Skill als ältere Modelle mit schwächerem Reasoning. | Bild: Google

Ältere 2.5-Modelle profitierten deutlich weniger, was laut Google an schwächer ausgeprägtem Reasoning liegt. Eine Vercel-Studie zeigt allerdings, dass direkte Anweisungen via AGENTS.md noch wirksamer sein könnten. Google prüft daher auch andere Wege, darunter MCP-Dienste. Der Skill ist auf GitHub verfügbar.

Kommentieren Quelle: Google

Matthias Bastian

28. März 2026

Gesellschaft

ChatGPT vs. Claude: Anthropic sieht sich angeblich als gesunde Alternative zur "Tabakindustrie" OpenAI

Anthropic entstand nicht nur aus Sorge um KI-Sicherheit, sondern auch aus einem erbitterten Macht- und Beziehungskonflikt bei OpenAI. Ein Bericht von Sam-Altman-Biografin Keach Hagey zeigt, wie persönliche Verletzungen, Rivalitäten und strategische Differenzen die wohl folgenreichste Abspaltung der KI-Branche hervorgebracht haben.

Vollständigen Artikel lesen

Kommentieren

Jonathan Kemper

28. März 2026

Forschung

Meta stellt Hyperagents vor: KI-System verbessert den eigenen Verbesserungsprozess

Chirurgische Szene mit neonfarbenen Kabeln, die aus dem offenen Torso eines humanoiden KI-Roboters im futuristischen Labor geschnitten werden.

Matthias Bastian

28. März 2026

Short News

OpenAI schaltet Sora im April und September ab. Das KI-Videotool wird in zwei Stufen eingestellt: Die Web- und App-Version endet am 26. April 2026, die Sora-API am 24. September 2026. OpenAI empfiehlt Nutzern, ihre Inhalte vor der Abschaltung herunterzuladen. Videos und Bilder lassen sich direkt aus der Sora-Bibliothek exportieren.

Ob es danach noch ein letztes Zeitfenster für den Datenexport geben wird, ist laut OpenAI noch nicht entschieden. Falls ja, werden Nutzer per E-Mail informiert. Nach Ablauf aller Fristen werden sämtliche Nutzerdaten dauerhaft gelöscht. Die Einstellung betrifft auch die Plattform sora.chatgpt.com, die zur Bild- und Videogenerierung genutzt werden konnte. Details finden sich auf der OpenAI-Hilfeseite unter "What to know about the Sora discontinuation".

Die Einstellung von Sora fügt sich in einen größeren Strategiewechsel bei OpenAI ein. Das Unternehmen will seine Rechenressourcen künftig auf zwei Kernbereiche konzentrieren: Coding-Werkzeuge und Geschäftskunden – ähnlich dem Rivalen Anthropic – sowie eine Super-App, die ChatGPT und weitere Tools vereint. Sora soll als Forschungsprojekt zum Thema Weltmodelle weiterleben, mit dem Ziel, "die physische Arbeit zu automatisieren".

Kommentieren Quelle: OpenAI

Jonathan Kemper

28. März 2026

Gesellschaft

Anthropic-Studie: Wer KI länger nutzt, erzielt bessere Ergebnisse

Matthias Bastian

27. März 2026

Short News

Google kopiert Anthropics Memory-Import-Funktion, um Erinnerungen aus ChatGPT in Gemini zu holen. Gemini-Nutzer können ab sofort ihre gespeicherten Erinnerungen, Vorlieben und den kompletten Chatverlauf aus anderen KI-Apps wie ChatGPT und Claude importieren.

Dazu kopiert man einen vorgeschlagenen Prompt in die bisherige KI-App, lässt dort eine Zusammenfassung erstellen und fügt diese in Gemini ein. Gemini speichert die Informationen dann im eigenen Kontext. Zusätzlich lassen sich Chatverläufe als ZIP-Datei (bis zu 5 GB) hochladen und frühere Gespräche in Gemini fortsetzen. Google benennt zudem die bisherige Funktion "Past Chats" in "Memory" um. Die Funktion wird schrittweise ausgerollt.

Googles neue Memory-Import-Funktion in Gemini: Nutzer kopieren einen Prompt in ihre bisherige KI-App und fügen die generierte Zusammenfassung in Gemini ein. | Bild: Google

Anthropic hatte die Funktion zuerst vorgestellt, nachdem OpenAI wegen eines Militär-Deals in die Kritik geraten war, den Anthropic aus ethischen Gründen abgelehnt hatte. Die daraufhin gestiegene Zahl an Wechslern wollte Anthropic mit einem zusätzlichen Anreiz bedienen. Interessant ist, dass die Datenextraktion sowohl bei Google als auch bei Anthropic rein auf einem Prompt basiert, der die bisherige KI-App dazu bringt, alle gespeicherten Informationen über den Nutzer auszugeben.

Kommentieren Quelle: Google Blog

Matthias Bastian

27. März 2026

Short News

Das kanadische KI-Unternehmen Cohere hat mit "Transcribe" ein neues Open-Source-Modell zur automatischen Spracherkennung veröffentlicht. Das Modell belegt laut Cohere Platz 1 auf dem HuggingFace Open ASR Leaderboard mit einer durchschnittlichen Wortfehlerrate von nur 5,42 Prozent. Damit übertrifft es Konkurrenten wie OpenAIs Whisper Large v3, ElevenLabs Scribe v2 und Qwen3-ASR-1.7B. Neben hoher Genauigkeit bietet Transcribe laut Cohere auch den besten Durchsatz unter vergleichbar großen Modellen.

Die Grafik zeigt den Vergleich von sieben Spracherkennungsmodellen mit mehr als einer Milliarde Parametern. Auf der x-Achse ist die Genauigkeit als Wortfehlerrate (WER) abgetragen, wobei niedrigere Werte besser sind. Die y-Achse zeigt den Durchsatz (RTFx), also wie schnell ein Modell Audio im Verhältnis zur Echtzeit verarbeitet. Cohere Transcribe liegt mit einem RTFx von 525 und einer WER von etwa 5,4 oben links und ist damit sowohl das schnellste als auch das genaueste Modell. NVIDIA Canary Qwen 2.5B folgt mit einem RTFx von 418. Modelle wie OpenAIs Whisper Large v3 und Voxtral Realtime sind deutlich langsamer und ungenauer. — Cohere Transcribe im Vergleich mit sieben anderen Spracherkennungsmodellen: Je weiter oben links ein Modell liegt, desto besser ist es: also schneller (hoher Durchsatz) und genauer (niedrige Wortfehlerrate). | Bild: Cohere

Das 2-Milliarden-Parameter-Modell unterstützt 14 Sprachen, darunter Englisch, Deutsch, Französisch und Japanisch. Es steht unter der Apache-2.0-Lizenz auf Hugging Face zum Download bereit und ist auch über Coheres API sowie die Plattform Model Vault nutzbar. Cohere plant, Transcribe künftig in seine KI-Agenten-Plattform North zu integrieren.

Kommentieren Quelle: Cohere

Matthias Bastian

27. März 2026

Short News

Anthropic hat vor einem Bundesgericht in San Francisco eine einstweilige Verfügung gegen die Trump-Regierung erwirkt. Richterin Rita Lin untersagte damit vorläufig die Umsetzung von Präsident Trumps Anweisung, Bundesbehörden die Nutzung von Anthropics KI-Modellen zu verbieten, sowie die Einstufung des Unternehmens als Sicherheitsrisiko durch das Pentagon.

Anthropic dafür zu bestrafen, dass es die Vertragsposition der Regierung in die öffentliche Kritik gerückt hat, ist ein klassischer Fall unzulässiger Vergeltung im Widerspruch zum First Amendment. […] Nichts in dem maßgeblichen Gesetz stützt die orwellsche Vorstellung, dass ein amerikanisches Unternehmen allein deshalb als potenzieller Gegner und Saboteur der USA gebrandmarkt werden darf, weil es seine Meinungsverschiedenheit mit der Regierung zum Ausdruck bringt.
Rita F. Lin, United States District Judge

Hintergrund ist ein gescheiterter 200-Millionen-Dollar-Vertrag: Das Pentagon wollte uneingeschränkten Zugang zu Anthropics Claude-Modellen, Anthropic forderte Garantien gegen den Einsatz für autonome Waffen oder Massenüberwachung. Verteidigungsminister Pete Hegseth hatte Anthropic daraufhin als "Supply Chain Risk" eingestuft. Anthropic ist das erste US-Unternehmen mit dieser Kennzeichnung. Ein endgültiges Urteil steht noch aus.

Kommentieren Quelle: Urteil