Neues Trainingsverfahren lässt KI-Agenten besser im Team arbeiten
Forscher stellen ein neues Framework vor, das verschiedene KI-Agenten gemeinsam trainieren kann. Die Methode soll komplexe Aufgaben durch spezialisierte Rollen und Teamwork besser lösen.
Forscher der TU Darmstadt haben mit VOIX ein Framework entwickelt, das Websites um zwei neue HTML‑Elemente erweitert. Dadurch können KI‑Agenten direkt erkennen, welche Aktionen möglich sind, statt mühsam Benutzeroberflächen auswerten zu müssen. Das verspricht schnellere und sicherere Interaktionen, erfordert aber die Unterstützung von Web‑Entwicklern.
Metas neues KI-Modell SAM 3 verbindet Sprache und Vision flexibler als zuvor
Meta veröffentlicht die dritte Generation seines „Segment Anything Model“. SAM 3 soll Bilder und Videos gleichermaßen verstehen und setzt auf eine neue Trainingsmethode, die menschliche und künstliche Annotatoren kombiniert.
OpenAI unter Druck: Neues KI-Modell "Shallotpeat" soll Googles Vorsprung aufholen
OpenAI steht unter Druck: Ein internes Memo zeigt, wie Sam Altman auf Googles Vorsprung mit Gemini 3 reagiert – und mit welchem neuen Modell OpenAI gegensteuern will.
Das nach eigener Aussage "beste Open-Weight-LLM eines US-Unternehmens" ist ein Deepseek-Finetune. Deep Cogito hat Cogito-v2.1-671B veröffentlicht, das auf dem Deepseek-Basismodell vom November 2024 basiert (vermutlich R1-Lite, Deepseek-V3-Base wurde erst im Dezember veröffentlicht) und intern nachtrainiert wurde. Das Modell konkurriert laut Deep Cogito mit führenden geschlossenen und offenen Modellen bei Branchenbenchmarks und übertrifft andere US-amerikanische offene Modelle wie GPT-OSS-120B.
Die Grafik zeigt einen Mittelwert der generierten Tokens pro Benchmark-Instanz über alle Benchmarks hinweg.
Der Hauptvorteil liege in der Effizienz: Cogito v2.1 nutzt in den Benchmarks deutlich weniger Token als vergleichbare Modelle, was niedrigere API-Kosten zur Folge hat. Deep Cogito hat das Modell mit Prozessüberwachung für Denkprozesse trainiert, wodurch es kürzere Argumentationsketten benötigt. Das Modell zeigt Verbesserungen bei Prompt-Following, Programmierung, längeren Anfragen und Kreativität. Nutzer können das Modell kostenlos über chat.deepcogito.com testen, wo laut Entwickler keine Chats gespeichert werden. Die Modellgewichte sind auf Hugging Face verfügbar. Kleinere Ausgaben sollen folgen.