Anzeige
Skip to content

Forscher basteln an Webseiten für KI-Agenten

Forscher der TU Darmstadt haben mit VOIX ein Framework entwickelt, das Websites um zwei neue HTML‑Elemente erweitert. Dadurch können KI‑Agenten direkt erkennen, welche Aktionen möglich sind, statt mühsam Benutzeroberflächen auswerten zu müssen. Das verspricht schnellere und sicherere Interaktionen, erfordert aber die Unterstützung von Web‑Entwicklern.

Metas neues KI-Modell SAM 3 verbindet Sprache und Vision flexibler als zuvor

Meta veröffentlicht die dritte Generation seines „Segment Anything Model“. SAM 3 soll Bilder und Videos gleichermaßen verstehen und setzt auf eine neue Trainingsmethode, die menschliche und künstliche Annotatoren kombiniert.

OpenAI unter Druck: Neues KI-Modell "Shallotpeat" soll Googles Vorsprung aufholen

OpenAI steht unter Druck: Ein internes Memo zeigt, wie Sam Altman auf Googles Vorsprung mit Gemini 3 reagiert – und mit welchem neuen Modell OpenAI gegensteuern will.

Read full article about: Das "beste Open-Weight-LLM eines US-Unternehmens" ist ein Deepseek-Finetune

Das nach eigener Aussage "beste Open-Weight-LLM eines US-Unternehmens" ist ein Deepseek-Finetune. Deep Cogito hat Cogito-v2.1-671B veröffentlicht, das auf dem Deepseek-Basismodell vom November 2024 basiert (vermutlich R1-Lite, Deepseek-V3-Base wurde erst im Dezember veröffentlicht) und intern nachtrainiert wurde. Das Modell konkurriert laut Deep Cogito mit führenden geschlossenen und offenen Modellen bei Branchenbenchmarks und übertrifft andere US-amerikanische offene Modelle wie GPT-OSS-120B.

Balkendiagramm: Durchschnittlicher Tokenverbrauch pro Modell, Cogito v2.1 4894 am niedrigsten, Gemini 2.5 pro 9178 am höchsten.
Die Grafik zeigt einen Mittelwert der generierten Tokens pro Benchmark-Instanz über alle Benchmarks hinweg.

Der Hauptvorteil liege in der Effizienz: Cogito v2.1 nutzt in den Benchmarks deutlich weniger Token als vergleichbare Modelle, was niedrigere API-Kosten zur Folge hat. Deep Cogito hat das Modell mit Prozessüberwachung für Denkprozesse trainiert, wodurch es kürzere Argumentationsketten benötigt. Das Modell zeigt Verbesserungen bei Prompt-Following, Programmierung, längeren Anfragen und Kreativität. Nutzer können das Modell kostenlos über chat.deepcogito.com testen, wo laut Entwickler keine Chats gespeichert werden. Die Modellgewichte sind auf Hugging Face verfügbar. Kleinere Ausgaben sollen folgen.