Das nach eigener Aussage "beste Open-Weight-LLM eines US-Unternehmens" ist ein Deepseek-Finetune. Deep Cogito hat Cogito-v2.1-671B veröffentlicht, das auf dem Deepseek-Basismodell vom November 2024 basiert (vermutlich R1-Lite, Deepseek-V3-Base wurde erst im Dezember veröffentlicht) und intern nachtrainiert wurde. Das Modell konkurriert laut Deep Cogito mit führenden geschlossenen und offenen Modellen bei Branchenbenchmarks und übertrifft andere US-amerikanische offene Modelle wie GPT-OSS-120B.

Der Hauptvorteil liege in der Effizienz: Cogito v2.1 nutzt in den Benchmarks deutlich weniger Token als vergleichbare Modelle, was niedrigere API-Kosten zur Folge hat. Deep Cogito hat das Modell mit Prozessüberwachung für Denkprozesse trainiert, wodurch es kürzere Argumentationsketten benötigt. Das Modell zeigt Verbesserungen bei Prompt-Following, Programmierung, längeren Anfragen und Kreativität. Nutzer können das Modell kostenlos über chat.deepcogito.com testen, wo laut Entwickler keine Chats gespeichert werden. Die Modellgewichte sind auf Hugging Face verfügbar. Kleinere Ausgaben sollen folgen.