Anzeige
Skip to content

Jonathan Kemper

Jonathan ist Technikjournalist und beschäftigt sich stark mit Consumer Electronics. Er erklärt seinen Mitmenschen, wie KI bereits heute nutzbar ist und wie sie im Alltag unterstützen kann.

Forscher basteln an Webseiten für KI-Agenten

Forscher der TU Darmstadt haben mit VOIX ein Framework entwickelt, das Websites um zwei neue HTML‑Elemente erweitert. Dadurch können KI‑Agenten direkt erkennen, welche Aktionen möglich sind, statt mühsam Benutzeroberflächen auswerten zu müssen. Das verspricht schnellere und sicherere Interaktionen, erfordert aber die Unterstützung von Web‑Entwicklern.

Read full article about: Das "beste Open-Weight-LLM eines US-Unternehmens" ist ein Deepseek-Finetune

Das nach eigener Aussage "beste Open-Weight-LLM eines US-Unternehmens" ist ein Deepseek-Finetune. Deep Cogito hat Cogito-v2.1-671B veröffentlicht, das auf dem Deepseek-Basismodell vom November 2024 basiert (vermutlich R1-Lite, Deepseek-V3-Base wurde erst im Dezember veröffentlicht) und intern nachtrainiert wurde. Das Modell konkurriert laut Deep Cogito mit führenden geschlossenen und offenen Modellen bei Branchenbenchmarks und übertrifft andere US-amerikanische offene Modelle wie GPT-OSS-120B.

Balkendiagramm: Durchschnittlicher Tokenverbrauch pro Modell, Cogito v2.1 4894 am niedrigsten, Gemini 2.5 pro 9178 am höchsten.
Die Grafik zeigt einen Mittelwert der generierten Tokens pro Benchmark-Instanz über alle Benchmarks hinweg.

Der Hauptvorteil liege in der Effizienz: Cogito v2.1 nutzt in den Benchmarks deutlich weniger Token als vergleichbare Modelle, was niedrigere API-Kosten zur Folge hat. Deep Cogito hat das Modell mit Prozessüberwachung für Denkprozesse trainiert, wodurch es kürzere Argumentationsketten benötigt. Das Modell zeigt Verbesserungen bei Prompt-Following, Programmierung, längeren Anfragen und Kreativität. Nutzer können das Modell kostenlos über chat.deepcogito.com testen, wo laut Entwickler keine Chats gespeichert werden. Die Modellgewichte sind auf Hugging Face verfügbar. Kleinere Ausgaben sollen folgen.

Neuer Benchmark entlarvt große Wissenslücken bei KI-Modellen – nur vier schaffen positive Bewertung

Ein neuer Benchmark von Artificial Analysis zeigt erschreckende Schwächen bei der faktischen Zuverlässigkeit von KI-Modellen auf. Von 40 getesteten Modellen erreichen nur vier einen positiven Score, Googles neues Gemini 3 Pro führt deutlich.

Read full article about: Microsoft, Nvidia und Anthropic schließen 45-Milliarden-Dollar-Deal

Microsoft, Nvidia und Anthropic haben neue strategische Partnerschaften im Wert von 45 Milliarden Dollar angekündigt. Anthropic skaliert sein Claude-KI-Modell auf Microsoft Azure und verpflichtet sich zum Kauf von Azure-Rechenkapazitäten im Wert von 30 Milliarden Dollar sowie zusätzlicher Kapazitäten von bis zu einem Gigawatt. Nvidia und Anthropic arbeiten erstmals eng bei Design und Engineering zusammen, um Anthropics Modelle für Nvidia-Architekturen zu optimieren. Die Rechenkapazitäten umfassen Nvidias Grace-Blackwell- und Vera-Rubin-Systeme. Nvidia investiert bis zu 10 Milliarden Dollar in Anthropic, Microsoft bis zu 5 Milliarden Dollar.

Microsoft-Foundry-Kunden erhalten Zugang zu Claude-Modellen wie Claude Sonnet 4.5, Claude Opus 4.1 und Claude Haiku 4.5. Claude wird damit als einziges Spitzenmodell auf allen drei großen Cloud-Diensten verfügbar sein. Microsoft setzt Claude weiterhin in seiner Copilot-Familie ein, einschließlich GitHub Copilot und Microsoft 365 Copilot.  Die CEOs Dario Amodei, Satya Nadella und Jensen Huang stellten die Partnerschaften in einem zehnminütigen Video gemeinsam vor.

Read full article about: Cloudflare übernimmt Replicate mit deren 50.000 KI-Modellen

Cloudflare übernimmt Replicate und erweitert damit seinen KI-Modellkatalog auf über 50.000 Modelle. Die Übernahme stärkt Cloudflares bereits bestehende Inferenz-Plattform Workers AI erheblich. Replicate-Nutzer können ihre APIs weiterhin verwenden, während Workers-AI-Nutzer Zugang zu deutlich mehr Modellen und Fine-Tuning-Funktionen erhalten. Die Unternehmen planen, den gesamten Replicate-Katalog in Workers AI zu integrieren und Entwicklern zu ermöglichen, eigene Modelle auf dem Netzwerk auszuführen.

Replicate ermöglicht Entwicklern den einfachen Zugang zu KI-Modellen über eine API und hat sich zu einem wichtigen Hub für die KI-Entwicklergemeinschaft entwickelt. Cloudflare bringt sein globales Netzwerk und die serverlose Inferenz-Technologie ein. "Zusammen werden wir zum Standard für die Entwicklung von KI-Apps", sagt Replicate-Mitgründer Ben Firshman. Dessen Unternehmen soll als eigenständige Marke weiterbestehen und von Cloudflares Ressourcen profitieren.

Cloudflare ist vor allem als DNS-Anbieter bekannt und hat kürzlich ein System eingeführt, das KI-Crawler standardmäßig blockiert und Website-Betreibern mehr Kontrolle über den Zugriff auf ihre Inhalte gibt.

Read full article about: Google Deepmind präsentiert Wetter-KI der nächsten Generation

Google Deepmind hat WeatherNext 2 vorgestellt, das laut Unternehmen bei 99,9 Prozent aller meteorologischen Variablen und Vorhersagezeiträume besser abschneidet als das Vorgängermodell. Das KI-System übertrifft die erste WeatherNext-Generation bei Messgrößen wie Temperatur, Wind und Luftfeuchtigkeit über Zeiträume von null bis 15 Tagen. Es generiert laut Google Vorhersagen achtmal schneller und mit einer Auflösung von bis zu einer Stunde. Dafür berechnet das Modell hunderte mögliche Wetterszenarien in weniger als einer Minute auf einer einzelnen TPU – eine Aufgabe, für die herkömmliche physikbasierte Systeme auf Supercomputern Stunden benötigen würden.

Das Modell nutzt eine neue Technik namens Functional Generative Network, die Störsignale in die Architektur einbaut, um physikalisch realistische Vorhersagen zu gewährleisten. WeatherNext ist bereits in die Google-Suche, Gemini, Pixel Weather und die Weather-API integriert, Google Maps  soll folgen.

Deepmind forscht bereits seit Jahren intensiv daran, durch Künstliche Intelligenz genauere Wettervorhersagen zu erzielen. Im Dezember 2024 stellte das Forschungslabor dazu GenCast vor, ein KI-Modell auf Basis von Diffusionstechnologie.

KI-Modell DeepEyesV2 nutzt Werkzeuge statt Wissen - und schlägt größere Konkurrenz

DeepEyesV2 ist ein multimodales KI-Modell, das Bilder analysiert, Code ausführt und das Web durchsucht. Statt mit purem Wissen schlägt DeepEyesV2 größere Modelle mit intelligenter Werkzeugnutzung. Das Modell ist unter der Apache-2.0-Lizenz nutzbar.