Anzeige
Skip to content
Read full article about: Nvidias DreamDojo ist ein Open-Source-Weltmodell für das Robotertraining

Nvidias KI-Forschungsteam hat DreamDojo vorgestellt, ein Open-Source-Weltmodell für Robotik. Es nimmt Motorsteuerungsbefehle entgegen und erzeugt daraus eine simulierte Zukunft in Bildern, ohne klassische 3D-Engine oder manuell erstellte Physik. Jim Fan, Director of AI bei NVIDIA, spricht von "Simulation 2.0".

Das Kernproblem: Roboter in der echten Welt zu trainieren, ist langsam, teuer und riskant – begrenzt durch Zeit, Verschleiß, Sicherheit und ständiges Zurücksetzen. DreamDojo soll das lösen, indem es auf 44.000 Stunden menschlicher Ego-Perspektiv-Videos vortrainiert wurde. Sogenannte "latente Aktionen" übersetzen dabei menschliche Bewegungen in ein hardwareunabhängiges Format. So kann das Modell aus menschlichen Videos lernen, ohne je einen Roboter gesehen zu haben. In einem zweiten Schritt wird es dann auf die spezifische Mechanik eines konkreten Roboters zugeschnitten.

DreamDojo läuft in Echtzeit mit zehn Bildern pro Sekunde und ermöglicht VR-Fernsteuerung in einer simulierten Umgebung, Bewertung von Roboter-Strategien und vorausschauende Planung direkt im Weltmodell. Laut Jim Fan sind alle Gewichte, Code und Daten frei verfügbar. Details gibt es auf der Projektseite und im Paper. DreamDojo basiert auf Nvidia Cosmos.

KI-Agenten sind laut Anthropic bislang nur im Coding einigermaßen angekommen

KI-Agenten sollen bald den Arbeitsalltag revolutionieren. Anthropics eigene Daten zeigen: Bislang ist das fast nur im Software-Engineering der Fall. Und selbst dort lassen die Nutzer die Agenten längst nicht so autonom arbeiten, wie es technisch möglich wäre.

Read full article about: Anthropic erweitert Claude Code um automatisierte Desktop-Funktionen für Entwickler

Anthropic erweitert Claude Code auf dem Desktop um Funktionen, die den Entwicklungsprozess stärker automatisieren. Die KI kann nun Entwicklungsserver starten und laufende Web-Apps direkt in der Oberfläche anzeigen, Fehler erkennen und selbstständig beheben.

Neu ist auch eine Code-Review-Funktion, die Änderungen prüft und Kommentare direkt in der Diff-Ansicht hinterlässt. Für GitHub-Projekte überwacht Claude Code Pull Requests im Hintergrund, behebt CI-Fehler automatisch und kann PRs nach bestandenen Tests eigenständig zusammenführen. So können Entwickler an neuen Aufgaben arbeiten, während Claude Code offene PRs im Hintergrund fertigstellt. Sitzungen lassen sich zwischen CLI, Desktop, Web und Mobilgerät fortsetzen. Die Updates sind ab sofort verfügbar.

Größte Seed-Finanzierung eines europäischen Start-ups: Langjähriger Deepmind-Forscher David Silver gründet KI-Start-up

Der langjährige Deepmind-Forscher David Silver sammelt eine Milliarde Dollar für sein Londoner KI-Start-up Ineffable Intelligence ein. Er setzt auf Reinforcement Learning in Simulationen und will eine „endlos lernende Superintelligenz“ bauen. Die Seed-Runde wäre die größte in der Geschichte europäischer Start-ups.

Chinas KI-Wettlauf: Alibaba stellt Qwen3.5 als kostenloses Open-Weight-Modell vor

Chinesische KI-Labore setzen ihre Modelloffensive fort – heute ist es Alibabas Qwen3.5, das mit einer hybriden Architektur aus linearer Attention und Mixture-of-Experts bei nur 17 Milliarden aktiven Parametern an die Leistung westlicher Spitzenmodelle heranreichen will. Natürlich als Open Weight.

Read full article about: Anthropic plant eigene Rechenzentren und wirbt dafür Ex-Google-Manager an

Anthropic plant massiv in eigene Rechenzentrumskapazitäten zu investieren und hat dafür erfahrene Ex-Google-Manager angeworben, berichtet The Information. Das KI-Unternehmen diskutiert intern den Aufbau von mindestens 10 Gigawatt Kapazität – Kosten: Hunderte Milliarden Dollar. Da Anthropic als Startup keine starke Bonität hat, braucht es finanzstarke Partner als Absicherung. Google sprang bereits bei einem Rechenzentrum in Louisiana als Bürge ein.

Bisher mietet Anthropic Rechenkapazität bei Cloud-Anbietern, will künftig aber auch eigene Rechenzentren leasen. Dafür wurden Tim Hughes von Stack Infrastructure und Brett Rogers eingestellt, der bei Google sechs Jahre lang Rechenzentren baute. Bereits an Bord ist Winnie Leung mit über 20 Jahren Google-Erfahrung.

Zum Vergleich: OpenAI kündigte im letzten Jahr strategische Allianzen mit Nvidia über mindestens 10 Gigawatt, Broadcom, Oracle über 4,5 Gigawatt und AMD über bis zu 6 Gigawatt an. Ob diese Pläne tatsächlich umgesetzt werden und OpenAI wie Anthropic genug Umsatzwachstum erzielen, um die Rechnungen zu begleichen, bleibt offen. Anthropic konnte zuletzt zumindest ein starkes Umsatzwachstum verzeichnen.

Read full article about: Google Deepmind rüstet Denkmodus "Gemini 3 Deep Think" für komplexe Aufgaben auf

Google Deepmind hat seinen spezialisierten Denkmodus "Gemini 3 Deep Think" aufgerüstet und stellt ihn über die Gemini-App sowie als API über ein Vertex AI-Frühzugangsprogramm bereit. Das Upgrade soll bei komplexen Aufgaben in Wissenschaft, Forschung und Ingenieurwesen helfen. Die Gemini-App steht Google AI Ultra-Abonnenten zur Verfügung, Entwickler und Forscher können sich für das API-Programm anmelden.

Laut Google Deepmind erreicht Deep Think Bestwerte auf mehreren Benchmarks: auf ARC-AGI-2 (einem Test für logisches Denken), auf "Humanity's Last Exam" (schwierige Aufgaben aus Mathematik, Naturwissenschaften und Ingenieurwesen) sowie einen Elo-Wert von 3455 auf der Programmierplattform Codeforces.

Benchmark Deep Think Claude Opus 4.6 GPT-5.2 Gemini 3 Pro Preview
ARC-AGI-2 84.6% 68.8% 52.9% 31.1%
Humanity's Last Exam 48.4% 40.0% 34.5% 37.5%
Codeforces 3,455 2,352 - 2,512

Zudem erzielte das Modell bei den Physik- und Chemie-Olympiaden 2025 Ergebnisse auf Goldmedaillen-Niveau. Beispiele für den Einsatz von Deep Think in der Wissenschaft stehen hier.