Hugging Face startet mit HuggingChat Omni ein neues Routing-System, das automatisch aus über 100 Open-Source-Modellen das passende Modell für eine Nutzeranfrage auswählt. Ziel ist es, je nach Aufgabe das günstigste, schnellste oder passendste Modell dynamisch zu nutzen, ähnlich dem neuen GPT-5-Router. Zum Einsatz kommen unter anderem gpt-oss, qwen, deepseek, kimi und smolLM.
Bild: Hugging Face
Hugging-Face-Mitgründer Clément Delangue sagt, dass HuggingChat Omni erst der Anfang sei – auf Hugging Face gebe es bereits mehr als zwei Millionen offene Modelle, nicht nur für Text, sondern auch für Bild, Audio, Video, Biologie, Chemie, Zeitreihen und mehr.
Grundlage dafür ist Arch-Router-1.5B von Katanemo, ein kompaktes Modell mit 1,5 Milliarden Parametern, das Anfragen nach Themen und Aktionen klassifiziert. Laut eigener Aussage übertrifft Arch-Router bei der Abstimmung auf menschliche Vorlieben andere Modelle und ist Open Source verfügbar. Weitere Details stehen in der begleitenden Forschungsarbeit auf arXiv.
OpenAI stellt fest, dass Respekt eine Sache ist. Nutzer haben in Sora respektlose Darstellungen von Martin Luther King Jr. erzeugt, darunter etwa ein Video, in dem er affenlaute von sich gebend an einem Rednerpult zu sehen ist. Der Nachlass von King forderte entsprechend ein Verbot solcher Inhalte.
OpenAI hat daraufhin die Generierung von Kings Abbild „pausiert“ und erklärt, es gebe zwar starke Interessen an freier Meinungsäußerung bei Darstellungen historischer Figuren, aber öffentliche Personen und ihre Familien sollten letztlich selbst entscheiden, wie ihr Bild verwendet wird. Die Regeln für Deepfakes – in Sora „Cameo“ genannt – historischer Persönlichkeiten sollen nun überarbeitet werden. Künftig können Angehörige oder autorisierte Organisationen verlangen, dass bestimmte Personen nicht mehr generiert werden.
OpenAI erwartet durch die Co-Entwicklung eigener Chips mit Broadcom 20 bis 30 Prozent Kostenersparnis gegenüber Nvidia-Hardware.
Dies berichtet Bloomberg unter Berufung auf eine mit den Überlegungen des Unternehmens vertraute Person. Die Chips sollen ab Ende 2026 zum Einsatz kommen und sind Teil eines Projekts im Wert von mehreren zehn Milliarden Dollar. Von den typischen 50 Milliarden Dollar, die OpenAI für den Bau eines 1-Gigawatt-Rechenzentrums veranschlagt, entfallen etwa 35 Milliarden auf fortgeschrittene Chips – hier setzt die Kostensenkung an.
Doch das Vorhaben birgt erhebliche Risiken: Die Entwicklung maßgeschneiderter Chips erfordert Milliarden-Investitionen, spezialisierte Expertise und mehrere Iterationen. Zudem droht bei schnell wechselnden KI-Techniken rasche Obsoleszenz. "Es gibt eine steile Lernkurve", sagt Halbleiter-Analyst Cody Acree von Benchmark.
Manus stellt mit Version 1.5 sein bisher leistungsfähigstes KI-Agentensystem vor. Die neue Architektur senkt die Bearbeitungszeit von Aufgaben von 15 auf 4 Minuten und steigert laut internen Tests die Ergebnisqualität um 15 Prozent. Das agentische System kann jetzt komplette Webanwendungen inklusive Backend, Nutzerverwaltung und Datenbank direkt in der Plattform erstellen, testen und verbessern. Unterstützt wird auch bei Recherche, Bildgenerierung und Analyse.
OpenAI hat zwei Neuerungen in ChatGPT und für Sora. ChatGPT kann nun automatisch gespeicherte Erinnerungen verwalten, sodass keine manuelle Löschung bei vollem Speicher mehr nötig ist. In den Einstellungen lassen sich Erinnerungen nach Aktualität sortieren, durchsuchen und bei Bedarf neu priorisieren. Die Funktion wird ab sofort weltweit für Plus- und Pro-Nutzer auf der Web-Version ausgerollt.
Für das Video-KI-Modell Sora gibt es ebenfalls Updates: Pro-Nutzer können jetzt Storyboards direkt im Web nutzen. Zudem lassen sich Videos jetzt auf der App und im Web für alle Nutzer auf bis zu 15 Sekunden verlängern, Pro-Nutzer können im Web Videos mit bis zu 25 Sekunden Länge erstellen.
Claude von Anthropic lässt sich nun mit Microsoft 365 verbinden und kann Inhalte aus Outlook, SharePoint, OneDrive und Teams nutzen. So lassen sich E-Mails, Kalender und Dokumente direkt in Gesprächen einbeziehen.
Zusätzlich startet Anthropic eine zentrale Suche über Unternehmensdaten hinweg – etwa für HR-Dokumente oder Teamrichtlinien. Die Funktionen sind für Claude-Team- und Enterprise-Kunden verfügbar, müssen aber von Admins freigeschaltet werden.
Die Ankündigung folgt kurz nach Microsofts Copilot-Integration in Windows – ein Zeichen dafür, wie eng der Wettlauf um KI-Plattformen mit dem digitalen Arbeitsplatz verknüpft ist.
Laut Henry Daubrez, Creative Director bei Google Labs und Flow by Google, hat Probleme mit dem KI-Hype, und findet deutliche Worte: Das gerade veröffentlichte Veo 3.1 sei lediglich ein kleines Update und werde durch überzogene Erwartungen falsch bewertet, obwohl die Neuerungen wie Bild-zu-Bild-Animationen wichtig fürs kreative Arbeiten seien.
„Das größere Problem ist, dass die enormen finanziellen Interessen rund um KI Zeitpläne in Marketinglärm verwandeln – Gerüchte werden so aufgeblasen, dass jedes kleine Update wie ein großer Umbruch wirkt.“