Hugging Face startet mit HuggingChat Omni ein neues Routing-System, das automatisch aus über 100 Open-Source-Modellen das passende Modell für eine Nutzeranfrage auswählt. Ziel ist es, je nach Aufgabe das günstigste, schnellste oder passendste Modell dynamisch zu nutzen, ähnlich dem neuen GPT-5-Router. Zum Einsatz kommen unter anderem gpt-oss, qwen, deepseek, kimi und smolLM.
Hugging-Face-Mitgründer Clément Delangue sagt, dass HuggingChat Omni erst der Anfang sei – auf Hugging Face gebe es bereits mehr als zwei Millionen offene Modelle, nicht nur für Text, sondern auch für Bild, Audio, Video, Biologie, Chemie, Zeitreihen und mehr.
Grundlage dafür ist Arch-Router-1.5B von Katanemo, ein kompaktes Modell mit 1,5 Milliarden Parametern, das Anfragen nach Themen und Aktionen klassifiziert. Laut eigener Aussage übertrifft Arch-Router bei der Abstimmung auf menschliche Vorlieben andere Modelle und ist Open Source verfügbar. Weitere Details stehen in der begleitenden Forschungsarbeit auf arXiv.