Halb-offene KI-Modelle aus China verdrängen die US-Konkurrenz

21. Dezember 2025

Sora prompted by THE DECODER

Im Jahr 2025 hat sich das Verhältnis bei den Downloadzahlen offener KI-Modelle verschoben: Erstmals verzeichnen chinesische Entwickler höhere Abrufzahlen als Anbieter aus den USA.

Laut dem Bericht "Economies of Open Intelligence", der Daten der Plattform Hugging Face auswertet, stammten über 44 Prozent der Downloads populärer neuer Modelle aus China. Vor allem die Modellfamilien Qwen von Alibaba und Deepseek verzeichnen massive Abrufzahlen und lassen US-Konkurrenten wie Meta oder Google hinter sich.

Tabelle mit Rangliste und Balken: China 2,7 Mrd. Downloads (44,2%), USA 1,7 Mrd. (27,9%), User 850,8 Mio. (13,9%), International/Online 439,0 Mio. (7,2%), UK 167,2 Mio. (2,7%), Deutschland 144,7 Mio. (2,4%), Schweiz 30,9 Mio. (0,5%), Frankreich 30,8 Mio. (0,5%), Israel 19,0 Mio. (0,3%), Spanien 8,3 Mio. (0,1%). — Diese Tabelle zeigt die Verteilung der Modellherkunft für die meisten Downloads 2025 im ersten Jahr nach Erstellung. | Bild: EOI

Vom US-Monopol zur chinesischen Dominanz

Der Wandel vollzog sich in nur wenigen Jahren. Noch bis Ende 2022 kontrollierten Google, Meta und OpenAI zusammen bis zu 60 Prozent aller Downloads auf Hugging Face, der wichtigsten Plattform für offene KI-Modelle. Die USA allein kamen auf über 60 Prozent Marktanteil. Modelle wie BERT oder CLIP prägten das Feld, allesamt wichtige US-amerikanische Entwicklungen.

Dann kam Stable Diffusion. Die Veröffentlichung des Bildgenerators Ende 2022 öffnete die Türen für alle. Plötzlich konnten auch kleine Teams und Einzelpersonen eigene Modelle entwickeln und anpassen. Der US-Anteil begann zu schrumpfen, während internationale Entwicklergruppen und Community-Projekte an Bedeutung gewannen.

Gestapeltes Flächendiagramm (100%-Skala) für 2021– — Die USA verlieren seit 2023 deutlich an Gewicht, während Communities, China und internationale Online-Akteure ab 2024 stärker zulegen. | Bild: EOI

2025 erreichte diese Entwicklung einen Wendepunkt. China überholte die USA erstmals. Allein Deepseek und Qwen vereinen 14 Prozent der Downloads in dem Zeitraum auf sich. Die Qwen-Modelle von Alibaba wurden im vergangenen Jahr über 750 Millionen Mal heruntergeladen. Metas Llama-Modelle, die noch 2024 dominierten, kamen dagegen nur auf 500 Millionen Downloads.

Die neue Mittelschicht der KI-Entwicklung

Neben den großen Playern hat sich eine gänzlich neue Entwicklerschicht etabliert. Gruppen wie LM Studio, comfy oder mlx-community entwickeln keine eigenen KI-Modelle von Grund auf. Stattdessen nehmen sie bestehende Modelle und machen sie für normale Nutzer überhaupt erst nutzbar.

Sie komprimieren die riesigen Dateien, passen sie für bestimmte Anwendungen an oder verpacken sie in benutzerfreundliche Software. Diese Zwischenhändler des KI-Marktes machen mittlerweile mehr als 22 Prozent der Downloads aus, mehr als mancher große Konzern.

Größer, multimodaler und undurchsichtiger

Die Modelle selbst haben sich stark entwickelt, mit den Fähigkeiten jedoch auch in ihrer Parameterzahl und Dateigröße, von 827 Millionen Parametern noch 2023 auf 20 Milliarden in diesem Jahr. Statt nur Text zu verstehen, können viele Modelle nun auch Bilder, Videos und Sprache verarbeiten und erzeugen. Video-KIs wie AnimateDiff-Lightning von ByteDance oder die Tools von Stable Diffusion gehören zu den meistgenutzten Modellen.

Sankey-Diagramm: Input-Anteile links: Text 61,62%, Bild+Text 19,68%, Bild 9,20%, Audio 7,43%, weitere Kombinationen <1,1%. Outputs rechts: Text-Encoding 32,50%, Text-Generation 22,01%, Bild-Generation 19,22%, Bild-Encoding 17,84%, Audio-Generation 2,81%, Video-Generation 1,08%, weitere/sonstige Kategorien 2,92% bzw. 1,62% (Bild-Encoding+Text-Encoding). — Als Input überwiegt Text mit 61,62 Prozent, gefolgt von Kombinationen aus Bild und Text. Bei den Outputs liegen Text-Encoding, Text-Generation sowie Bild-Generation und Bild-Encoding vorn, Video- und Audio-Generierung spielen eine kleinere Rolle. | Bild: EOI

Doch bei aller technischer Fortentwicklung gibt es eine problematische Gegenbewegung. Die Transparenz nimmt drastisch ab. Noch 2022 legten fast 80 Prozent der beliebten Modelle offen, mit welchen Daten sie trainiert wurden. 2025 sind es nur noch 39 Prozent.

Immer mehr Modelle sind zwar frei herunterladbar, aber niemand weiß genau, was in ihnen steckt. Echte Open Source, bei der auch die Trainingsdaten nachvollziehbar sind, wird seltener, aber existiert. Stattdessen gibt es immer mehr Modelle mit Nutzungseinschränkungen und Lizenzbedingungen, die man erst akzeptieren muss.

Die Dominanz chinesischer KI-Modelle birgt aber auch politische Risiken. Eine aktuelle Untersuchung des US-Medienwatchdogs NewsGuard zeigt, dass viele China-LLMs in 60 Prozent der Fälle pro-chinesische Falschbehauptungen wiederholen oder nicht korrigieren.

Da diese Technologien neue Inhalte basierend auf ihren Trainingsdaten generieren, sorgen sie so zwangsläufig auch für eine Verbreitung der in den Modellen verankerten Narrative und Wertvorstellungen. Wer chinesische Modelle einsetzt, implementiert damit automatisch auch chinesische Propaganda in die eigenen KI-Systeme.

Natürlich gilt dies auch für andere Medien, die man importiert. Aber der Unterschied ist hier, dass bei generierten Inhalten die Beeinflussung viel kleinteiliger und allgegenwärtiger stattfindet. Einen chinesischen Film oder eine Nachrichtensendung kann man als einzelnes Produkt identifizieren, einordnen oder auch ablehnen. Generative KI hingegen sickert wie Sand in unzählige Alltagsanwendungen ein – vom Kundenservice-Chatbot über die automatische E-Mail-Zusammenfassung bis zum Coding-Assistenten. Die ideologische Prägung verteilt sich unsichtbar auf Millionen kleiner Interaktionen, statt in einem klar abgrenzbaren Medienprodukt gebündelt zu sein.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

KI-News ohne Hype
Von Menschen kuratiert.

Mehr als 20 Prozent Launch-Rabatt.
Lesen ohne Ablenkung – keine Google-Werbebanner.
Zugang zum Kommentarsystem und Austausch mit der Community.
Wöchentlicher KI-Newsletter.
6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
Bis zu 25 % Rabatt auf KI Pro Online-Events.
Zugang zum kompletten Archiv der letzten zehn Jahre.
Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.

The Decoder abonnieren