Alibaba hat Qwen-Image-2512 veröffentlicht, ein Update seines Text-zu-Bild-Modells. Das Modell erzeugt laut Alibaba realistischere Bilder von Menschen, mit mehr Gesichtsdetails und weniger künstlichem Aussehen.

Zusätzlich verbessert sich die Darstellung von Text in Bildern, etwa bei Infografiken oder Präsentationen. Auch Landschaften, Tierfell und andere natürliche Elemente werden feiner dargestellt.

In mehr als 10 000 Blindtests auf der Alibaba-Plattform AI Arena erreichte Qwen-Image-2512 den vierten Platz und ist damit laut Alibaba das stärkste Open-Source-Modell in diesem Bereich. Es konkurriert mit offenen Modellen wie HunyuanImage-3.0, Z-image oder Flux.2.
Qwen-Image-2512 ist auf Hugging Face und ModelScope verfügbar und kann über Qwen Chat getestet werden. Weitere Informationen bieten der Tech Report und der Blog.
