Luma hat sein hervorragendes Bildmodell Uni-1.1 jetzt in die API gebracht. Das KI-Labor aus dem Silicon Valley stellt Entwicklern damit eine REST-Schnittstelle zur Verfügung, die Bildgenerierung und Bildbearbeitung per Text ermöglicht. Bei der KI-Modell-Vergleichsplattform Arena liegt Uni-1.1 derzeit in beiden Disziplinen auf Platz 7–8, knapp hinter den OpenAI- und Google-Bildmodellen sowie Grok Imagine.
Die API bietet zwei Varianten: "uni-1" ab 0,0404 Dollar pro Bild und "uni-1-max" ab 0,10 Dollar pro Bild in höherer Qualität. Beide liefern Bilder in 2048-Pixel-Auflösung. Entwickler können bis zu neun Referenzbilder einbinden, jedes zusätzliche kostet 0,003 Dollar. Auch hier liegt das Modell auf Augenhöhe mit Google und OpenAI. Details gibt es in der Dokumentation. Verfügbarkeit über andere Plattformen wie AWS ist in Planung, ein Datum gibt’s bisher nicht.
Von der Webversion von Uni-1.1 war ich begeistert, hier werkeln allerdings noch agentische Prozesse im Hintergrund. Laut Luma bietet die API dieselbe Text- und Bildsuche im Web sowie eingebautes Denken und Schlussfolgern wie der Agent. Der Agent ist laut Luma primär für iterative Arbeitsabläufe praktischer, etwa "mache 20 Varianten dieses Bildes". Solche Abläufe lassen sich laut Luma aber auch um die API herum bauen.
