KI in der Praxis

KI-Bilder: Midjourney v5 ist da - das ist neu

Matthias Bastian

Midjourney prompted by THE DECODER

Midjourney v5 ist nun verfügbar. Das neue Modell kann wesentlich realistischere und detailliertere Bilder erzeugen, benötigt dafür aber auch genauere Prompt-Angaben.

Das neue Modell wurde auf einem "AI Supercluster" in der Google Cloud trainiert und war etwa fünf Monate in Entwicklung. Es verwendet laut Midjourney eine deutlich veränderte neuronale Architektur und neue ästhetische Techniken. Insbesondere kann das Modell realistischere Bilder und mehr Details erzeugen, die mit höherer Wahrscheinlichkeit richtig sind.

Dies zeigt auch der erste Test: Die gleichen Prompts ohne explizite Vorgabe eines Bildstils führten zu deutlich realistischeren Bildern mit mehr Details. Hier zum Beispiel der Prompt "a tree made of banknotes" im Vergleich, bei dem v4 eine Illustration erzeugt, während v5 eher eine fotorealistische Installation in einem Museum bevorzugt. Das Ergebnis von v5 gibt zudem den beabsichtigten Inhalt des Bildbefehls deutlich umfassender wieder.

Bild: Midjourney v4
Bild: Midjourney v5

Auch Porträts bekannter Personen sehen realistischer aus und weisen weniger Bildfehler auf. Hier der Vergleich zwischen v4 und v5 zum Prompt: "Apple CEO Tim Cook wearing closed VR headset with non-transparent front and Apple logo on it, digital art".

Bild: Midjourney v4
Bild: Midjourney v5

Der Prompt "The grand glazed entrance to a large corporate building, a large gush of green paint spilling out of the front door onto the street" führt in V4 zu einer zwar realistischen, aber dennoch stärker illustrativen Darstellung, während v5 ohne explizite Foto-Vorgabe bereits fotorealistische Bilder generiert.

Bild: Midjourney v4
Bild: Midjourney v5

Bei Händen kann es nach wie vor zu fehlerhaften Darstellungen kommen, insgesamt werden Extremitäten jedoch genauer dargestellt als bei v4.

MJ5 als "Profi-Modus" für realistischere Motive

Der Gründer von Midjourney, David Holz, bezeichnet die Version 5 als "Professional Mode", da das neue Modell im Gegensatz zu seinen Vorgängern weniger auf bestimmte Stile festgelegt ist und eine größere Vielfalt an Bildresultaten liefert.

Es bietet also mehr kreativen Spielraum, der aber auch beherrscht werden muss. Dies kann, so Holz, längere Prompts erfordern, die mehr und explizitere Details zum gewünschten Bild beschreiben, um das gewünschte Ergebnis zu erzielen.

Das aktuelle v5-Modell sei noch eine Alpha-Version, die sich bis zum endgültigen Release noch "signifikant verändern" werde, so Holz. Unter anderem werde es wie die Vorgängermodelle einen einsteigerfreundlichen Default-Stil erhalten. Kreative sollten sich also nicht darauf verlassen, dass der aktuelle v5-Stil für spätere Folgearbeiten zur Verfügung steht.

Um v5 zu starten, muss in den Discord-Einstellungen von Midjourney auf "MJ v5" umgestellt oder der Parameter "--v 5" an den Prompt angehängt werden. Die Ausgabe erfolgt direkt in der doppelten Auflösung von v4, ein Upscaling ist noch nicht verfügbar.