Inhalt
summary Zusammenfassung

Midjourney v5 ist nun verfügbar. Das neue Modell kann wesentlich realistischere und detailliertere Bilder erzeugen, benötigt dafür aber auch genauere Prompt-Angaben.

Anzeige

Das neue Modell wurde auf einem "AI Supercluster" in der Google Cloud trainiert und war etwa fünf Monate in Entwicklung. Es verwendet laut Midjourney eine deutlich veränderte neuronale Architektur und neue ästhetische Techniken. Insbesondere kann das Modell realistischere Bilder und mehr Details erzeugen, die mit höherer Wahrscheinlichkeit richtig sind.

Dies zeigt auch der erste Test: Die gleichen Prompts ohne explizite Vorgabe eines Bildstils führten zu deutlich realistischeren Bildern mit mehr Details. Hier zum Beispiel der Prompt "a tree made of banknotes" im Vergleich, bei dem v4 eine Illustration erzeugt, während v5 eher eine fotorealistische Installation in einem Museum bevorzugt. Das Ergebnis von v5 gibt zudem den beabsichtigten Inhalt des Bildbefehls deutlich umfassender wieder.

Bild: Midjourney v4
Bild: Midjourney v5

Auch Porträts bekannter Personen sehen realistischer aus und weisen weniger Bildfehler auf. Hier der Vergleich zwischen v4 und v5 zum Prompt: "Apple CEO Tim Cook wearing closed VR headset with non-transparent front and Apple logo on it, digital art".

Anzeige
Anzeige
Bild: Midjourney v4
Bild: Midjourney v5

Der Prompt "The grand glazed entrance to a large corporate building, a large gush of green paint spilling out of the front door onto the street" führt in V4 zu einer zwar realistischen, aber dennoch stärker illustrativen Darstellung, während v5 ohne explizite Foto-Vorgabe bereits fotorealistische Bilder generiert.

Bild: Midjourney v4
Bild: Midjourney v5

Bei Händen kann es nach wie vor zu fehlerhaften Darstellungen kommen, insgesamt werden Extremitäten jedoch genauer dargestellt als bei v4.

MJ5 als "Profi-Modus" für realistischere Motive

Der Gründer von Midjourney, David Holz, bezeichnet die Version 5 als "Professional Mode", da das neue Modell im Gegensatz zu seinen Vorgängern weniger auf bestimmte Stile festgelegt ist und eine größere Vielfalt an Bildresultaten liefert.

Es bietet also mehr kreativen Spielraum, der aber auch beherrscht werden muss. Dies kann, so Holz, längere Prompts erfordern, die mehr und explizitere Details zum gewünschten Bild beschreiben, um das gewünschte Ergebnis zu erzielen.

Das aktuelle v5-Modell sei noch eine Alpha-Version, die sich bis zum endgültigen Release noch "signifikant verändern" werde, so Holz. Unter anderem werde es wie die Vorgängermodelle einen einsteigerfreundlichen Default-Stil erhalten. Kreative sollten sich also nicht darauf verlassen, dass der aktuelle v5-Stil für spätere Folgearbeiten zur Verfügung steht.

Empfehlung

Um v5 zu starten, muss in den Discord-Einstellungen von Midjourney auf "MJ v5" umgestellt oder der Parameter "--v 5" an den Prompt angehängt werden. Die Ausgabe erfolgt direkt in der doppelten Auflösung von v4, ein Upscaling ist noch nicht verfügbar.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Midjourney v5 ist da und soll deutlich mehr kreativen Spielraum als sein Vorgängermodell bieten.
  • Im Vergleich zu v4 erzeugt v5 realistischere Bilder mit mehr Details und weniger Fehlern.
  • Die aktuelle v5 befindet sich noch im Alpha-Stadium und wird sich bis zum endgültigen Release noch "signifikant" verändern.
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!