Der KI-Bildgenerator Midjourney hat mit V4 eine "völlig neue Codebasis und KI-Architektur" eingeführt. Die generierten Bildern sind detaillierter, konkreter und zum Teil realistischer.
Der KI-Bildgenerator Midjourney hat eine neue Alphaversion seines Algorithmus veröffentlicht. Midjourney-CEO David Holz kündigt im Zuge dessen eine ganze Reihe an Änderungen der V4 an.
Die neue Version verfüge über
- deutlich mehr Wissen etwa über Kreaturen oder Orte,
- sei besser in der Lage, kleine Details richtig zu erkennen
- und könne komplexere Prompts verarbeiten.
- Zudem beherrsche V4 besser Szenen mit mehreren Objekten und Charakteren.
V4 ist eine völlig neue Codebasis und eine völlig neue KI-Architektur. Es ist unser erstes Modell, das auf einem neuen Midjourney-KI-Supercluster trainiert wurde und an dem wir seit über 9 Monaten arbeiten. V4 ist nicht der letzte Schritt, sondern unser erster Schritt, und wir hoffen, dass ihr alle es als den neuen Anfang von etwas Tiefem und Unergründlichem empfindet.
David Holz, CEO Midjourney
Detailliertere und realistischere Bilder: Midjourney will Richtlinien strenger durchsetzen
Midjourney V4 kann nach Angaben von David Holz deutlich realistischere Bilder generieren, was Risiken birgt. Ab sofort würde man die Community-Richtlinien daher viel strikter anwenden. Wer also offensichtlich versucht, die Liste gebannter Wörter in einem Prompt zu umgehen, riskiere schneller einen gesperrten Account.
Generell würde V4 außerdem eine ganz neue Art der Prompt-Formulierung benötigen. Die Remix-Funktion, also die Möglichkeit, generierte Bilder per KI weiter zu bearbeiten, ist für v4 bereits aktiv.
Midjourney V4 unterstützt derzeit nur quadratische Bilder
Während V4 ein Schritt nach vorn ist und in den Augen einiger Nutzer:innen deutlich ansprechendere Ergebnisse liefert, gibt es in der Alphaversion auch noch Einschränkungen. Die wahrscheinlich größte ist die Beschränkung auf ein quadratisches Seitenverhältnis.
Zudem stehen auf der To-do-Liste der Entwickler:innen eine höhere Auflösung, Qualität, Kontrolle des Upscalings und Bildschärfe. Probleme mit Textartefakten und Cropping-Fehler sollen hingegen eliminiert sein.
The quality raises, but woth quality also kitsch factor increases. It's all in the prompts, which should be written differently, as devs state. pic.twitter.com/egOP6nkisc
— Merzmensch Kosmopol (@Merzmensch) November 5, 2022
Weitere Neuerungen bei Midjourney
Kurz nach der Veröffentlichung von V4 wurden bereits die nächsten Neuerungen für Midjourney angekündigt, die vorwiegend die Weboberfläche unter midjourney.com/app betreffen. Im Schnelldurchlauf:
- Bilder können in der Weboberfläche in Sammlungen sortiert werden.
- Collections und hoch bewertete Bilder werden ganz oben im Profil angezeigt.
- Profile können durch Nutzername, Profil- und Headerbilder angepasst werden.
- Breitbildmodus, Kachelvorschau, Bewertungsfilter und benutzerdefinierte Home-Filter in der Weboberfläche hinzugefügt.
- Stapelverarbeitung zum Veröffentlichen/Entfernen und Hinzufügen zu Sammlungen in der Weboberfläche hinzugefügt.
- Anpassung der Größe des Stapeldownloads in der Weboberfläche möglich.