Mehr als ein halbes Jahr nach dem letzten Update gibt es ein neues Midjourney-Modell - aber nicht den angekündigten Versionssprung. Die nächste Aktualisierung soll allerdings schon bald folgen.
Midjourney hat am Dienstag Version 6.1 seines Bildmodells veröffentlicht, wie CEO David Holz wie üblich per Discord-Ankündigung bekanntgab. Die neue Version folgt auf die Ende Dezember erschienene V6 und verspricht kohärente, detailliertere und visuell ansprechendere Ergebnisse. Die vergleichsweise lange Wartezeit auf das neue Modell glänzt aber eher nur mit graduellen Verbesserungen.
25 Prozent schneller bei Standardjobs
Generell bringe V6.1 dem Changelog zufolge eine wesentlich bessere Bildqualität mit weniger Artefakten und verbesserten Texturen mit, wobei Holz Haut und 8-Bit-Pixelart hervorhebt. Die Standard-Bildgenerierung sei 25 Prozent schneller.
Besonders viel Feinschliff ist in bekannte Problemzonen menschlicher Extremitäten wie Armen, Beinen, Hände geflossen, aber auch explizit in die Darstellung von Pflanzen und Tieren. Kleine Bilddetails wie Augen, kleine Gesichter und entfernte Hände sind jetzt detaillierter und genauer.
Etwas genauere Textdarstellung
Das Update führt außerdem neue Upscaler ein. Auch die Textgenauigkeit wurde verbessert, insbesondere beim Zeichnen von Wörtern mit "Anführungszeichen" in Prompts. In einer kurzen Gegenüberstellung zeigte sich V6.1 tendenziell besser, aber weiterhin nicht verlässlich fehlerfrei.
Neuer Parameter für mehr Textur
Der neue Parameter --q 2
braucht zwar 25 Prozent länger für die Bilderzeugung, kann aber auf Kosten der Bildkohärenz mehr Textur hinzufügen. Hier ein Vergleich desselben Prompts ohne und mit dem Zusatz.
Im Juni hat Midjourney erste Funktionen für eine Personalisierung des Modells eingeführt, die es mit V6.1 ausbaut. Das neue Modell habe verbesserte Werte in Sachen Nuancierung, Überraschung und Genauigkeit, wobei Holz nicht genauer erklärt, wie genau sich das in der Benutzung bemerkbar macht. Nutzer:innen können zudem jetzt dank Versionisierung die Personalisierungscodes aus älteren Jobs verwenden.
Wie schwierig die Weiterentwicklung eines KI-Bildmodells manchmal in Worte zu fassen ist, zeigt Holz mit dem letzten Punkt seiner Liste der Änderungen: "Die Dinge sollten durch die Bank 'schöner' aussehen."
In- und Outpainting noch auf V6
Midjourney V6.1 enthält derzeit kein neues Inpainting/Outpainting-Modell, sodass Funktionen wie Zoom, Reframe, Repaint und Vary Region auf das V6.0-Modell zurückgreifen.
Um die Datenerfassung zu maximieren und zukünftige Entwicklungen zu unterstützen, hat es V6.1 zum Standardmodell gemacht. Ältere Modelle lassen sich wie gewohnt über /settings
über den Discord-Bot oder das Einstellungsmenü auf der Website aktivieren.
Während zwischen V5 und V5.1 nur rund zwei Monate vergingen, benötigte Midjourney für dieses Update gut sieben Monate. Ist die Entwicklungskurve bei der Verbesserung von Diffusionsmodellen damit abgeflacht?
Laut Ankündigung im März befand sich V7 noch auf gutem Kurs und hätte im Sommer an den Start gehen sollen. Für diesen Versionssprung haben die Neuerungen aber offenbar nicht gereicht.
V6.2 soll jedoch bereits im Laufe des August erscheinen. Diese Verbesserungen erstellt das Unternehmen auf Grundlage der Daten, die es aus den Erfahrungen der Benutzer:innen mit V6.1 sammelt.