Midjourney testet aktuell eine Alpha-Version seines Bildgenerierungsmodells V7. Die neue Version soll bessere Bildqualität und einen extrem schnellen Entwurfsmodus.
Midjourney hat eine Alpha-Version seines neuen Bildgenerierungsmodells V7 veröffentlicht. Das Modell soll laut dem Unternehmen deutlich besser mit Text- und Bildprompts umgehen. Texturen, Körper, Hände und Objekte aller Art seien kohärenter und detaillierter dargestellt.
Zum ersten Mal ist bei Midjourney die so genannte Modellpersonalisierung standardmäßig aktiviert. Die Benutzer müssen diese Funktion jedoch erst freischalten. Dazu muss man sich durch 200 Bildpaare klicken und aus zweien das Bevorzugte auswählen. Erst dann können mit v7 Bilder generiert werden.
Ziel der Personalisierung sei es, besser zu verstehen, was einzelne Nutzer als ästhetisch empfinden und wie sie Inhalte interpretieren. Bei der Bewertung der Bilder wird der Kontext des Prompts allerdings nicht berücksichtigt. Bei manchen Bildaufgaben kann es sein, dass man eine Illustration vorzieht, bei anderen ein Foto.
Entwurfsmodus soll schnelle Bilditerationen ermöglichen
Mit dem neuen "Draft Mode" führt Midjourney einen besonders schnellen und günstigen Bildmodus ein. Bilder werden darin zehnmal schneller erzeugt als bisher und kosten nur die Hälfte eines normalen V6-Jobs. Die Qualität ist entsprechend niedriger, aber laut Midjourney konsistent im Verhalten und Aussehen – was ideal sein soll für schnelle Ideenfindung.
Wird ein Entwurfsbild erzeugt, können Nutzer es bei Gefallen mit einem Klick in höherer Qualität neu rendern oder Varianten davon erstellen. Der Modus lässt sich auch explizit per --draft
-Parameter ansprechen. Der Draft-Modus funktioniert nur mit v7.
Video: Midjourney
Auf der Web-Oberfläche aktiviert der Draft-Modus zusätzlich einen sogenannten "Conversational Mode". Nutzer können hier über ein Mikrofon Sprachbefehle geben – etwa, um ein Tier auszutauschen, die Tageszeit zu ändern oder andere schnelle Bildanpassungen vorzunehmen. Die Prompts werden dabei automatisch angepasst und ein neuer Bildjob gestartet.
Zwei Modi und neue Funktionen in Aussicht
V7 startet in den Modi Turbo und Relax. Turbo-Jobs kosten doppelt so viel wie normale V6-Jobs, während Draft-Jobs nur die Hälfte kosten. Der Standardmodus für V7 ist laut Midjourney noch in Entwicklung und soll bald folgen.
Während Kernfunktionen wie Moodboards oder SREF bereits mit V7 kompatibel sind, greifen andere Funktionen wie Upscaling, Bildbearbeitung und Retexturierung derzeit noch auf die V6-Modelle zurück. Eine Aktualisierung für V7 ist angekündigt.
In den kommenden zwei Monaten will Midjourney im Zwei-Wochen-Rhythmus neue Funktionen veröffentlichen. Das wichtigste geplante Feature ist ein Referenzsystem für Charaktere und Objekte. Zudem soll die Community über ein Ranking-Verfahren bei der Priorisierung weiterer Entwicklungen mitbestimmen.