Anzeige
Skip to content

Midjourney veröffentlicht V8-Testversion: Fünfmal schneller, aber teure Premium-Features

Image description
Midjourney v8 prompted by THE DECODER

Kurz & Knapp

  • Midjourney hat eine frühe Version seines V8-Modells zum Community-Test freigegeben. Die Bildgenerierung soll rund fünfmal schneller ablaufen als bisher, und ein neuer --hd Modus rendert Bilder nativ in 2K-Auflösung.
  • Das Modell soll detaillierten Anweisungen besser folgen, kohärentere Bilder liefern und Text in Bildern zuverlässiger darstellen.
  • Als Diffusion-basiertes Modell hat Midjourney V8 bei der Prompt-Präzision jedoch weiterhin Schwächen gegenüber autoregressiven Modellen.

Midjourney gibt eine frühe Version seines neuen V8-Modells zum Community-Test frei. Die Bildgenerierung soll deutlich schneller und detaillierter sein, doch einige Features kosten das Vierfache.

Midjourney hat eine frühe Version seines V8-Modells auf der Alpha-Website zum Testen freigegeben. Das Unternehmen ruft die Community explizit dazu auf, das Modell zu erkunden und Feedback zu liefern. Laut der Ankündigung handelt es sich um ein grundlegend neues Modell mit eigenen Stärken und Schwächen, das möglicherweise gänzlich neue Prompting-Stile erfordert.

Die Bildgenerierung soll laut Midjourney rund fünfmal schneller ablaufen als bisher. Dazu kommen ein neuer --hd Modus, der Bilder nativ in 2K-Auflösung rendert, sowie ein --q 4 Modus für zusätzliche Bildkohärenz. V8 unterstützt zum Start mehrere Seitenverhältnisse und Parameter wie --chaos, --weird, --exp und --raw. Bestehende V7-Personalisierungsprofile, Moodboards und Style References (srefs) sollen rückwärtskompatibel funktionieren.

V8 soll laut Midjourney deutlich besser darin sein, detaillierten Anweisungen zu folgen. Das Verständnis individueller Ästhetik durch Personalisierung, Style References und Moodboards sei ebenfalls spürbar verbessert, die generierten Bilder kohärenter und detailreicher. Auch das Textrendering, also die Darstellung von Text innerhalb generierter Bilder, funktioniere zuverlässiger als in früheren Versionen, sofern der gewünschte Text im Prompt in Anführungszeichen gesetzt werde.

Anzeige
DEC_D_Incontent-1

Reines Diffusionsmodell stößt bei komplexen Prompts an Grenzen

Als reines Diffusionsmodell hat Midjourney allerdings weiterhin einen strukturellen Nachteil gegenüber Konkurrenten, die autoregressive Komponenten in ihre Bildgenerierungs-Pipelines integriert haben. Modelle wie Googles Nano Banana und OpenAIs GPT Image 1.5 nutzen solche hybriden Architekturen, um die Prompt-Genauigkeit zu steigern. Schon bei älteren Midjourney-Modellen war der Unterschied im Vergleich deutlich sichtbar.

Erste Tests deuten darauf hin, dass V8 diese Lücke nicht schließen wird, auch wenn ein abschließendes Urteil noch verfrüht wäre. In einem informellen Benchmark mit einem komplexen Astronauten-Prompt, bei dem ein abstraktes Konzept umgesetzt werden musste, nämlich ein Pferd, das auf einem Astronauten reitet und nicht umgekehrt, schneidet Midjourney V8 deutlich schlechter ab als beide autoregressiven Modelle. Selbst der direktere Konkurrent Flux erledigte die Aufgabe etwas besser. Je mehr Bildgeneratoren auf gemischte Architekturen setzen, desto schwieriger dürfte es für Midjourneys reine Diffusionsstrategie werden, Nutzer zu überzeugen, die auf präzise Prompt-Kontrolle angewiesen sind.

A hyper-realistic DSLR photo. A monkey holding a pink banana is sitting on a tiger in the foreground. In the background, a HORSE is RIDING AN ASTRONAUT. The astronaut is underneath like a living “spacesuit horse saddle,” and the HORSE is clearly on top, in control, as the rider. Make it 100% unambiguous: the HORSE is the rider and the ASTRONAUT is being ridden, NOT the other way around. High-resolution, sharp focus, realistic lighting.

MJV8 Drafts
NBPro prompted by THE DECODER / Bestes Bild aus zwei Generierungen

Laut Midjourney ist die Standard-Ästhetik von V8 bisher nicht fertig. Für Nutzer, die einen fotorealistischen oder kontrollierteren Look anstreben, empfiehlt das Unternehmen, direkt den --raw Modus zu verwenden oder auf Moodboards und Style References zurückzugreifen. Wer die Personalisierung hochdrehe, etwa auf --stylize 1000, könne das Modell derzeit am besten ausreizen. Generell soll V8 vor allem dann glänzen, wenn Nutzer die Stilisierungssysteme intensiv einsetzen und längere, spezifischere Prompts formulieren.

Anzeige
DEC_D_Incontent-2

Höhere Kosten für Premium-Features, kein Relax-Modus

Die Preisstruktur von V8 dürfte für manche Nutzer ein Dämpfer sein. Jobs mit --hd, --q 4, Style References oder Moodboards sind laut Midjourney derzeit viermal langsamer als reguläre Jobs und kosten entsprechend das Vierfache. Der bei vielen Nutzern beliebte Relax-Modus, der langsamere aber kostenlose Generierungen ermöglicht, wird zum Start nicht unterstützt. Midjourney arbeite nach eigenen Angaben an einem neuen Server-Cluster für Relax sowie an günstigeren Render-Modi.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Quelle: Midjourney