Inhalt
newsletter Newsletter
DEEP MINDS Podcast
Podcast über Künstliche Intelligenz und Wissenschaft
KI bei der Bundeswehr und der BWI | DEEP MINDS #16

Der KI-Bildgenerator Midjourney hat mit V4 eine "völlig neue Codebasis und KI-Architektur" eingeführt. Die generierten Bildern sind detaillierter, konkreter und zum Teil realistischer.

Der KI-Bildgenerator Midjourney hat eine neue Alphaversion seines Algorithmus veröffentlicht. Midjourney-CEO David Holz kündigt im Zuge dessen eine ganze Reihe an Änderungen der V4 an.

Die neue Version verfüge über

  • deutlich mehr Wissen etwa über Kreaturen oder Orte,
  • sei besser in der Lage, kleine Details richtig zu erkennen
  • und könne komplexere Prompts verarbeiten.
  • Zudem beherrsche V4 besser Szenen mit mehreren Objekten und Charakteren.

V4 ist eine völlig neue Codebasis und eine völlig neue KI-Architektur. Es ist unser erstes Modell, das auf einem neuen Midjourney-KI-Supercluster trainiert wurde und an dem wir seit über 9 Monaten arbeiten. V4 ist nicht der letzte Schritt, sondern unser erster Schritt, und wir hoffen, dass ihr alle es als den neuen Anfang von etwas Tiefem und Unergründlichem empfindet.

David Holz, CEO Midjourney

Detailliertere und realistischere Bilder: Midjourney will Richtlinien strenger durchsetzen

Midjourney V4 kann nach Angaben von David Holz deutlich realistischere Bilder generieren, was Risiken birgt. Ab sofort würde man die Community-Richtlinien daher viel strikter anwenden. Wer also offensichtlich versucht, die Liste gebannter Wörter in einem Prompt zu umgehen, riskiere schneller einen gesperrten Account.

Anzeige
Anzeige

Generell würde V4 außerdem eine ganz neue Art der Prompt-Formulierung benötigen. Die Remix-Funktion, also die Möglichkeit, generierte Bilder per KI weiter zu bearbeiten, ist für v4 bereits aktiv.

Midjourney V4 unterstützt derzeit nur quadratische Bilder

Während V4 ein Schritt nach vorn ist und in den Augen einiger Nutzer:innen deutlich ansprechendere Ergebnisse liefert, gibt es in der Alphaversion auch noch Einschränkungen. Die wahrscheinlich größte ist die Beschränkung auf ein quadratisches Seitenverhältnis.

Zudem stehen auf der To-do-Liste der Entwickler:innen eine höhere Auflösung, Qualität, Kontrolle des Upscalings und Bildschärfe. Probleme mit Textartefakten und Cropping-Fehler sollen hingegen eliminiert sein.

Weitere Neuerungen bei Midjourney

Kurz nach der Veröffentlichung von V4 wurden bereits die nächsten Neuerungen für Midjourney angekündigt, die vorwiegend die Weboberfläche unter midjourney.com/app betreffen. Im Schnelldurchlauf:

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
  • Bilder können in der Weboberfläche in Sammlungen sortiert werden.
  • Collections und hoch bewertete Bilder werden ganz oben im Profil angezeigt.
  • Profile können durch Nutzername, Profil- und Headerbilder angepasst werden.
  • Breitbildmodus, Kachelvorschau, Bewertungsfilter und benutzerdefinierte Home-Filter in der Weboberfläche hinzugefügt.
  • Stapelverarbeitung zum Veröffentlichen/Entfernen und Hinzufügen zu Sammlungen in der Weboberfläche hinzugefügt.
  • Anpassung der Größe des Stapeldownloads in der Weboberfläche möglich.
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Jonathan ist Technikjournalist und beschäftigt sich stark mit Consumer Electronics. Er erklärt seinen Mitmenschen, wie KI bereits heute nutzbar ist und wie sie im Alltag unterstützen kann.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!