Inhalt
summary Zusammenfassung
DEEP MINDS Podcast
Podcast über Künstliche Intelligenz und Wissenschaft
KI bei der Bundeswehr und der BWI | DEEP MINDS #16
Update
  • Midjourney-Gründer David Holz gibt bekannt, dass v5 diese Woche startet.
  • Zuvor gibt es eine letzte Rating-Session: Alle zahlenden Kund:innen können sich daran beteiligen (siehe unten).
  • Midjourney hat zudem Google Cloud als Partner für das Training und die Ausspielung der eigenen KI-Modelle ausgewählt. Für das Training nutzt Midjourney Googles v4 TPUs mit Deepminds JAX, die Inferenz läuft über "große GPU-Cluster".

Von allen Bildgeneratoren auf dem Markt bietet Midjourney den besten Kompromiss zwischen Zugänglichkeit und Ergebnis. Mit der bald erscheinenden Version 5 wird die generative KI noch einen Schritt weiter gehen. Erste Testbilder sind vielversprechend.

Schon der Sprung von Midjourney v3 zu v4 war qualitativ gigantisch: Die Bild-KI generierte ansprechendere Bilder, die deutlich besser zu den eingegebenen Prompts passten. Derzeit testet Midjourney den neuesten Algorithmus, v5, der in Kürze veröffentlicht werden soll.

Die Entwicklung von v5 ist jedoch noch nicht abgeschlossen: Midjourney sammelt menschliches Feedback durch die Bewertung von Bildern, die mit v5 generiert wurden. Aus diesem Prozess stammen die Motive, die derzeit im Internet kursieren.

Da die Ergebnisse dieses Feedbacks die Entwicklung des Modells beeinflussen, sind die derzeit kursierenden v5-Bilder laut Midjourney noch nicht repräsentativ für die zu veröffentlichende v5-Version. Die Bewertungen und die daraus resultierende Datenqualität seien für die endgültige Version "sehr wichtig".

Anzeige
Anzeige

Bereits bei v4 hat Midjourney auf einen Feedback-Prozess gesetzt, der laut des Start-ups die Qualität der finalen v4-Ausgabe weiter verbessert hat.

Ein Entwickler von Midjourney vergleicht v5 mit dem "Schiff des Theseus": Jede Komponente sei ab einem bestimmten Punkt ausgetauscht, aber keine sei von Grund auf neu entwickelt worden.

Midjourney v5 könnte detaillierter und realistischer werden - auch bei Händen

Die v5-Testbilder zeichnen sich durch einen höheren Detailgrad und eine größere Genauigkeit aus, insbesondere bei fotorealistischen Bildern. Laut Midjourney bieten die mit v5 generierten Bilder grundsätzlich eine höhere Auflösung (1024 x 1024) und können eine größere stilistische Bandbreite abbilden. Erste fotorealistische Bilder zeigen die höhere Detaildichte.

Ein großes Problem bei Midjourney und Co. ist die genaue Darstellung der Hände und Finger. Meist sind zu viele oder zu wenige Finger an der Hand, die zudem noch seltsam gekrümmt oder verdreht sind. Ein Fehler, der so häufig vorkommt, dass KI-Kunstkritiker:innen eine verkrüppelte Hand zum Symbol ihrer Gegenbewegung gemacht haben. Wie sehen die Hände in Midjourney v5 aus?

Empfehlung

Die Defekte an Händen und Füßen sind im Preview-Material nicht vollständig beseitigt. Auf einer Reihe von Bildern sind immer noch die charakteristischen mutierten Extremitäten zu sehen. Aber es scheint Fortschritte zu geben, und womöglich ist die finale v5-Version fehlerfrei.

Bezahlende Kund:innen von Midjourney können hier an der Rating Party teilnehmen und sich weitere v5-Bilder ansehen. Bis zum Alpha-Release könnte es schnell gehen: Zwischen der Rating Party für v4 und dem Alpha-Release lagen etwa zwei Wochen.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Midjourney ist der benutzerfreundlichste KI-Bildgenerator auf dem Markt.
  • Bereits von v3 zu v4 gab es einen enormen Qualitätssprung. Nun steht v5 vor der Tür.
  • Erste Alpha-Bilder zeigen signifikante Verbesserungen, vor allem im Detailgrad bei fotorealistischen Bildern - und bei Händen. 🖖
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!