In den "Office Hours" berichtet Midjourney-Gründer und -CEO David Holz höchstpersönlich von aktuellen Projekten und stellt sich Fragen der Community - natürlich über Discord. In der letzten Ausgabe gab es wieder einige spannende Aussagen.
Nach raschem Fortschritt in kurzer Zeit hat die Frequenz, in der Midjourney neue Modelle veröffentlicht, spürbar abgenommen. Zuletzt hat das Start-up im Juli nach langer Wartezeit Version 6.1 herausgebracht, obwohl eigentlich Version 7 im Raum stand und noch vor Sommer erscheinen sollte. Jetzt gibt es ein neues Zeitfenster: In ein bis zwei Monaten soll es wirklich so weit sein.
Acht Bilder auf einmal
Stattdessen konzentrieren sich die Entwickler:innen darauf, die Technologie zugänglicher zu machen und das Tool insgesamt im für den professionellen Einsatz im Alltag nützlicher zu machen. Für viele zu Beginn abschreckend war der Zwang, die Chatplattform Discord zu verwenden. Mittlerweile ist die Weboberfläche für alle Nutzer:innen verfügbar, auch solche, die die Bild-KI nur kostenlos ausprobieren wollen.
Während der im April eingeführte Turbo-Modus die Bildgeneration schon deutlich verschnellerte, soll es bald die Möglichkeit geben, acht Bilder auf einmal zu erstellen. Seit Veröffentlichung der Beta war dies auf vier Bilder pro Durchgang beschränkt, so auch in einigen anderen Bildgeneratoren wie Ideogram.
Bearbeitung externer Bilder
Midjourney verfügt schon seit langer Zeit über In- und Outpainting-Funktionen, mit denen sich Inhalte generierter Bilder verändern oder hinzufügen lassen. Von vielen Nutzer:innen gewünscht ist, dies auch bei eigenen Bildern aus externen Quellen, also etwa Fotos, vornehmen zu können.
Laut Ankündigung in den Office Hours arbeitet Midjourney derzeit an einem Bildbearbeiter. Ob dieser in die bestehende Plattform integriert wird oder ein separates Produkt wird, bleibt abzuwarten. Einen Zeithorizont gab es dazu noch nicht. Bis dahin bleibt für diesen Anwendungsfall wohl Photoshop mit Generative Fill die beste Wahl.
Midjourney will uns in Bilder eintauchen lassen
Nach einem noch größeren Projekt klingt schließlich diese Ankündigung: Midjourney arbeitet angeblich an einem 3D-System, mit dem man quasi in KI-Bilder eintauchen könne. Dafür greife man weder auf eine Polygondarstellung, noch NeRFs, noch Gaussian Splatting zurück, sondern ein neues "NeRF-artiges" Format.
Angeführt werde das Team von einer Person, die eine wichtige Rolle in der Erfindung von NeRFs gespielt habe. Das führt einige zu der Vermutung, dass es sich dabei um Ex-Nvidia-Forscher Alex Evans handele, der seit letztem Jahr Teil von Midjourney ist.
Personalisierung für Niji-Modelle
Außerdem steht Personalisierung weit oben auf der Liste der Funktionen, die Midjourney integriert. Auf Basis vorheriger Bewertungen soll das Tool mehr über die Vorlieben seiner Nutzer:innen herausfinden und individuellere Ergebnisse liefern. Kürzlich hat Midjourney dieses Feature auch für das auf Anime-Charaktere spezialisierte Modell Niji freigeschaltet.
Midjourney scheint sich aktuell eine ganze Menge vorgenommen zu haben. Nach den branchenführenden Ergebnissen in der Bildgeneration will sich das Unternehmen auch der Videogeneration annehmen. Neben Software investiert Midjourney zudem in die Hardwareentwicklung.