Inhalt
summary Zusammenfassung

Ein Forscherteam hat ein KI-System vorgestellt, das automatisch Manga-Comics erstellen kann. Das System namens DiffSensei kann Charaktere und Layouts präzise steuern und passt die Figuren dynamisch an die Geschichte an.

Anzeige

Wissenschaftler der Peking University, des Shanghai AI Laboratory und der Nanyang Technological University haben ein KI-System entwickelt, das automatisch Manga-Comics generieren kann. Dafür kombiniert das System "DiffSensei" Diffusions-Modelle mit großen Sprachmodellen, um Charaktere und Layouts präzise zu steuern.

Die Forscher demonstrieren die Fähigkeiten des Systems auch mit einer fiktiven Geschichte über die KI-Pioniere Geoffrey Hinton, Yann LeCun und Yoshua Bengio. Die Geschichte erzählt, wie die drei Wissenschaftler versuchen, ein KI-Modell zu entwickeln, das die Transformer-Architektur übertrifft. Nach vielen Rückschlägen und Selbstzweifeln gelingt ihnen der Durchbruch - Jahre später werden sie dafür mit dem Nobelpreis ausgezeichnet.

Bild: Wu et al.
Bild: Wu et al.

DiffSensei generiert personalisierte Mangas

DiffSensei nutzt multimodale Modelle und Methoden wie LoRAs, um Charaktere identisch in einzelnen Bildern zu halten. Das Team generiert dann in einem dreistufigen Prozess Layouts, Zeichnungen mit festgelegten Charakteren und Dialoge.

Anzeige
Anzeige
Bild: Wu et al.

Für das Training des Systems haben die Forscher zudem einen neuen Datensatz namens MangaZero erstellt. Dieser umfasst 43.264 Manga-Seiten und 427.147 einzelne Panels aus 48 verschiedenen Manga-Serien.

Die Panels wurden mit detaillierten Annotationen versehen, die unter anderem die Position der Charaktere und Dialoge markieren. Diese Informationen sind laut dem Team entscheidend für das Training des Systems.

Forscher sehen Potenzial in der Manga-Produktion

Die Forscher räumen in ihrer Studie auch Schwächen des Systems ein. Bei undeutlichen Eingabebildern der Charaktere hat das System Probleme, deren Erscheinungsbild korrekt zu erfassen. Außerdem kommt es bei mehreren ähnlich aussehenden Figuren manchmal zu einer unerwünschten "Verschmelzung" der Charaktere.

Ohne Charakter-Eingabebilder hat das System zudem Schwierigkeiten, den Manga-Stil präzise zu kontrollieren. Die generierten Bilder tendieren dann zu einem eher generischen Manga-Look.

Das System könnte laut den Forschern dennoch in Zukunft die Manga-Produktion unterstützen und den Arbeitsablauf optimieren. Die Technologie ermögliche es Künstlern, Verlagen und Kreativen, personalisierte Manga-Geschichten mit detaillierter Kontrolle über Charaktere und Layouts zu erstellen.

Empfehlung

Mehr Beispiele und den Datensatz gibt es auf der DiffSensei-Projektseite.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Ein Forscherteam der Peking University, des Shanghai AI Laboratory und der Nanyang Technological University hat ein KI-System namens DiffSensei entwickelt, das automatisch Manga-Comics generieren kann.
  • DiffSensei nutzt verschiedene Modelle und Methoden wie multimodale Modelle und LoRAs, um Charaktere, Layouts und Dialoge präzise zu steuern. Für das Training wurde der neue Datensatz MangaZero mit über 43.000 annotierten Manga-Seiten erstellt.
  • Trotz einiger Schwächen bei undeutlichen Eingabebildern und ähnlichen Charakteren sehen die Forscher Potenzial für DiffSensei, um in Zukunft die Manga-Produktion zu unterstützen und Künstlern, Verlagen und Kreativen die Erstellung personalisierter Manga-Geschichten zu ermöglichen.
Quellen
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!