Inhalt
summary Zusammenfassung

KI-Bildsysteme können neue Bilder erzeugen - oder bestehende Bilder umwandeln. Wie das direkt in einer Kamera aussehen könnte, zeigt das Projekt "DreamGenerator".

Anzeige

Anders als bei herkömmlichen Kameras wählt man beim DreamGenerator zunächst aus, in welcher Welt das nächste Foto spielen soll: Himmel oder Hölle, Mittelalter, Unterwasser oder Weltraum, es gibt viele Varianten. Dreißig Motive sind vorprogrammiert.

Nimmt man das Foto auf, wird es automatisch in ein neues Motiv im zuvor gewählten Thema umgewandelt. Dabei bleiben die Grundzüge des Motivs erhalten, zum Beispiel bei einer Person die Körperhaltung und die Gesichtszüge oder der Winkel, aus dem ein Auto auf dem Parkplatz fotografiert wird. Nur ist das Auto nach der Aufnahme ein neuer Ferrari und kein alter Honda.

Der DreamGenerator macht aus einem alten Honda einen neuen Ferarri. Der Name des Gerätes scheint passend gewählt. | Bild: Kyle Goodrich

"Die generierten Bilder beziehen sich auf die Komposition und Pose des Originalfotos und stellen sicher, dass die Schlüsselelemente erhalten bleiben, während neue, fantasievolle Akzente hinzugefügt werden", schreibt der Entwickler Kyle Goodrich.

Anzeige
Anzeige

Mit authentischer Fotografie hat das natürlich nichts zu tun. Aber Goodrich geht es nach eigenen Angaben vorwiegend darum, den komplexen Prompting-Prozess von Systemen wie Stable Diffusion zu vereinfachen. Natürlich ginge das auch mit einer Smartphone-App, aber Goodrich bevorzugt nach eigener Aussage die "Einfachheit einer Point-and-Shoot-Kamera".

ControlNet ermöglicht minimalistisches Bild-KI-Feintuning

Für die Bildgenerierung verwendet Goodrich eine Kombination aus der Open-Source-Bild-KI Stable Diffusion und ControlNet, einer einfachen Feinabstimmungsmethode, die die Bild-zu-Bild-Fähigkeiten von Stable Diffusion erheblich verbessert.

Das Feintuning für ein bestimmtes Motiv erfolgt hier mit extrem kleinen Datensätzen - etwa einem einzelnen Foto. Wie Stable Diffusion ist auch ControlNet als kostenlose Open-Source-Software verfügbar und läuft sogar auf Smartphones.

Im folgenden Video zeigt Goodrich, der hauptberuflich für das Design von AR-Produkten bei Snapchat verantwortlich ist, einen Prototyp der Hard- und Software. Zu einer Verkaufsversion äußert er sich nicht. Wer die KI-Kamera haben will, wird sie wohl nachbauen müssen.

Empfehlung
Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • DreamGenerator ist eine Kamera, die generative KI nutzt, um aufgenommene Bilder in neue Themen wie Himmel, Mittelalter, Unterwasser oder Weltraum zu transformieren und dabei die wesentlichen Elemente des Originalfotos beizubehalten.
  • Entwickler Kyle Goodrich will mit der Kamera den komplexen Prompting-Prozess in KI-Systemen wie Stable Diffusion vereinfachen, um einzigartige Bilder zu erzeugen.
  • DreamGenerator kombiniert die Open-Source-Bild-KI Stable Diffusion und ControlNet, eine Methode zur Feinabstimmung, die die Bild-zu-Bild-Fähigkeiten verbessert. Beide KI-Systeme sind als Open-Source-Software verfügbar.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!