Malen nach Zahlen hat im KI-Zeitalter so verloren.
Nvidia stellt im eigenen Blog eine neue, potente Bild-KI vor: Sie verwandelt einfach zusammengesetzte Farbflächen in fotorealistische Landschaftsgemälde. Verpackt ist die KI-Software in eine simple Bedienoberfläche, die an die Ursoftware Microsoft Paint erinnert.
Mit einem Pinsel malt der Computer-Künstler Flächen und Striche auf eine weiße Leinwand. Die KI erkennt in den groben Zeichnungen einzelne Segmente und versteht sie als Anleitung für die Komposition des Fotos. Je nach Farbe verwandelt sie die Pinselstriche in eine fotorealistische Abbildung eines Berges, eines Wasserfalls oder einer Steppe.
Zugrundeliegend ist ein von Nvidia entwickeltes neuronales GA-Netzwerk (GauGAN), das mit Millionen Landschaftsaufnahmen der Fotoplattform Flickr trainiert wurde. Die von der KI generierten Bilder sollen allerdings keine Zusammenschnitte dieser Fotos sein, sondern von Grund auf neue Bilder, die die KI auf Basis der Trainingsdaten halluziniert. So ähnlich arbeite auch ein Künstler, schreibt Nvidia.
KI lernt aus Bildern
Die KI hat aus den Trainingsdaten ein Verständnis für die Zusammenhänge typischer Merkmale auf Landschaftsaufnahmen gelernt: Bei einem stillen See zeigt sie Reflexionen auf der Wasseroberfläche. Ist die Landschaft schneebedeckt, erscheint der Himmel gräulich. Stellt man die Jahreszeit auf Winter um, verschwinden Blätter von den Bäumen.
Für die Umwandlung der abstrakten Skizze in ein fotorealistisches Bild ist ein schneller Rechner erforderlich: Nvidia nutzt einen PC mit Tensor-Recheneinheit und einer RTX-Titan-Grafikkarte. Die Software soll mit Anpassungen auch auf langsameren Rechnern laufen - allerdings benötigt die Bilderstellung dann länger.
Nvidia sieht GauGAN insbesondere als Erleichterung für Entwickler virtueller Welten, beispielsweise in Spielen, für Architektur-Entwürfe oder um Trainingsumgebungen für selbstfahrende Autos zu generieren.
Das Unternehmen hat derzeit keine Pläne, die Software zu verkaufen. Eine öffentlich verfügbare Demo soll es demnächst geben.
Quelle: Nvidia, Titelbild: Nvidia