Mit Generative Power of Tens zeigen Forscher eine Methode für "extreme semantische Zooms" von Weitwinkelansichten bis hin zu Nahaufnahmen kleinster Details. Im Gegensatz zu herkömmlichen "Super-Resolution"-Methoden verwendet das Team der University of Washington, Google Research und der UC Berkeley Textprompts für jeden Maßstab, was tiefere Zoomstufen ermöglicht. Im Vergleich zu herkömmlichen Outpainting-Techniken erzeugt der Ansatz einen konsistenten Zoom, bei dem die Inhalte der gröberen und feineren Zoomstufen übereinstimmen.

Video: Wang et al.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Quellen
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!