Stable Diffusion ist ein leistungsfähiges generatives KI-Modell für Bilder, aber die Bedienung über Web- und lokale Schnittstellen ist oft mit vielen Einstellungen und Prompt-Engineering verbunden. Fooocus will das ändern.
Lvmin Zhang, die Person hinter Fooocus, beschreibt das Projekt als eine Überarbeitung des Designs von Stable Diffusion und Midjourney. Von Stable Diffusion übernimmt Fooocus das Modell und den Fokus auf Offline-Kapazitäten und Open Source, von Midjourney den Fokus auf einfache Bedienung: Manuelle Anpassungen von Werten wie CFG sind nicht erforderlich, Nutzer:innen können sich einfach auf das Bild und den Prompt konzentrieren.
Kurz: Fooocus ist eine Art kostenlose Offline-Variante von Midjourney, die das neueste SDXL-Modell von Stability AI nutzt.
Fooocus hat geringe Anforderungen und einfache Installation
Fooocus kommt mit einer einfachen Installation, zwischen dem Drücken von "Download" und der Erzeugung des ersten Bildes ist die Anzahl der erforderlichen Mausklicks auf ein Minimum beschränkt, verspricht Zhang.
Im Hintergrund hat das Projekt viele Optimierungen und Qualitätsverbesserungen eingebaut und automatisiert, die bei anderen Schnittstellen für Stable Diffusion manuell eingestellt werden müssen. Das soll wie bei Midjourney gute Ergebnisse bei jedem Versuch ermöglichen. Wer mehr einstellen möchte, kann dies über den Reiter Advanced in Fooocus tun. Dort können etwa ein Sharpness-Filter oder eigene LoRAs eingestellt werden. Außerdem kann der Stil durch eine einfache Auswahl bestimmt werden.
Zum Betrieb wird mindestens eine Nvidia-Grafikkarte mit 4 Gigabyte RAM und 8 Gigabyte System-RAM unter Windows benötigt. Dazu muss Virtual Swap von Microsoft aktiviert sein, was in der Regel bereits automatisch der Fall ist und ansonsten relativ einfach eingeschaltet werden kann. Auf einem Laptop mit 16 Gigabyte System-RAM und einer Nvidia 3060 mit 6 Gigabyte RAM dauert die Bildgenerierung laut Zhang weniger als 1,5 Sekunden.
Mehr Informationen und den Download gibt es im Fooocus-GitHub.