Kostenlos und unzensiert KI-Bilder generieren - das geht mit Stable Diffusion. Zwei Programme machen es Nutzer:innen unter Windows besonders leicht.
Mit Stable Diffusion steht seit August 2022 eine quelloffene und damit kostenlose Alternative zu den geschlossenen, kommerziellen Bildgeneratoren DALL-E 2 und Midjourney zur Verfügung. Vorteil von Stable Diffusion gegenüber den beiden anderen kostenpflichtigen Browser- bzw. Discord-basierten Diensten: Es lässt sich auf dem eigenen Computer installieren.
Open Source heißt auch ohne Filter
Während sich macOS-Nutzende bei GUIs für Stable Diffusion zwischen einigen Lösungen entscheiden müssen, haben sich auf Windows-PCs mit der NMKD GUI sowie der Automatic1111 WebUI zwei Softwares durchgesetzt.
Obwohl beide Programme kostenlos zum Download angeboten werden, sind sie mittlerweile recht umfangreich und werden ständig um neue Funktionen erweitert.
Die lokale Installation bedeutet, dass kein Unternehmen Prompts oder Ergebnisse zensieren kann und die Nutzer:innen die komplette Kontrolle über das System und das genutzte Modell haben. Die Schnittstellen ermöglichen auch die Installation von Stable-Diffusion-Modellen, die auf bestimmte Aufgaben spezialisiert sind, oder von Modellerweiterungen wie LoRAs.
Wie installiert man NMKD GUI?
Die NMKD GUI kommt als Ein-Klick-Installer und benötigt keine weiteren Softwarebibliotheken. Abgesehen von der Grundfunktion, Textprompts in Bilder umzuwandeln, ist der Werkzeugkasten prall gefüllt. In Version 1.9.1 basierend auf Stable Diffusion 1.5 sind unter anderem folgende Funktionen enthalten:
- Promptwarteschlange und -historie
- Mehrere Prompts auf einmal
- Verstärkung von Prompts, negative Prompts
- Befehlsbasierte Bearbeitung mit InstructPix2Pix
- Benutzerdefinierte SD- und VAE-Modelle mit Malwarescanner
- Upscaling und Gesichtswiederherstellung
- Generierung von nahtlosen Tiles für Texturen
Wie installiert man Automatic1111?
Automatic1111 erscheint auf den ersten Blick etwas komplexer als NMKD, bietet dafür aber auch einen größeren Funktionsumfang und wird häufiger aktualisiert. So ist z.B. derzeit auch Stable Diffusion 2.1 statt nur 1.5 verfügbar.
Im Gegensatz zu NMKD handelt es sich bei Automatic1111 um eine browserbasierte Oberfläche und bei Download aus offizieller Quelle aus dem GitHub-Repository müssen Git und Python separat installiert werden. Ein Drittanbieter nimmt euch bei Bedarf auch diese Arbeit durch einen Ein-Klick-Installer ab. Wie erwähnt bietet Automatic1111 mehr Funktionen, zu den wichtigsten gehören aber:
- Txt2Img und Img2Img
- Generation von nahtlosen Tiles für Texturen
- Validierung der Token-Länge
- Upscaling
- Stapelverarbeitung
- Inpainting und Outpainting
- Prompt Editing während der Generierung
- Alternative Scripts
Systemvoraussetzungen: Welche Hardware braucht man für Stable Diffusion?
Bei der Verwendung von generativen KI-Bildmodellen kommt es weniger auf den Prozessor an, sondern mehr auf die Grafikkarte. Generell scheint Nvidia für die Zukunft der KI-Bildmodelle besser aufgestellt zu sein. NMKD ist ebenfalls für eine GeForce-GPU optimiert. Mit einer RTX 4090 soll ein Bild in nur 1,7 Sekunden generiert werden können.
Für Nutzer:innen mit bestimmten AMD-Grafikkarten gibt es laut Entwickler n00mkrad einen Umweg, um die Stable-Diffusion-GUI dennoch auszuführen. Automatic1111 läuft ebenfalls am besten auf Nvidia-Grafikkarten, jedoch findet sich hier ein Workaround für AMD-GPUs. Ob ein Prozessor von Intel oder AMD verbaut ist, spielt hingegen keine Rolle.
Speichermangel spielt bei modernen PCs kaum noch eine Rolle, daher sollte jeder Rechner die empfohlenen 5 bis 25 Gigabyte zusätzlich für temporäre Dateien zur Verfügung haben. Einen Unterschied macht hingegen die Lese- und Schreibgeschwindigkeit, weshalb NVMe-SSDs eher zu empfehlen sind als herkömmliche Festplatten oder HDDs.
Minimum | Empfohlen | Professionell/DreamBooth | |
---|---|---|---|
GPU | Nvidia-GPU mit 4 GB VRAM, Maxwell (2014) | Nvidia-GPU mit 8 GB VRAM, Pascal (2016) | Nvidia-GPU mit 24 GB VRAM, Turing (2018) |
RAM | 8 GB | 16 GB | 32 GB |
Speicher | 10 (+5) GB | 12 (+5) GB auf (SATA-)SSD | 12 GB auf (NVMe-)SSD |