Inhalt
summary Zusammenfassung

Kostenlos und unzensiert KI-Bilder generieren - das geht mit Stable Diffusion. Zwei Programme machen es Nutzer:innen unter Windows besonders leicht.

Mit Stable Diffusion steht seit August 2022 eine quelloffene und damit kostenlose Alternative zu den geschlossenen, kommerziellen Bildgeneratoren DALL-E 2 und Midjourney zur Verfügung. Vorteil von Stable Diffusion gegenüber den beiden anderen kostenpflichtigen Browser- bzw. Discord-basierten Diensten: Es lässt sich auf dem eigenen Computer installieren.

Open Source heißt auch ohne Filter

Während sich macOS-Nutzende bei GUIs für Stable Diffusion zwischen einigen Lösungen entscheiden müssen, haben sich auf Windows-PCs mit der NMKD GUI sowie der Automatic1111 WebUI zwei Softwares durchgesetzt.

Obwohl beide Programme kostenlos zum Download angeboten werden, sind sie mittlerweile recht umfangreich und werden ständig um neue Funktionen erweitert.

Anzeige
Anzeige

Die lokale Installation bedeutet, dass kein Unternehmen Prompts oder Ergebnisse zensieren kann und die Nutzer:innen die komplette Kontrolle über das System und das genutzte Modell haben. Die Schnittstellen ermöglichen auch die Installation von Stable-Diffusion-Modellen, die auf bestimmte Aufgaben spezialisiert sind, oder von Modellerweiterungen wie LoRAs.

Bild: NMKD

Wie installiert man NMKD GUI?

Die NMKD GUI kommt als Ein-Klick-Installer und benötigt keine weiteren Softwarebibliotheken. Abgesehen von der Grundfunktion, Textprompts in Bilder umzuwandeln, ist der Werkzeugkasten prall gefüllt. In Version 1.9.1 basierend auf Stable Diffusion 1.5 sind unter anderem folgende Funktionen enthalten:

  • Promptwarteschlange und -historie
  • Mehrere Prompts auf einmal
  • Verstärkung von Prompts, negative Prompts
  • Befehlsbasierte Bearbeitung mit InstructPix2Pix
  • Benutzerdefinierte SD- und VAE-Modelle mit Malwarescanner
  • Upscaling und Gesichtswiederherstellung
  • Generierung von nahtlosen Tiles für Texturen
Bild: NMKD

Wie installiert man Automatic1111?

Automatic1111 erscheint auf den ersten Blick etwas komplexer als NMKD, bietet dafür aber auch einen größeren Funktionsumfang und wird häufiger aktualisiert. So ist z.B. derzeit auch Stable Diffusion 2.1 statt nur 1.5 verfügbar.

Bild: Automatic1111

Im Gegensatz zu NMKD handelt es sich bei Automatic1111 um eine browserbasierte Oberfläche und bei Download aus offizieller Quelle aus dem GitHub-Repository müssen Git und Python separat installiert werden. Ein Drittanbieter nimmt euch bei Bedarf auch diese Arbeit durch einen Ein-Klick-Installer ab. Wie erwähnt bietet Automatic1111 mehr Funktionen, zu den wichtigsten gehören aber:

  • Txt2Img und Img2Img
  • Generation von nahtlosen Tiles für Texturen
  • Validierung der Token-Länge
  • Upscaling
  • Stapelverarbeitung
  • Inpainting und Outpainting
  • Prompt Editing während der Generierung
  • Alternative Scripts

Systemvoraussetzungen: Welche Hardware braucht man für Stable Diffusion?

Bei der Verwendung von generativen KI-Bildmodellen kommt es weniger auf den Prozessor an, sondern mehr auf die Grafikkarte. Generell scheint Nvidia für die Zukunft der KI-Bildmodelle besser aufgestellt zu sein. NMKD ist ebenfalls für eine GeForce-GPU optimiert. Mit einer RTX 4090 soll ein Bild in nur 1,7 Sekunden generiert werden können.

Empfehlung

Für Nutzer:innen mit bestimmten AMD-Grafikkarten gibt es laut Entwickler n00mkrad einen Umweg, um die Stable-Diffusion-GUI dennoch auszuführen. Automatic1111 läuft ebenfalls am besten auf Nvidia-Grafikkarten, jedoch findet sich hier ein Workaround für AMD-GPUs. Ob ein Prozessor von Intel oder AMD verbaut ist, spielt hingegen keine Rolle.

Speichermangel spielt bei modernen PCs kaum noch eine Rolle, daher sollte jeder Rechner die empfohlenen 5 bis 25 Gigabyte zusätzlich für temporäre Dateien zur Verfügung haben. Einen Unterschied macht hingegen die Lese- und Schreibgeschwindigkeit, weshalb NVMe-SSDs eher zu empfehlen sind als herkömmliche Festplatten oder HDDs.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Minimum Empfohlen Professionell/DreamBooth
GPU Nvidia-GPU mit 4 GB VRAM, Maxwell (2014) Nvidia-GPU mit 8 GB VRAM, Pascal (2016) Nvidia-GPU mit 24 GB VRAM, Turing (2018)
RAM 8 GB 16 GB 32 GB
Speicher 10 (+5) GB 12 (+5) GB auf (SATA-)SSD 12 GB auf (NVMe-)SSD
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Im Gegensatz zu Midjourney und DALL-E 2 lässt sich Stable Diffusion auf dem eigenen PC installieren.
  • Mit NMKD und Automatic1111 sind derzeit zwei empfehlenswerte Lösungen für Windows verfügbar.
  • Neben Text-zu-Bild sind auf diesem Weg auch verschiedene andere KI-Tools verfügbar.
Jonathan ist Technikjournalist und beschäftigt sich stark mit Consumer Electronics. Er erklärt seinen Mitmenschen, wie KI bereits heute nutzbar ist und wie sie im Alltag unterstützen kann.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!