KI-Bilder lassen sich dank Stable Diffusion unkompliziert auf dem eigenen Mac-Rechner mit Silicon-Chip generieren. Dabei helfen verschiedene Ein-Klick-Installer.
Während KI-Bildgeneratoren wie Midjourney oder DALL-E 2 nur als kostenpflichtige Onlineangebote verfügbar sind, bietet Stable Diffusion ein frei verfügbares Open-Source-Modell ohne inhaltliche Einschränkungen. Jede:r kann sich den Code herunterladen und - genügend GPU-Leistung vorausgesetzt - Bilder auf seinem eigenen Rechner generieren.
Dafür muss man kein Code-Profi sein: Aus der Community sind inzwischen diverse Ein-Klick-Installer entstanden, die Stable Diffusion in wenigen Minuten auf dem eigenen Computer zum Laufen bringen.
So kosten Bildgenerationen keine Credits bei Webdiensten wie DreamStudio, sondern können lokal kostenlos durchgeführt werden (abgesehen von euren Stromkosten, versteht sich). Außerdem ist keine Verbindung zum Internet notwendig - die Programme funktionieren offline, sobald die Trainingsdatenbank heruntergeladen ist.
Dabei braucht es keinen großen Computertower, um solche Rechenaufgaben zu bewältigen. Auch auf dem Laptop klappt das problemlos, wenngleich der Prozess mehr Zeit in Anspruch nimmt. Prädestiniert für diese Art von Arbeit sind Apple MacBooks mit einem Silicon-Prozessor. M1, M1 Pro, M1 Max und M2 verfügen nämlich über die sogenannte Neural Engine. Empfohlen sind zusätzlich mindestens 16 Gigabyte Arbeitsspeicher.
CHARL-E
- erster Ein-Klick-Installer
- kaum Einstellungsmöglichkeiten
- nur Text to Image
CHARL-E von Charlie Holtz war die erste Lösung, die Stable Diffusion als einfaches Installationspaket angeboten hat. Leider hat sich seit dem initialen Release nicht mehr viel an der Software getan. Entsprechend beschränkt ist der Funktionsumfang.
Nach der Installation stehen nur wenige Einstellungsmöglichkeiten zur Verfügung. So könnt ihr die Zahl der Schritte (sie beeinflussen die Qualität des Ergebnisses deutlich) sowie einen Seed festlegen. Die Auflösung oder Anzahl der Bilder lassen sich allerdings nicht anpassen. Immerhin ist eine Galerie der erstellten Bilder an Bord.
🖼️Introducing CHARL-E: Run Stable Diffusion on your M1 Mac.
- 1 click download
- Open source
- Runs locally, no internet requiredhttps://t.co/nZ3o8HImq4 pic.twitter.com/nwZ4qypBDr— Charlie Holtz (@charliebholtz) September 17, 2022
DiffusionBee
- umfangreiche Einstellungsmöglichkeiten bei Text to Image
- Image to Image und Verlauf verfügbar
- soll auch für Intel-Macs erscheinen
DiffusionBee ist eine deutlich umfangreichere Alternative zur Nutzung von Stable Diffusion auf einem Silicon-MacBook. Texteingaben verwandelt das Programm in Bilder, bei denen sich Steps, Guidance, Seed, Auflösung und Anzahl (zwischen eins und 100) einstellen lassen. Vorgefertigte Einstellungen für verschiedene Styles sind ebenfalls enthalten.
Neben Text to Image unterstützt das Hobbyprojekt von Meta-Entwickler Divam Gupta auch Image to Image, also das Einspeisen von eigenem Bildmaterial. Ein Verlauf zeigt alle bisher generierten Bilder übersichtlich an. Gupta will auch ein Feature zum sogenannten Outpainting integrieren, was Bilder per KI über ihre Grenzen hinaus erweitert. Angeblich arbeitet er zudem an einer Version, die auf Macs mit Intel-Prozessor funktioniert.
Introducing a new version of DiffusionBee - Stable Diffusion app on Mac with all cutting-edge features.
- Easy to use and install
- Runs locally
- Runs much faster nowSupports Text-to-image, Image-to-image, in-painting, out-painting, advanced options.https://t.co/N3KwWR9Own pic.twitter.com/qbwwWVN60c
— Divam Gupta (@divamgupta) November 3, 2022
Roll Art Die
- nur Text to Image, aber einige Einstellungsmöglichkeiten
- im Mac App Store verfügbar
- Bilder automatisch bis zu sechsfach skalieren
Roll Art Die ist im Gegensatz zu den beiden vorher genannten Lösungen einfach über den App Store installierbar. Der Download ist mit rund zwölf Gigabyte aber deutlich größer als die vier Gigabyte, die DiffusionBee und CHARL-E einnehmen. Bildgenerationen lassen sich per Seed, Steps, Guidance und Auflösung anpassen.
Ein "Prompt Enhancer" soll eure Eingaben per KI automatisch erweitern, kann aber deaktiviert werden. Ferner ist eine bis zu sechsfache Skalierung der finalen Bilder möglich.