ByteDance habe mit Seedream 4.0 ein neues KI-Modell vorgestellt, das Text-zu-Bild-Generierung und Bildbearbeitung in einem System vereint.
Laut Bytedance soll die zugrunde liegende Architektur über zehnmal schneller arbeiten als die Vorgängerversion Seedream 3.0. Das Modell unterstütze Referenzbilder, native Steuerungssignale und Mehrbild-Workflows. Nutzer könnten Bilder mit Auflösungen bis 4K und variablen Seitenverhältnissen erzeugen.
Auch Text, Tabellen und Diagramme sollen sich klarer darstellen lassen als beim Vorgänger. Änderungen wie das Entfernen von Objekten oder Anpassungen der Lichtverhältnisse sind direkt per Texteingabe möglich. ByteDance zufolge führe Seedream 4.0 in internen Benchmarks („MagicBench“ und „MagicArena“) in den Bereichen Text-zu-Bild und Einzelbildbearbeitung.

Für Entwickler und Unternehmen stellt ByteDance über die Cloud-Plattform Volcano Engine – Ark einen offiziellen API-Zugang bereit. Dort wurden einige Funktionen, etwa die 4K-Ausgabe, zuerst freigeschaltet. Überdies ist Seedream 4.0 in ByteDances eigenen Doubao-Chatbot integriert und über No-Code-Partnerplattformen wie FAL.ai, Freepik oder Wavespeed.ai erreichbar.
Die Preise für Seedream 4.0 variieren je nach Plattform und Anwendungsfall. Der Richtwert liegt bei 30 US-Dollar für 1.000 Generierungen. Bei Partnerplattformen wie FAL.ai, Wavespeed.ai oder Runware.ai kostet eine Text-zu-Bild- oder Bildbearbeitungs-Generierung jeweils 0,03 US-Dollar pro Bild bzw. Run.
Die genannten Partnerpreise gelten in der Regel für Bildgrößen bis etwa 1024×1024 Pixel. Höhere Auflösungen wie 2K oder 4K sowie Batch- oder Sequenz-Jobs können abweichend bepreist sein.
Über die offizielle Cloud-Plattform Volcano Engine – Ark von ByteDance erfolgt die Abrechnung nutzungsbasiert („Pay-as-you-go“) oder über sogenannte Resource Packs. Konkrete Preise werden erst nach Login in der Ark-Konsole oder im Preisrechner sichtbar und hängen von Region und gewähltem Paket ab.