Inhalt
summary Zusammenfassung

ByteDance habe mit Seedream 4.0 ein neues KI-Modell vorgestellt, das Text-zu-Bild-Generierung und Bildbearbeitung in einem System vereint.

Anzeige

Laut Bytedance soll die zugrunde liegende Architektur über zehnmal schneller arbeiten als die Vorgängerversion Seedream 3.0. Das Modell unterstütze Referenzbilder, native Steuerungssignale und Mehrbild-Workflows. Nutzer könnten Bilder mit Auflösungen bis 4K und variablen Seitenverhältnissen erzeugen.

Eine Stärke von Seedream 4.0 soll der verlässliche Style-Transfer sein. | Bild: ByteDance

Auch Text, Tabellen und Diagramme sollen sich klarer darstellen lassen als beim Vorgänger. Änderungen wie das Entfernen von Objekten oder Anpassungen der Lichtverhältnisse sind direkt per Texteingabe möglich. ByteDance zufolge führe Seedream 4.0 in internen Benchmarks („MagicBench“ und „MagicArena“) in den Bereichen Text-zu-Bild und Einzelbildbearbeitung.

Bild: ByteDance

Für Entwickler und Unternehmen stellt ByteDance über die Cloud-Plattform Volcano Engine – Ark einen offiziellen API-Zugang bereit. Dort wurden einige Funktionen, etwa die 4K-Ausgabe, zuerst freigeschaltet. Überdies ist Seedream 4.0 in ByteDances eigenen Doubao-Chatbot integriert und über No-Code-Partnerplattformen wie FAL.ai, Freepik oder Wavespeed.ai erreichbar.

Anzeige
Anzeige

Die Preise für Seedream 4.0 variieren je nach Plattform und Anwendungsfall. Der Richtwert liegt bei 30 US-Dollar für 1.000 Generierungen. Bei Partnerplattformen wie FAL.ai, Wavespeed.ai oder Runware.ai kostet eine Text-zu-Bild- oder Bildbearbeitungs-Generierung jeweils 0,03 US-Dollar pro Bild bzw. Run.

Die genannten Partnerpreise gelten in der Regel für Bildgrößen bis etwa 1024×1024 Pixel. Höhere Auflösungen wie 2K oder 4K sowie Batch- oder Sequenz-Jobs können abweichend bepreist sein.

Über die offizielle Cloud-Plattform Volcano Engine – Ark von ByteDance erfolgt die Abrechnung nutzungsbasiert („Pay-as-you-go“) oder über sogenannte Resource Packs. Konkrete Preise werden erst nach Login in der Ark-Konsole oder im Preisrechner sichtbar und hängen von Region und gewähltem Paket ab.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • ByteDance hat mit Seedream 4.0 ein KI-Modell vorgestellt, das Text-zu-Bild-Generierung und Bildbearbeitung in einem System kombiniert und laut Unternehmen mehr als zehnmal schneller arbeitet als der Vorgänger Seedream 3.0.
  • Das Modell unterstützt Referenzbilder, native Steuerungssignale, Mehrbild-Workflows und kann Bilder bis zu 4K-Auflösung erstellen; auch Text, Tabellen und Diagramme sollen klarer dargestellt werden, während Bildänderungen wie Objektentfernung oder Lichtanpassung direkt per Texteingabe möglich sind.
  • Seedream 4.0 ist über ByteDances Cloud-Plattform Volcano Engine – Ark, den Doubao-Chatbot sowie Partnerplattformen wie FAL.ai, Freepik oder Wavespeed.ai verfügbar; die Preise variieren je nach Anbieter und Auflösung, mit einem Richtwert von 30 US-Dollar für 1.000 Generierungen bzw. 0,03 US-Dollar pro Bild bei Partnern.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!