Stable Audio Open ist ein Open Source KI-Modell für Geräusche und Sounddesign

5. Juni 2024

Stability AI

Kurz & Knapp

Stability AI, das Unternehmen hinter Stable Diffusion, hat Stable Audio Open vorgestellt, ein kostenloses Open-Source-Modell zur Generierung von Audiosamples, Soundeffekten und Produktionselementen aus Textbeschreibungen.
Das KI-Modell ist in der Lage, Audiodaten von bis zu 47 Sekunden Länge in hoher Qualität zu erzeugen. Es ist speziell auf Drumbeats, Instrumentalriffs, Umgebungsgeräusche und Foley-Aufnahmen für Musikproduktion und Sounddesign ausgerichtet.
Stable Audio Open steht auf der Hugging Face-Plattform zum Download bereit und kann von den Nutzern mit eigenen Audiodaten erweitert werden. Es ist auf kürzere Samples spezialisiert, im Gegensatz zur kommerziellen Version Stable Audio 2, die auch für ganze Songs geeignet ist.

Stability AI hat mit Stable Audio Open ein kostenloses KI-Modell veröffentlicht, mit dem sich Audiosamples, Soundeffekte und Produktionselemente aus Textbeschreibungen erzeugen lassen. Das Open-Source-Modell richtet sich an Sounddesigner, Musiker und Kreativschaffende.

Stability AI, das Unternehmen hinter dem populären KI-Bildgenerator Stable Diffusion, hat mit Stable Audio Open ein quelloffenes Modell für die Generierung von Audiodaten vorgestellt. Laut einer Mitteilung auf der Stability-AI-Website ermöglicht das KI-Modell die Erstellung von bis zu 47 Sekunden langen, qualitativ hochwertigen Audiosamples aus einfachen Textanweisungen.

Das Training des Modells ist speziell auf die Generierung von Drumbeats, Instrumentalriffs, Umgebungsgeräuschen, Foley-Aufnahmen und anderen Audioelementen für die Musikproduktion und das Sounddesign ausgerichtet.

Stable Audio Open soll einen Einblick in die Möglichkeiten der generativen KI für das Sounddesign geben und gleichzeitig eine verantwortungsvolle Entwicklung in Zusammenarbeit mit kreativen Communities gewährleisten. Für das Training von Stable Audio Open wurden Audiodaten von FreeSound und dem Free Music Archive verwendet, um die Rechte der Urheber zu wahren.

Zum Einstieg steht das Stable Audio Open Modell auf der Hugging Face Plattform zum Download bereit. Die Open-Source-Veröffentlichung ermöglicht es Benutzern zudem, das Modell mit ihren eigenen Audiodaten zu verfeinern und anzupassen.

Stability AI ermutigt Sounddesigner, Musiker, Entwickler und Audioenthusiasten, das Modell herunterzuladen und Feedback zu geben.

Im Gegensatz zum kommerziellen Produkt Stable Audio 2, das komplette Musikstücke von bis zu drei Minuten Länge erzeugen kann, ist Stable Audio Open auf kürzere Audiosamples und Soundeffekte spezialisiert. Es eigne sich weniger für die Generierung kompletter Songs, Melodien oder Gesang.

Source: Stability AI

KI-News ohne Hype
Von Menschen kuratiert.

Mehr als 20 Prozent Launch-Rabatt.
Lesen ohne Ablenkung – keine Google-Werbebanner.
Zugang zum Kommentarsystem und Austausch mit der Community.
Wöchentlicher KI-Newsletter.
6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
Bis zu 25 % Rabatt auf KI Pro Online-Events.
Zugang zum kompletten Archiv der letzten zehn Jahre.
Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.

The Decoder abonnieren

Stable Audio Open ist ein Open Source KI-Modell für Geräusche und Sounddesign

Kurz & Knapp

KI-News ohne HypeVon Menschen kuratiert.

KI-News ohne Hype
Von Menschen kuratiert.