Inhalt
summary Zusammenfassung

Stability AI hat mit Stable Audio Open ein kostenloses KI-Modell veröffentlicht, mit dem sich Audiosamples, Soundeffekte und Produktionselemente aus Textbeschreibungen erzeugen lassen. Das Open-Source-Modell richtet sich an Sounddesigner, Musiker und Kreativschaffende.

Stability AI, das Unternehmen hinter dem populären KI-Bildgenerator Stable Diffusion, hat mit Stable Audio Open ein quelloffenes Modell für die Generierung von Audiodaten vorgestellt. Laut einer Mitteilung auf der Stability-AI-Website ermöglicht das KI-Modell die Erstellung von bis zu 47 Sekunden langen, qualitativ hochwertigen Audiosamples aus einfachen Textanweisungen.

Das Training des Modells ist speziell auf die Generierung von Drumbeats, Instrumentalriffs, Umgebungsgeräuschen, Foley-Aufnahmen und anderen Audioelementen für die Musikproduktion und das Sounddesign ausgerichtet.

Stable Audio Open soll einen Einblick in die Möglichkeiten der generativen KI für das Sounddesign geben und gleichzeitig eine verantwortungsvolle Entwicklung in Zusammenarbeit mit kreativen Communities gewährleisten. Für das Training von Stable Audio Open wurden Audiodaten von FreeSound und dem Free Music Archive verwendet, um die Rechte der Urheber zu wahren.

Anzeige
Anzeige

Zum Einstieg steht das Stable Audio Open Modell auf der Hugging Face Plattform zum Download bereit. Die Open-Source-Veröffentlichung ermöglicht es Benutzern zudem, das Modell mit ihren eigenen Audiodaten zu verfeinern und anzupassen.

Stability AI ermutigt Sounddesigner, Musiker, Entwickler und Audioenthusiasten, das Modell herunterzuladen und Feedback zu geben.

Im Gegensatz zum kommerziellen Produkt Stable Audio 2, das komplette Musikstücke von bis zu drei Minuten Länge erzeugen kann, ist Stable Audio Open auf kürzere Audiosamples und Soundeffekte spezialisiert. Es eigne sich weniger für die Generierung kompletter Songs, Melodien oder Gesang.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Stability AI, das Unternehmen hinter Stable Diffusion, hat Stable Audio Open vorgestellt, ein kostenloses Open-Source-Modell zur Generierung von Audiosamples, Soundeffekten und Produktionselementen aus Textbeschreibungen.
  • Das KI-Modell ist in der Lage, Audiodaten von bis zu 47 Sekunden Länge in hoher Qualität zu erzeugen. Es ist speziell auf Drumbeats, Instrumentalriffs, Umgebungsgeräusche und Foley-Aufnahmen für Musikproduktion und Sounddesign ausgerichtet.
  • Stable Audio Open steht auf der Hugging Face-Plattform zum Download bereit und kann von den Nutzern mit eigenen Audiodaten erweitert werden. Es ist auf kürzere Samples spezialisiert, im Gegensatz zur kommerziellen Version Stable Audio 2, die auch für ganze Songs geeignet ist.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!