Text zu Boom: KI-Sprachgenerator Elevenlabs unterstützt jetzt Soundeffekte

Elevenlabs erweitert sein KI-Audio-Angebot: Auf Stimmen folgen Soundeffekte, Musik steht in den Startlöchern.

Elevenlabs, bekannt für seinen KI-Stimmgenerator, hat sein Angebot um eine KI-basierte Soundeffekt-Funktion erweitert. Mit "Text to Sound" können Nutzer ab sofort Soundeffekte, kurze Instrumentalstücke, Klanglandschaften und verschiedene Charakterstimmen über Textbefehle erzeugen.

Das neue Tool soll Filmstudios, Videospielentwicklern und Social-Media-Kreativen helfen, schnell, kostengünstig und in großem Umfang reichhaltige und immersive Klanglandschaften zu generieren.

Die neue Audio-Funktion ist nach einem Login bei Elevenlabs verfügbar. Wie bei generativen KI-Systemen üblich, genügt eine kurze Textbeschreibung des gewünschten Soundeffekts.

Die Länge des Effekts wird vom System automatisch anhand der Beschreibung ermittelt oder manuell auf bis zu 22 Sekunden eingestellt. Außerdem kann eingestellt werden, wie genau das System dem Prompt folgen oder ob es sich mehr kreativen Freiraum nehmen soll.

Um die Erweiterung um Soundeffekte auf eine rechtlich saubere Basis zu stellen, ist Elevenlabs eine Partnerschaft mit Shutterstock eingegangen. Durch diese Zusammenarbeit konnte Elevenlabs sein Modell mit der umfangreichen lizenzierten Audiobibliothek der Datenbank trainieren.

Auf diese Weise kann Elevenlabs mögliche Urheberrechtsklagen vermeiden, wie sie Audio-Konkurrenten wie Suno oder Udio drohen könnten. Sony Music hat bereits Briefe an KI-Firmen geschickt und Transparenz bei den Datensätzen fürs KI-Training gefordert.

Mit dem Schritt zu KI-generierten Soundeffekten setzt Elevenlabs seinen Weg fort, Kreative mit allen notwendigen Audio-Werkzeugen auszustatten. Zuletzt stellte das Unternehmen einen Musikgenerator vor, der sich allerdings noch in der Beta-Phase befindet.

Empfehlung

KI in der Praxis

MIT-Studie zeigt "kognitive Schulden" durch ChatGPT - was das für die Praxis bedeutet

Klar ist, dass Elevenlabs über Stimmgenerierung hinauswachsen will. Anfang des Jahres hat es dafür weitere 80 Millionen Dollar von Investoren erhalten.

Community beitreten

Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Text zu Boom: KI-Sprachgenerator Elevenlabs unterstützt jetzt Soundeffekte

MIT-Studie zeigt "kognitive Schulden" durch ChatGPT - was das für die Praxis bedeutet

Suno veröffentlicht erste Audio-Demos des neuen v4-Modells

Stable Audio Open ist ein Open Source KI-Modell für Geräusche und Sounddesign

KI-Musik-App Udio bringt neue Features und Abo-Plan

Cloudflare-Boss Matthew Prince hat schlechte Nachrichten für das WWW

Othello-Experiment stützt erneut Weltmodell-Hypothese für große Sprachmodelle

MIT-Studie zeigt "kognitive Schulden" durch ChatGPT - was das für die Praxis bedeutet

Text zu Boom: KI-Sprachgenerator Elevenlabs unterstützt jetzt Soundeffekte

Artikel teilen

Bankverbindung