Inhalt
summary Zusammenfassung

Elevenlabs erweitert sein KI-Audio-Angebot: Auf Stimmen folgen Soundeffekte, Musik steht in den Startlöchern.

Elevenlabs, bekannt für seinen KI-Stimmgenerator, hat sein Angebot um eine KI-basierte Soundeffekt-Funktion erweitert. Mit "Text to Sound" können Nutzer ab sofort Soundeffekte, kurze Instrumentalstücke, Klanglandschaften und verschiedene Charakterstimmen über Textbefehle erzeugen.

Das neue Tool soll Filmstudios, Videospielentwicklern und Social-Media-Kreativen helfen, schnell, kostengünstig und in großem Umfang reichhaltige und immersive Klanglandschaften zu generieren.

 

Anzeige
Anzeige

Die neue Audio-Funktion ist nach einem Login bei Elevenlabs verfügbar. Wie bei generativen KI-Systemen üblich, genügt eine kurze Textbeschreibung des gewünschten Soundeffekts.

Die Länge des Effekts wird vom System automatisch anhand der Beschreibung ermittelt oder manuell auf bis zu 22 Sekunden eingestellt. Außerdem kann eingestellt werden, wie genau das System dem Prompt folgen oder ob es sich mehr kreativen Freiraum nehmen soll.

Um die Erweiterung um Soundeffekte auf eine rechtlich saubere Basis zu stellen, ist Elevenlabs eine Partnerschaft mit Shutterstock eingegangen. Durch diese Zusammenarbeit konnte Elevenlabs sein Modell mit der umfangreichen lizenzierten Audiobibliothek der Datenbank trainieren.

Auf diese Weise kann Elevenlabs mögliche Urheberrechtsklagen vermeiden, wie sie Audio-Konkurrenten wie Suno oder Udio drohen könnten. Sony Music hat bereits Briefe an KI-Firmen geschickt und Transparenz bei den Datensätzen fürs KI-Training gefordert.

Mit dem Schritt zu KI-generierten Soundeffekten setzt Elevenlabs seinen Weg fort, Kreative mit allen notwendigen Audio-Werkzeugen auszustatten. Zuletzt stellte das Unternehmen einen Musikgenerator vor, der sich allerdings noch in der Beta-Phase befindet.

Empfehlung

Klar ist, dass Elevenlabs über Stimmgenerierung hinauswachsen will. Anfang des Jahres hat es dafür weitere 80 Millionen Dollar von Investoren erhalten.

 

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Elevenlabs, bekannt für seinen KI-Stimmgenerator, hat sein Angebot um "Text to Sound" erweitert, ein Tool zur Generierung von Soundeffekten, kurzen Instrumentalstücken, Klanglandschaften und Charakterstimmen über Textbefehle.
  • Eine Partnerschaft mit Shutterstock ermöglicht es Elevenlabs, sein Modell mit einer lizenzierten Audiobibliothek zu trainieren und so mögliche Urheberrechtsklagen zu vermeiden, wie sie Audio-Konkurrenten drohen könnten.
  • Nach der Stimmgenerierung und den Soundeffekten arbeitet Elevenlabs zudem derzeit an einem Musikgenerator in der Beta-Phase.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!