Elevenlabs erweitert sein KI-Audio-Angebot: Auf Stimmen folgen Soundeffekte, Musik steht in den Startlöchern.
Elevenlabs, bekannt für seinen KI-Stimmgenerator, hat sein Angebot um eine KI-basierte Soundeffekt-Funktion erweitert. Mit "Text to Sound" können Nutzer ab sofort Soundeffekte, kurze Instrumentalstücke, Klanglandschaften und verschiedene Charakterstimmen über Textbefehle erzeugen.
Das neue Tool soll Filmstudios, Videospielentwicklern und Social-Media-Kreativen helfen, schnell, kostengünstig und in großem Umfang reichhaltige und immersive Klanglandschaften zu generieren.
Die neue Audio-Funktion ist nach einem Login bei Elevenlabs verfügbar. Wie bei generativen KI-Systemen üblich, genügt eine kurze Textbeschreibung des gewünschten Soundeffekts.
Die Länge des Effekts wird vom System automatisch anhand der Beschreibung ermittelt oder manuell auf bis zu 22 Sekunden eingestellt. Außerdem kann eingestellt werden, wie genau das System dem Prompt folgen oder ob es sich mehr kreativen Freiraum nehmen soll.
Um die Erweiterung um Soundeffekte auf eine rechtlich saubere Basis zu stellen, ist Elevenlabs eine Partnerschaft mit Shutterstock eingegangen. Durch diese Zusammenarbeit konnte Elevenlabs sein Modell mit der umfangreichen lizenzierten Audiobibliothek der Datenbank trainieren.
Auf diese Weise kann Elevenlabs mögliche Urheberrechtsklagen vermeiden, wie sie Audio-Konkurrenten wie Suno oder Udio drohen könnten. Sony Music hat bereits Briefe an KI-Firmen geschickt und Transparenz bei den Datensätzen fürs KI-Training gefordert.
Mit dem Schritt zu KI-generierten Soundeffekten setzt Elevenlabs seinen Weg fort, Kreative mit allen notwendigen Audio-Werkzeugen auszustatten. Zuletzt stellte das Unternehmen einen Musikgenerator vor, der sich allerdings noch in der Beta-Phase befindet.
Klar ist, dass Elevenlabs über Stimmgenerierung hinauswachsen will. Anfang des Jahres hat es dafür weitere 80 Millionen Dollar von Investoren erhalten.