Text-to-Audio-Plattform Supertone AI bringt die Stimme von Freddie Mercury zurück

12. August 2023

Supertone AI

Supertone AI ist eine ausdrucksstarke Text-zu-Audio-Plattform, die es mit der Verlagsbranche aufnehmen will.

Mehr als Text-zu-Sprache

Die Technologie von Supertone stellt einen Fortschritt gegenüber der herkömmlichen Text-zu-Sprache-Synthese dar. Das Unternehmen hat eine eigene Sprachsynthesetechnologie namens Nuvo entwickelt.

Sie ermöglicht es dem Benutzer, zu sprechen, zu singen und Emotionen einzufangen. Die Technologie kann Stimmen erzeugen, die praktisch nicht von menschlichen Stimmen zu unterscheiden sind.

Die CVC-Technologie (Controllable Voice Conversion) von Supertone ermöglicht es dem Benutzer, seine Stimme in Echtzeit in eine beliebige andere Stimme umzuwandeln. So kann der Benutzer seine Stimme in die eines Mannes, einer älteren Person, einer Frau oder sogar eines Kindes umwandeln und je nach Bedarf verschiedene Charaktere spielen.

Dabei geht es nicht nur um das Klonen von Stimmen wie bei Eleven Labs oder Descript, sondern um die Erweiterung von Stimmen. Damit eignet sich die Sprachsynthese-Plattform hervorragend für Hörbücher, bei denen für verschiedene Charaktere unterschiedliche Stimmtypen benötigt werden. Eines der jüngsten Ergebnisse ist die Darstellung der Stimme eines verstorbenen südkoreanischen Popstars.

Oder diese Darbietung von Freddie Mercury auf Koreanisch.

https://www.youtube.com/watch?v=ZfC5SH8r04k

Stimmen personalisieren

Supertone Nuvo erlaubt dem Benutzer auch, seine Stimmen zu personalisieren. Es gibt voreingestellte Basisstimmen, die der Benutzer auswählen und anpassen kann. Die Technologie verwendet dazu neuronale Netze, die mit unsortierten Daten der Zielstimme trainiert wurden, um Rohaudio zu erzeugen und einen natürlichen Sprachsyntheseprozess zu ermöglichen.

Produktpalette

Supertone AI besteht aus einer Reihe von Tools, darunter Nest, der Voice Gene Designer, Voice Content Creator, Real-Time Voice Converter und Real-Time Voice Separator.

Eines der wichtigsten Produkte, der GOYO Voice Separator, ist ein Postproduktions-Plug-in, das Audio entrauschen, enthallen und entstimmen kann, indem es es bei voller Kontrolle über die Audioelemente in drei Kanäle aufteilt. Es ist seinen Konkurrenten Eleven Labs, Lovo by Genny und Murf weit voraus.

Preise

Detaillierte Preise für kostenpflichtige Programme sind nicht verfügbar. Die Sprachsynthesetechnologie von Supertone steht nur autorisierten Partnern zur Verfügung. Die Durchlaufzeiten für die Sprachsynthese können je nach Projektumfang variieren.

Um mit Supertone AI arbeiten zu können, müssen interessierte Anwender dem Team zunächst einen Business Case vorlegen. Derzeit steht das Tool nur denjenigen zur Verfügung, die die Kriterien des Teams erfüllen.

Nach der Prüfung durch das Team unterzeichnen der Anwender und das Unternehmen eine Vereinbarung, um das Projekt voranzutreiben. Auf diese Weise werden einige der Deepfake-Probleme vermieden, mit denen andere Plattformen zu kämpfen haben.

Die Gründer

Supertone AI wurde im März 2020 von Choi Hee-doo, Huh Hoon, Hyungseok Choi, Kim Wansoo, Kyogu Lee und Lee Juheon aus Südkorea gegründet. Ziel des Unternehmens ist es, Kreativen ein innovatives Umfeld für die Produktion von Sprachinhalten von der Ideenfindung bis zur Postproduktion zu bieten.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

KI-News ohne Hype
Von Menschen kuratiert.

Mehr als 20 Prozent Launch-Rabatt.
Lesen ohne Ablenkung – keine Google-Werbebanner.
Zugang zum Kommentarsystem und Austausch mit der Community.
Wöchentlicher KI-Newsletter.
6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
Bis zu 25 % Rabatt auf KI Pro Online-Events.
Zugang zum kompletten Archiv der letzten zehn Jahre.
Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.

The Decoder abonnieren