Supertone AI ist eine ausdrucksstarke Text-zu-Audio-Plattform, die es mit der Verlagsbranche aufnehmen will.
Mehr als Text-zu-Sprache
Die Technologie von Supertone stellt einen Fortschritt gegenüber der herkömmlichen Text-zu-Sprache-Synthese dar. Das Unternehmen hat eine eigene Sprachsynthesetechnologie namens Nuvo entwickelt.
Sie ermöglicht es dem Benutzer, zu sprechen, zu singen und Emotionen einzufangen. Die Technologie kann Stimmen erzeugen, die praktisch nicht von menschlichen Stimmen zu unterscheiden sind.
Die CVC-Technologie (Controllable Voice Conversion) von Supertone ermöglicht es dem Benutzer, seine Stimme in Echtzeit in eine beliebige andere Stimme umzuwandeln. So kann der Benutzer seine Stimme in die eines Mannes, einer älteren Person, einer Frau oder sogar eines Kindes umwandeln und je nach Bedarf verschiedene Charaktere spielen.
Dabei geht es nicht nur um das Klonen von Stimmen wie bei Eleven Labs oder Descript, sondern um die Erweiterung von Stimmen. Damit eignet sich die Sprachsynthese-Plattform hervorragend für Hörbücher, bei denen für verschiedene Charaktere unterschiedliche Stimmtypen benötigt werden. Eines der jüngsten Ergebnisse ist die Darstellung der Stimme eines verstorbenen südkoreanischen Popstars.
Oder diese Darbietung von Freddie Mercury auf Koreanisch.
Stimmen personalisieren
Supertone Nuvo erlaubt dem Benutzer auch, seine Stimmen zu personalisieren. Es gibt voreingestellte Basisstimmen, die der Benutzer auswählen und anpassen kann. Die Technologie verwendet dazu neuronale Netze, die mit unsortierten Daten der Zielstimme trainiert wurden, um Rohaudio zu erzeugen und einen natürlichen Sprachsyntheseprozess zu ermöglichen.
Produktpalette
Supertone AI besteht aus einer Reihe von Tools, darunter Nest, der Voice Gene Designer, Voice Content Creator, Real-Time Voice Converter und Real-Time Voice Separator.
Eines der wichtigsten Produkte, der GOYO Voice Separator, ist ein Postproduktions-Plug-in, das Audio entrauschen, enthallen und entstimmen kann, indem es es bei voller Kontrolle über die Audioelemente in drei Kanäle aufteilt. Es ist seinen Konkurrenten Eleven Labs, Lovo by Genny und Murf weit voraus.
Preise
Detaillierte Preise für kostenpflichtige Programme sind nicht verfügbar. Die Sprachsynthesetechnologie von Supertone steht nur autorisierten Partnern zur Verfügung. Die Durchlaufzeiten für die Sprachsynthese können je nach Projektumfang variieren.
Um mit Supertone AI arbeiten zu können, müssen interessierte Anwender dem Team zunächst einen Business Case vorlegen. Derzeit steht das Tool nur denjenigen zur Verfügung, die die Kriterien des Teams erfüllen.
Nach der Prüfung durch das Team unterzeichnen der Anwender und das Unternehmen eine Vereinbarung, um das Projekt voranzutreiben. Auf diese Weise werden einige der Deepfake-Probleme vermieden, mit denen andere Plattformen zu kämpfen haben.
Die Gründer
Supertone AI wurde im März 2020 von Choi Hee-doo, Huh Hoon, Hyungseok Choi, Kim Wansoo, Kyogu Lee und Lee Juheon aus Südkorea gegründet. Ziel des Unternehmens ist es, Kreativen ein innovatives Umfeld für die Produktion von Sprachinhalten von der Ideenfindung bis zur Postproduktion zu bieten.