PlayHT ist ein weiteres KI-basiertes Text-to-Speech (TTS) Tool, das ursprünglich als Sprachtool für Medium entwickelt wurde.
Die Hauptanwendung von PlayHT ist die Erstellung von Podcasts. Es bietet eine Vielzahl von Funktionen, einschließlich einer großen Auswahl an Sprachen und Stimmen.
Eine der besten Eigenschaften von PlayHT ist, dass es die Text-to-Speech-Stimmen von Google, Amazon, IBM und Microsoft in einer API vereint.
Es unterstützt 132 Sprachen und insgesamt 832 Stimmen sowie MP3- und WAV-Export für einen einfachen Upload auf Plattformen wie Spotify und Apple Podcasts.
Eine einzigartige Funktion von PlayHT, das benutzerdefinierte Klonen von Stimmen, ermöglicht es Benutzern, benutzerdefinierte Stimmenmodelle zu erstellen. Diese basieren auf individuellem Audio-Input, wodurch eine zusätzliche Personalisierungsebene geschaffen wird.
Die vollständige Unterstützung von PlayHT für die Sprachsynthesesprache SSML (Speech Synthesis Markup Language) ermöglicht es dem Benutzer, verschiedene Aspekte der Sprache wie Betonung, Geschwindigkeit und Pausen zu steuern, was zu einer nuancierten und menschenähnlichen Sprachausgabe führt.
PlayHT bietet einen sicheren Cloud-Speicher für synthetisierte Audiodateien, so dass die Benutzer ihre Dateien einfach und sicher verwalten können. Die Software bietet auch Tools für den Teamzugriff und die Zusammenarbeit. So kann ein ganzes Team zusammenarbeiten, Audiodateien austauschen und gemeinsam erstellen.
Anwendungsfälle
Die KI-generierten Stimmen von PlayHT können in verschiedenen Bereichen eingesetzt werden. Marketer und Content-Produzenten können diese Stimmen für Marketing-, Erklärungs-, Produkt- und YouTube-Videos verwenden.
Die Technologie kann für E-Learning-Zwecke eingesetzt werden, um Schulungsmaterialien mit der korrekten Aussprache von Fachbegriffen und Abkürzungen zu versehen.
Entwickler können mithilfe der bereitgestellten API menschenähnliche Stimmen in Geräte und Anwendungen integrieren.
Unternehmen können ihren Kundenservice durch professionelle Sprachinteraktionen in IVR- und Telefonsystemen verbessern.
Webmaster können die Zugänglichkeit und das Engagement auf ihren Websites verbessern, indem sie SEO-freundliche Audio-Widgets einbetten.
Kürzlich hat PlayHT sein neuestes Modell PlayHT Turbo vorgestellt, das eingegebenen Text besonders schnell in Sprache umwandeln kann. Die Verzögerung soll nur 150 bis 200 ms betragen, also gefühlte Echtzeit.
Von der Chrome-Erweiterung zur KI-Anwendung
PlayHT wurde 2016 als Chrome-Erweiterung zum Anhören von Artikeln der Plattform Medium ins Leben gerufen. Nach einer Auszeichnung auf Product Hunt sah das Team die Möglichkeit, PlayHT zu einem Tool für die Erstellung realistischer Audioinhalte weiterzuentwickeln.
Heute unterstützt das Team nach eigenen Angaben einige der weltweit größten Unternehmen bei der Erstellung hochwertiger Text-to-Speech-Inhalte für ihre Anwendungen. Das Unternehmen ist dezentral organisiert und konzentriert sich auf die Bereitstellung hochwertiger Sprachsynthese- und Audio-Accessibility-Lösungen.
Preise
PlayHT bietet erschwingliche Tarife ab $9 pro Monat für 10.000 Wörter pro Monat und $39 für 50.000 Wörter pro Monat mit schnellerer Generierung.
Die höchste Stufe kostet $99 pro Monat und bietet zusätzlich zu 200.000 Wörtern pro Monat einen High-Fidelity-Klon.