Inhalt
summary Zusammenfassung
DEEP MINDS Podcast
Podcast über Künstliche Intelligenz und Wissenschaft
KI bei der Bundeswehr und der BWI | DEEP MINDS #16

PlayHT ist ein weiteres KI-basiertes Text-to-Speech (TTS) Tool, das ursprünglich als Sprachtool für Medium entwickelt wurde.

Die Hauptanwendung von PlayHT ist die Erstellung von Podcasts. Es bietet eine Vielzahl von Funktionen, einschließlich einer großen Auswahl an Sprachen und Stimmen.

Eine der besten Eigenschaften von PlayHT ist, dass es die Text-to-Speech-Stimmen von Google, Amazon, IBM und Microsoft in einer API vereint.

Es unterstützt 132 Sprachen und insgesamt 832 Stimmen sowie MP3- und WAV-Export für einen einfachen Upload auf Plattformen wie Spotify und Apple Podcasts.

Anzeige
Anzeige

Eine einzigartige Funktion von PlayHT, das benutzerdefinierte Klonen von Stimmen, ermöglicht es Benutzern, benutzerdefinierte Stimmenmodelle zu erstellen. Diese basieren auf individuellem Audio-Input, wodurch eine zusätzliche Personalisierungsebene geschaffen wird.

Die vollständige Unterstützung von PlayHT für die Sprachsynthesesprache SSML (Speech Synthesis Markup Language) ermöglicht es dem Benutzer, verschiedene Aspekte der Sprache wie Betonung, Geschwindigkeit und Pausen zu steuern, was zu einer nuancierten und menschenähnlichen Sprachausgabe führt.

PlayHT bietet einen sicheren Cloud-Speicher für synthetisierte Audiodateien, so dass die Benutzer ihre Dateien einfach und sicher verwalten können. Die Software bietet auch Tools für den Teamzugriff und die Zusammenarbeit. So kann ein ganzes Team zusammenarbeiten, Audiodateien austauschen und gemeinsam erstellen.

Anwendungsfälle

Die KI-generierten Stimmen von PlayHT können in verschiedenen Bereichen eingesetzt werden. Marketer und Content-Produzenten können diese Stimmen für Marketing-, Erklärungs-, Produkt- und YouTube-Videos verwenden.

Die Technologie kann für E-Learning-Zwecke eingesetzt werden, um Schulungsmaterialien mit der korrekten Aussprache von Fachbegriffen und Abkürzungen zu versehen.

Empfehlung

Entwickler können mithilfe der bereitgestellten API menschenähnliche Stimmen in Geräte und Anwendungen integrieren.

Unternehmen können ihren Kundenservice durch professionelle Sprachinteraktionen in IVR- und Telefonsystemen verbessern.

Webmaster können die Zugänglichkeit und das Engagement auf ihren Websites verbessern, indem sie SEO-freundliche Audio-Widgets einbetten.

Kürzlich hat PlayHT sein neuestes Modell PlayHT Turbo vorgestellt, das eingegebenen Text besonders schnell in Sprache umwandeln kann. Die Verzögerung soll nur 150 bis 200 ms betragen, also gefühlte Echtzeit.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Von der Chrome-Erweiterung zur KI-Anwendung

PlayHT wurde 2016 als Chrome-Erweiterung zum Anhören von Artikeln der Plattform Medium ins Leben gerufen. Nach einer Auszeichnung auf Product Hunt sah das Team die Möglichkeit, PlayHT zu einem Tool für die Erstellung realistischer Audioinhalte weiterzuentwickeln.

Heute unterstützt das Team nach eigenen Angaben einige der weltweit größten Unternehmen bei der Erstellung hochwertiger Text-to-Speech-Inhalte für ihre Anwendungen. Das Unternehmen ist dezentral organisiert und konzentriert sich auf die Bereitstellung hochwertiger Sprachsynthese- und Audio-Accessibility-Lösungen.

Preise

PlayHT bietet erschwingliche Tarife ab $9 pro Monat für 10.000 Wörter pro Monat und $39 für 50.000 Wörter pro Monat mit schnellerer Generierung.

Die höchste Stufe kostet $99 pro Monat und bietet zusätzlich zu 200.000 Wörtern pro Monat einen High-Fidelity-Klon.

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • PlayHT ist ein KI-gestütztes Text-to-Speech-Tool mit 832 Stimmen in 132 Sprachen, das Google-, Amazon-, IBM- und Microsoft-APIs für die Erstellung von Podcasts, Marketingvideos, E-Learning-Materialien und mehr nutzt.
  • Zu den einzigartigen Funktionen gehören das Klonen benutzerdefinierter Stimmen, volle Unterstützung für die Sprachsynthesesprache SSML (Speech Synthesis Markup Language), sicherer Cloud-Speicher und Tools für die Zusammenarbeit im Team.
  • Ursprünglich eine Chrome-Erweiterung zum Anhören von Medienartikeln, bedient PlayHT heute große Unternehmen weltweit mit Tarifen ab 9 US-Dollar pro Monat für 10.000 Wörter.
Quellen
Journalist und Autor Harry Verity nutzt KI-Tools, um seine Geschichten auf neue Weise zum Leben zu erwecken. Derzeit arbeitet er an den ersten vollständig KI-generierten Filmen aus seinen Romanen und bietet einen Newsletter mit Fortsetzungsgeschichten, die von Midjourney illustriert werden.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!