KI in der Praxis

KI-Avatare können jetzt mehr Emotionen zeigen

Matthias Bastian

Synthesia

Das KI-Startup Synthesia stellt die vierte Generation seiner KI-Avatare vor. Die "Expressive Avatars" sollen Emotionen, Stimmlage und Körpersprache realistisch wiedergeben können. Zielgruppe ist vor allem die Unternehmenskommunikation.

Synthesia, ein KI-Start-up für Videokommunikation, hat die vierte Generation seiner KI-Avatare vorgestellt. Die "Expressive Avatars" basieren auf dem neuen "EXPRESS-1"-Modell des Unternehmens, das Avatar-Performances realistischer machen soll.

Laut Synthesia können Avatare nun Skripte mit der richtigen Betonung, Körpersprache und Lippensynchronität wie ein echter Schauspieler vortragen. Jede Bewegung und jeder Gesichtsausdruck werde in Echtzeit vorhergesagt und nahtlos mit dem Timing, der Intonation und der Betonung der gesprochenen Sprache synchronisiert. Das Ergebnis sei eine natürliche und menschenähnliche Performance.

Das EXPRESS-1-Modell verwendet große, vortrainierte Modelle als Rückgrat für die Leistung der Expressive Avatare, kombiniert mit Diffusion, um "komplexe multimodale Verteilungen zu modellieren". Im Gegensatz zu konkurrierenden Lösungen, die auf vordefinierten Dynamiken basieren, sollen die Avatare von Synthesia einzigartige Darstellungen erzeugen.

Potenzielle Anwendungsbeispiele sind neben Präsentationen und Marketing der Wissenstransfer und Onboardings. Synthesia ist davon überzeugt, dass Video mit dem Eintritt der Generation Z und Alpha ins Berufsleben zum Standardmedium für die Zusammenarbeit und Kommunikation am Arbeitsplatz wird. Die eigene Plattform sieht es als eine mögliche Antwort auf die Herausforderung, immer mehr mit Video statt mit Text zu arbeiten.

Die Fortschritte von Synthesia machen deutlich, dass - wie bereits bei KI-Fotos - KI-generierte Personen in Videos bald kaum noch von echten Personen zu unterscheiden sein werden. Synthesia betont, dass es zusätzliche Maßnahmen ergriffen hat, um den Missbrauch seiner Plattform zu verhindern, wie Richtlinien zur Beschränkung bestimmter Inhalte, Investitionen in die Früherkennung böswilliger Akteure und Experimente mit Technologien zur Identifizierung von Inhalten.

Synthesia mit Sitz in London erhielt zuletzt im Juni 2023 90 Millionen Dollar und erreichte damit eine Bewertung von einer Milliarde Dollar. Das Start-up wurde 2017 von Forschenden und Unternehmer:innen des University College London, aus Stanford, der Technischen Universität München sowie aus Cambridge gegründet.

Quellen: