Inhalt
summary Zusammenfassung

Das KI-Startup Synthesia stellt die vierte Generation seiner KI-Avatare vor. Die "Expressive Avatars" sollen Emotionen, Stimmlage und Körpersprache realistisch wiedergeben können. Zielgruppe ist vor allem die Unternehmenskommunikation.

Anzeige

Synthesia, ein KI-Start-up für Videokommunikation, hat die vierte Generation seiner KI-Avatare vorgestellt. Die "Expressive Avatars" basieren auf dem neuen "EXPRESS-1"-Modell des Unternehmens, das Avatar-Performances realistischer machen soll.

Laut Synthesia können Avatare nun Skripte mit der richtigen Betonung, Körpersprache und Lippensynchronität wie ein echter Schauspieler vortragen. Jede Bewegung und jeder Gesichtsausdruck werde in Echtzeit vorhergesagt und nahtlos mit dem Timing, der Intonation und der Betonung der gesprochenen Sprache synchronisiert. Das Ergebnis sei eine natürliche und menschenähnliche Performance.

Das EXPRESS-1-Modell verwendet große, vortrainierte Modelle als Rückgrat für die Leistung der Expressive Avatare, kombiniert mit Diffusion, um "komplexe multimodale Verteilungen zu modellieren". Im Gegensatz zu konkurrierenden Lösungen, die auf vordefinierten Dynamiken basieren, sollen die Avatare von Synthesia einzigartige Darstellungen erzeugen.

Anzeige
Anzeige

Potenzielle Anwendungsbeispiele sind neben Präsentationen und Marketing der Wissenstransfer und Onboardings. Synthesia ist davon überzeugt, dass Video mit dem Eintritt der Generation Z und Alpha ins Berufsleben zum Standardmedium für die Zusammenarbeit und Kommunikation am Arbeitsplatz wird. Die eigene Plattform sieht es als eine mögliche Antwort auf die Herausforderung, immer mehr mit Video statt mit Text zu arbeiten.

Die Fortschritte von Synthesia machen deutlich, dass - wie bereits bei KI-Fotos - KI-generierte Personen in Videos bald kaum noch von echten Personen zu unterscheiden sein werden. Synthesia betont, dass es zusätzliche Maßnahmen ergriffen hat, um den Missbrauch seiner Plattform zu verhindern, wie Richtlinien zur Beschränkung bestimmter Inhalte, Investitionen in die Früherkennung böswilliger Akteure und Experimente mit Technologien zur Identifizierung von Inhalten.

Synthesia mit Sitz in London erhielt zuletzt im Juni 2023 90 Millionen Dollar und erreichte damit eine Bewertung von einer Milliarde Dollar. Das Start-up wurde 2017 von Forschenden und Unternehmer:innen des University College London, aus Stanford, der Technischen Universität München sowie aus Cambridge gegründet.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Synthesia, ein KI-Startup für Videokommunikation, stellt die vierte Generation seiner KI-Avatare vor, die "Expressive Avatars". Diese basieren auf dem Modell "EXPRESS-1" und sollen Emotionen, Stimmlage und Körpersprache realistisch wiedergeben können.
  • Die Avatare verwenden große, vortrainierte Modelle und Diffusion, um einzigartige Darstellungen zu erzeugen. Bewegungen und Gesichtsausdrücke werden in Echtzeit vorhergesagt und mit Timing, Intonation und Betonung der gesprochenen Sprache synchronisiert.
  • Mögliche Anwendungsbeispiele sind Präsentationen, Marketing, Wissenstransfer und Onboarding. Synthesia sieht seine Plattform als Antwort auf die Herausforderung, dass immer mehr Video in der Unternehmenskommunikation benötigt wird.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!