KI in der Praxis

D-IDs GPT-basiertes Live Portrait Tool gibt ChatGPT und Co. ein Gesicht

Harry Verity
Eine digitale Frau in einem Fernsehgerät, die Unterstützung leistet.

D-ID

Das Kreativstudio D-ID hat ein neues Live-Portrait-Tool entwickelt, mit dem KI-generierte Präsentatoren für Marketing-, Bildungs- und andere Zwecke erstellt werden können.

Das Live-Portrait-Tool kombiniert die Textgenerierung für Konversationen von GPT-3 mit Animationen von Stable Diffusion und der Möglichkeit, aus einer Reihe von KI-Stimmen zu wählen oder eigene Audiodaten hochzuladen.

Die Zukunft des Podcasting?

Das D-ID-Tool könnte die Art und Weise verändern, wie Kreative und Unternehmen Inhalte erstellen. Denn theoretisch muss nicht mehr stundenlang gefilmt und fotografiert werden. Nutzer können einfach vorhandene Fotos von sich mit einer eigenen oder KI-generierten Sprachaufnahme versehen.

Wer sich bei der Aufnahme eines Podcasts versprochen oder vergessen hat, ein wichtiges Thema zu erwähnen, muss nicht mehr neu aufnehmen, sondern kann die Lücken mit Live-Porträts füllen - so die Theorie.

In der Praxis sind die Lippen- und Kopfbewegungen realer Personen noch etwas gewöhnungsbedürftig, und man kann immer noch erkennen, dass das Bild vom Computer manipuliert wurde.

Video: DID / Harry Verity

Ein Traum für Geschichtenerzähler

Das Live-Portrait-Tool funktioniert viel besser mit KI-generierten Avataren als mit Originalfotos. Auch KI-Bilder, die mit Midjourney und DALL-E erstellt wurden, können integriert werden. Dies bietet digitalen Künstler:innen die Möglichkeit, ihre Arbeit zu animieren und eine Geschichte zu erzählen.

Benutzer, denen die Worte fehlen, können auch das neue Textgenerierungstool von D-ID verwenden, das auf GPT-3 basiert, derselben Technologie, die auch ChatGPT zugrunde liegt.

Weitere Anwendungsfälle für das Live-Portrait-Tool sind automatisierte Chatbots, die durch ein animiertes Bild einer realen Person dargestellt werden, eine Funktion, die das Unternehmen mit seinem anderen Chatbot-Tool Chat D-ID verwendet.

Familiengeschichten

D-ID hat seine Software bereits an die Genealogie-Website My Heritage lizenziert. Mit Deep Nostalgia können Ahnenforscher Fotos ihrer Vorfahren hochladen und sie so zum Leben erwecken.

Nach Angaben von My Heritage wurde dieses Tool bereits über 100 Millionen Mal genutzt. Mit dem LiveStory-Tool der nächsten Generation können Nutzer ihre Vorfahren zum Leben erwecken und eine Geschichte über ihre Erlebnisse erzählen.

Ethik und Datenschutz

Alle D-ID Tools verhindern das Hochladen von Bildern realer Personen, um den Missbrauch durch Fälscher zu verhindern. Ich habe versucht, ein Foto des britischen Königs George V. hochzuladen und es mit seiner echten Weihnachts-Radiosendung aus dem Jahr 1935 zu verknüpfen - ohne Erfolg. Anscheinend gilt diese Politik sogar für längst verstorbene Persönlichkeiten des öffentlichen Lebens.

In der Ethikerklärung verpflichtet sich D-ID außerdem, "wissentlich keine Lizenzen zur Nutzung unserer Plattform an politische Parteien zu vergeben. Wir werden auch nicht wissentlich mit Pornoverlagen, terroristischen Organisationen oder Waffenherstellern zusammenarbeiten."

D-ID wurde 2017 von den israelischen Informatikern Gil Perry, Sella Blondheim und Eliran Kuta gegründet und wird von Risikokapitalgebern unterstützt.