Anzeige
Short

Das Sprach-KI-Startup ElevenLabs hat einen ersten Einblick in ein neues Modell gegeben, das Songs aus Prompts generieren kann. Das von ehemaligen Google- und Palantir-Mitarbeitern gegründete Unternehmen hat sich auf maschinelles Lernen für das Kopieren und die Synthese von Stimmen spezialisiert. ElevenLabs hat bereits Tools für die Synchronisation ganzer Filme entwickelt und will mit ElevenLabs Music nun wohl auch in die Musikindustrie einsteigen. Die veröffentlichten Beispiele liegen ungefähr auf dem Niveau der Konkurrenz von Suno AI und Udio und haben eine Laufzeit von etwa drei Minuten.

Video: Elevenlabs via X

Anzeige
Anzeige
Short

Das Forschungsteam von Temporal Games hat ein Plugin für das Echtzeit-Streaming volumetrischer Videos in Unreal Engine 5 via Gaussian Splatting entwickelt. Animiertes Gaussian Splatting ermöglicht es, reale Ereignisse oder Performances als dreidimensionale Projektionen der Realität darzustellen. Die Herausforderung liegt in der großen Datenmenge, die für die Darstellung der Animation erforderlich ist. Das Team konnte die Datengröße, um das 15-fache zu reduzieren. In einem kürzlich veröffentlichten Video zeigen die Forscher auch, wie die integrierte Aufnahme in Echtzeit dynamisch beleuchtet werden kann. Das Team plant eine Client-Server-Lösung für das 4DGS-Streaming und will die Technologie für Spiele und Webplattformen verfügbar machen.

Anzeige
Anzeige
Anzeige
Anzeige
Google News