Anzeige
Skip to content
Read full article about: Jared Leto investiert in KI-Startup Captions für einfache Videoproduktion und digitale Avatare

Captions, ein KI-Startup für Videoerzeugung und -bearbeitung, hat in einer neuen Finanzierungsrunde unter der Leitung von Index Ventures 60 Millionen Dollar eingesammelt. Damit steigt die Bewertung des Unternehmens auf 500 Millionen Dollar. Weitere Investoren sind Kleiner Perkins, Andreessen Horowitz, Sequoia Capital und der Schauspieler Jared Leto. Mit der Software von Captions können Nutzer ohne Filmerfahrung Videos mit mehrsprachigen Avataren erstellen, bearbeiten und verbreiten. Über die App des Unternehmens werden laut CEO Gaurav Misra monatlich fast 3,5 Millionen Videos veröffentlicht, insgesamt wurde sie bereits mehr als zehn Millionen Mal heruntergeladen. Captions kombiniert eigene KI-Modelle mit denen anderer Anbieter wie OpenAI, Anthropic und Eleven Labs. Wettbewerber sind etwa HeyGen und Synthesia, die beide ebenfalls gut finanziert und hoch bewertet sind. Neu bei Captions ist ein generativer KI-Video-Editor.

Read full article about: RX1 ist ein humanoider Open-Source-Roboter zum Selberbauen für unter 1.000 Dollar.

RX1 ist ein humanoider Open-Source-Roboter, der für weniger als 1.000 US-Dollar nachgebaut werden kann. RX1, das erste Projekt von Red Rabbit Robotics, ist ein menschengroßer zweiarmiger Roboter, der Objekte greifen und platzieren kann und über eine Verbindung zu einem Computer mittels maschinellem Lernen oder einer VR-Brille ferngesteuert werden kann. Für das Projekt werden 3D-gedruckte, kommerziell erhältliche Komponenten verwendet. Mit dem RX1 Humanoid Servo sind nun die Pläne für das erste Bauteil auf GitHub verfügbar. Weitere Baupläne, Software und Anleitungen sollen in den kommenden Wochen veröffentlicht werden.

Read full article about: Googles Multimodal Canvas ist eine Entwicklungsumgebung für multimodale Prompts

Google Deepmind hat mit Multimodal Canvas eine experimentelle Testkonsole für Entwickler gestartet. Die können mit einem gültigen API Key über Gemini 1.5 Flash schnell multimodale Prompts mit Text, Zeichnungen, Kameraaufnahmen und anderen Bildern testen. Gemini 1.5 Flash ist schneller und günstiger als das größere Gemini 1.5 Pro und unterstützt ein Kontextfenster mit 1 Million Token.