Inhalt
summary Zusammenfassung

Das Münchner KI-Start-up Spaitial entwickelt sogenannte Spatial Foundation Models, die reale und imaginäre 3D-Welten aus Text oder Bildern erzeugen und verstehen sollen. Ziel ist eine neue Generation von KI-Systemen mit physikalischem Raumverständnis.

Anzeige

Mit Spaitial startet in München und London ein neues KI-Unternehmen, das sich auf die Generierung und das Verständnis von 3D-Welten spezialisiert. Im Zentrum steht ein neuer Modelltyp: sogenannte Spatial Foundation Models (SFMs), die räumlich und zeitlich konsistente 3D-Umgebungen erzeugen und verstehen sollen.

Im Gegensatz zu bisherigen generativen KI-Modellen operieren SFMs nicht auf Pixel- oder Textebene, sondern direkt auf 3D-Strukturen wie Geometrie, Materialität und physikalischen Eigenschaften. Diese Modelle sollen so eine physikalisch konsistente Vorstellung von Raum und Zeit entwickeln – eine Schwachstelle vieler aktueller Systeme.

Langfristig könnten sie als Grundlage für sogenannte Weltmodelle dienen, die wiederum als Basis für das Training von KI-Agenten fungieren, die sich in komplexen Umgebungen autonom bewegen und handeln können.

Anzeige
Anzeige

Fotorealistische Szenen aus Text oder Bild

Laut Spaitial können SFMs fotorealistische und physikalisch plausible 3D-Szenen aus einzelnen Bildern, kurzen Videosequenzen oder Textbeschreibungen erzeugen. Die generierten Umgebungen lassen sich interaktiv aus verschiedenen Kameraperspektiven betrachten.

Der Wechsel von zweidimensionalem Output zu einer raumzeitlich verankerten Darstellung soll eine höhere Konsistenz ermöglichen – etwa bei der Simulation physikalischer Prozesse oder der Navigation durch dynamische Umgebungen.

Anwendungsgebiete sieht Spaitial unter anderem im Bereich immersiver Medien wie Games, Film und AR/VR, bei der Erstellung digitaler Zwillinge für Planung und Simulation, in der autonomen Robotik sowie in der Modellierung von Industrie- und Stadtinfrastruktur. So könnten etwa Produktionsanlagen in Echtzeit simuliert oder autonome Maschinen besser auf ihre Umgebung abgestimmt werden.

Forschungs-Know-how trifft Industrieerfahrung

Für den Aufbau hat Spaitial eine Seed-Finanzierungsrunde über 13 Millionen US-Dollar abgeschlossen. Lead-Investor ist Earlybird Venture Capital, weitere Mittel kommen vom Risikokapitalgeber Speedinvest und einer Reihe prominenter Angel-Investoren, darunter Robin Rombach (Black Forest Labs), Victor Riparbelli und Steffen Tjerrild (Synthesia), Jon Barron, Edward Grefenstette und Maximilian Odendahl.

Das Kapital soll in die Weiterentwicklung der SFMs, den Aufbau skalierbarer Infrastruktur und die Expansion des Teams fließen. Spaitial plant außerdem Partnerschaften mit Unternehmen, um konkrete Anwendungen zu pilotieren. Wer früh Zugang zur Technologie erhalten möchte, kann sich auf eine Warteliste setzen lassen.

Empfehlung

Im Gründungsteam sind Matthias Niessner, Professor an der TU München und Mitgründer des Avatar-KI-Start-ups Synthesia, Ricardo Martin-Brualla, der bei Google an generativer 3D-Technologie gearbeitet hat, sowie David Novotny, der zuvor bei Meta im Bereich digitale Zwillinge tätig war. Luke Rogers, ehemals bei McKinsey und Cazoo, bringt unternehmerische Erfahrung ein.

Zum erweiterten Team gehören unter anderem Katja Schwarz, die frühe generative 3D-Modelle wie GRAF und VoxGRAF mitentwickelte, sowie Mojtaba Bemana, der mit dem Paper "X-Fields" 4D-Darstellungen erforschte und mit dem EuroGraphics PhD Award 2025 ausgezeichnet wurde.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Das Münchner Start-up Spaitial entwickelt "Spatial Foundation Models" (SFMs), die konsistente 3D-Welten aus Text, Bildern oder kurzen Videos generieren und verstehen können.
  • Ziel ist es, KI-Systeme mit physikalischem Raumverständnis zu schaffen. Anwendungsfelder sind Games, Film, AR/VR, digitalen Zwillingen und autonomer Robotik.
  • Im Unterschied zu bisherigen KI-Modellen arbeiten SFMs direkt mit 3D-Strukturen wie Geometrie und Materialität, was eine physikalisch plausible Darstellung und Interaktion ermöglichen soll.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!