Das Münchner KI-Start-up Spaitial entwickelt sogenannte Spatial Foundation Models, die reale und imaginäre 3D-Welten aus Text oder Bildern erzeugen und verstehen sollen. Ziel ist eine neue Generation von KI-Systemen mit physikalischem Raumverständnis.
Mit Spaitial startet in München und London ein neues KI-Unternehmen, das sich auf die Generierung und das Verständnis von 3D-Welten spezialisiert. Im Zentrum steht ein neuer Modelltyp: sogenannte Spatial Foundation Models (SFMs), die räumlich und zeitlich konsistente 3D-Umgebungen erzeugen und verstehen sollen.
Im Gegensatz zu bisherigen generativen KI-Modellen operieren SFMs nicht auf Pixel- oder Textebene, sondern direkt auf 3D-Strukturen wie Geometrie, Materialität und physikalischen Eigenschaften. Diese Modelle sollen so eine physikalisch konsistente Vorstellung von Raum und Zeit entwickeln – eine Schwachstelle vieler aktueller Systeme.
Langfristig könnten sie als Grundlage für sogenannte Weltmodelle dienen, die wiederum als Basis für das Training von KI-Agenten fungieren, die sich in komplexen Umgebungen autonom bewegen und handeln können.
Fotorealistische Szenen aus Text oder Bild
Laut Spaitial können SFMs fotorealistische und physikalisch plausible 3D-Szenen aus einzelnen Bildern, kurzen Videosequenzen oder Textbeschreibungen erzeugen. Die generierten Umgebungen lassen sich interaktiv aus verschiedenen Kameraperspektiven betrachten.
Der Wechsel von zweidimensionalem Output zu einer raumzeitlich verankerten Darstellung soll eine höhere Konsistenz ermöglichen – etwa bei der Simulation physikalischer Prozesse oder der Navigation durch dynamische Umgebungen.
Anwendungsgebiete sieht Spaitial unter anderem im Bereich immersiver Medien wie Games, Film und AR/VR, bei der Erstellung digitaler Zwillinge für Planung und Simulation, in der autonomen Robotik sowie in der Modellierung von Industrie- und Stadtinfrastruktur. So könnten etwa Produktionsanlagen in Echtzeit simuliert oder autonome Maschinen besser auf ihre Umgebung abgestimmt werden.
Forschungs-Know-how trifft Industrieerfahrung
Für den Aufbau hat Spaitial eine Seed-Finanzierungsrunde über 13 Millionen US-Dollar abgeschlossen. Lead-Investor ist Earlybird Venture Capital, weitere Mittel kommen vom Risikokapitalgeber Speedinvest und einer Reihe prominenter Angel-Investoren, darunter Robin Rombach (Black Forest Labs), Victor Riparbelli und Steffen Tjerrild (Synthesia), Jon Barron, Edward Grefenstette und Maximilian Odendahl.
Das Kapital soll in die Weiterentwicklung der SFMs, den Aufbau skalierbarer Infrastruktur und die Expansion des Teams fließen. Spaitial plant außerdem Partnerschaften mit Unternehmen, um konkrete Anwendungen zu pilotieren. Wer früh Zugang zur Technologie erhalten möchte, kann sich auf eine Warteliste setzen lassen.
Im Gründungsteam sind Matthias Niessner, Professor an der TU München und Mitgründer des Avatar-KI-Start-ups Synthesia, Ricardo Martin-Brualla, der bei Google an generativer 3D-Technologie gearbeitet hat, sowie David Novotny, der zuvor bei Meta im Bereich digitale Zwillinge tätig war. Luke Rogers, ehemals bei McKinsey und Cazoo, bringt unternehmerische Erfahrung ein.
Zum erweiterten Team gehören unter anderem Katja Schwarz, die frühe generative 3D-Modelle wie GRAF und VoxGRAF mitentwickelte, sowie Mojtaba Bemana, der mit dem Paper "X-Fields" 4D-Darstellungen erforschte und mit dem EuroGraphics PhD Award 2025 ausgezeichnet wurde.