KI in der Praxis

Nvidia Replicator: Künstliche Daten fürs KI-Training

Matthias Bastian
Ein 3D-Modell eines Gabelstalpers vor einem wirren Hintergrund

Nvidia

In Nvidias Business-Metaverse "Omniverse" soll Künstliche Intelligenz zum Allzweckhelfer werden. Dafür benötigen die verschiedenen Systeme viele Daten fürs Grundlagen- und Feintraining.

Ebendiese Daten sind die Krux: Die Zusammenstellung von Datensätzen kann mehr Aufwand sein als das eigentliche KI-Training. Schleichen sich in die Daten Fehler ein, besteht das Risiko, dass KI-Systeme falsche, schlechte oder ungerechte Entscheidungen treffen. Daten sind also beides: sowohl die Grundlage Künstlicher Intelligenz als auch ihre größte mögliche Fehlerquelle.

Hinzu kommt, dass der Zugang zu Daten ungleich verteilt ist. Große Tech-Konzerne wie Google oder Facebook sitzen auf einem gigantischen Datenschatz etwa für Sprach-KI, während viele andere Unternehmen nur auf intern generierte Daten zurückgreifen können, sofern diese denn strukturiert erhoben werden, oder auf frei verfügbare Datensätze.

Omniverse Replicator: Künstliche Daten für autonome Autos und Roboter

Mit Omniverse Replicator will Nvidia den Datenengpass in zwei Bereichen beseitigen: Die "Synthetic-Data-Generation Engine" kann künstliche Daten für den Einsatz von KI im autonomen Straßenverkehr (Nvidia Drive Sim) oder für Roboter (Nvidia Isaac Sim) generieren.

"Omniverse Replicator erweitert die kostspieligen, mühsam von Menschen beschrifteten realen Daten, die fehleranfällig und unvollständig sein können", schreibt Nvidia.

Im folgenden Video generiert das System 3D-Modelle von Gabelstaplern unter visuell vielen unterschiedlichen Bedingungen. Ein Computer-Vision-Modell, das mit diesen Daten trainiert wird, soll dann im Alltag sicher Gabelstalper erkennen, etwa für autonomen Lagerverkehr.

Nvidia verspricht physikalisch korrekt simulierte künstliche Daten, mit denen Entwickler:innen Lücken in Echtwelt-Daten schließen und neue Ground-Truth-Daten ergänzen können, die in der Realität schwierig zu erfassen und zu beschreiben sind wie Geschwindigkeit, Tiefe, verdeckte Objekte oder ungünstige Wetterbedingungen.

Nvidias KI-Datenmaschine: Weitere Domänen im nächsten Jahr

Drive Sim und Isaac Sim verwendet Nvidia in der internen KI-Entwicklung für das eigene autonome Fahrsystem Nvidia Drive sowie die Isaac Robotik-Systeme.

"Omniverse Replicator ermöglicht es uns, vielfältige, massive und genaue Datensätze zu erstellen, um qualitativ hochwertige, leistungsstarke und sichere Datensätze zu erstellen, was für KI unerlässlich ist", sagt Omniverse-Ingenieur Rev Lebaredian, der als Ressortleiter bei Nvidia Simulationstechnologie übersieht.

Nvidia möchte den Omniverse Replicator im kommenden Jahr extern zur Verfügung stellen. Unternehmen können dann auf Basis des vorhandenen Systems eigene Domänen-spezifische Daten-Engines erstellen.

Forschende des AI Now Instituts warnten im Herbst 2020 vor künstlich generierten Daten für das KI-Training, da sie auf Grundlage einiger weniger Daten extrapoliert würden und in den Ursprungsdaten vorhandene Probleme somit verstärken könnten. Allerdings bezog sich diese Warnung insbesondere auf KI-Systeme, die unmittelbar Menschen betreffen wie etwa für Gesichtserkennung.

Weiterlesen über Künstliche Intelligenz: