Inhalt
summary Zusammenfassung

Forschende des chinesischen Technologiekonzerns Tencent haben Version 2.0 von Hunyuan3D veröffentlicht, einem Open-Source-System zur Generierung von texturierten 3D-Modellen aus Bildern.

Anzeige

Die neue Version besteht aus zwei Hauptkomponenten: Hunyuan3D-DiT für die Generierung der 3D-Formen und Hunyuan3D-Paint für die Generierung der Texturen.

Video: Tencent

Zweigeteilte Architektur für Form und Textur

Hunyuan3D-DiT ist ein neues Diffusions-Transformer-Modell, das die wesentlichen Formen eines 3D-Objekts erkennt und komprimiert darstellen kann. Darauf aufbauend kann es dann zu einem Eingabebild passende 3D-Formen generieren, die dem Bild sehr ähnlich sehen.

Anzeige
Anzeige

Für die Texturierung kommt dann Hunyuan3D-Paint zum Einsatz. Es nutzt Informationen über die 3D-Form wie Oberflächenausrichtungen und Positionen, um Texturen zu generieren, die laut den Forschenden von allen Seiten gut aussehen.

Technisches Diagramm: Hunyuan3D 2.0 Architektur mit zwei Hauptkomponenten für 3D-Mesh-Generierung und Texturierung.
Die Architektur von Hunyuan3D 2.0 kombiniert zwei Kernkomponenten für die 3D-Generierung: Hunyuan3D-DiT erstellt das Grundgerüst aus einem Eingabebild, während Hunyuan3D-Paint Texturen basierend auf geometrischen Bedingungen wie Normal- und Positionskarten erzeugt. | Bild: Tencent

Gegenüber der ersten Generation weist Hunyuan3D 2.0 mehrere Neuerungen auf: Das Modell Hunyuan3D-DiT erkennt besonders relevante Formdetails wie Kanten und Ecken. Die generierten 3D-Modelle geben daher Bilddetails wie Gesichter, Oberflächenstrukturen und Beschriftungen genauer wieder. Außerdem seien sie frei von Löchern und Fehlern, so die Forscher:innen.

Hunyuan3D-Paint entfernt auch Beleuchtungseffekte aus dem Eingabebild. So entstehen Texturen, die unabhängig von der Beleuchtung gut aussehen und sich nahtlos in die 3D-Modelle einfügen.

In Tests habe Hunyuan3D 2.0 sowohl bei der Erzeugung der 3D-Formen und Texturen als auch bei den fertigen 3D-Modellen alle Vergleichsmodelle in Bezug auf Qualität und Ähnlichkeit zum Eingabebild übertroffen, heißt es in dem Forschungspapier. Am deutlichsten wird dies im folgenden Beispiel an dem gut lesbaren Text auf dem Schild, das der Pinguin hochhält.

Vergleichsstudie: Drei Reihen mit 3D-Modellen zeigen Pinguine, Pinguinfiguren in Bewegung und Berglandschaften in verschiedenen Rendering-Varianten.
Das neue Hunyuan-Modell zeigt im Vergleich zu anderen Lösungen deutliche Verbesserungen bei Oberflächendetails, Bewegungsdarstellung und komplexen Strukturen mit realistischen Texturen. | Bild: Tencent

Hunyuan3D-Studio: Web-Werkzeuge sollen 3D-Generierung für alle zugänglich machen

Zusätzlich zum Generierungssystem gibt es nun das webbasierte Hunyuan3D-Studio, eine Sammlung von Werkzeugen für die 3D-Produktion. Sketch-to-3D wandelt 2D-Skizzen in 3D-Modelle um. Ein Tool zur Vereinfachung reduziert die Komplexität von 3D-Modellen. Die 3D-Charakteranimation versieht generierte Figuren automatisch mit Bewegung. Die Nutzung ist jedoch erst nach Login per WeChat, QQ oder chinesischer Telefonnummer möglich.

Empfehlung

Das Tencent-Forschungsteam hofft, dass Hunyuan3D 2.0 eine Basis für weitere große 3D-Modelle in der Open-Source-Welt schafft und zukünftige Forschung auf diesem Gebiet erleichtert. Dank der Veröffentlichung als Open Source könnten Entwickler auf dem System aufbauen und es für ihre Zwecke anpassen und erweitern.

Die KI-gestützte Generierung von 3D-Objekten ist beständiger Forschungsgegenstand, sowohl im Open-Source- als auch kommerziellen Bereich. Zuletzt haben dahingehend unter anderem Nvidia, Stability AI und Meta Fortschritte gezeigt.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Tencent-Forschende haben Version 2.0 von Hunyuan3D veröffentlicht, einem Open-Source-System zur Generierung texturierter 3D-Modelle aus Bildern, das aus den Komponenten Hunyuan3D-DiT für 3D-Formen und Hunyuan3D-Paint für Texturen besteht.
  • Hunyuan3D-DiT erkennt als Diffusions-Transformations-Modell die wesentlichen Formen eines 3D-Objektes und kann zum Eingabebild passende 3D-Formen erzeugen, während Hunyuan3D-Paint Texturen auf Basis von Informationen wie Oberflächenausrichtungen und -positionen generiert.
  • In Tests übertraf Hunyuan3D 2.0 Vergleichsmodelle bei der Erzeugung von 3D-Formen, Texturen und fertigen 3D-Modellen in Bezug auf Qualität und Ähnlichkeit zum Eingabebild. Zusätzlich steht das webbasierte Hunyuan3D Studio mit Werkzeugen für die 3D-Produktion zur Verfügung.
Quellen
Jonathan ist Technikjournalist und beschäftigt sich stark mit Consumer Electronics. Er erklärt seinen Mitmenschen, wie KI bereits heute nutzbar ist und wie sie im Alltag unterstützen kann.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!