Welt der Wunder

Nicht glauben, sondern wissen

Wie generative KI den Weg ins Metaverse ebnen wird

Foto: Envato / DC_Studio

Wie generative KI den Weg ins Metaverse ebnen wird

Generative KI erstellt anhand einfacher Anweisungen in Sekunden Bilder, Texte, Videos und vieles mehr. Sie hat somit das Potenzial, kreative Prozesse, wie wir sie kennen, für immer zu verändern. Auch die virtuellen Welten des Metaverse werden entscheidend davon profitieren.

Das Metaverse wird flache Websites durch eine dynamische, frei erkundbare 3D-Welt ablösen. Noch erfordert die Erstellung dieser 3D-Welten jedoch viel technisches Know-how. Hier könnte generative KI ihre Stärken ausspielen und den Arbeitsaufwand enorm reduzieren.

3D-Modelle bringen einen weitaus höheren Arbeitsaufwand mit sich als konventionelle Grafiken

Die klassischen Verfahren zur Erzeugung von 3D-Grafiken sind sehr aufwendig und haben sich seit ihrer Erfindung in den 1970er-Jahren kaum weiterentwickelt. Die Basis von 3D-Objekten besteht aus Hunderten bis Tausenden von Vielecken (Polygonen), die so zusammengefügt werden, dass die gewünschte Form entsteht.

Wie generative KI den Weg ins Metaverse ebnen wird: die Gestaltung von 3D-Modellen
Von Hand erstellte 3D-Grafiken werden von einem 3D-Designer aus teils winzigen Vielecken zusammengesetzt.

Foto: Envato / LightfieldStudios

Vielecke haben den Vorteil, dass diese mit relativ geringem Rechenaufwand aus jeder möglichen Perspektive dargestellt werden können. Andere Verfahren zur Modellierung von 3D-Objekten wie mit Volumen versehene Pixel (Voxel) konnten sich im Mainstream nicht durchsetzen.

Der Nachteil von Polygonen: Aufgrund des eckigen Erscheinungsbilds sind runde oder geschwungene Formen eine Herausforderung für 3D-Designer. Werden zum Modellieren entsprechend viele kleine Polygone verwendet, kann dieser Nachteil bis zu einem gewissen Grad ausgeglichen werden. Dementsprechend bestehen Spielfiguren und Avatare in aktuellen 3D-Spielen wie Fortnite und Hogwarts Legacy aus bis zu 60.000, zum Teil winzigen, Polygonen.

Die Erstellung von 3D-Objekten von Hand kann Tage dauern

Ist die Basis des 3D-Objekts fertig modelliert, werden dessen Polygone mit Oberflächenstrukturen versehen, in der Fachsprache Texturen genannt. Gängige Oberflächenstrukturen in 3D-Welten sind z. B. Gras, Erde, Steine und Baumaterialien für die Gestaltung von 3D-Umgebungen. Bei der Gestaltung von Avataren imitieren Texturen das Aussehen von Kleidung, Haut und Haaren.

Eine gekonnte Kombination einer aufwendig modellierten Struktur und geschickt gewählten Texturen kann fotorealistisch aussehen. Bei komplexen 3D-Modellen dauert die Erstellung dementsprechend 70 bis 100 Stunden.

Quelle: YouTube / Grant Abbitt

Bei der Erstellung von 3D-Welten kann generative KI ihre Stärken voll ausspielen

Erstellung von 3D-Modellen aus 2D-Grafiken per KI

Derzeit sind mehrere Verfahren in der Entwicklung, die mithilfe generativer KI 3D-Modelle aus 2D-Bildern erzeugen können. Diese sind in der Lage, den Aufwand der Erstellung von 3D-Welten massiv zu verringern. Ein Beispiel: das Tool GET3D des Grafikprozessorherstellers nVidia.

Hier wurde eine KI mithilfe einer Million 3D-Modelle aus verschiedensten Perspektiven trainiert. Lädt der Nutzer ein 2D-Bild hoch, erstellt die KI daraus automatisch ein 3D-Modell. Dieses 3D-Modell kann anschließend durch einfache Texteingabe weiter angepasst werden – von der Form bis hin zur Oberflächengestaltung.

Quelle: YouTube.com / NvidiaDeveloper

Erstellung von 3D-Modellen mithilfe von Photogrammetrie und Videogrammetrie

Bei Photogrammetrie werden mehrere Fotos eines Objekts oder einer Landschaft aus verschiedenen Blickwinkeln und Positionen aufgenommen. Anschließend erstellt eine speziell trainierte KI aus den Fotos ein 3D-Modell.

Mittlerweile können auch Videos geeignete Daten für KI-generierte Erstellung von 3D-Modellen liefern. Dieses Verfahren wird daher als Videogrammetrie bezeichnet. So ist es etwa möglich, aus Drohnenaufnahmen KI-gestützt dreidimensionale Landschaften zu erstellen.

Quelle: YouTube / Capturing Reality

Auslesen von Tiefeninformationen in 2D-Bildern per KI

Zudem sind KI-Algorithmen inzwischen in der Lage, 2D-Bildern dreidimensionale Tiefeninformationen zu entnehmen. Die ermittelten Daten werden anschließend zur Erstellung eines 3D-Modells verwendet. Im Gegensatz zur Photogrammetrie-Methode wird nur ein einziges Foto eines Objekts oder einer Landschaft benötigt.

Quelle: YouTube / RoblabWHGe

Erstellung von 3D-Grafiken mithilfe von LiDAR-Scannen

LiDAR steht für „Light Detection and Ranging“. Bei dieser Technik wird die 3D-Oberfläche eines Objekts, einer Landschaft oder einer Person mit einem Laser abgetastet. Dadurch wird der Abstand im 3D-Raum zwischen dieser und dem Scanner bestimmt. Mithilfe von KI-Algorithmen können diese Daten zur Erstellung eines 3D-Modells verwendet werden. Mittlerweile gibt es bereits Smartphone-Modelle mit integriertem LiDAR-Scanner.

Quelle: YouTube / Curtis Holt

Prozedurale Generierung von 3D-Grafiken

Hierbei werden 3D-Umgebungen oder Objekte komplett mithilfe eines Algorithmus erzeugt. Der Benutzer hat die Möglichkeit, das Ergebnis durch die Eingabe von Parametern zu beeinflussen. Er kann etwa bei einer prozedural generierten Landschaft festlegen, ob sie mehr Bäume oder Büsche enthalten, ob sie hügelig oder flach sein soll.

Durch prozedurale Generierung können theoretisch unendlich viele verschiedene 3D-Objekte und 3D-Landschaften erzeugt werden. Der Nachteil: Sie können sich sehr ähneln, da viele prozedurale Generatoren vorgegebene Bausteine und Elemente immer wieder nach dem Zufallsprinzip neu kombinieren.

Quelle: YouTube / Werewolven

ChatGPT als Negativbeispiel für generative KI

Auch die momentan bekannteste künstliche Intelligenz der Welt ist eine generative KI. Mit seiner Fähigkeit, auf Zuruf realistische Texte zu jedem denkbaren Thema zu generieren, ist ChatGPT auf den ersten Blick zu beeindruckenden Leistungen fähig.

Die „Intelligenz“, die ChatGPT bei der Beantwortung von Fragen zur Schau zu stellen scheint, ist jedoch eine reine Statistikrechnung. Die Textgenerierung geschieht durch eine Analyse der Wissensdatenbank, auf welche die KI zugreift, und einer anschließenden Berechnung, welche Wörter bei einem Text zum gewünschten Thema statistisch gesehen am wahrscheinlichsten aufeinanderfolgen.

Textgenerierung per KI als Fake-News-Schleuder, 3D-Generierung per KI als Revolution

Die KI ist daher extrem anfällig dafür, falsche Informationen auszugeben. Nicht nur die faktischen Fehler, die in ihrer Wissensdatenbank enthalten sind, werden unverändert übernommen. Je weniger Texte zum angefragten Thema in der Datenbank der KI vorhanden sind, desto wahrscheinlicher ist, dass bei der Textgenerierung faktisch falsche Texte entstehen.

Bei der Texterstellung hat die generative KI also noch massive Schwächen. Im Bereich des 3D-Designs werden ihre Fähigkeiten jedoch in wenigen Jahren zweifellos zu massiven Fortschritten führen.

Welt der Wunder - Die App

Kostenfrei
Ansehen