Virtual Reality – Überblick und Grundlagen

Nach den digitalen Sprachassistenten schickt sich mit Virtual Reality (VR) aktuell eine weitere lange belächelte digitale Innovation an, Einzug in  unseren Alltag zu halten. Die Nachfrage nach VR-Technologie steigt seit einiger Zeit erheblich, getrieben v. a. durch spektakuläre technische Verbesserungen benötigter Hardware und verfügbarer Software.

Was bedeutet Virtual Reality?

Um sich dem Begriff Virtual Reality anzunähern, können zunächst die Bedeutungen der Wörter „Virtual“ und „Reality“ betrachtet werden. Als Synonyme von „virtuell“ werden im Duden Begriffe wie „eingebildet“ und „imaginär“ aufgelistet. Die Realität ist sinnverwandt mit der „Wirklichkeit“, dem „Leben“ und der „Praxis“. Wenn mit Reality die vom Mensch wahrgenommene physische, reale Welt gemeint ist, beschreibt der zusammengesetzte Begriff Virtual Reality abgeleitet die Wahrnehmung einer virtuellen Umgebung, die nicht real, allerdings in ihrer Funktionalität erlebt werden kann. Das führende IT-Marktforschungsinstitut Gartner charakterisiert VR vereinfachend als eine computergenerierte 3D-Umgebung, die den Nutzer umgibt und mit möglichst viel Natürlichkeit auf dessen individuelle Bewegungen und Interaktionen reagiert.

Video: Virtual Reality – eine technologische Revolution steht an | SRF Einstein.

Merkmale virtueller Realitäten

Zentrales Wesensmerkmal jeder virtuellen Realität ist die multimodale Präsentation der virtuellen Welt. Virtuelle Realitäten sprechen also zeitgleich mehrere Sinnesmodalitäten anIn einer perfekten VR müssen alle menschlichen Sinneswahrnehmungen gleichzeitig simuliert werden: sehen, hören, fühlen, berühren, riechen schmecken und noch einige weitere sekundäre Empfindungen wie zum Beispiel Beschleunigung. Eine virtuelle Realität wird so zu einer interaktiven Mensch-Maschine-Schnittstelle, die 3D-Interaktionen wie Körperbewegungen, Hand-, Kopf- und Körpergestik abbilden kann. In der Praxis werden virtuellen Welten heute v. a. visuell, akustisch und haptisch erlebbar.

Wichtig bei der Simulation virtueller Realitäten ist v. a. auch die Echtzeitinteraktion.  Echtzeitfähigkeit heißt in diesem Kontext nicht, dass die Eingabe des Nutzers und die Präsentation der virtuellen Welt absolut simultan erfolgen müssen. Aber: Die Verarbeitung von Interaktionen in der virtuellen Realität (z. B. Selektionen von Objekten in virtuellen Welten, geometrische Transformationen zur Objektplatzierung oder Navigation) sollte aber nicht mehr als 100ms dauern.

Ein in diesem Zusammenhang wichtiger Begriff ist die Immersion. Immersion beschreibt den Effekt, den virtuelle Welten auf Betrachter haben. Die Wahrnehmung der realen Welt vermindert sich und der Betrachter identifiziert sich zunehmend mit der virtuellen Welt. Er taucht sozusagen komplett in die virtuelle Welt ein.

The Evolution of Virtual Reality by 2025.

Augmented Reality als Zwischenschritt

Eine Variante der Virtual reality (VR) ist die Augmented Reality (AR). Augmented Reality beschreibt die Kombination von virtueller Realität und realer Umwelt mit einer Überlagerung der beiden Welten in Echtzeit. Die reale Umgebung eines Benutzers wird also durch virtuelle Informationen oder Objekte erweitert. Ziele sind die Erleichterung der Informationsaufnahme, die Förderung der aktiven Wahrnehmung bei gesteigerter Verweildauer und die Schaffung von Interaktion während einer realen Situation eingeblendet wird.

AR wird ermöglicht durch die Nutzung von Hardware, Software und Sensoren, z. B. durch Brillen, in deren Gläser zusätzliche Informationen eingeblendet werden. Eine andere verbreitete AR-Darstellungsoption ist die Betrachtung der Umwelt durch den Bildschirm des eigenen Smartphones. In Flugzeugen und Autos kommen dagegen Head-Up-Displays zum Einsatz. Die virtuell eingeblendete Abseitslinie beim Videobeweis bei Fußballspielen ist ein letztes Beispiel.

Wie lassen sich AR und VR abgrenzen? Eine interessante Einordnung nimmt Milgrim (1994) in seinem Realitäts-Virtualitäts-Kontinuum (vgl. nachfolgende Abbildung) vor. Das Kontinuum endet auf der einen Seite mit der vollkommenen Realität und auf der anderen Seite mit der vollkommenen Virtualität. Die dazwischen liegenden Bereiche können als Mixed Reality (MR) bezeichnet werden. AR ist somit Teil der MR.

Abbildung: Das Realitäts-Virtualitäts-Kontinuum nach Milgram [1].

Bei der AR wird zwischen AR im engeren Sinne und AR im weiteren Sinne unterschieden. Beispielsweise wird der Quick-Response-Code (QR-Code) dem weiteren AR-Verständnis zugeordnet. Das Scannen von QR-Codes ermöglicht das Abrufen der darin enthaltenden Informationen von einem mobilen Endgerät aus. Weder der QR-Code noch die dahintersteckende Verknüpfungsfunktion stellen aber ein virtuelles Objekt dar. Es gibt auch keine zweidimensionale Überlagerung mit der angezeigten Umwelt. Die Überlagerung von virtuellen, dreidimensionalen Objekten mit der Realität wird hingegen als AR im engeren Sinne gesehen.

Zur menschlichen Informationsverarbeitung…

Die menschliche Wahrnehmung und die dazugehörige Verarbeitung von Informationen sind essentiell für die Interaktion innerhalb virtueller Welten. Daher ist es sinnvoll, sich mit den grundlegenden Funktionen der menschlichen Informationsverarbeitung auseinanderzusetzen, um die verschiedenen Auswirkungen und Phänomene virtueller Realitäten besser verstehen zu können.

Die sechs Sinne des Menschen bilden die Grundlage der Wahrnehmung, insbesondere für die Wahrnehmung der Außenwelt. Menschen sind in der Lage Informationen zu suchen, aufzunehmen und zu verarbeiten. Informationen werden dabei besser verinnerlicht, wenn simultan mehrere Sinne angesprochen werden. Somit bekommt das Gehirn nicht nur gleichzeitige Eindrücke, sondern kann diese auch untereinander verknüpfen.

Die Vorstellung eines Computers kann dabei helfen, die komplexen neuronalen Prozesse bei der menschlichen Sinneswahrnehmung und -verarbeitung nachzuvollziehen. Konkret: Alle physischen Eigenschaften des Menschen werden dabei Hardware, alle psychischen Eigenschaften Software zugeordnet. Der Prozess lässt sich in die drei Stufen 1. perzeptuelle Informationsaufnahme, also die Wahrnehmung, 2. kognitive Verarbeitung, also die Informationstransformation wie Denken und Entscheiden, sowie 3. Informationsspeicherung durch das Erlernen und Informationsausgabe, die Motorik, unterteilen (vgl. Abbildung).

Die menschliche Informationsverarbeitung beginnt dabei mit der Aufnahme eines äußeren oder inneren Reizes: der Eingabe. Diese Eingabe wird verarbeitet und abschließend als Ausgabe dargestellt. Zunächst wird die Eingabe an das perzeptuelle System übergeben und dort wahrgenommen. Die Verarbeitung der resultierenden wahrgenommenen Reize findet dann im kognitiven System statt. Dort kann auf Speicher, wie das Arbeits- und Langzeitgedächtnis, zugegriffen werde, um die Reize zu interpretieren und entsprechendes Handeln zu planen. Die tatsächliche Handlung findet im motorischen System statt, der die Bewegungen einleitet: die Ausgabe.

Informationsverarbeitung

Abbildung: Ablauf menschlicher Wahrnehmung.

Simulation virtueller Realitäten

Im Kontext heutiger virtueller Technologien liegt der Fokus auf dem visuellen, akustischen und haptischen Erleben virtueller Welten. Hierbei wirken Bildschirme und Lautsprecher als visuelle bzw. akustische Stimuli und Reize, die nutzerseitig Reaktionen auslösen. Auch Sprache, Gesten und andere menschliche Ausdrucksformen können aber verwendet werden. Die virtuelle Stimulation der Sinne Riechen und Schmecken ist in den bisherigen VR-Systemen nicht gegeben.

Simulation von Bilderwelten

Die virtuelle Simulation von Bildern findet zumeist über VR-Brillen statt. Hierbei unterscheidet man zwischen zwei Typen von VR-Brillen.

Die erste Art besitzt zwei fest integrierte Displays. Diese liegen fünf bis acht Zentimeter vom Auge entfernt und decken den gesamten Radius des menschlichen Blickfeldes von 120 Grad ab. Damit das scharfe Sehen für den Nutzer der VR-Brille aus so kurzer Entfernung realisiert werden kann, befinden sich vor den Displays zwei Linsen. Eine Linse für das linke und eine für das rechte Auge. Die Lichteinstrahlung des Displays wird durch die Linsen gebrochen. Dieser Bruch ermöglicht die Projektion des Lichtes auf die Netzhaut des Nutzers und dadurch das scharfe Sehen. Die Fähigkeit unseres Gehirns, nämlich das stereoskopische Sehen, erlaubt dem Nutzer den dreidimensionalen Eindruck des Bildes. Bedingt durch den Augenabstand, nehmen die Augen zwei unterschiedliche Bilder wahr, die sich nur leicht voneinander unterscheiden. Das Gehirn setzt diese Bilder zu einem dreidimensionalen Bild zusammen. Die Software der VR-Brille ist auf diese Art des Sehens ausgerichtet, um die beiden von zwei verschiedenen Punkten aufgenommenen, übereinander projizierten Bildern sowohl dem rechten als auch dem linken Auge zuzuführen, die unser Gehirn dann zusammensetzt. Das immersive, visuelle Erlebnis wird durch die Änderung des Bildes in der Brille entsprechend der Kopfbewegung des Nutzers hervorgerufen. Jede kleinste Bewegung wird mithilfe von Positions- und Beschleunigungssensoren millimetergenau registriert. Anschließend verarbeitet die Software der VR-Brille die Bewegungsdaten, berechnet zusätzlich das nächste Folgebild und zeigt dieses auf dem Bildschirm an. So gelingt die Änderung des Bildes. Hierfür wird eine Hardware mit hoher Rechenleistung benötigt. Zum Beispiel kann die VR-Brille mit einem leistungsstarken Computer oder einer Spielkonsole in Verbindung gebracht werden. Dieser Vorgang wird bis zu 90 Mal pro Sekunde wiederholt. Dies ist schneller als das menschliche Gehirn einzelne Bilder aktiv wahrnehmen kann.

Die zweite Art von VR-Brillen sind smartphonebasiert. Hierfür wird das Mobiltelefon in eine Kopfvorrichtung platziert, um sowohl als Bildschirm als auch als Hardwarekomponente, die die Rechenleistung erbringt, zu dienen. Durch das Abspielen von beispielsweise 360-Grad-Videos auf dem Bildschirm in zwei nebeneinander angeordneten Fenstern mit leicht unterschiedlichen Perspektiven, gelingt dem Nutzer das stereoskopische Sehen.

Simulation von Tönen

In virtuellen Welten nimmt die Simulation von Tönen eine zentrale Rolle ein. Akustik unterstützt die Immersion von Nutzern enorm. Daher müssen  Geräusche im virtuellen Welten präzise und realistisch sein. Die Tonwiedergabe funktioniert dabei nach demselben Prinzip wie beim menschlichen Ohr, das aus verfügbaren Klangwelten ein echtes Raumgefühl erzeugen kann. Dazu werden mehrere voneinander getrennte Soundkanäle verwendet, deren Aufgabe es ist, Töne separat in die Ohren des Nutzers zu spielen. Beispielsweise könnte so die Wahrnehmung eines Krankenwagens, welcher sich von rechts nähert, gesteigert werden, indem das Geräusch der Sirene im rechten Ohr lauter eingespielt wird.

Simulation von Berührung, Geruch und Geschmack

Virtuelle Welten können durch die Simulation von Berührung, Geruch und Geschmack deutlich immersiver gestaltet werden. Allerdings geht man davon aus, dass authentische Erlebnisse in virtuellen Welten in Bezug auf das Anfassen, Riechen und Schmecken erst dann gegeben sein können, wenn Empfindungen im menschlichen Kopf durch neuronale Stimulation gesteuert werden können.

Zumindest Berührungen können heute bereits mithilfe von haptischen Ausgabegeräten, z. B. Handschuhen oder Anzüge, zumindest ansatzweise simuliert werden. Die hierbei benötigten Rezeptoren, die die Wahrnehmung der Berührungen in der Haut auslösen, können durch Druck oder Vibration stimuliert werden.

Literatur

[1] P. Milgram et al.: Augmented Reality: „A class of displays on the reality-virtuality continuum“. Telemanipulator and Telepresence Technologies. 1994.

Geschrieben von