3D-Klangrekonstruktion - 3D sound reconstruction

Die 3D-Schallrekonstruktion ist die Anwendung von Rekonstruktionstechniken auf die 3D-Schalllokalisierungstechnologie . Diese Methoden zur Rekonstruktion von dreidimensionalem Schall werden verwendet, um Geräusche so zu erstellen , dass sie zu natürlichen Umgebungen passen und räumliche Hinweise auf die Schallquelle liefern. Sie sehen auch Anwendungen in der Erstellung von 3D - Visualisierung auf einem Klangfeld physische Aspekte von Schallwellen einschließlich Richtung, umfasst Druck und Intensität . Diese Technologie wird in der Unterhaltung verwendet, um eine Live-Performance über Computerlautsprecher zu reproduzieren. Die Technologie wird auch in militärischen Anwendungen verwendet, um den Standort von Schallquellen zu bestimmen . Die Rekonstruktion von Schallfeldern ist auch auf die medizinische Bildgebung anwendbar , um Punkte im Ultraschall zu messen.

Techniken

Um robustes und natürlich klingendes Audio aus einer dreidimensionalen Audioaufnahme zu reproduzieren, werden Techniken zur Schalllokalisierung und Nachhallrekonstruktion verwendet. Diese Techniken verarbeiten Ton, um die räumlichen Hinweise zu reproduzieren .

  1. Der Ort einer Schallquelle wird durch dreidimensionale Schalllokalisierung unter Verwendung mehrerer Mikrofonarrays, binauraler Hörmethoden und HRTF (Head-Related Transfer Function) bestimmt .
  2. Nach dem Identifizieren der Richtung werden andere Signalverarbeitungstechniken verwendet, um die Impulsantwort über Zeiträume zu messen, um die Intensitätskomponenten in verschiedenen Richtungen zu bestimmen. Indem sowohl Daten als auch die Intensität des Schalls mit der Richtung kombiniert werden, wird ein dreidimensionales Schallfeld bestimmt und physikalische Eigenschaften, die die resultierenden Intensitätsänderungen erzeugen, werden rekonstruiert.

Infolge dieses zweistufigen Prozesses enthält das rekonstruierte dreidimensionale Schallfeld nicht nur Informationen zur Lokalisierung der Schallquelle, sondern auch zu den physikalischen Aspekten der Umgebung der ursprünglichen Signalquelle. Dies ist der Unterschied zu den Ergebnissen des Schalllokalisierungsprozesses.

Nachdem der Ton rekonstruiert wurde und die räumlichen Hinweise verfügbar sind, müssen sie an den Kunden geliefert werden. Die verschiedenen Methoden hierzu sind in diesem Abschnitt enthalten.

Hörraum

Lautsprecherstandort gemäß ITU-R-Empfehlung

Bei der Hörraummethode empfängt der Hörer den Ton entweder über Kopfhörer oder über Lautsprecher. Kopfhörer bieten genügend Klangquellen, damit ein Hörer 3D-Klang mit Direktionalität erleben kann. Bei Lautsprechern wirkt sich die Platzierung und Anzahl der Lautsprecher auf die Wiedergabetiefe aus. Es gibt verschiedene Methoden, um den Lautsprecherstandort auszuwählen. Ein einfaches Modell besteht aus fünf Lautsprechern, die in der von ITU-R empfohlenen Formation angeordnet sind: Mitte, 30 ° nach links, 110 ° nach links, 30 ° nach rechts und 110 ° nach rechts. Dieser Aufbau wird mit mehreren dreidimensionalen Soundsystemen und Rekonstruktionstechniken verwendet. Alternativ kann die kopfbezogene Übertragungsfunktion für das Schallquellensignal verwendet werden, um seine Faltung je nach Richtung und Position auf jeden der Lautsprecher zu übertragen. Dies ermöglicht die Berechnung der Signalenergie für jeden Lautsprecher durch Auswertung des Tons an mehreren Kontrollpunkten im Hörraum.

Nachhallrekonstruktion

3D-Soundsystem mit Reverberation Reconstruction-Flussdiagramm

Bei der Nachhallrekonstruktion wird der Schall mit einem Vierpunktmikrofon gemessen, um die tatsächlichen Lieferverzögerungen an verschiedenen Orten zu messen. Jedes Mikrofon misst eine Impulsantwort aus einem zeitgestreckten Impulssignal für verschiedene Zeitrahmen mit verschiedenen Schallquellen. Die erhaltenen Daten werden wie bei der Hörraumtechnik auf das dreidimensionale Soundsystem mit 5 Lautsprechern angewendet. Das System faltet auch die kopfbezogene Übertragungsfunktion mit der Impulsantwort aus dem von den Mikrofonen aufgezeichneten Signal zusammen, und die Energie wird gemäß dem ursprünglichen Zeitrahmen des Tonsignals angepasst, und dem Ton wird eine zusätzliche Verzögerung hinzugefügt, um dem Zeitrahmen zu entsprechen der Impulsantwort. Die Faltung und Verzögerungen werden auf alle Schallquellendaten angewendet, die für das resultierende Signal aufgenommen und summiert werden.

Diese Technik verbessert auch die Direktionalität, Natürlichkeit und Klarheit des rekonstruierten Klangs in Bezug auf das Original. Ein Nachteil dieser Methode besteht darin, dass die Annahme einer einzelnen Schallquelle - während der reale Nachhall verschiedene Geräusche mit Überlappung umfasst - in Verbindung mit der Addition aller unterschiedlichen Werte die Wahrnehmung der Größe des Raums durch den Hörer nicht verbessert, die Wahrnehmung der Entfernung jedoch nicht verbessert.

Laserprojektionen

Da die Schallwellen Änderungen der Luftdichte verursachen, verursacht sie anschließend Schalldruckänderungen. Sie werden gemessen und dann unter Verwendung der Tomographiesignalverarbeitung verarbeitet, um das Schallfeld zu rekonstruieren. Diese Messungen können mithilfe von Projektionen durchgeführt werden, sodass nicht mehr mehrere Mikrofone verwendet werden müssen, um separate Impulsantworten zu bestimmen. Diese Projektoren verwenden ein Laser-Doppler-Vibrometer , um den Brechungsindex des Mediums auf dem Laserweg zu messen. Diese Messungen werden durch tomographische Rekonstruktion verarbeitet , um das dreidimensionale Schallfeld zu reproduzieren, und dann wird die Faltungsrückprojektion verwendet, um es zu visualisieren.

Akustische Nahfeldholographie

Bei der akustischen Nahfeldholographie wird die Lichtbrechung in einem zweidimensionalen Bereich des Mediums gemessen (dieses zweidimensionale Schallfeld ist ein Querschnitt des dreidimensionalen Schallfelds), um ein Hologramm zu erzeugen . Dann wird die Wellenzahl des Mediums durch Analyse der Wassertemperatur geschätzt. Es werden mehrere zweidimensionale Schallfelder berechnet, und das dreidimensionale Schallfeld kann ebenfalls rekonstruiert werden.

Diese Methode ist hauptsächlich auf Ultraschall und niedrigere Schalldrücke anwendbar, häufig in Wasser und in der medizinischen Bildgebung. Das Verfahren arbeitet unter der Annahme, dass die Wellenzahl des Mediums konstant ist. Wenn sich die Wellenzahl im gesamten Medium ändert, kann diese Methode das dreidimensionale Schallfeld nicht so genau rekonstruieren.

Siehe auch

Verweise