Immersiver Sound - Objekt-basierte Audioaufnahmen
Audioformate haben sich im Laufe der Zeit weiterentwickelt. Angefangen bei schmalbandigem Mono über diverse Zweikanal-Varianten bis hin zu vollbandigem, immersivem Mehrkanal-Audio. Der Ton wird auf vielfältige Art und Weise wiedergegeben, von Kopfhörern bis Mehrkanalsystemen in Kinos oder großen Veranstaltungsorten. Immersives Audio kann beschrieben werden als eine Gruppe von Aufnahme- und Wiedergabeformaten, die über den grundlegenden Zweikanal-Stereoton hinausgehen.
Immersives Audio umfasst alle Surround-Formate:
- Kanalbasierte Wiedergabeformate in 5.0/5.1*), 7.1*), 9.1*), etc.
- Formate, die Höheninformationen beinhalten, wahlweise kanalbasiert oder objektbasiert
*) die .1 steht für einen einzelnen Audiokanal, der nur einen kleinen Teil des gesamten Frequenzbereichs abdeckt, nämlich den Bereich von 20 Hz bis 120 Hz.
Es gibt viele Möglichkeiten, immersives Audio aufzunehmen. In diesem Artikel werden die Mikrofon-Setups für den Großteil der immersiven Audioformate beschrieben. Es ist wichtig, die Abhörumgebung zu definieren, bevor das Aufnahme-Setup gewählt wird. Ausgangspukt für Rundfunk- und Musikproduktionen ist die Standard-Hörkonfiguration ITU-775.
Überlagerungs-Arrays vs. Abstands-Arrays
Ein Mikrofonarray ist schlichtweg eine physikalische Anordnung von Mikrofonen. Dieses Array kann aus verschiedenen Mikrofonen bestehen, die auf einem einzigen Mikrofonstativ oder vielleicht auch auf mehreren Stativen oder Haltern angebracht sind. In einigen Fällen sind die Mikrofone in eine Einheit integriert (wie das 5100 Surround-Mikrofon).
Markierte Produkte
In einem Überlagerungs-Array sind die Mikrofone extrem nahe beieinander angebracht. Grundsätzlich empfangen alle Mikrofone dieser Art eines Arrays den Schall zeitgleich.
In der Überlagerungstechnik basieren Lokalisierungsinformationen auf Pegeldifferenzen zwischen den Signalen. Diese Technik kann zu einer angemessenen Lokalisierungsgenauigkeit führen, weist jedoch zu einem gewissen Grad keine Umhüllung auf und verfügt über einen kleinen Sweet Spot (in zwei Dimensionen: links / rechts und vorne / hinten). Die Vorteile eines Überlagerungs-Arrays sind die Kompaktheit, die Portabilität und die Mono-Kompatibilität. Es lässt sich leicht auf einen einzigen Monokanal heruntermischen, ohne dass Färbungen durch Kammfilterung und andere Artefakte auftreten.
Ein Abstands-Array erzeugt ein dreidimensionales, umhüllendes Audioerlebnis, indem ein ausreichendes Maß an Dekorrelation zwischen den Signalen generiert wird (Lokalisierungshinweise basieren auf Laufzeitunterschieden). Durch die Anpassung der Mikrofonposition (Abstand und Winkel) an das Schallfeld ermöglichen Abstands-Arrays eine angemessene Lokalisierungsgenauigkeit.
Die Abstandstechniken bieten im Allgemeinen einen schönen, großen Sweet Spot und geben dem Zuhörer das Gefühl einer großen und umhüllenden Klangbühne in einem größeren Hörfeld. Der Nachteil liegt in ihrer Größe und in manchen Fällen ihrer Aufbauzeit. Außerdem ist es nicht zu empfehlen, die Signale zu einem Monosignal zusammenzufassen – stattdessen kann ein Einzelsignal verwendet werden.
Envelopment | Size of listening area | Size and portability | Localization accuracy | |
---|---|---|---|---|
Coincident arrays | - | - | + | + |
Spaced arrays | + | + | - | - |
5.x
Das grundlegende und einfache Setup für kanalbasierten 5.x (5.0 / 5.1 / 5.2) Surround-Sound besteht aus der Verwendung von fünf Mikrofonen in einem Abstands-Array. Es gibt verschiedene Möglichkeiten, die Mikrofone auszuwählen und anzuordnen; das hängt von vielen Faktoren ab, wie der akustischen Qualität des Aufnahmeraums (bspw. eine Konzerthalle / ein Jazz Club / eine Kirche), der Anordnung vorhandener Schallquellen, der Richtwirkung der verwendeten Mikrofone oder vielleicht auch nur dem eigenen Geschmack. Der Aufbau kann von streng mathematisch berechneten und psychoakustisch verifizierten bis hin zu "Bauchgefühls"-Konfigurationen variieren.
Eine Möglichkeit, die Abdeckung eines 360°-Kreises um die Abhörposition zu betrachten, besteht darin, jeweils zwei benachbarte Mikrofone als Stereopaar wahrzunehmen. Jedes Paar deckt ein bestimmtes Kreissegment ab. Manchmal überlappen sich die Segmente, manchmal weisen sie Lücken auf. Eine andere Betrachtungsweise besteht darin, die Frontalmikrofone als Hauptbühne und die Rückmikrofone als Raumklang / Atmos zu betrachten.
Die folgenden Setups erheben keinen Anspruch auf Vollständigkeit, können aber als Inspiration angesehen werden und sind Beispiel für bewährte Verfahren.
Das Kugelkapsel-basierte Surround-Array
Fünf Kugelmikrofone als Abstands-Array angeordnet bietet eine gute tonale Balance. Der niederfrequente Anteil wird äußerst überzeugend reproduziert. Diese Anordnung liefert auch eine exzellente Umhüllung — bei der Wiedergabe ist der Zuhörer von Schall umgeben. Der Nachteil dieser Anordnung ist die mangelnde Isolation zwischen den Kanälen.
Drei Frontmikrofone – oft auch als Front-Triplet bezeichnet – werden als Decca-Tree angeordnet. Die Positionen werden abhängig vom optimalen Aufnahmewinkel zur vorhandenen Schallquelle gewählt.
Die Position der Rückmikrofone wird unabhängig vom umgebenden Schallfeld gewählt. Normalerweise sollten die Rückmikrofone nicht zu weit von den Frontmikrofonen entfernt platziert werden. Wenn der Abstand zu groß ist, kann die Verzögerung hörbar werden. Weiterhin wird möglicherweise ein wenig Richtwirkung für den Surround-Tonabnehmer gewünscht. Dies kann durch akustische Druckentzerrer (APEs) erreicht werden, die die Richtwirkung bei höheren Frequenzen sicherstellen, aber die Vorteile der Kugelkapsel für ein gutes Tiefton-Verhalten beibehalten.
Eine gute Ausgangsbasis für dieses Setup könnte so aussehen:
L-R 60-120 cm (24-47 in)
L-C 30-60 cm (12-24 in)
R-C 30-60 cm (12-24 in)
C-LR 15-45 cm (6-8 in)
Front-Rear: 200-500 cm (80-200 in)
LS-RS: 200-300 cm (80-118 in)
Abstand zwischen den äußeren Frontmikrofonen: 60-120 cm (24-47 in). Je breiter die Schallquelle, desto enger sollten die Mikrofone platziert werden. Das Centermikrofon sitzt etwa 15-45 cm (6-8 in) vor dem L/R-Paar.
Die beiden Rückmikrofone werden 2-5 m (80-200 in) hinter das Front-Triplet gesetzt. Der Abstand zwischen den Rückmikrofonen sollte im Bereich von 2-3 m (80-118 in) zueinander liegen. Wie bereits erwähnt, können APEs eingesetzt werden, um die Erfassung frontaler Impulse bei den Rückkanälen zu unterbinden.
Der schottische Tontechniker, Aufnahmespezialist und Dozent Michael Williams hat sich intensiv mit dem Multichannel Microphone Array Design (MMAD) befasst. In der Literatur von Michael sind präzise Aufstellungen für zahlreiche Anwendungen zu finden – wir verweisen gern auf zwei Publikationen.
Literatur:
[1] Williams, Michael; Guillaume Le Dû: Multichannel sound recording, Multichannel Microphone Array Design (MMAD). 2010.
[2] Williams, Michael: Microphone Arrays for Stereo and Multichannel Sound Recording Vol II. ISBN 978-88-7365-104-8. Milano 2013.
Das Nierenkapsel-basierte Surround-Array
Das Mikrofonarray mit fünf Nierenkapseln (Richtwirkung) bietet den Vorteil einer höheren Kanaltrennung im Vergleich zu einem Array mit Kugelkapseln. Um die richtige Abdeckung mit Abstands-Array zu erreichen, können die Mikrofone enger beieinander platziert werden, wodurch ein kleineres Array entsteht. Dies kann natürlich bis zum Äußersten genutzt werden, wenn die Mikrofone als Überlagerungsarray angeordnet sind.
Beispiel: Ein Nierenkapsel-basierter 5-Kanal-Aufbau mit gleichmäßiger Abdeckung über alle Kreissegmente
Das Breite-Nierenkapsel-basierte Surround-Array
Das von Mikkel Nymand eingeführte Breite-Nierenkapsel-Surround-Array (Wide Cardioid Surround Array, WCSA) bietet die gleichen Klangqualitäten, einen hohen Grad an Umhüllung und gute Niederfrequenzeigenschaften.
Um den gewünschten Klangcharakter zu erhalten (und die Abhörposition von einem Sweet Spot zu einer Sweet Area zu erweitern), sollten die fünf Signale nicht korrelieren. Das bedeutet, die fünf Mikrofone müssen in einem ausreichenden Abstand zueinander platziert werden. Auf der anderen Seite sollten die Signale nicht zu unterschiedlich sein bzw. zu weit auseinander liegen. In diesem Fall wäre der resultierende Klang nicht kohärent.
Kugelmikrofone werden häufig bei Abstands-Arrays bevorzugt. Dies ist auf ihre natürliche Klangfarbe und ihre Fähigkeit zurückzuführen, direkte Signale mit dem Raumklang zu mischen. Breite Nieren (auch als Sub-Nieren bekannt) bieten ein geringes Maß an Richtwirkung, wodurch der Raumklang mehr gesteuert und die Genauigkeit der Front-Abbildung und Signallokalisierung verbessert werden können.
Das von Geoff Martin und Jason Corey entwickelte Surround-Array verwendet je ein Kugel- und ein Nierenmikrofon, um die Charakteristik einer Breiten Niere zu erzielen. Mit Augenmerkt auf die Vermeidung von Interferenzen wurden die Mikrofonpaare in einem Abstand von L-C 60 cm (24 in), R-C 60 cm (24 in), Front-Rear 60 cm (24 in) und LS-RS 30 cm (12 in) angeordnet. Die rückseitigen Nierenmikrofone wurden nach oben gerichtet, um die Höheninformationen zu erfassen.
DPA Microphones hat dieses Array an fünf identische Mikrofone mit Breiter Niere angepasst (abgestimmt auf Frequenzgang und Empfindlichkeit innerhalb einer sehr engen Toleranz von ±1 dB). Die Auswahl von fünf identischen Mikrofonen anstelle einfach nur eines bestimmten Mikrofontyps erhält die natürliche Mischung und führt zu einer authentischeren und gleichförmigeren Reproduktion aller Kanäle.
Nach intensiven Hör-Sessions und zahlreichen praktischen Versuchen unter verschiedenen Aufnahmesituationen (Symphonische Musik, Modern Jazz, PA/Live, Pop-Konzerte und Ambient Recording) hat sich gezeigt, dass diese Anpassungen bei einem größeren Abstand, insbesondere bei den hinteren Kanälen, am besten funktionieren. Dieses Array erzeugt einen intensiven, dynamischen und umhüllenden Klangcharakter.
Die empfohlenen Abstände sind:
L-C 60-75 cm (24-30 in)
R-C 60-75 cm (24-30 in)
C-LR 20 cm (8 in)
Front-Rear: 150-200 cm (59-79 in)
LS-RS: 120-150 cm (47-59 in)
Anwinklung L/R: ±15°
Anwinklung LS/RS: ±165°
Das Array kann für große Ensembles (oder große Entfernungen zwischen Array und Quelle) um zwei omnidirektionale Ausleger für links / rechts erweitert werden, um von der Niederfrequenzerfassung der Druckwandler zu profitieren. Diese Mikrofone werden mit den L/R-Mikrofonen des Arrays in geeignetem Verhältnis gemischt und bieten ein wunderschön kohärentes, präzises und sattes Surround-Klangbild.
Soundfield / Ambisonics
In den frühen 1970er Jahren erfanden die britischen Ingenieure Peter Felget und Michael Gerzon das später als Ambisonics bekannte Soundfield-Prinzip (heute als „First Order Ambisonics“ bezeichnet). Das Format basiert auf einer koinzidenten Anordnung von Mikrofonen mit dem Ziel, eine beliebige Mikrofonausrichtung zu ermöglichen (links / rechts, vorne / hinten, oben / unten). Grundsätzlich funktioniert das Soundfield-Prinzip wie MS durch Addition und Subtraktion der verfügbaren Signale. Ambisonics sind zwei Konfigurationen zugeordnet: A-Format und B-Format.
Das A-Format entspricht der physikalischen Anordnung von vier Mikrofonkapseln mit Nierencharakteristik und den Ausgängen: FU (vorne oben), RU (hinten oben), LD (links unten) und RD (rechts unten). Die Winkel zwischen den Kapseln sind deckungsgleich mit einem Tetraeder, einer dreieckigen Pyramide.
Das B-Format entspricht einer umgewandelten Version des A-Formats, die ein virtuelles Format bestehend aus drei orthogonal ausgerichteten Achterkapseln darstellt: X (vorne / hinten), Y (seitlich), Z (oben / unten), dazu eine Kugelkapsel (W).
Durch Addition und Subtraktion können die einzelnen Signale in ein Mikrofon mit Richtwirkung umgewandelt werden, welches in eine beliebige Richtung weisen kann. So erzeugt zum Beispiel eine Kugel (W) und eine Acht (X) eine Niere, die in X-Richtung weist.
DPA Microphones stellte in der Vergangenheit Mikrofone für dieses Format her, derzeit jedoch nicht.
Beispiel: B-Format-Komponenten
Optimiertes Nieren-Dreieck (OCT)
OCT ist ein Array, das nur für die drei Front-Kanäle entwickelt wurde. Das System bietet eine hohe Trennung von Links-Center und Rechts-Center. Eine zusätzliche Konfiguration für die Surround-Kanäle sollte mit Sorgfalt gewählt werden.
Für den Center-Kanal wird ein Nierenmikrofon verwendet, das nur 8 cm (3.1 in) vor den beiden nach außen gerichteten, engeren Nieren für den linken und rechten Kanal angeordnet ist. Der Abstand zwischen dem linken und rechten Mikrofon ist der Schlüssel zum gewünschten Aufnahmewinkel. Von den Designern werden Abstände zwischen 40 cm (15.7 in) und 90 cm (35.4 in) empfohlen, um Aufnahmewinkel von 160° bis 90° zu erzielen.
Ein oder mehrere Druckempfänger-Mikrofone (Kugel) können dem System hinzugefügt werden, um fehlende Niederfrequenzanteile der Druckgradientenkapseln der Nieren zu kompensieren.
Beispiel: Die OCT2-Variante schlägt vor, dass das Center-Mikrofon 40 cm (15.7 in) vor der Links-Rechts-Mikrofonbasislinie platziert werden sollte, um größere Laufzeitunterschiede und räumliche Unterschiede wie beim Decca Tree zu erzielen.
Doppel-MS
Eine zeitsimultane, kompakte und justierbare Surround-Konfiguration.
Das Doppel-MS-Setup ist eine zeitsimultane, kompakte und justierbare Konfiguration für Surround-Sound / Immersive-Sound. Zum Einsatz kommen zwei Nierenmikrofone und ein Mikrofon mit Achter-Charakteristik. Alternativ kann dieses Setup auch aus vier Nierenmikrofonen erstellt werden.
Das Prinzip der Doppel-MS-Technik ist ein vorwärts- und rückwärtsgerichteter MS-Satz, der sich dasselbe Seitenmikrofon teilt. Wie bei einem Standard-MS-Aufbau ist das Seitenmikrofon so positioniert, dass die In-Phase-Seite nach links zeigt, sodass nur drei Mikrofone benötigt werden. In diesem Setup sind Signalverarbeitung / Mischung notwendig, um das endgültige Format zu erstellen. Wie bei MS-Konfigurationen üblich werden zwei verschiedene Schallwandlertypen verwendet, um die Mitteninformation (Nierenmikrofone) und die Seiteninformation (bidirektionale Mikrofone) zu erhalten. Es besteht das Risiko unterschiedlicher Frequenz- und Phasenantworten bei der Signalerfassung von vorne oder von den Seiten.
So werden die Kanäle gewonnen:
Center = Mfront
Left = Mfront + S
Right = Mfront – S
Left surround = Mrear + S
Right surround = Mrear – S
Der Anteil jedes Signals wird für eine korrekte räumliche Verteilung angepasst, insbesondere in Bezug auf die Frontabbildung. Typischerweise wird die L/R-Verteilung im Vergleich zu Standard-MS für Zweikanal-Stereo etwas breiter produziert.
Die Doppel-MS-Technik kann mit vier identischen, aufeinander abgestimmten 4011A oder 4011C Nierenmikrofonen durchgeführt werden, die in einer horizontalen Ebene im Winkel von 0°, 90°, 180° und 270° zueinander stehen. Die Membranen sollten für die beste zeitliche Übereinstimmung in der horizontalen Ebene übereinander angeordnet sein.
Mfront = Cardioid front
S = S’ (Cardioid left) – S’’ (Cardioid right) *)
Mrear = Cardioid rear
*) Bei der praktischen Aufnahme mit einem Mischpult werden einfach die linke Niere nach links und die rechte Niere bei invertierter Phase nach rechts gemischt (Pin 2 und 3 tauschen). Der „dreckige“ Weg, dies zu erreichen, besteht darin, ein Y-Summierkabel zu verwenden und den XLR-Stecker für die rechte Niere zu invertieren.
Fukada Tree
Der Fukada Tree ist ein Decca Tree-Array, jedoch mit fünf Nierenmikrofonen und zwei zusätzlichen Kugelmikrofonen als Ausleger, die zwischen die Front- und Rear-Kanäle gemischt werden. Dieses Setup wurde 1997 von Akira Fukada entworfen.
Die Wahl von Nierenmikrofonen verbessert die Signaltrennung während die rückwärts gerichteten hinteren Nieren das Übersprechen von direktem Frontschall zu den hinteren Lautsprechern minimieren.
Kugelmikrofone werden in Decca Tree-Konfiguration aufgrund ihrer natürlichen Klangfarbe und ihres vollen Frequenzspektrums für Musikaufnahmen bevorzugt. Die beiden Kugel-Ausleger dienen dieser sehr wichtigen Komponente im Fukada Tree-Array.
Seit der ersten Ankündigung der Fukada Tree-Anordnung hat Akira Fukada eine Reihe von Positionierungsänderungen entwickelt, um die Front-Lokalisierung zu verbessern. Seine Auswahl an Mikrofonen bleibt jedoch unverändert und er verwendet weiterhin DPA-Mikrofone aufgrund ihrer Transparenz.
Hamasaki Quadrat
Das Hamasaki Quadrat besteht aus vier bi-direktionalen Mikrofonen, die in einem Quadrat angeordnet sind.
Das Hamasaki Quadrat wurde für die Erfassung des Ambient-Sounds / des diffusen Teils einer Surround-Sound-Aufnahme konzipiert. Es handelt sich um ein Quadrat aus vier Mikrofonen mit Achtercharakteristik, die im Abstand von 1,8 – 2 m (5.9 – 6.6 ft) zueinander aufgebaut sind und deren Signale im entsprechenden Mischungsverhältnis zum Front-Array auf die Kanäle Links, Rechts, Links Surround und Rechts Surround geroutet werden. Die Achter-Kapseln weisen mit ihrer In-Phase-Ausrichtung zu den Seiten und mit ihren Nullen zum Direktschall.
Verglichen mit anderen Systemen für Ambient Recording ist dieses System in Bezug auf Abstand zwischen dem Hauptarray und dem Ambient-Array am unempfindlichsten.
Der Aufbau wurde vom japanischen Toningenieur Kimio Kamasaki entwickelt.
Immersives Audio mit vertikaler Abbildung
Setups, die für herkömmliche Surround-Aufnahmen (wie 5.1) entwickelt wurden, haben sich als sehr gut erwiesen. Das Hinzufügen von Vertikalinformationen in diese Aufnahmen ist interessant, da es dem wahrgenommenen Erlebnis auch neue Dimensionen hinzufügen kann.
Die Herausforderung besteht darin, nach oben ausgerichtete Klangkulissen hinzuzufügen, ohne die wahrgenommene Lokalisierung von horizontal positionierten Schallquellen zu verändern, also das vertikale Kanalübersprechen zu minimieren. Dies führt zu Überlegungen hinsichtlich vertikaler Zeit- und Pegeldifferenzen. Der für die Dekorrelation erforderliche Abstand vertikaler Mikrofone muss ebenfalls berücksichtigt werden. Wie kann schließlich eine Kammfilterung im unvermeidlichen Downmix vermieden werden?
Wenn Vertikalinformationen auf die richtige Weise hinzugefügt werden, wird die empfundene Einhüllung des Sounds gesteigert. Darüber hinaus belegt die Praxis, dass die wahrgenommene Präzision bei der Lokalisierung von Schallquellen auch in der horizontalen Ebene verbessert wird.
Beispiele: Ein Standard-Wiedergabe-System für Immersives Audio mit Vertikalinformationen ist 9.1. Hierbei handelt es sich um ein 5.1 Standard-Layout nach ITU 775 mit zusätzlichen Lautsprechern in der Ebene über den Lautsprechern für Links, Rechts, Links Surround und Rechts Surround. Die Höhe der vier zusätzlichen Lautsprecher sollte einen vertikalen Abhörwinkel von etwa 30° ermöglichen.
Dr. Hyunkook Lee von der Huddersfield University (UK) und seine Forschungsgruppe haben viele theoretische und praktische Informationen zur wahrgenommenen Schallabbildung geliefert.
Ein wichtiger Faktor, den er fand, ist, dass der Präzedenz-Effekt (der Effekt, dass der erste ankommende Schall die Richtung bestimmt) in der vertikalen Ebene nicht funktioniert. Daher lohnt es sich, sich mit Pegeldifferenzen zu beschäftigen. Bei der Wiedergabe desselben Signals über die unteren und die oberen Lautsprecher wurde festgestellt, dass die Präsenz von Hochtonanteilen und Transienten im Signal die Lokalisierung zum oberen Lautsprecher hin verschiebt [2,3].
Beispiel: Um die Lokalisierung in der hoizontalen Ebene zu halten, wurde ermittelt, dass das obere Signal um mindestens 7 dB gedämpft werden muss.
Diese Erkenntnisse haben zu dem unten gezeigten Mikrofon-Setup geführt. Es besteht aus acht Nierenmikrofonen und zwei Supernierenmikrofonen.
Die Mikrofone sind so ausgerichtet, dass möglichst wenig Frontschall von den oberen Mikrofonen erfasst wird. Im Allgemeinen sollten die oberen Mikrofone so wenig Schall wie möglich empfangen, der von den primären horizontalen Quellen abgegeben wird oder von Quellen unterhalb der horizontalen Ebene.
[1] Wallis, Rory, and Lee, Hyunkook: The Effect of Inter-channel Time Difference on Localization in Vertical Stereophony. Journal of the Audio Engineering Society, Vol. 63, No. 10, October 2015.
[2] Lee, Hyunkook, and Gribben, Christopher: Effect of Vertical Microphone Layer Spacing for a 3D Microphone Array. Journal of the Audio Engineering Society, Vol. 62, No. 12, December 2014.
[3] Lee, Hyunkook: Perceptual Band Allocation (PBA) for the Rendering of Vertical Image Spread with a Vertical 2D Loudspeaker Array. AES Convention 138, Warzawa 2015.
[4] Lee, Hyunkook: The Relationship between Interchannel Time and Level Differences in Vertical Sound Localisation and Masking. AES Convention 131, New York 2011.
IRT Kreuz
Das IRT-Kreuz ist für die Erfassung von Ambient-Sound ausgelegt. Das Setup besteht aus vier Nierenmikrofonen.
Das IRT Kreuz dient zum Erfassen des Ambient-Sounds / Diffusschalls einer Surround-Sound-Aufnahme. Es ist ein Quadrat aus vier Nierenmikrofonen mit einem Abstand von 20 – 25 cm (7.9 – 9.8 in) zueinander, die auf Link, Rechts, Links Surround und Rechts Surround geroutet und in einem angemessenen Abstand verglichen mit dem Front-Array platziert werden.
Das IRT Kreuz wird normalerweise einige Meter hinter das Haupt-Array gesetzt. Es sollte jedoch nicht zu weit entfernt sein, da im reproduzierten Signal ansonsten Laufzeitprobleme (wie ein Echo) auftreten können. Die optimale Platzierung eines IRT Kreuzes zeigt sich in der Balance zwischen ausreichender Atmosphäre und gleichzeitiger Vermeidung von Echo.
Objekt-basiertes Audio
Seit Jahren ist der am meisten umhüllende Klang von Lautsprechern kanalbasiert. Ein Kanal ist für Mono, zwei Kanäle sind für Stereo und sechs Kanäle sind für 5.1 Surround-Sound (oder 22 Kanäle für NHK 22.2).
Konventionen bezüglich der Platzierung der Lautsprecher für jedes Format waren das Rückgrat des Sounddesigns. Inter-Channel-Panning mit Hilfe von Delay- und Pegel-Anpassungen waren das Werkzeug für die Platzierung von Quellen im Klangbild. Das fertige Produkt würde für eine bestimmte Zahl an Kanälen ausgelegt sein. Auch wenn das ursprünglich aufgenommene Programmmaterial eine Vielzahl von Audiokanälen umfasste, würde das fertige Produkt eine feste Zahl an Kanälen umfassen – einen für Mono, zwei für Stereo usw.
Objektbasierte Audio (OBA) ist etwas anders. Ein "Klangobjekt" kann auf einer oder mehreren Spuren aufgezeichnet werden. Zusammen mit dem Ton werden Metadaten geliefert, aus denen hervorgeht, wo der Sound auf der Klangbühne positioniert werden soll.
Ein Objekt kann eine Stimme sein, die in Mono aufgezeichnet wurde. Wenn die Produzenten beabsichtigen, die Stimme von der rechten Seite der Klangbühne kommen zu lassen, enthalten die Metadaten dieser aufgenommenen Stimme die Koordinaten für diesen Sound. Die Stimme wird aus diesem Grund als Stereospur aufgezeichnet. Die Metadaten dieser Stereospur liefern dann die Daten für die Positionierung.
Prinzipiell kann ein Objekt auch aus einer Ambisonic-Aufnahme oder einem anderen Format stammen. Deshalb wird ein AV-Programm mit OBA aus einer Reihe von Objekten wie Sprachaufnahmen, Musik, Umgebungsgeräuschen, speziellen Soundeffekten usw. erstellt. Jedes Objekt enthält Metadaten darüber, wann und wo es wiedergegeben werden soll.
OBA hat bereits den Weg ins Kino gefunden (Dolby Atmos und dergleichen). Es ist aber geplant, es auch in den Rundfunk zu bringen und es wurden viele Experimente durchgeführt. Darüber hinaus ist Virtual Reality (VR) ein naheliegendes Ziel für OBA.
Warum?
Die generelle Idee liegt darin, dem Hörer einen höheren Freiheitsgrad zuzugestehen, insbesondere im Rundfunk. Mit OBA ist es möglich, ein einzelnes Objekt zu betonen. Wenn ein hörgeschädigter Zuhörer den Dialog verstärken möchte, ist dies eine Möglichkeit, wenn der Dialog als Objekt aufgezeichnet wird. Man kann auch die Sprache des Kommentars ändern, wenn jede Sprache einem separaten Objekt zugeordnet wird.
Aus Fernsehproduktionen wie Formel-1-Rennen wissen wir, dass spezielle Bordkameras ausgewählt werden können, wenn der Zuschauer einem bestimmten Auto folgen möchte. Der Ton dieses spezifischen Autos ist ein Objekt in Verbindung mit dem Bild. Bestimmte Musikinstrumente in einem Orchester können als Objekte betrachtet werden. Alternativ kann der an verschiedenen Hörpositionen aufgenommene Klang eines Konzerts ein Objekt sein.
Ein weiteres Argument für OBA ist, dass fast jedes Reproduktionsformat gültig ist. Der Downmix wird in Abhängigkeit von der Kanalzahl und deren für die Wiedergabe verfügbaren Positionen optimiert (solange die Anzahl der Kanäle mindestens zwei beträgt). Binaurale Reproduktion ist hierfür ebenfalls zulässig.
Mikrofone?
Die grundlegende Idee ist, dass der Tontechniker die von ihm bevorzugten Mikrofone verwenden kann. Es gibt nicht zwingend eine Notwendigkeit für bestimmte Mikrofone, Mikrofonkonfigurationen oder Mikrofonmarken. Die besonderen Anforderungen betreffen die Produktionsausstattung, mit der die Metadaten erzeugt werden können und natürlich die Formate, die die vollständigen Informationen enthalten.
Empfohlene Mikrofone & Zubehör
Kugelkapsel-basiertes Surround-Array
- 4006A Kugelmikrofon
- 4006C Kugelmikrofon, Kompakt
- 5006A Surround-Kit aus fünf gematchten 4006A, Clips und Windschutz im Peli™-Case
- S5 Surround/Decca Tree Mount
Nierenkapsel-basiertes Surround-Array
- 4011A Nierenmikrofon
- 4011C Nierenmikrofon, Kompakt
- S5 Surround/Decca Tree Mount
Breite-Nierenkapsel-basiertes Surround-Array (WCSA)
Markierte Produkte
4015 Mikrofon mit breiter Nierencharakteristik
Pencil
Jetzt entdecken
5015A Surround Kit with 5 Matched 4015A
Immersive
Jetzt entdecken
4006 Mikrofon mit Kugelcharakteristik
Pencil
Jetzt entdecken
3506A Stereo Kit with Matched 4006A Omnidirectional Microphones
Pencil
Jetzt entdecken
S5 Surround/Decca-Tree-Halterung für Stäbchenmikrofone
Stereo Surround Holders
Jetzt entdecken
- 4015A Mikrofon mit breiter Nierencharakteristik
- 4015C Mikrofon mit breiter Nierencharakteristik, Kompakt
- 5015A Surround-Kit aus fünf gematchten 4015A, Clips und Windschutz im Peli™-Case
4006A Kugelmikrofon - 4006C Kugelmikrofone, Kompakt
- 3506A Surround-Kit aus zwei gematchten 4006A, Clips und Windschutz im Peli™-Case
- S5 Surround/Decca Tree Mount
Optimiertes Nieren-Dreieck (OCT)
- 4011A Nierenmikrofon
- 4011C Nierenmikrofon, Kompakt
- 4018A Supernieren-Mikrofon
- S5 Surround/Decca Tree Mount
Doppel-MS
DPA bietet keine Mikrofone mit Achtercharakteristik. Wenn dieses Setup mit DPA-Mikrofonen aufgebaut werden soll, empfehlen wir, die Mikrofone mit Achtercharakteristik durch jeweils zwei Nierenmikrofone zu ersetzen:
Fukada Tree
Markierte Produkte
4011 Mikrofon mit Nierencharakteristik
Pencil
Jetzt entdecken
4006 Mikrofon mit Kugelcharakteristik
Pencil
Jetzt entdecken
3506A Stereo Kit with Matched 4006A Omnidirectional Microphones
Pencil
Jetzt entdecken
S5 Surround/Decca-Tree-Halterung für Stäbchenmikrofone
Stereo Surround Holders
Jetzt entdecken
SB0400/SBS0400 Leichte Stereoschiene für Stäbchenmikrofon
Stereo Surround Holders
Jetzt entdecken
- 4011A Nierenmikrofon
- 4011C Nierenmikrofon, Kompakt
- 4006A Kugelmikrofon
- 3506A Surround-Kit aus zwei gematchten 4006A, Clips und Windschutz im Peli™-Case
- S5 Surround/Decca Tree Mount
- ST4011A Stereopaar mit 4011A Nierenmikrofonen
- SB0400 Modularer Stereo-Boom
Hamasaki Quadrat
DPA bietet keine Mikrofone mit Achtercharakteristik. Wenn dieses Setup mit DPA-Mikrofonen aufgebaut werden soll, empfehlen wir, die Mikrofone mit Achtercharakteristik durch jeweils zwei Nierenmikrofone zu ersetzen:
Immersives Audio mit Vertikaler Abbildung
- 8 x 4011A Nierenmikrofon
- 2 x 4018 Supernierenmikrofon
IRT Kreuz
- 4011A Nierenmikrofon
- 4011C Nierenmikrofon, Kompakt
- ST4011A Stereopaar mit 4011A Nierenmikrofon
- MMC4011 Nierenmikrofonkapsel
- MMP ER/ES Modulares Aktivkabel
- SB0400 Modularer Stereo-Boom
- UA0837 Stereo-Boom
DPA 5100 Surround-Mikrofon
Das 5100 Surround-Mikrofon ist eine Plug-and-Play-Lösung.
Ein System besteht aus drei direktionalen (DIP-MIC, direktionaler Druckempfänger), koinzident angeordneten Frontmikrofonen. Die hinteren Kanäle werden über ein auf Abstand platziertes Kugelmikrofonpärchen aufgezeichnet. Das System verfügt außerdem über einen LFE-Ausgang. Alle Kanäle sind auf Unity Gain kalibriert. Der LFE ist standardmäßig um 10 dB reduziert.
Das 5100 ist ein hochgeschätztes System in der Filmproduktion.
Referenzen
[1] Gasull Ruiz, Allejandro: A Description of an Object-Based Audio Workflow for Media Productions. Convention Paper 9570, AES 140th Convention, Paris 2016.
[2] Steven A.: Object-based audio for television production. IBC 2015.
[3] Messonnier, Jean-Christophe et al.: Object-based audio recording methods. Conference proceedings, AES 57th International Conference, USA, 2015.
[4] Shirley, Ben et al.: Personalized Object-Based Audio for Hearing Impaired TV Viewers. Journal of the Audio Engineering Society, Vol. 65, No. 4, April 2017.