Navigation

Infos & Services

Kunst & Forschung

Akustik

Bachelorarbeit

Computermusik

Human Computer Int

Komposition

Neue Medien

Publikationen

Beiträge zur Elekt

Externe Publikatio

IEM - Reports

IEM Report 15/03 A

IEM-Report 01/98 A

IEM-Report 02/98 A

IEM-Report 03/98 P

IEM-Report 04/98 A

IEM-Report 05/98 d

IEM-Report 06/98 d

IEM-Report 07/98 M

IEM-Report 08/99 B

IEM-Report 09/99

IEM-Report 10/00

IEM-Report 12/03 I

IEM-Report 14/03 S

IEM-Report 17/03 W

IEM-Report 19/03 S

IEM-Report 21/03 W

IEM-Report 23/04 S

IEM-Report 24/04 P

...

IEM-Report 09/99 Ambisonic System mit unsymmetrischem Lautsprecher Layout

Alois Sontacchi, Robert Hoeldrich

Probleme bei unsymmetrischen Lautsprecherlayouts und der Versuch diese zu kompensieren.

Bei der Bestimmung eines Ambisonic Systems steht zu Beginn die Wahl der Dimension (2 oder 3-dimensional) und der Ordnung (1., 2. oder höhere Ordnung). Diese Wahl legt die Anzahl der Kanäle aber auch implizit die minimale Anzahl der Lautsprecher fest [1], [2]. Eine Monoquelle aus Richtung (j ,q) mit dem Signal S wird allgemein für ein 3-dim. System 1.Ordnung in folgender Form in die entsprechenden Kanäle kodiert: (Gleichungen 1-4)

Kodierungsvorschrift:

j _n,q_n)

a , b , g , d

matching conditions:

Anhand einer speziellen Vorgabe wird nun die Vorgangsweise dokumentiert.

Geg.: 2 Lautsprecherkreise, mit je 30m Durchmesser, á 8 Lautsprecher (gleichmäßig verteilt) übereinander (Höhendifferenz 4m) angeordnet.

Es handelt sich hierbei um eine unsymmetrische Anordnung, da die Winkelauflösung bzgl. der Elevation nicht gleichmäßig erfolgt. Da es sich um eine 3-dim. Anordnung handelt, stellt sich nur noch die Frage der Ordnung des Systems.

Gerzon hat in seinem "Metatheory"-Artikel [3] bewiesen, daß für ein Ambisonic-System mit 4 Lautsprechern im Rechteck die Verwendung von 3 Signalen, nämlich W,X und Y hinreichend ist. Er hat festgestellt, daß durch die Verwendung eines vierten Signales die Abbildungsfehler zunehmen (Vgl. auch Bamfords Arbeit). Weiters findet sich in der Literatur die Aussage, daß bei Ambisonic-Systemen immer mindestens soviele Lautsprecher zur Verfügung stehen müssen wie Übertragungskanäle. Das heißt für ein horizontales (=2-dimensionales) System müssen 3 LS für 1. Ordnung und 5 LS für 2. Ordnung zur Verfügung stehen.

Frage: Ist es möglich, bei einer wie oben gegebenen Lautsprecheranordnung (siehe Geg.:), ein Ambisonic System 1.Ordnung in der Horizontalebene, aber ein System 2.Ordnung in der Vertikalen, um trotz des geringen Abstands zwischen den Lautsprecher-Ringen einen verbesserten Höheneindruck zu erreichen?

Erklärung: Man nehme vier LS an den Positionen (x,y), (x,-y), (-x,y) und (-x,-y) im Rechteck. Es sei x > y, d.h. Das Rechteck hat vorne und hinten eine Schmalseite. Für die Konfiguration sind W,X und Y als Signale ausreichend, die Abbildung in y- Richtung wird schlechter sein als in x-Richtung, da die LS nicht weit genug auseinander stehen. Ein System 2.Ordnung könnte in seiner Gesamtheit nicht realisiert werden, ohne den Abbildungsfehler zu erhöhen. Wohl wäre es theoretisch möglich z.B. nur eine Komponente der 2. Ordnung, sin(2j ), als 4. Signal hinzuzufügen, doch das erhöht den "Wave Front Mismatch Error" und den absoluten Fehler. Wenn jetzt dieses LS-Rechteck um die y-Achse zu drehen beginnt, so wird die z-Koordinate miteinbezogen. Die 4 LS beschreiben bei dieser Drehung zwei Ringe mit den Mittelpunkten (0,y,0) und (0,-y,0), der Drehachse (0,1,0) und dem Radius x. Für den Anteil des Y-Signals zu den LS-Signalen hat die Rotation des LS-Rechtecks überhaupt keine Bedeutung. Er wäre immer gleich groß. Wenn man entlang der durch die Drehung entstandenen Ringe noch zusätzliche Lautsprecher setzt, so unterscheiden sich deren Signale natürlich in ihren X- und Z- Anteilen. Das ursprüngliche X-Signal wird hier aufgeteilt in zwei Medianebenen- Signale, nämlich X und Z. Wenn man die Anzahl der LS auf diesen Ringen erhöht, wird die Abbildung in der Medianebene sicher besser, die y-Abbildung und damit die Behandlung der Y-Signals bleiben davon unberührt. Es wirken also die zwei LS-Ringe für die y-Richtung so wie nur 4 LS. Wenn man diese LS-Konfiguration (zwei Ringe mit den Mittelpunkten (0,y,0) und (0,-y,0) und dem Radius x) nun um 90° um die x-Achse dreht, so erhält man die oben vorausgesetzte LS-Situation. Die y-Achse und die z-Achse wurden dadurch getauscht. Es wirken also die 2 LS-Ringe für die Abbildung in die Vertikale so wie 4 LS an den Stellen (x,z), (x,-z), (-x,z) und (-x,-z).

Daher ist ein vertikales System 2. Ordnung nicht zielführend. Somit wählt man ein System 1.Ordnung. Durch die gegebene Lautsprecheranordnung ergibt sich für die Höhenauflösung (Vertikalkomponente) eine gewisse Einschränkung, die durch eine Parametrisierung "kompensiert" werden kann.

Berechnung der Parameter

Die Berechnung der Parameter a , b , g und d erfolgt mit Hilfe der "matching conditions" (Gleichungen 6 bis 9) und der Formel für die Lautsprechersignale (Gleichung 10). Es ergeben sich für die Anordnung folgende Parameter für die Lautsprechersignale:

a = 1 b = 0.67852 g = 0.67852 d = 19.0836

Bedingt durch das Lautsprecherlayout ergibt sich eine symmetrische Parametrisierung bezüglich X und Y. Da der Elevationswinkel 2q _n, den die beiden Ringe einschließen, sehr klein ist, kommt es zu einem sehr großen Parametrisierungswert d für den Z-Kanal. Man erhält das vorläufige Ergebnis der Dekodiermatrix, welches in der folgenden Tabelle (Tabelle 1) dargestellt ist.

Tabelle 1:

LS	azmuth in [ °]		elevation in [ °]	W	X	Y	Z
Ring 1
1	0	-7.5946		0.0625	0.1261	0.0000	-0.4729
2	45	-7.5946		0.0625	0.0892	0.0892	-0.4729
3	90	-7.5946		0.0625	0.0000	0.1261	-0.4729
4	135	-7.5946		0.0625	0.0892	0.0892	-0.4729
5	180	-7.5946		0.0625	0.1261	0.0000	-0.4729
6	225	-7.5946		0.0625	-0.0892	-0.0892	-0.4729
7	270	-7.5946		0.0625	0.0000	-0.1261	-0.4729
8	315	-7.5946		0.0625	0.0892	-0.0892	-0.4729
Ring 2
9	0		7.5946	0.0625	0.1261	0.0000	0.4729
10	45		7.5946	0.0625	0.0892	0.0892	0.4729
11	90		7.5946	0.0625	0.0000	0.1261	0.4729
12	135		7.5946	0.0625	-0.0892	0.0892	0.4729
13	180		7.5946	0.0625	-0.1261	0.0000	0.4729
14	225		7.5946	0.0625	-0.0892	-0.0892	0.4729
15	270		7.5946	0.0625	0.0000	-0.1261	0.4729
16	315		7.5946	0.0625	0.0892	-0.0892	0.4729

Große Parametrisierungsfaktoren führen zu einer gegenphasigen Ansteuerung der Lautsprecher für Signale aus der entsprechenden Richtung (hier die Z-Richtung). Durch die gegenphasige Ansteuerung wird zwar die "Stereobreite", hier die Ausdehnung in der Z-Richtung, vergrößert, jedoch kommt es zu einem unerwünschten Nebeneffekt. Dieser Effekt ist auch bei Stereoabbildungen bzw. bei der Vergrößerung der Stereobreite bekannt als "phasiness". Gerzon zeigt in [4] eine mögliche Berechnung.

Berechnung bzw. Bestimmung der "phasiness":

In [4] bezeichnet Gerzon die Känale entsprechend der Stereoapplikationen mit L und R. Für ein Signal aus q = 90° (X=Y=0) erhält man für den oberen LS-Ring das Signal O (anstelle von L) und für den unteren Ring das Signal U (anstelle von R).

hier: O = 0.065W + 0.4729Z

hier:² U = 0.065W – 0.4729Z

Der "phasiness" Effekte wird nach Gerzon [4] durch ein komplexes Verhältnis (siehe Gleichung 13) bestimmt.

(13)

Der Realteil P bestimmt die Position einer Quelle (Bsp.: bei P = 1 ® Quelle aus Richtung q _n, bei P = -1 ® Quelle aus Richtung -q _n). Q beschreibt die Phasigkeit (hier Q=0). Darüber hinaus zeigt sich für Positionswerte P >1 bzw <-1 auch ein Phasigkeits Effekt. Die Hörbarkeit der "phasiness" in Abhängigkeit von P und Q ist schematisch in der Abbildung 1 (übernommen aus Gerzon [4]) dargestellt. Überschreitet P einen Wert von 2, so kommt es zu einem hörbar störenden "phasiness" Effekt.

hier: (für

und

)

Zur Vermeidung dieses Effektes muß die Z-Komponente mit wachsenden Winkel q entsprechend abgeschwächt werden. Dazu benötigt man den Abschwächungsfaktor A, der so gewählt wird, daß man bei q = ± 90° maximal eine Position P = ± 2 erreicht (Gleichung 14).

(14)

hier: A = 5.14

Im folgenden werden mögliche Vorgangsweise zur Berücksichtigung des entsprechenden Abschwächungsfaktors A diskutiert.

Das Ambisonic-Signal wird selbst kodiert.

Das Ambisonic-Signal liegt kodiert vor.

Liegt das Ambisonic Signal bereits kodiert vor, ist ein einfacher Eingriff auf den Winkel q nicht mehr möglich. Die Vorgangsweise, die hier gewählt werden muß bedarf einer "Realtime Hardware" die mittels Software justierbar ist. Das Z-Signal wird auf das Gesamtsignal W normiert und entsprechend komprimiert. Das Z_mod-Signal erhält man durch anschließende Multiplikation mit der Amplitude des W-Signals (siehe Abbildung 3). Damit erreicht man eine gute Höhenauflösung, zumindest für kleine Winkel q , die unabhängig von der Signalleistung ist.

Die in Abbildung 3 dargestellte Vorgangsweise benötigt einen Kompressor, der eine Kennlinie besitzt, die in Abbildung 4 dargestellt ist (mit A = 5.14 bzw. -11.2dB).

Da der oben angeführte Fall nur durch zusätzliche programmierbare Hardware realisierbar ist, stellt sich die Frage nach einer einfachen praktischen Lösung. Eine einfache Lösung stellt die alleinige Kompression des Z-Kanals dar. Damit man auch hier die entsprechende Kompressionskennlinie bestimmen kann, wird bei dieser Vorgangsweise von einer "mittleren Aussteuerung" von –20dB ausgegangen. Der Abschwächungsfaktor A wird auch hier in einen dB-Wert umgerechnet und bestimmt damit die Kompressorkennlinie (siehe Abbildung 5).

Der Vorteil dieser Methode beruht in der relativ leichten Handhabung. Als Nachteil erscheint hier jedoch die Behandlung von leisen Signalen, die aus dem Richtungsbereich q = 90° kommen, sowie die von lauten Signalen, deren Höhenauflösung dadurch verschlechtert wird.

Referenzen:

[1] M. A. Gerzon, "Periphony: With-heigth Sound Reproduction" J. Audio Eng. Soc., Vol. 21, pp. 2-10, 1973, January.

[2] J. S. Bamford, "An Analysis of Ambisonic Sound Systems of First and Second Order", Thesis presented to the University of Waterloo, Waterloo, Ontario, Canada, 1995

[3] M. A. Gerzon, "General Metatheory of Auditory Localisation", Preprinted at the 92^nd Audio Engineering Convention 1992, March, Vienna.

[4] M. A. Gerzon, Signal Processing for Simulating Realistic Stereo Images, 93^rd AES Convention 1992, October, San Francisco.

---------------------------
¹ Liegen die physikalischen Lautsprecher aus der Sicht des Zentralhörers nicht auf einer gemeinsamen Kugeloberfläche, so müssen deren Abweichungen mit entsprechenden Zeitverzögerungsglieder kompensiert werden.

type: IEM-Report state: finished project Date: 01.01.1999