Mixing Perceptual Coded Audio Streams

Stefan Bayer

Diplomarbeit (999 KB pdf)

Wahrnehmungsangepasste Audiokompressionsverfahren basierend auf der Modulierten Diskreten Cosinus Transformation (MDCT) sind seit geraumer Zeit etabliert und in weiter Verwendung.

Nachdem ein Überblick über Algorithmen wahrnehmungsangepasster Audiokodierungsverfahren und aktueller Kodierungsstandards gegeben wird, untersucht diese Diplomarbeit die Möglichkeiten, zwei Audioströme, die auf der MDCT basieren, zu mischen, ohne sie komplett in die Zeitdomäne zu dekodieren. Dafür werden Algorithmen für die Änderung von Blocklängen der Ströme und deren anschließende Mischung in der MDCT Domäne entwickelt. Diese werden in Hinsicht auf Latenzen, nötigen Rechenaufwand und Auswirkungen auf die psychoakustische Verarbeitung untersucht.

Als Beispielandwendung wird ein simpler Mischer für die Zusammenführung zweier mit Ogg Vorbis komprimierter Audiodateien mit fixen Blocklängen in MATLAB1ex® implementiert.

Stefan Bayer Typ: Diplomarbeit Status: Projekt ist abgeschlossen. Datum: 18.11.2002