Time-scale-modification using the phase vocoder
Diplomarbeit (Acrobat Reader), Soundfiles
Der Phasen-Vocoder wird seit mehreren Jahrzehnten als Algorithmus zur Zeitskalenmodifikation
verwendet.
Wird ein Klang extrem in der Zeit "gedehnt", klingt er "phasy" bzw. "hallig".Eine
Methode zur Verbesserung der Klangqualität ist "phase-locking". Dabei
werden
die Phasenbeziehungen rund um ein lokales Maximum im Analyseamplitudenspektrum
in die
Berechnung der Synthesephasen übernommen. Für große Skalierungsfaktoren
klingt das Ergebnis "starr", wenn phase-locking auf das gesamte Phasenspektrum
angewendet wird.
In dieser Arbeit werden die deterministischen und stochastischen Anteile
eines Klanges im Frequenzbereich getrennt. Dadurch ist es möglich, nur
für die deterministischen Phasen phase-locking zu verwenden und die stochastischen
Phasen auf Zufallszahlen zu setzen. Die Detektion der deterministischen Komponente
geschieht innerhalb eines Amplitudenspektrums mit verringerter Varianz und
basiert auf heuristischen Bedingungen.
Die Varianz der Schätzung wird dadurch verringert, dass das aktuelle
Amplitudenspektrum, das Spektrum ca. 11 ms danach und das Spektrum mit reduzierter
Varianz ca. 11 ms davor, gewichtet werden. In diesem gewichteten Spektrum
werden die spektralen Maxima gesucht. Durch die Reduktion der Varianz der
Schätzung werden für rauschhafte Signale bessere Resultate bei der
Detektion des deterministischen Anteils erreicht.
Für die Resynthese des modifizierten Signals werden die deterministischen
Amplituden mit den geglätteten stochastischen Amplituden und die deterministischen
Phasen mit den zufälligen Phasen kombiniert.
© 2000, zuletzt geändert am 27. September 2001.