Speech Enhancement with Factor-Graphs
Diplomarbeit ( 3.961 KB pdf file)
Das gesunde menschliche auditorische System besitzt eine erstaunliche Fähigkeit ein komplexes Schallfeld
auf einzelne Schallquellen zu analysieren und diese getrennt zu verarbeiten. Dies ist die Voraussetzung für
Sprachverständlichkeit in geräuschhafter Umgebung. Bei hörgeschädigten Personen ist diese Fähigkeit stark
beeinträchtigt und erschwert so Sprache im Störgeräusch zu verstehen.
Probabilistische Modelle durch Faktorgraphen ausgedrückt sind ein vielversprechender Ansatz um
Sprachsignal-Algorithmen zu entwickeln. Ziel der Diplomarbeit ist die Anwendbarkeit von
Faktorgraphen-Algorithmen auf reale Probleme der Störgeräuschbefreiung zu zeigen. Dazu soll das vorhandene
Erstmodell - Nachbildung des LPC-Modells - erweitert werden, wobei möglichst realistische Annahmen über
Sprachsignale getroffen werden sollten, z.B. ist eine Möglichkeit zu suchen, die Annahmen über Stationarität
der Grundfrequenz und der Filterkoeffizienten aufzuheben. Als Anhaltspunkt dafür kann das klassische
TVAR-Modell dienen.