Speech Enhancement with Factor-Graphs
Diplomarbeit ( 3.961 KB pdf file)
Das gesunde menschliche auditorische System besitzt eine erstaunliche Fähigkeit ein komplexes Schallfeld 
auf einzelne Schallquellen zu analysieren und diese getrennt zu verarbeiten. Dies ist die Voraussetzung für 
Sprachverständlichkeit in geräuschhafter Umgebung. Bei hörgeschädigten Personen ist diese Fähigkeit stark 
beeinträchtigt und erschwert so Sprache im Störgeräusch zu verstehen. 
Probabilistische Modelle durch Faktorgraphen ausgedrückt sind ein vielversprechender Ansatz um 
Sprachsignal-Algorithmen zu entwickeln. Ziel der Diplomarbeit ist die Anwendbarkeit von 
Faktorgraphen-Algorithmen auf reale Probleme der Störgeräuschbefreiung zu zeigen. Dazu soll das vorhandene 
Erstmodell - Nachbildung des LPC-Modells - erweitert werden, wobei möglichst realistische Annahmen über 
Sprachsignale getroffen werden sollten, z.B. ist eine Möglichkeit zu suchen, die Annahmen über Stationarität 
der Grundfrequenz und der Filterkoeffizienten aufzuheben. Als Anhaltspunkt dafür kann das klassische 
TVAR-Modell dienen.