Untersuchung prosodischer Merkmale zur Erkennung von Emotionen und Stress
Fast gleich bedeutsam wie der Inhalt einer Äußerung ist die Art und Weise der Formulierung. Intonation, Sprechrhythmus, Intensität und Akzentuierung dienen einerseits der Gliederung und Hervorhebung auf allen linguistischen Ebenen; andererseits kann die Bedeutung des Gesagten entweder unterstrichen oder sogar ins Gegenteil verkehrt werden (Ironie). Somit kommt der Prosodie eine gewichtige Rolle beim Übermitteln von Informationen durch Sprache zu, da sie – unabhängig vom Inhalt – Rückschlüsse auf den Gemütszustand des Sprechers und dessen Einstellung zur getätigten Aussage ermöglicht.
In dieser Dissertation sollen (psycho-)akustische Korrelate prosodischer Merkmale (Grundfrequenz, Sprechrhythmus, Lautheit und Akzentuierung) auf ihre Eignung zur Erkennung von Emotionen, Arbeitsbelastung oder Stresszuständen hin untersucht werden. Gesucht werden verlässliche Indikatoren für einzelne Faktoren, die den emotionalen Zustand des Sprechers beeinflussen – mit dem Ziel, diese quantitativ beschreibbar und somit für die automatisierte Analyse verwendbar zu machen.
Als Fortführung einer Diplomarbeit zum Thema „robuste Features zur Stressanalyse“, die den aktuellen Stand der Forschung zusammenfasst sowie die universelle Verwendbarkeit von aus dem Sprachsignal abgeleiteten Features untersucht, liegt der Fokus dieser Dissertation auf der Quantifizierung bestehender (qualitativer) Erkenntnisse über emotionale Eindruckswirkungen prosodischer Merkmale sowie dem Finden neuartiger Beschreibungsarten für Sprechrhythmus und Akzentuierung; letztere unter Einbeziehung von Tonhöhe, Intensität und Silbenlänge.