Navigation

...

Entwicklungen an d

Evaluierung und Im

Evaluierung von ro

Evaluierung von Ve

Extraktion prosodi

Feedbackcancellati

Fraktionale Faltun

Frequenz- und Ampl

Frequenzanalyse ni

Gesangsvibrato: Me

GRAINY - Granulars

Granularsynthese i

Implementierung de

Implementierung ei

Improving the Esti

Manipulation of au

Mathematische Mode

MATLAB-Tool für di

MATLAB-Toolbox: Re

Mehrkanal-Audiotre

Modell zur objekti

MP3 versus MPEG4

Noise Cancellation

Parametric Sound T

Phasen Vocoder App

Portierung und Imp

Prosody-based auto

Prädiktion von epi

...

Bearbeitung und Transformation von Sprache

Ines Kargel

Für die Komposition bzw. Klanginstallation " WITTGNSTN " (Wavesound 111 MB) von Ines Kargel (Linz, IEM Graz) wird die Sprache als ureigenes Ausgangs- Basismaterial verwendet. Die Installation ist räumlich und klanglich in fünf Ebenen aufgebaut. Die erste Ebene gibt den unbehandelten Text - die originale Aufnahme wieder. Der Text - die Aufnahme erfährt in den darauffolgenden Schichten eine Metamorphose, die einen Auffächerung der Sprache in ihre informatorische und emotionale Aspekte bewirkt. In der zweite und dritten Ebene erfolgt eine Transformation durch Morsekodierung in eine maschinelle Klangstruktur (Information, Symbole). In der 4. und 5. Ebene erfolgt eine Transformation, die den prosodischer Verlauf der Sprache hervorkehrt (Intonation, Klangfarbe).

Zu den Grundlagen der einzelnen Transformationsprozesse gehört zum einen die Umsetzung der geschriebenen Texte in den Morsekode und zum anderen die Extrahierung des prosodischen Gehalts der Sprache der aufgenommenen Texte. Im Folgenden werden die dazu notwendigen Arbeitsschritte, die verwendeten Programme und Algorithmen beschrieben und die Ergebnisse der einzelnen Zwischenschritte anhand von Hörbeispielen dokumentiert.

Morsekodierung

Die verwendeten Textvorlagen sind Zitate von Ludwig Wittgenstein [1 ] und Paul Watzlawick (Quelle 2 und Quelle 3 ) [2 , 3 ]. Diese Texte werden mit dem Morsealphabetes kodiert und Anstelle der kurzen und langen Morseimpulse werden zufällig gewählte Konsonanten (für kurze: g, k, p, t und für lange: f, l, s, s-stimmhaft, sch, sch-stimmhaft, r, n, w) gesetzt. Die dabei entstehenden Klangdateien dienen als akustisches Ausgangsmaterial für die Komposition der 2. und 3. Ebene.

Textausschnitt: Es geht um die Frage, wie wir - dadurch, dass wir unweigerlich von einem ganz bestimmten Ausgangspunkt (...) [P.Watzlawick, "Die Unsicherheit der Wirklichkeit?", Piper (1981), S.9]

Alle aif-Hörbeispiele sind 44.1 kHz, mono und gezippt!

Das originale Klangmaterial
Hörbeispiel 1 , 456 Kb
modifiziertes Klangmaterial
- Modifiziertes Klangmaterial durch Timestretching
  Hörbeispiele 2a , 175 Kb; 2b , 1132 Kb
  Die Morsekodierung bewirkt eine grundlegende rhythmische Struktur. Die Modifikationen durch timestretching verändert die zeitliche Feinstruktur weitgehend (Programm CoolPro V1.2, --> Stretch).
- Modifikation des Klangmaterials durch frequenzabhängige Noisereduction
  Hörbeispiele 3a , 698 Kb; 3b , 648 Kb; 3c , 595 Kb
  Eine andere mögliche Modifizierung stellt die frequenzabhängige Subtraktion der stochastischen Anteile dar. Dadurch wird der Attack der Plosivlaute verschliffen und auch die übrigen Konsonanten klingen synthetischer und maschineller (Programm CoolPro V1.2, --> Noise Reduction).
- Modifizierung des Klangmaterials durch einen Ringmodulator mit variabler Frequenz
  Hörbeispiele 4a , 705 Kb; 4b , 831 Kb; 4c , 762 Kb

Eine weitere Modifizierung bietet ein Ringmodulator mit variabler Frequenz. Bedingt durch die Freiheitsgrade des Ringmodulators ergeben sich unterschiedliche Klangfacetten durch entsprechender Wahl der Parameter (Programm PD V1.9, modifizierter Ringmodulator mit variabler Frequenz).
Prinzipschaltbild des Ringmodulators

Extrahierung des prosodischen Verlaufs aus einer Textaufnahme

Ausgangsmaterial ist eine Textaufnahme die in einem gängigen Soundfile Format (wie WAV bzw. AIF) vorliegt. Mit der Software Praat [4] kann der Verlauf der Fundamentalfrequenz analysiert werden. Die Analyse erfolgt durch eine Autokorrelation des Soundfiles nach dem Algorithmus von P. Boersma [5] . Abhängig vom Soundfile ergibt die Autokorrelation meist mehrer mögliche "Kandidaten" für einen Signalausschnitt, die den Verlauf der Grundfrequenz beschreiben. Bei der Analyse können daher Parameter vom Benutzer eingestellt werden, die eine Auswahl eines Kandidaten für den jeweiligen Signalausschnitt bestimmen (Tracing Algorithmus). Der Verlauf der Fundamentalfrequenz dient als Modulator für die speziell generierten Klänge, die im Folgenden beschrieben werden. Weiters wird der Amplitudenbetragsverlauf der originalen Aufnahme ebenfalls analysiert und kann für die dynamische Steuerung der Klänge verwendet werden (Programm MATLAB V5.1). Die speziellen Klänge werden durch verdichten von Vokalen und stimmhaften Lauten kreiert, die aus den Sprachaufnahmen extrahiert werden. Die Extrahierung erfolgt durch Eliminierung von Plosivlauten durch entsprechend pegelabhängige Steuerung eines Verstärkers und anschließende Unterdrückung von stimmlosen Lauten und Zischlauten. Die Extrahierung und Verdichtung erfolgt mit Hilfe von MAX - Patches.

Extrahierung

Prinzipschaltbild

Das originale Klangmaterial - eine Textaufnahme
Hörbeispiel 5 , 1464 Kb
Das prozessierte Klangmaterial - die extrahierten Vokale und stimmhaften Laute
Hörbeispiel 6 , 1562 Kb

Verdichtung

Prinzipschaltbild

Das prozessierte Klangmaterial - die verdichteten Klänge
Hörbeispiel 7a , 781 Kb; 7b , 792 Kb

Die Modulationsstärke der Fundamentalfrequenz d.h. die Wahl der Intervallvergrößerung bzw. Intervallverkleinerung und der Einfluss der dynamischen Modulation durch den Amplitudenbetragsverlauf kann durch zwei Parameter getrennt gesteuert werden (Programm MATLAB V5.1). Dadurch ergibt sich der quasi "prosodische Verlauf" der Sprache.

Die modifizierten verdichteten Klänge - der Prosodische Verlauf
Hörbeispiel 8a , 1090 Kb; 8b , 936 Kb

Danksagung

Herzlichen Dank gilt an dieser Stelle Herrn Paul Boersma für die kostenlose Verwendung der Sprachanalyse-Software PRAAT. Weiteren Dank gilt Herrn Joachim Schallock der sich für die Aufnahme der Texte zur Verfügung stellte.

Quellen

[1] Ludwig Wittgenstein, Tractatus logico-philosophicus, Werkausgabe Bd.1, Suhrkamp 1984.

[2] Paul Watzlawick, Wie wirklich ist die Wirklichkeit?, Piper 1976.

[3] Paul Watzlawick, Die Unsicherheit der Wirklichkeit, Piper 1981.

[5] P. Boersma "Accurate Short-Term Analysis of the Fundamental Frequency and the Harmonics-to-Noise Ratio of a Sampled Sound", IFA Proceedings 17, pp97-110, (1993), Institute of Phonetic Sciences, University of Amsterdam.