Skip to content

News Arts and Science Teaching Media Library Services IEM - intern Contact
  You are not logged in Link icon Log in
You are here: Home » Kunst & Forschung » Signalverarbeitung » Bearbeitung und Transformation von Sprache

Bearbeitung und Transformation von Sprache

Ines Kargel

Für die Komposition bzw. Klanginstallation " WITTGNSTN " (Wavesound 111 MB)  von Ines Kargel (Linz, IEM Graz) wird die Sprache als ureigenes Ausgangs- Basismaterial verwendet. Die Installation ist räumlich und klanglich in fünf Ebenen aufgebaut. Die erste Ebene gibt den unbehandelten Text - die originale Aufnahme wieder. Der Text - die Aufnahme erfährt in den darauffolgenden Schichten eine Metamorphose, die einen Auffächerung der Sprache in ihre informatorische und emotionale Aspekte bewirkt. In der zweite und dritten Ebene erfolgt eine Transformation durch Morsekodierung in eine maschinelle Klangstruktur (Information, Symbole). In der 4. und 5. Ebene erfolgt eine Transformation, die den prosodischer Verlauf der Sprache hervorkehrt (Intonation, Klangfarbe).

Zu den Grundlagen der einzelnen Transformationsprozesse gehört zum einen die Umsetzung der geschriebenen Texte in den Morsekode und zum anderen die Extrahierung des prosodischen Gehalts der Sprache der aufgenommenen Texte. Im Folgenden werden die dazu notwendigen Arbeitsschritte, die verwendeten Programme und Algorithmen beschrieben und die Ergebnisse der einzelnen Zwischenschritte anhand von Hörbeispielen dokumentiert.


Morsekodierung

Die verwendeten Textvorlagen sind Zitate von Ludwig Wittgenstein [1 ] und Paul Watzlawick (Quelle 2 und Quelle 3 ) [2 , 3 ]. Diese Texte werden mit dem Morsealphabetes kodiert und Anstelle der kurzen und langen Morseimpulse werden zufällig gewählte Konsonanten (für kurze: g, k, p, t und für lange: f, l, s, s-stimmhaft, sch, sch-stimmhaft, r, n, w) gesetzt. Die dabei entstehenden Klangdateien dienen als akustisches Ausgangsmaterial für die Komposition der 2. und 3. Ebene.

Textausschnitt: Es geht um die Frage, wie wir - dadurch, dass wir unweigerlich von einem ganz bestimmten Ausgangspunkt (...) [P.Watzlawick, "Die Unsicherheit der Wirklichkeit?", Piper (1981), S.9]

Alle aif-Hörbeispiele sind 44.1 kHz, mono und gezippt!

  • Das originale Klangmaterial
    Hörbeispiel 1 , 456 Kb
  • modifiziertes Klangmaterial
    • Modifiziertes Klangmaterial durch Timestretching
      Hörbeispiele 2a , 175 Kb; 2b , 1132 Kb

      Die Morsekodierung bewirkt eine grundlegende rhythmische Struktur. Die Modifikationen durch timestretching verändert die zeitliche Feinstruktur weitgehend (Programm CoolPro V1.2, --> Stretch).

    • Modifikation des Klangmaterials durch frequenzabhängige Noisereduction
      Hörbeispiele 3a , 698 Kb; 3b , 648 Kb; 3c , 595 Kb

      Eine andere mögliche Modifizierung stellt die frequenzabhängige Subtraktion der stochastischen Anteile dar. Dadurch wird der Attack der Plosivlaute verschliffen und auch die übrigen Konsonanten klingen synthetischer und maschineller (Programm CoolPro V1.2, --> Noise Reduction).

    • Modifizierung des Klangmaterials durch einen Ringmodulator mit variabler Frequenz
      Hörbeispiele 4a , 705 Kb; 4b , 831 Kb; 4c , 762 Kb

Eine weitere Modifizierung bietet ein Ringmodulator mit variabler Frequenz. Bedingt durch die Freiheitsgrade des Ringmodulators ergeben sich unterschiedliche Klangfacetten durch entsprechender Wahl der Parameter (Programm PD V1.9, modifizierter Ringmodulator mit variabler Frequenz).
Prinzipschaltbild des Ringmodulators

Extrahierung des prosodischen Verlaufs aus einer Textaufnahme

Ausgangsmaterial ist eine Textaufnahme die in einem gängigen Soundfile Format (wie WAV bzw. AIF) vorliegt. Mit der Software Praat [4] kann der Verlauf der Fundamentalfrequenz analysiert werden. Die Analyse erfolgt durch eine Autokorrelation des Soundfiles nach dem Algorithmus von P. Boersma [5] . Abhängig vom Soundfile ergibt die Autokorrelation meist mehrer mögliche "Kandidaten" für einen Signalausschnitt, die den Verlauf der Grundfrequenz beschreiben. Bei der Analyse können daher Parameter vom Benutzer eingestellt werden, die eine Auswahl eines Kandidaten für den jeweiligen Signalausschnitt bestimmen (Tracing Algorithmus). Der Verlauf der Fundamentalfrequenz dient als Modulator für die speziell generierten Klänge, die im Folgenden beschrieben werden. Weiters wird der Amplitudenbetragsverlauf der originalen Aufnahme ebenfalls analysiert und kann für die dynamische Steuerung der Klänge verwendet werden (Programm MATLAB V5.1). Die speziellen Klänge werden durch verdichten von Vokalen und stimmhaften Lauten kreiert, die aus den Sprachaufnahmen extrahiert werden. Die Extrahierung erfolgt durch Eliminierung von Plosivlauten durch entsprechend pegelabhängige Steuerung eines Verstärkers und anschließende Unterdrückung von stimmlosen Lauten und Zischlauten. Die Extrahierung und Verdichtung erfolgt mit Hilfe von MAX - Patches.

Extrahierung

Prinzipschaltbild

  • Das originale Klangmaterial - eine Textaufnahme
    Hörbeispiel 5 , 1464 Kb
  • Das prozessierte Klangmaterial - die extrahierten Vokale und stimmhaften Laute
    Hörbeispiel 6 , 1562 Kb

Verdichtung

Prinzipschaltbild

  • Das prozessierte Klangmaterial - die verdichteten Klänge
    Hörbeispiel 7a , 781 Kb; 7b , 792 Kb

Die Modulationsstärke der Fundamentalfrequenz d.h. die Wahl der Intervallvergrößerung bzw. Intervallverkleinerung und der Einfluss der dynamischen Modulation durch den Amplitudenbetragsverlauf kann durch zwei Parameter getrennt gesteuert werden (Programm MATLAB V5.1). Dadurch ergibt sich der quasi "prosodische Verlauf" der Sprache.

  • Die modifizierten verdichteten Klänge - der Prosodische Verlauf
    Hörbeispiel 8a , 1090 Kb; 8b , 936 Kb


Danksagung

Herzlichen Dank gilt an dieser Stelle Herrn Paul Boersma für die kostenlose Verwendung der Sprachanalyse-Software PRAAT. Weiteren Dank gilt Herrn Joachim Schallock der sich für die Aufnahme der Texte zur Verfügung stellte.


Quellen

[1] Ludwig Wittgenstein, Tractatus logico-philosophicus, Werkausgabe Bd.1, Suhrkamp 1984.

[2] Paul Watzlawick, Wie wirklich ist die Wirklichkeit?, Piper 1976.

[3] Paul Watzlawick, Die Unsicherheit der Wirklichkeit, Piper 1981.

[4] Praat Version 3.8.50, a system for doing phonetics by computer, www.praat.org , © by Paul Boersma & David Weenink)

[5] P. Boersma "Accurate Short-Term Analysis of the Fundamental Frequency and the Harmonics-to-Noise Ratio of a Sampled Sound", IFA Proceedings 17, pp97-110, (1993), Institute of Phonetic Sciences, University of Amsterdam.

© 2000 IEM Graz zuletzt geändert am 16. November 2001.

Last modified 17.07.2003