Akustische Phonetik - Kapitel I
Was ist Schall?

Prof. H.G. Tillmann, Dr.-Ing. F. Schiel

Inhalt:

  1. Einleitende Bemerkungen
  2. Der physikalische Schallbegriff
  3. Kreisschwingung
  4. Kenngrößen des Schalls
  5. Fourierreihe von periodischen Signalen
  6. Spektren von aperiodischen Signalen
  7. Die Hörfläche
  8. Fragen


  1. Einleitende Bemerkungen
  2. Bei der Beantwortung der Frage Was ist Schall? trifft man in der akustischen Phonetik unweigerlich auf eine etwas paradoxe Situation:

    Einerseit ist Schall - zumindest teilweise - etwas, was man hören kann. Denn wenn wir wir nicht hören könnten, gäbe es das Wort gar nicht. Schall ist also ein auditives Ereignis.

    Andererseits - von der Seite der physikalischen Akustik betrachtet - ist Schall genau das, was man beim Hören natürlicherweise nicht beobachten kann. Also kann man Schall im Sinne der Akustik gar nicht hören, sondern muß ihn mit geeigneten technischen Einrichtungen messen.

    Vorläufig gelte folgende Definition:
    Die natürliche, intensionale Bedeutung des hörbaren (auditiven) Schalles läßt sich mit dem meßbaren Schallbegriff auf eine unabhängige Extension abbilden: die
    Hörfläche

    Diese Definition wollen wir in diesem Kapitel erarbeiten und verstehen.

  3. Der physikalische Schallbegriff
  4. Infolge der Gravitationskraft hat die uns umgebende Luft ein Gewicht und wird - je nach Höhe über dem Meeresspiegel - zum Luftdruck zusammengepresst. Dabei entspricht die vom Luftdruck verursachte Kraft auf eine Fläche - ca. 100000 Newton pro Quadratmeter auf Meereshöhe - dem Gewicht der Luftsäule in der Atmosphäre über dieser Fläche. Seit dem jungen Einstein wissen wir, daß der Luftdruck durch die Brownsche Molekularbewegung entsteht. Dabei stoßen die Luftmoleküle infolge ihrer Bewegung ständig aufeinander und natürlich auf die angrenzenden festen Wände. Die Summe all dieser Stöße macht die Kraft aus, die wir im allgemeinen Luftdruck nennen.

    Die zusammengepresste Luft kann - wie auch andere Medien, z.B. Wasser oder Festkörper - durch eine mechanische Störung in Schwingung versetzt werden, d.h. daß sich mechanische Longitudinalwellen mit einer bestimmten Geschwindigkeit, der Schallgeschwindigkeit, durch das Medium Luft fortpflanzen können.
    Bei Longitudinalwellen schwingen die Elemente des Mediums (Luftmoleküle) in derselben Richtung wie die Richtung in der die Welle sich ausbreitet. Im Gegensatz dazu schwingen Transversalwellen im rechten Winkel zur Ausbreitungsrichtung, z.B. Wasserwellen.

    Durch die Fortpflanzung der Schallwelle durch das Medium entsteht in einem festen Punkt eine lokale Schwankung des Luftdrucks, der sog. Schalldruck.
    Der Schalldruck ist im Vergleich zum Luftdruck sehr klein. Der gerade noch hörbare Schall entspricht einem Druck von einem Zehntausendstel eines Millionstels des normalen Luftdrucks, also

    0.00001 Pa

    Der normale Luftdruck beträgt - wie gesagt - etwa 100000 Pa.

    Ein Pa ist der Druck, den die Kraft von 1 Newton auf die Fläche von 1 Quadratmeter ausübt. Das bar ist eine veraltete, aber immer noch gebräuchliche Einheit für Druck und entspricht 100000 Pa. Außer Pascal und bar trifft man auch noch auf die Einheiten 'Atmosphären-Überdruck' oder at (1 at = 98066,5 Pa) und Millimeter Quecksilbersäule oder Torr (1 Torr = 133,3224 Pa). Diese sind veraltet und sollten daher nicht mehr benutzt werden. Das heute in der Wetterkunde gebräuchliche 'Hektopascal' (hPa) entspricht dem veralteten 'Millibar' (mbar).

  5. Kreisschwingung
  6. Bevor wir genauer auf die physikalischen Eigenschaften von Schall eingehen, soll hier der Begriff der Kreis- oder Sinusschwingung, auch Sinoidalton erläutert werden.

    Reine Töne oder Sinustöne kommen zwar in der Natur praktisch nicht vor - der Flötenton ist wohl die nächste Annäherung -, aber, wie wir noch sehen werden, ist die Kreisschwingung als fundamentale Grundschwingung von großer Bedeutung.

    Stellen Sie sich ein Gewicht vor, das an einem Faden aufgehängt ist. Aufgrund der Schwerkraft wird es, wenn es aus seiner Ruhelage ausgelenkt wird, in diese zurückkehren, indem es auf die Ruhelage hin beschleunigt. Wenn es die Ruhelage erreicht, hat das Gewicht gerade seine maximale Geschwindigkeit erreicht, schießt daher über diese hinaus und wird nun von der Schwerkraft gebremst - d.h. negativ beschleunigt - bis es in einem Punkt, der gegenüber seinem Startpunkt liegt, zur Ruhe kommt. Dann beginnt der Vorgang in umgekehrter Richtung von Neuem: Beschleunigung - Erreichen der maximalen Geschwindigkeit im Ruhepunkt - Abbremsen - zur Ruhe kommen. Nehmen wir an, daß das Experiment sich im luftleeren Raum abspielt und auch alle sonstigen Reibungskräfte vernachlässigbar sind, dann wird sich der eben beschriebene Zyklus bis in alle Ewigkeit wiederholen.
    Stellt man nun den horizontalen Abstand des Gewichts von der Ruhelage in Abhängigkeit von der Zeit als Funktion dar, so erhält man eine Cosinusschwingung, also eine Kreisschwingung (vorausgesetzt, der Auslenkungswinkel ist klein!). Z.B. könnten wir an dem Gewicht einen sehr feinen Tuschpinsel befestigen, der die Schwingung auf einen Streifen Papier zeichnet, den wir gleichmäßig unter dem Pendel hindurchziehen.

    Die Zeitdauer, die das Gewicht braucht, um nach genau einem vollen Zyklus in seine Startposition zuückzukehren, nennt man Schwingungsdauer T und wird in Sekunden angegeben. Der Kehrwert der Schwingungsdauer ist die Frequenz f der Schwingung und wird mit Schwingungen pro Sekunde oder der Einheit Hertz angegeben.

    f = 1/T [Hz]

    Vertiefung

    In der Phonetik werden wir Kreisschwingungen fast ausschließlich als Zeitfunktionen verwenden, d.h. daß diese mathematischen Funktionen uns dazu dienen, die Veränderung von physikalischen Größen in Abhängigkeit von der Zeit darzustellen.
    Dazu bedarf es allerdings außer der Frequenz noch zweier weiterer Kenngrößen oder Parameter, um eine tatsächliche Schwingung vollständig zu charakterisieren.
    Diese sind die Amplitude A und die Phase FI (griechisches kleines fi). Die Amplitude beschreibt die maximale Größe der Kreisschwingung und wird daher einfach mit der Sinusfunktion, die nach unserer Herleitung immer die Amplitude 1 hat, multipliziert. Die Phase beschreibt die horizontale Verschiebung auf der Zeitachse, d.h auf der Achse, auf der unser Argument für die Funktion aufgetragen ist. Daher wird die Phase innerhalb der Sinusfunktion auf das Argument, das die Lage des zu berechnenden Punktes beschreibt, addiert.
    Die vollständige mathematische Beschreibung einer Kreisschwingung ist also:

    f(t) = A sin(2 PI f t + Fi)

    (PI : Kreiszahl 3.1416)

    Verlauf der Schwingung

    4.5 sin(2 Pi 100 Hz t + Pi/3)

    Der Vollständigkeit halber sei hier noch die Wellenlänge Lambda (griechisch kleines Lambda) genannt. Die Wellenlänge einer Sinusschwingung ist die Länge einer vollen Periode in der Schallwelle zu einem festen Zeitpunkt. Daher ist sie nicht nur von der Frequenz f sondern auch von der Schallgeschwindigkeit c abhängig und wird in Metern [m] angegeben.

    Lambda = c/f

    Übung:
    Zeichnen Sie auf karierten Papier die Zeitfunktion mit folgenden Parametern
    A = 3 cm, f = 150 Hz, FI = PI/2
    (PI : Kreiszahl 3.1416)
    über einen Zeitraum von 0.01 s, indem Sie die Werte für folgende Zeitpunkte berechnen, eintragen und die Punkte verbinden:
    t = 0.000 0.001 0.002 0.003 0.004 0.005 0.006 0.007 0.008 0.009 0.010

    Hören Sie sich die folgenden (fast) reinen Töne an:

    100 Hz 1000 Hz 2000 Hz

    Welche Grundfrequenz hat dieser Ton ?

    Antwort

  7. Kenngrößen des Schalls
  8. Wir wollen nun auf Einheiten und Kenngrößen des Schalls eingehen.

  9. Fourierreihe von periodischen Signalen
  10. Bis jetzt haben wir nur von Sinus- oder reinen Tönen gesprochen. Ein Klang oder, ganz allgemein, ein periodisches Signal dagegen hat zwar auch eine Periode, aber meistens eine ganz andere Kurvenform als ein reiner Ton.
    Im folgenden wollen wir einige Begriffe klären, die es uns ermöglichen, mit solchen - schon etwas komplexeren - Signalen umzugehen.

    Periodische Schwingung

    Eine Schwingung oder eine Schallsignal ist periodisch, wenn es sich nach einer bestimmten Zeitdauer T0 exakt wiederholt. Die Inverse von T0

           1
    f  = ----- 
     0     T
            0
    

    wird Grundfrequenz der Schwingung genannt.

    Spektrum und Linearität

    Unter dem Spektrum eines Signals oder Schalls verstehen wir ganz allgemein eine sonagrammähnliche Beschreibung der Frequenzanteile des Signals. Die Voraussetzung dafür ist, daß wir die Schwingung als aus vielen einzelnen, additiv überlagerten Sinusschwingungen verschiedener Frequenz, Amplitude und Phase betrachten können.

    Wir haben also zwei grundsätzlich unterschiedliche Bereiche, in denen wir Zeitsignale darstellen können: den Zeitbereich und den Frequenzbereich

    Für die Analyse bedeutet dies, daß ein beliebiges periodisches Signal in eine Überlagerung von mehreren (evtl. unendlich vielen) Sinusschwingungen zerlegt werden kann.
    Für die Synthese bedeutet dies umgekehrt, daß jede beliebige, periodische Schwingung aus einer geeigneten Überlagerung mittels Addition (Mischen) erzeugt werden kann.

    Ein solches System, in dem also komplexe Schwingungen durch additive Überlagerung von einfachen Schwingungen dargestellt werden dürfen, nennt man lineares System.

    Beispiel:
    Eine Sinusschwingung mit Amplitude 4,5, Phase Pi/3 und Frequenz 100 Hz läßt sich durch die genannten Parameter vollständig beschreiben. Daher genügt in der spektralen Darstellung ein einziger Wert im Amplituden- und Phasenspektrum bei der Frequenz 100 Hz.

    Fourierreihe

    Es läßt sich zeigen, daß sich jede periodische Schwingung in eine - meist unendliche - Reihe von Sinusschwingungen zerlegen läßt, wobei diese entweder ein Signal der Grundfrequenz oder eine Harmonische der Grundschwingung sind.
    Eine Harmonische (Oberton) ist eine Sinusschwingung beliebiger Amplitude und Phase mit einer Frequenz, die ein Vielfaches der Grundfrequenz ist.
    Die Darstellung eines periodischen Signals durch die Anteile der darin quasi 'verborgenen' Sinusschwingungen nennt man Fourierreihe oder harmonisches Spektrum
    .

    Beispiel:
    Der nachfolgend dargestellte Klang mit einer Grundfrequenz von 100 Hz ist aus drei harmonischen Sinusschwingungen mit 100, 200 und 300 Hz zusammengesetzt. Im Spektrum (der Einfachheit halber ist hier nur das Amplitudenspektrum dargestellt) sehen wir die entsprechenden Amplitudenwerte bei den Vielfachen der Grundfrequenz. Wie man leicht sehen kann, ist der Verlauf des Klangs periodisch mit der Grundfrequenz von 100 Hz.

    100 Hz

    200 Hz

    300 Hz

    Klang

    Jedes beliebige, periodische Signal läßt sich also in eine Summe von Sinusschwingungen zerlegen; auch so 'eckige' Signale wie Rechteckschwingung oder Dreieckschwingung. In solchen Fällen handelt es sich aber um Summen mit unendlich vielen Elementen. Daher spricht man - im mathematischen Sinne - von einer Reihe.

    Ein harmonisches Spektrum muß jedoch keine vollständige Obertonreihe enthalten. Auch ein Vokalspektrum eines männlichen Sprechers in einem Telefon-Sprachsignal, bei dem aus technischen Gründen die tiefen Frequenzen bei 300 Hz abgeschnitten sind, hat ein harmonisches Spektrum. Die Grundfrequenz muß also im Signal gar nicht mit enthalten sein; Hauptsache die anderen Frequenzen liegen im ganzzahligem Verhältnis zueinander.

    Vertiefung

    Quasistationäre Signale

    Ein periodisches Signal wird auch stationäres Signal genannt. In der Natur kommen solche Signale streng genommen gar nicht vor. Ein quasistationäres Signal dagegen beschreibt einen Ausschnitt aus einem Signal, innerhalb dessen das Signal praktisch (mit ganz kleinem Fehler) periodisch ist. Denkt man sich den Ausschnitt so gewählt, daß der ausgeschnittene Bereich genau eine Periode der Grundfrequenz abdeckt, kann man die Fourier-Reihenanalyse durchführen, indem man sich das Signal außerhalb des Ausschnitts bis ins Unendliche fortgesetzt vorstellt.

    Dies kann man natürlich dann auch mit jedem beliebigen anderen Ausschnitt machen (vorausgesetzt, die Schnittstellen passen aufeinander), und man erhält ein harmonisches Linienspektrum. Man muß sich dabei aber immer bewußt sein, daß es sich dann nur um das harmonische Spektrum dieses Ausschnitts handelt.

  11. Spektren von aperiodischen Signalen
  12. Signale, die keine fortwährende Periodizität haben, nennen wir aperiodische Signale. Sie der allgemeinste Fall, weil in der Realität jedes Signal einen Anfang und eine Ende hat.

    Aperiodische Signale mit Linienspektren

    Ein aperiodisches Signal kann ebenfalls ein Linienspektrum haben; die Linien liegen dann aber nicht auf ganzzahligen Vielfachen einer Grundfrequenz. Oder mit anderen Worten: die Periodendauern der beteiligten Sinustöne dürfen in keinem ganzzahligen Verhältnis zueinander stehen; es muß sich also um irrationale Zahlen (keine glatten Brüche) handeln.

    Vertiefung

    Solche Signale haben in der Phonetik keine praktische Bedeutung, weshalb sie hier nur der Vollständigkeit halber erwähnt werden. In der Realität kommen Glockentöne dem aperiodischen Linienspektrum am nächsten.

    Beispiel:
    Die folgende Schwingung ist aus drei Sinusschwingungen mit 100 Hz Wurzel aus 27555 Hz und Wurzel aus 29583 Hz synthetisiert worden.

    Im Signalverlauf ist keine Periodizität mehr erkennbar.

    Impulsartige Signale - Kontinuierliche Spektren

    Wie verhält es sich nun mit Impulsen, z.B. dem Zeitsignal einer Verschlußlösung in einem Plosiv?

    Ein solches Ereignis wiederholt sich ja nicht, ist also bestimmt nicht periodisch.

    Dazu folgendes Gedanken-Experiment:
    Wir haben schon beim harmonischen Spektrum gesehen, daß die Linien im Spektrum um so dichter aneinander liegen, je kleiner die Grundfrequenz ist. Warum ist das so? Weil ja beim harmonischen Spektrum die Linien auf den ganzzahligen Vielfachen der Grundfrequenz zu liegen kommen. (Diesen Sachverhalt nennt man auch Reziprozitäts-Gesetz der Systemtheorie.) Stellen wir uns nun ein Signal vor, das sich alle 10 ms wiederholt. Der Verlauf einer Periode enthalte dabei nur einen kurzen Impuls und dann eine längere Pause, bis sich die Periode wiederholt. Die Form des Impulses ist für diese Betrachtung nicht relevant; wir wählen daher einen einfachen Nadelimpuls oder Dirac-Impuls. Wir erwarten natürlich, daß dieses Signal ein harmonisches Linienspektrum haben wird.

    Nun verlängern wir - ohne dabei den Impuls zu verändern - die Periode, indem wir die Pause länger machen, sagen wir auf 20 ms.

    Wir sehen, daß die Linien des Spektrums dichter zusammenrücken, da ja nun die Grundfrequenz niedriger geworden ist.
    Im nächsten Schritt machen wir den Abstand zwischen zwei Impulsen noch größer. Die Folge: die Linien im Spektrum rücken noch enger zusammen. Schließlich machen wir - in Gedanken - die Periode unendlich lang. d.h. es bleibt nur noch ein Impuls übrig, der sich nicht mehr wiederholti (bzw. im Unendlichen wiederholt). Im Spektrum verschmelzen die Linien zu einem kontinuierlichen Spektrum, dem Impulsspektrum.

    Merke:
    Impulsartige, einmalige Ereignisse haben kein Linienspektrum mehr, sondern ein kontinuierliches Spektrum, einen Frequenzverlauf statt diskreter Werte.

    Statistische Signale - Mittlere Kontinuierliche Spektren

    Noch eine dritte Kategorie von Signalen fällt unter die aperiodischen Schwingungen: Zeitsignale, deren Verläufe von einem stochastischen Prozess bestimmt werden, also nicht deterministisch sind.

    Solche Zeitsignale werden als statistische Signale oder einfach als Rauschen bezeichnet. Diese Zeitsignale begegnen uns sehr häufig, z.B. in den Reibelauten bzw. Frikativen.

    Da sich das Zeitsignal eines statistischen Signals scheinbar völlig regellos verhält (der zugrundeliegende stochastische Prozess ist oberflächlich nicht erkennbar!), ist auch das Spektrum eines solchen Signals - zumindest wenn man ein sehr kurzes Stück Zeitsignal betrachtet - scheinbar völlig chaotisch. Im diesem Falle macht es nur Sinn, ein längeres Stück Zeitsignal (z.B. > 5 msec) zu betrachten. Auf diese Weise werden die statistischen Schwankungen des Signals gemittelt und es entsteht ein mittleres kontinuierliches Spektrum des zugrunde liegenden Zeitsignals (vergleichbar dem Zufallsexperiment 'Würfelwurf', bei dem auch erst nach sehr vielen Versuchen die zugrundeliegende statistische Quelle, nämlich daß jede Zahl gleich häufig kommt, erkennbar wird).

    Beispiel:
    Wir schneiden einen Stück Zeitsignal aus der Aufzeichnung eines F-Lauts und berechnen (z.B. mit digitaler Fouriertransformation DFT) daraus das Spektrum. Es ergibt sich ein kontinuierlicher, flacher Verlauf, der zu den höheren Frequenzen leicht ansteigt.
    Dies sagt uns, daß das Zeitsignal eines F-Lauts im statistischen Mittel alle Frequenzen des untersuchten Frequenzbereichs etwa gleich häufig enthält, mit einer leichten Betonung der höheren Frequenzen.

    Enthält ein Signal im Mittel alle Frequenzen des betrachteten Frequenzbereichs gleich häufig, so spricht man von weißem Rauschen.

  13. Die Hörfläche
  14. Nach all diesen sehr technischen Exkursen wollen wir zur zentralen Frage dieses Kapitels zurückkommen: Was ist Schall?

    Bisher haben wir ganz abstrakt über Schwingungen im Luftmedium gesprochen, haben Parameter dieser Schwingung definiert und über das Ausbreitungsverhalten gesprochen. Noch haben wir aber nicht darüber gesprochen, was davon als Schall bezeichnet werden soll. Sind Frequenzen über 100000 Hz Schall?

    In der Einleitung zu diesem Kapitel haben wir gesagt:
    Die natürliche, intensionale Bedeutung des hörbaren (auditiven) Schalles läßt sich mit dem meßbaren Schallbegriff auf eine unabhängige Extension abbilden: die Hörfläche

    Die Frage nach dem Schall kann also umformuliert werden in:
    Was ist die Hörfläche?

    Stellen Sie sich vor, Sie möchten mit dem bisher erarbeiteten Wissen die Grenzen der menschlichen Wahrnehmung in Bezug auf akustische Ereignisse bestimmen. Sie nehmen sich ein Blatt Papier und zeichnen folgendes Diagramm:
    Auf der waagerechten Achse zeichnen Sie eine Frequenzskala von 0 bis 20000 Hz; auf der senkrechten Achse eine Schalldruckskala von -10 dB bis 140 dB. Irgendwo in diesem Bereich sollte die Fläche der menschlichen Wahrnehmung liegen.

    Sie nehmen nun einen geeichten Sinusgenerator mit einem geeigneten Kopfhörer und viele Versuchspersonen. Dann lassen Sie jede Versuchsperson für jede Frequenz in Ihrem Diagramm den gerade noch hörbaren Pegel und den Pegel der Schmerzgrenze am Sinusgenerator einstellen und Sie tragen diese Werte in Ihr Diagramm ein. Verbinden Sie die Punkte und Sie erhalten eine geschlossene Fläche, welche den rezeptiven Bereich der Versuchsperson abdeckt, eben die Hörfläche.

    Führt man dieses Experiment für sehr viele Versuchspersonen aus und mittelt die Ergebnisse in geeigneter Weise erhält man die allgemeine Hörfläche wie im folgenden Diagramm dargestellt.

    Aus Pompino-Marschall (1995), S. 145.

    Die stark gezeichnete unterste Linie bezeichnet die Hörschwelle; die grau gezeichnete oberste Linie die Schmerzgrenze. Die dünn gezeichneten Linien dazwischen bezeichnen Kurven gleicher Lautstärke.

    Damit können wir abschliessend die zentrale Frage dieses Kapitels beantworten:

    Schall ist das, was in die Hörfläche fällt.

Fragen


  1. Welchem effektiven Schalldruck p entspricht 80 dB absoluter Schalldruck?
  2. Welche Grundfrequenz (ungefähr) hat dieser Ton?

  3. Was bedeutet es, wenn ein Schall -60 dB gegenüber einem anderen hat?
  4. Wir haben gesehen, daß der Schalldruck sehr klein gegenüber dem konstanten Luftdruck ist. Es genügen schon winzige Druckschwankungen im Bereich eines Tausendstel des Luftdrucks, um Schmerz beim Hören auszulösen. Warum schmerzt es dann nicht, wenn man z.B. vom Erdgeschoß in den ersten Stock geht (und sich dabei durch Veränderung der Höhe der Luftdruck beträchtlich ändert)?
  5. Warum hat ein Schallschnelle-Mikrophon eine Doppelkugel als Richtcharakteristik? Was ist beim praktischen Einsatz von Schallschnelle-Mikrophonen zu beachten?
  6. Was verstehen wir unter dem Spektrum eines Signals?

Antworten


Sollten Sie diese Seite als Papierausdruck vorliegen haben, finden Sie das Orginal Hypertext-Dokument unter folgender URL:

http://www.phonetik.uni-muenchen.de/AP/APKap1.html

Beachten Sie, daß alle Audio-Demonstrationen natürlich nur mit dem Orginal Dokument möglich sind.


Copyright © 1995 Institut für Phonetik und Sprachliche Kommunikation, Universität Müchen
Diese und alle weiteren hier referenzierten Seiten mit der Initiale 'AP' im Filenamen dürfen kopiert, gedruckt und an Dritte weitergegeben werden, unter der Bedingung, daß jede Seite vollständig bleibt. Weitergabe von Auszügen nur mit Erlaubnis der Urheber.

Florian Schiel