E – Vertiefung: Schallerzeuger – die menschliche Stimme und Instrumente

Der (Ober-)Ton macht die Musik

Ein junges, gesundes Ohr nimmt Schallwellen zwischen 20 und 20.000 Hz wahr und setzt sie in der Weiterleitung in Signale um, die wir als Schall wahrnehmen. Soweit, so bekannt. Bekannt ist ebenfalls, dass akustische Musikinstrumente  physikalisch gesehen keine Töne von sich geben, sondern Klänge. Jeder Grundton, der auf dem Instrument erzeugt wird, bringt auch immer gleich ein reiches Spektrum an Obertönen mit sich, die den akustischen Eindruck erst „voll“ erscheinen lassen. Dieses Obertonspektrum, nicht der gespielte Grundton, lässt uns auch erst erkennen, um welches Instrument es sich wohl handeln könnte. Aber noch mehr als das: Obertöne und höhere Frequenzen generell haben einen entscheidenden Einfluss auf unser Hörerleben – ohne Obertöne kein voller Klang, aber ohne hohe Frequenzen auch kaum sprachliche Artikulation. Dies wollen wir im Folgenden genauer betrachten.

E1: Die Menschliche Stimme – wie funktioniert Sprache?

Ein Instrument erkennt man an seinem Klang, d.h. der Mischung aus Grundton und Obertönen. Wie aber ist das mit der menschlichen Sprache und Stimme? Wie können wir ein A von einem O unterscheiden oder ein S von einem Sch?

Auch die Artikulation funktioniert über die Mischung von verschiedenen Frequenzanteilen (Tönen) und lässt sich mit gewissen Übergangsbereichen in Klänge und Geräusche unterscheiden. Grob betrachtet handelt es sich bei Vokalen um Klänge und bei Konsonanten um Geräusche. Vor allem unsere Stimmbänder dienen dabei als schallerzeugendes System, v.a. der Mundraum als Resonanzkörper, der das Spektrum der Frequenzen ausprägt. Dazu ein einfaches erstes Beispiel: ein gesummter und ein gesungener „Ton“ (physikalisch gesehen natürlich ein Klang). Im ersten Fall ist unser Mund geschlossen und der Resonanzraum klein. Im zweiten offen und größer.

Abbildung E1 zeigt den Unterschied der beiden Klänge anhand der Oszilloskopbilder und Frequenzspektren. Das Öffnen des Mundraums beim Singen bringt ein ausgeprägteres Spektrum an Obertönen (Vielfache des Grundtons) hervor.

Abb. E1: Oszilloskopbilder und Frequenzspektren eines gesummten (oben) und eines gesungenen (unten) „Tons“.

Diese Überlegung lässt sich nun noch weiterführen: Warum können wir (ähnlich der Unterscheidung der Instrumentenklänge) denn überhaupt verschiedene Vokale und Konsonanten artikulieren und unterscheiden?

Auch die Laute unserer Sprache zeichnen sich durch ein charakteristisches Spektrum an vielen Frequenzen, Grund- und Obertönen aus.

Abbildung E2 zeigt den Schwingungsverlauf und die Spektralanalyse für die vier Vokale a – e – i – o – u.

Abb. E2: Oszilloskopbilder und Frequenzspektren der Vokale a, e, i, o, u (von oben nach unten).

Auf die gleiche Weise lassen sich auch die Spektren von Konsonanten analysieren (siehe auch Beispiel M-A-U-S in D.4).

Wenn nun auch die Formung der Laute unserer Sprache über den bestimmten Mix der in ihnen enthaltenen Frequenzen realisiert wird – dann lässt sich dies umgekehrt natürlich nutzen, um künstlich menschliche Sprache zu generieren. Diese Idee ist weitaus älter als (KI-basierte) Sprachassistenten. Der Edison-Taschenphonograph funktioniert ebenso auf diese Weise wie der Kempelensche Sprechapparat (siehe Video des Deutschen Museums München: https://www.youtube.com/watch?v=oIjkzZGe2I8), der die Lautformung des menschlichen Sprechapparates nachformt.

Video E1: Der Taschenphonograph

E2: Kleine Musiktheorie der Instrumente

Können wir Instrumente tatsächlich anhand ihres Klangs, also ihrer spezifischen Anteile von Obertönen unterscheiden? Die Antwort ist: Ja, denn die spezifische Mischung von Frequenzen ist das, was unser Ohr wahrnehmen und unser Gehirn verarbeiten kann.

Abbildung E3 zeigt im Vergleich den gleichen „Ton“ gespielt auf einem Klavier (oben) und einer Gitarre (unten) als Oszilloskopbild und als Frequenzspektrum.

Abbildung E3: Das Oszilloskopbild und das Frequenzspektrum von Klavier (oben) und Gitarre (unten).

Das ausgeprägte Obertonspektrum kommt vor allem dadurch zustande, dass  das tonerzeugende System der schwingenden Saite bei Gitarre und Klavier nicht in einer reinen Sinusform schwingt, sondern zu einem Dreieck verzerrt aus der Ruhelage ausgelenkt wird (durch das Zupfen oder Anschlagen der Saiten). Hierdurch schwingt die Saite nicht nur in einem reinfrequenten Sinus, sondern gleichzeitig mit Frequenzen eines Vielfachen dieser Grundschwingung. Grundton und Oberton werden dann durch den jeweiligen Resonanzkörper des Instrumentes verstärkt.

Abbildung E4 zeigt eine Grundschwingung und ihren ersten Oberton sowie die durch die Überlagerung beider Schwingungen resultierende Gesamtschwingung. Diese Gesamtschwingung ähnelt schon deutlich mehr einer „schiefen“ oder gar sägezahnähnlichen Schwingung.

Abb. E4: Addition von Grundfrequenz und erstem Oberton

Daraus lässt sich noch weiteres folgern und untersuchen: Wenn die nicht-sinusförmige Auslenkung zu einem ausgeprägteren Obertonspektrum führt, müsste sich dieses Spektrum verändern, je nachdem wo wir die Gitarrensaite anzupfen.

Wie Abbildung E5 zeigt, ist dies auch tatsächlich der Fall – diesen Klangunterschied machen sich Gitarrenspieler ja auch tatsächlich zu Nutze, wenn sie unterschiedliche Anschlagspositionen auf der Gitarre wählen. Hier wurde die Gitarre zunächst besonders weit am Ende, dann immer näher zur Mitte hin angezupft.

Abb. E5: Oszilloskopbild einer schwingende Gitarresaite, angezupft am Ende und immer weiter zur Mitte hin (von links nach rechts).

Weiter lässt sich die Frage aufwerfen, wie die Schwingung der Saite sich über die Zeit entwickelt – schwingt sie weiterhin in der dreiecksähnlichen Form, in der sie ursprünglich ausgelenkt wurde? Tatsächlich nähert sich die Schwingung nach sehr kurzer Zeit – dem sogenannten Einschwingvorgang – zügig einer gleichmäßigeren, sinusartigen Schwingung an. Auch das lässt sich im Oszilloskopbild gut zeigen. Abbildung E6 zeigt den zeitlichen Verlauf der Schwingung einer gezupften Gitarrensaite über die ersten ca. 2 Sekunden. Hieraus lässt sich auch erahnen, dass es vor allem der Einschwingvorgang des Instrumentes ist, der uns überhaupt hilft zu erkennen, um welches Instrument es sich handelt. Ist diese sehr instrumentencharakteristische Phase vorüber, sind Instrumente für uns kaum noch zu unterscheiden. Bei Instrumenten, in denen die Schallerzeugung auch über die erste Anregung hinaus anhält, bleiben die Obertonspektren hingegen erhalten. Dies ist beispielsweise beim Streichen von Saiten (Geige, Cello usw.) der Fall, bei der der streichende Bogen kontinuierlich die Saite am Auflagepunkt in eine schwingende Bewegung „reißt“.

Abb. E6: Der zeitliche Verlauf der Schwingung einer gezupften Gitarrensaite über die ersten ca. 2 Sekunden.

In den folgenden Videos sind als weitere Beispiele die Oberton-Spektren verschiedener Instrumente mithilfe der App Phyphox zu erkennen.

Video E2: Obertonspektrum einer Violine.

Video E3: Obertonspektrum einer Tuba.

Video E4: Obertonspektrum einer Posaune.

Video E5: Obertonspektrum einer Querflöte.

Video E6: Obertonspektrum eines Cellos.