Überarbeitet aus:
Guski, Rainer (1996): Wahrnehmen - ein Lehrbuch. Stuttgart: Kohlhammer
4.2
Körperliche Ausstattung für das Hören
4.2.1
Anatomische Gesichtspunke
4.2.1.1
Allgemeines
Analog
zur Ausstattung für das Sehen besitzen wir für das Hören
zwei äußere Sinnesorgane, die mit einem
horizontalen Abstand von 15-18 cm oberhalb aller übrigen
Körperteile (mit Ausnahme des Gehirns und der Augen)
angeordnet sind. Die hohe Position der Ohrmuscheln über dem
Boden hat akustische Konsequenzen: Der vom Boden reflektierte
Schall erreicht einen stehenden Menschen frühestens
eine Hundertstelsekunde später als der
Direktschall.
Die
horizontale Distanz der beiden Ohrmuscheln hat ebenfalls
Konsequenzen: Da die durchschnittliche Kopfbreite frontal 15
cm, lateral 18 cm beträgt, werden Frequenzanteile
mit Wellenlängen unterhalb von 15 bis 18 cm
(oberhalb
1,9 bis 2,3 KHz) in der Ausbreitung behindert. Eine
Konsequenz
ist, daß der von der Seite auftreffende Schall auf der der
Quelle abgewandten Kopfseite wegen der
Dämpfung
höherer Frequenzen tiefer (dunkler) klingt als auf der dem
Schall zugewandten Seite. Der Ohrabstand von 15 cm bedeutet
zudem, daß es je nach Drehung des Kopfes um die vertikale
Achse Laufzeitunterschiede des Schalls bis zu 4,4 msec zwischen
rechtem und linkem Ohr gibt, wenn der Kopf von der Seite getroffen
wird. Wir können davon ausgehen, daß die beiden Ohren
normalerweise unterschiedliche akustische Informationen
aufnehmen - es sei denn, der Schall kommt direkt von vorn oder direkt
von hinten.
4.2.1.2
Das periphere auditive System
Das
periphere Hörsystem besteht aus der Ohrmuschel
und dem Ohrkanal bis zum Trommelfell. Die
Ohrmuschel, lateinisch oder englisch
"Pinna", jenes weiche, etwa 5 x 2 cm große
Gewebe an den Seiten unseres Kopfes, hat eine
individuell
sehr unterschiedliche Form, die sich mit dem Alter verändert.
Zu ihren wichtigsten Merkmalen gehören die Helix, jene
Wulst, die die Muschel begrenzt, die weitgehend parallel
dazu innen verlaufende Anthelix sowie die vor dem
Ohrkanal befindliche Erhebung, die man Tragus nennt.

Abb.
4-16: Schematische Schnittzeichnung von Außen-, Mittel-
und Innenohr.
Nach
D.W. Batteau (1967) arbeitet die Ohrmuschel wie ein kleines
Feld von einzelnen reflektierenden Elementen, wobei die
Gesamtzeit des Schalldurchgangs pro Reflexion von
der Richtung des einfallenden Schalls abhängt. Dadurch ist
der Klang unmittelbar vor dem Trommelfell
ganz anders als draußen vor der Ohrmuschel: Wenn
z.B. ein Knall draußen ertönt, kommt es durch die
vielfältigen Reflexionen in der Pinna zu einer
Vielzahl von schwächeren Knallen am Trommelfell, die
gegenüber dem Original verzögert sind. Diese
Verzögerung ist abhängig von der Richtung,
in der die Schallwelle auf die Pinna trifft. Zusätzlich
wirken sich Form und Material der Pinna auf den Klang insofern
aus, als "härtere" Stellen höhere
Frequenzen reflektieren können als "weichere"
Stellen.
Messungen
mit Hilfe von winzigen Mikrofonen am Eingang des Ohrkanals
ergaben, daß Töne oberhalb von 2 kHz, die in
Ohrhöhe
den fixierten Kopf treffen, in Abhängigkeit von ihrem
horizontalen Einfallswinkel um etwa +/- 10 dB im Pegel
variieren. Somit enthalten auch die gewöhnlich breitbandigen
Alltagsgeräusche durch die
Frequenzselektivität
der Ohrmuschel schon am Anfang des Ohrkanals Informationen
über
den seitlichen Einfallswinkel, die möglicherweise
ausgewertet werden können. Weiterhin wird oft
angenommen, daß frequenzselektive Veränderungen
durch die Form der Ohrmuschel auch für die Wahrnehmung
des vertikalen Einfallswinkels von Geräuschen genutzt werden.
Da
die Ohrmuscheln relativ starr am Kopf befestigt und nach vorn offen
sind und die Neigung des Kopfes im entspannten
Zustand
ungefähr 24,5 beträgt, wird die Aufnahme von Schallwellen
erleichtert, die von vorn unten kommen. Will ein Mensch gezielt
akustische Information aus anderen Richtungen aufnehmen, muß
er den Kopf bewegen. Die Tatsache, daß die Ohrmuscheln
nicht willkürlich verschließbar sind, weist darauf
hin, daß das Gehör in stärkerem Maße globale
Überwachungs- und Warnfunktionen hat als das Auge, das von
vornherein eher selektiv und lokal arbeitet.
Der
Ohrkanal, eine unregelmäßig geformte
Röhre von etwa 2,5 cm Länge und 7 mm Durchmesser, ist das
zweite Glied des peripheren Hörsystems. Da er am Trommelfell
endet, handelt es sich um eine halb geschlossene Röhre, die
einen Resonanzkörper darstellt, der Frequenzen in einem
relativ breiten Band zwischen 2 und 5 kHz verstärkt.

Abb.
4-17: Einfluss des Ton-Einfallswinkels auf den Schalldruck vor dem
Trommelfell.
Der
Gesamteffekt des Systems Ohrmuschel plus Pinna besteht vor
allem in einer selektiven Verstärkung einzelner
Frequenzanteile (Abb. 4-17): Shaw (1974) hat den
jeweiligen Schalldruck gemessen, der vor dem
Trommelfell herrscht, wenn Sinustöne mit
unterschiedlichem horizontalem
Einfallswinkel den Kopf treffen. Es zeigt sich, daß der
Frequenzbereich 2 bis 7 kHz durch das Außenohr
gegenüber
dem Freifeld um bis zu 20 dB verstärkt wird, und am
deutlichsten ist die Verstärkung, wenn der Schall den Kopf
um 45 Grad von vorn trifft. Die richtungsabhängige
frequenzselektive Verstärkung kann mit zur
Lokalisation
von Geräuschquellen benutzt werden.
4.2.1.3
Das Mittelohr
Das
Mittelohr besteht aus der sog. Paukenhöhle, den darin
befindlichen Gehörknöchelchen und der
Eustachischen Röhre. Die Paukenhöhle ist eine
mit Luft gefüllte kleine Kammer zwischen Trommelfell und
ovalem
Fenster (dem Eingang zur Cochlea). In der Kammer befindet
sich die Gehörknöchelkette mit Hammer
(malleus), Amboß (incus) und Steigbügel
(stapes) sowie die zugehörigen Muskeln.

Abb.
4-18: Schematische Darstellung des Mittelohrs.
Das
Mittelohr verbindet die Schallwellen der Luft mit den im
Innenohr liegenden Rezeptoren; seine Hauptaufgabe besteht in der
Druckanpassung zwischen den Medien Luft und
Gewebsflüssigkeit. Wenn Schallwellen auf Flüssigkeit
treffen, werden sie vor allem reflektiert - nur ein
Tausendstel der in Luft übertragenen
Energie wird im Wasser weitergeleitet. Wenn die
in der Flüssigkeit des Innenohres liegenden
Rezeptoren erregt werden sollen, muß der Druck der
Luftschallwellen erhöht werden. Dies geschieht mit Hilfe der
Hebelwirkung, die die vom Trommelfell zum
Schwingen gebrachten Gehörknöchelchen auf das ovale Fenster
ausüben: Durch die Flächenverhältnisse
zwischen Trommelfell und ovalem Fenster und durch die Art der
muskulären Verbindungen zwischen den
Gehörknöchelchen
wird eine Konzentration des Drucks um den Faktor 80 erreicht.
Das
Mittelohr kann die Druckanpassung nur dann befriedigend leisten, wenn
der Luftdruck auf beiden Seiten des Trommelfells vergleichbar ist,
und dies wird durch die Eustachische Röhre bewirkt,
die mit dem Mund verbunden (aber gewöhnlich
verschlossen)
ist. Bei äußeren Luftdruckveränderungen (z.B. im
Flugzeug) hören wir zunächst undeutlicher, weil die
Druckanpassung zwischen Außen- und Mittelohr nicht optimal ist,
bis wir den Mund weit öffnen, damit die Eustachische Röhre
frei wird.
Das
Mittelohr hat noch eine weitere Funktion, die unter dem Stichwort
Mittelohr-Reflex bekannt ist: Wird die
Gehörknöchelkette
durch sehr hohen Schalldruck in Vibrationen versetzt, kontrahieren
der Musculus tympani (Trommelfellspanner) und der Musculus
stapedius
reflektorisch und behindern somit allzu starke Ausschläge der
Knöchelchen. Dieser Reflex setzt bei Pegeln von etwa 70 dB ein
und ist bei Pegeln über 90 dB am wirksamsten. Hier dämpft
er die übertragene Schallintensität von Frequenzen
unterhalb 2 kHz um 10 bis 15 dB. Allerdings hat er eine Latenz- und
Anklingzeit von zusammen fast 200 Millisekunden (bei
Maximalbelastung), so daß er kaum als wirksamer Schutz gegen
intensive Knalle fungieren kann, sondern eher zur vorübergehende
Anpassung an hohe Pegel. Allerdings sind diese Muskeln
spätestens nach einer Sekunde nur noch zu 30 Prozent wirksam.
Der Mittelohr-Reflex wird übrigens auch aktiviert, wenn wir
selbst laut sprechen oder singen; auf diese Weise wird der eigenen
Vertäubung entgegengewirkt und die Aufnahme relativ leiser
Information auch dann verbessert, wenn wir selbst laut sind.
4.2.1.4
Das Innenohr
Das
Innenohr besteht vor allem aus der Cochlea (Schnecke), einem
35 mm langen, zweieinhalbmal schneckenförmig gewundenen
knöchernen Gebilde, in die das Cortische Organ
eingebettet
ist. Hier findet die Umwandlung von Druckschwankungen
der Flüssigkeit (Lymphe) in neurale Signale statt.
Daneben gehört noch das Gleichgewichtsorgan mit seinen
Bogengängen zum Innenohr.

Abb.
4-19: Schematische Darstellung von Mittel- und Innenohr. Die Pfeile
deuten Druckwellen in Luft (links) und Flüssigkeit (rechts) an.
In
Abb. 4-19 sind einige Teile des Mittel- und Innenohrs
schematisch dargestellt. Dabei geben Pfeile die Richtung
der Druckwellen in Luft (vor dem Trommelfell) und in der
Flüssigkeit
der Schnecke dar. Die Membran des ovalen Fensters
überträgt den Druck auf die Lymphe. Der Druck wandert
vom ovalen Fenster bis zur Spitze der Schnecke
(Helicotrema) und dann wieder zurück zum runden
Fenster - eine Membran, die die Verbindung zum
luftgefüllten Mittelohr wieder herstellt. Beim Wandern
des Drucks vom ovalen Fenster zum Helicotrema wird die
Basilarmembran verbogen; auf dieser befinden sich
die eigentlichen Rezeptoren, die Haarzellen
(Zilien) in einer wulstförmigen Verdickung, dem Cortischen
Organ.
Die
insgesamt etwa 15500 Haarzellen der Cochlea sind nicht selbst
schallempfindlich, sondern geben elektrische Impulse
ab, wenn die Haarspitzen gegenüber dem eigentlichen
Haarzellkörper mechanisch verbogen werden. Diese
mechanische Reizung wird durch die Druckschwankungen in der
Scala tympani erreicht. Die Nervenfasern treten an der
Seite der Cochlea aus und werden zum Nervus Acusticus gesammelt.
Wie wir dem rechten Teil der Abbildung 4-20 entnehmen können,
gibt es ca. dreimal so viele (12000) äußere Haarzellen
wie innere (3500), andererseits sind die einzelnen
inneren Haarzellen jeweils mit mehreren Nervenfasern
verbunden, während mehrere äußere
Haarzellen sich jeweils eine Nervenfaser teilen. Etwa 90 Prozent
der Nervenfasern in der Cochlea (etwa 35000) haben
Verbindung mit den inneren Haarzellen, der Rest zu den
äußeren.
Die Erregung einer inneren Haarzelle wird auf verschiedenen
Bahnen parallel auf die zentrale Hörbahn und in verschiedene
Teile des Gehirns geleitet, wo sie mehrere Funktionen
gleichzeitig ausüben kann.

Abb.
4-20: Schnitt durch eine Windung der Cochlea.
4.2.2
Zur Physik und Physiologie der Basilarmembran

Abb.
4-21: Schematische Darstellung einer Wanderwelle. A: zwei
Wellenbilder zu verschiedenen Zeitpunkten mit
Hüllkurve. B: räumliche Darstellung
einer Wanderwelle.
Animierte
Darstellung einer Wanderwelle.
Einen
Eindruck von der Druckwelle auf der Basilarmembran
vermittelt Abb. 4-21. Sie zeigt oben (A) zwei
Zustände
derselben Welle (durchgezogen und kurz gestrichelt)
sowie als Hüllkurve (lang gestrichelt) das jeweilige
Auslenkungsmaximum. In Teil (B) ist eine Welle zu
einem festen Zeitpunkt räumlich dargestellt. Die
Auslenkung der Basilarmembran ist im vorderen Teil
kleiner als im hinteren, weil die Membran mit
zunehmender
Nähe zum Helicotrema dünner und flexibler
wird. Eine Konsequenz der abnehmenden
Steifheit
ist die tonotope Organisation (räumliche
Abbildung) der Auslenkungsmaxima für Töne
unterschiedlicher Frequenz: Tiefere Töne haben ihr
Maximum am Ende der Membran, höhere am Anfang (vgl. Abb. 4-22).

Abb.
4-22: Auslenkungsmaxima der Basilarmembran bei Anregung
durch unterschiedliche Frequenzen.
Die
Feststellung unterschiedlicher Orte der maximalen
Auslenkung der Basilarmembran für
unterschiedliche Tonhöhen hat den Anstoß für die sog.
Ortstheorie der Frequenzun-terscheidung gegeben:
Danach wird jeder Ort auf der Basilarmembran von einer bestimmten
Frequenz maximal erregt, und die neuralen Signale von den
inneren Haarzellen behalten die Orts-Information. Diese
Theorie
stammt von G. v. Békésy, der dafür mit einem
Nobelpreis ausgezeichnet wurde. Problematisch an dieser
Erklärung ist allerdings, daß die
Orts-Information mit zunehmender Stärke des
akustischen Signals immer schwächer wird, weil die
Erregungsbreite auf der Basilarmembran mit
zunehmendem Pegel steigt - dennoch ändert sich
die Unterscheidungsfähigkeit für Frequenzen nicht
mit deren Lautstärke.
Die
Auslenkung der Basilarmembran erzeugt an den
Haarzellen
eine Depolarisierung, jedoch kann die einzelne
Faser nur bis zu Frequenzen von 400 - 800 Hz dem Schall direkt
folgen. Bei höheren Frequenzen wird das Salvenprinzip
realisiert: mehrere Fasern wechseln sich beim "Feuern"
ab, so daß die Gesamtentladungsrate der beteiligten
Fasern der Reizfrequenz entspricht (Abb. 4-23).

Abb.
4-23: Schematische Darstellung des Salvenprinzips: Die
Summenaktivität der Fasern kann hohen Frequenzen folgen.
Diese
Entdeckung hat zur Entwicklung der sog. Periodentheorie
der Frequenzunterscheidung geführt: danach korreliert das
Gesamtdepolarisationsmuster von Faserbündeln des Nervus
acusticus zumindest in der Nähe der Cochlea mit
dem Frequenzmuster des hereinkommenden Schalls, weil
Einzelfasern zu Gruppen zusammengefaßt sind und so
synchronisiert feuern, daß das Gesamtmuster der
Nervenaktivität auch bei höheren Frequenzen
noch den Schallschwingungen folgen kann.
Nicht
alle Fasern des Nervus Acusticus reagieren auf alle
Schallfrequenzen, sondern jede Faser hat einen relativ engen
Bereich sog. Bestfrequenzen: Bei niedrigen
Intensitäten reagieren sie nur auf Töne einer
bestimmten Frequenz. Bei höheren Intensitäten
wird dieser Frequenzbereich vor allem zu den niedrigen
Frequenzen hin breiter. Die Nervenfaser in Abb. 4-24 hat ihre
Bestfrequenz bei etwa 2000 Hz, jedoch reagiert sie
frequenzselektiv nur bei sehr niedrigen Schallpegeln;
bei höheren Pegeln reagiert sie auch im Nachbarbereich
ihrer Bestfrequenz. Anders ausgedrückt: Die
Intensität des Schalls wird (auch) dadurch neural
codiert, daß sich die Anzahl der erregten Nervenfasern
erhöht.
Diese Korrelation zwischen dem Schallpegel und
der Zahl der erregten Fasern gilt jedoch nur eingeschränkt:
Etwa 85 Prozent der Nervenfasern haben sehr geringe
Reaktionsschwellen, reagieren aber nur in einem Pegelbereich zwischen
0 und 40 dB. Die restlichen 15 Prozent haben höhere
Ansprechschwellen und zeigen erst bei höheren
Schallpegeln
eine Sättigung. Der Gesamtbereich von etwa 130 dB, in dem
unser Gehör gut Töne unterscheiden kann, wird
also durch diese beiden Prinzipien allein nicht erklärt.
Vermutlich sind am Gesamtprozeß noch
Hemmungsmechanismen beteiligt, auf die wir hier nicht
eingehen können.

Abb.
4-24: Schema eines Reaktionsfeldes für eine einzelne auditive
Nervenfaser.
4.2.3
Der Verlauf der Hörbahn
Das
zentrale Hörsystem ist sehr redundant aufgebaut: Es
gibt mehrere Hirnregionen, in denen dieselbe neuronale Erregung
ankommt, und gleichzeitig wird diese Erregung in Hirnareale
projiziert, die mit spezifischen akustischen Auswertungen,
mit der motorischen Steuerung oder mit der allgemeinen
Aktivierung des Körpers zu tun haben.
Noch
stärker als im visuellen System zeigt sich, daß
Informationen von beiden Ohren auf frühen Stationen der
Hörbahn gemeinsam verarbeitet werden. Außerdem muß
die Information um so "komplexer" (im physikalischen
Sinn) sein, je "höher" die zu erregenden
neuralen Strukturen liegen. Während die
primären
afferenten Neurone des Hörnervs und des ventralen
Cochleariskerns noch durch Sinustöne erregbar
sind, werden auf allen anderen Hörbahn-Stationen
komplexere Informationen verlangt, z.B. Pegeländerungen,
Frequenzänderungen, zeitliche und
Lautstärke-Differenzen zwischen rechtem und
linkem Ohr etc. Dies weist auf die große Bedeutung sog.
Transienten im auditiven Bereich hin: Cortikal
werden vor allem auditive Änderungs-Informationen
bearbeitet.

Abb.
4-25: Schema der wichtigsten Stationen der Hörbahn.
Anders
als beim visuellen System, in dem die Erregungen der
Rezeptoren erst mehrere neurale Schichten (z.B.
horizontale, bipolare und amacrine Zellen) passieren
müssen, bevor nichtvisuelle Areale erreicht werden (und z.B. das
motorische System reagieren kann), gelangen die Erregungen der
Haarzellen des auditiven Systems schon relativ früh
auch zu nicht-auditiven Systemem. So ist z.B. das
Zerebellum (Kleinhirn) - eine Struktur, die vor allem
motorische Steuerungsaufgaben hat - direkt mit den dorsalen
Cochleariskernen verbunden, und ebenso wird das
aufsteigende
Retikulärsystem (ARAS: ascending reticular
activation system), das den Gesamtorganismus aktiviert, auf derselben
Ebene durch akustische Reize erregt. Spreng & Keidel
(1963) konnten zeigen, daß akustische Reize etwa 40
bis 60 Millisekunden früher als vergleichbare optische
Reize zu kortikalen Reizantworten (Potentialschwankungen
an der Kopfhaut) führen, und Analysen der Latenzzeiten
auf unterschiedlichen Stationen der Hörbahn machen
plausibel , daß
die "schnelle" Verbindung zwischen dem ventralen
Nucleus Cochlearis und dem kontralateralen
Lemniscus
Lateralis wie auch zum kontralateralen Colliculus
Inferior dafür ausschlaggebend ist: Diese Bahn ist trotz
längeren Weges um bis zu 12 msec schneller als die
ipsilaterale Bahn zwischen dem Nucleus Cochelaris und dem
Lemniscus lateralis (vgl. Spreng et al. 1984).

Abb.
4-26: Schema der afferenten Hörbahn mit ihren
Verbindungen
zum Zerebellum und der Retikulärformation.
Die
direkte Verbindung zwischen den dorsalen Cochleariskernen
und dem Zerebellum (Kleinhirn) wird oft dafür
herangezogen, die um etwa 40 msec kürzeren
Reaktionszeiten auf akustische Signale gegenüber
optischen Signalen zu erklären (vgl. Welford 1980).
Allerdings
hängen Reaktionszeiten stark von der
Reizintensität,
deren Anstiegssteilheit und der Reizdauer ab, und es ist
schwierig, die Vergleichbarkeit der optischen und
akustischen Reize herzustellen, die Voraussetzung für einen
Vergleich der Reaktionszeitbedingungen wäre.
4.2.4
Die absolute Empfindlichkeit des Gehörs
Die
kleinste Schallenergie, die ein Mensch unter günstigsten
Bedingungen als Geräusch wahrnehmen kann, beträgt etwa
10-16 Watt/cm2, die größte, die er
schmerzfrei ertragen kann, 10-4 W/cm2. Dieser
riesige Energiebereich wird aus praktischen Gründen in
einen Schallpegel umgerechnet und in Dezibel angegeben (s. Kap.
3). Dabei ist die absolute Empfindlichkeit des Gehörs
individuell recht unterschiedlich und zudem stark von der
Meßmethode
abhängig. Als sog. normale Hörschwelle wird
derjenige Schallpegel bezeichnet, der sich unter Ruhebedingungen
in einem reflexionsarmen Raum als Mittelwert von Ja- und
Nein-Antworten auf die Frage ergibt, ob ein Sinuston gerade eben
gehört wird.
Hier eine
Demonstration der
frequenzabhängigen
Empfindlichkeit unseres Gehörs: 7 Frequenzen mit stufenweise
abnehmenden Pegeln werden jeweils zweimal hintereinander dargeboten.
Bitte zählen Sie bei jeder Frequenz, wie viele Pegelstufen sie
erkennen. Bei halbwefs linear arbeitenden Kopfhörern (empfohlen)
oder Lautstrpecher zeigt sich, daß die Anzahl hörbarer Pegel
bei den
verschiedenen Frequenzen sehr unterschiedlich ist.
Eine
typische Hörschwellenkurve nach Daten von Robinson &
Dadson (1956) ist in Abb. 4-27 zusammen mit der Standardabweichung
dargestellt. Es handelt sich dabei um Freifeldmessungen an etwa
50 jungen Menschen mit gesunden Ohren. (Bei Freifeldmessungen wird
der Schall per Lautsprecher übertragen;
Kopfhörer-Messungen
erbringen etwas flachere Kurven.) Bemerkenswert ist die hohe
Frequenzabhängigkeit des Hörvermögens: Im Bereich
zwischen 500 Hz und 6 kHz ist das Gehör am empfindlichsten;
die maximale Empfindlichkeit liegt bei 3 kHz. In Richtung auf
höhere und tiefere Frequenzen nimmt die Empfindlichkeit
deutlich ab. Unterhalb von 20 Hz und oberhalb von 20 kHz können
Menschen Schallenergie nicht als Schall wahrnehmen. Da auch die
menschliche Sprache ihre Hauptenergie im Frequenzbereich
zwischen 500 und 4000 Hz hat, scheinen Hörvermögen und
Sprache gut aufeinander abgestimmt.

Abb.
4-27: Hörschwellenkurve im Freifeld (mit
Standardabweichungen) nach Robinson & Dadson
(1956).
Die
Standardabweichungen um die Mittelwertskurve schwanken zwischen 4 und
10 dB. Dies weist daraufhin, daß die individuellen
Schwellenwerte sehr unterschiedlich sein können; auch unter
den Menschen mit sog. "gesunden Ohren" hören
manche wesentlich besser, manche wesentlich schlechter als der
Durchschnitt. Die Zunahme der Streuungen bei Frequenzen oberhalb
von 4000 Hz weist einerseits auf die Zunahme der interindividuellen
Unterschiede bei höheren Frequenzen
hin, andererseits auch auf zunehmende Unsicherheiten der
Meßmethode.
Bei
Menschen der industrialisierten Welt nimmt die
Hörempfindlichkeit im Bereich um 3 kHz mit zunehmendem Alter ab.
Dies ist keine reine Presbyakusis
(Altersschwerhörigkeit),
die nur durch Alterungsprozesse zu erklären wäre, denn
sie tritt bei sog. Naturvölkern kaum auf (Rosen et al.
1962). Ernährung und akustische Umwelt scheinen eine wesentliche
Rolle zu spielen. Besonders von Hörverlusten
betroffen sind industrielle Lärmarbeiter, aber auch
junge Menschen, die sich oft lauter Musik aussetzen, können
anfangs vorübergehende Hörermüdungen
(temporary threshold shifts, TTS) zeigen, die später
zu dauerhaften Schäden (permanent threshold shifts,
PTS) werden.
4.2.5
Methoden der Hörschärfebestimmung
Da
die individuelle Hörschärfe sehr von der Methode ihrer
Messung abhängt, sollen hier kurz die gebräuchlichsten
Verfahren und ihre jeweiligen Vor- und Nachteile erwähnt werden.
Die
Standardmethode von Ohrenärzten ist die klassische
Audiometrie mit Hilfe eines Audiometers. Hierbei sitzt
die
Untersuchungsperson in einer kleinen Meßkabine und hört
über Kopfhörer 5 bis 10 Sinustöne, die jeweils in
ihrem Pegel langsam ansteigen und später wieder fallen. Die
Untersuchungsperson hat die Aufgabe, jeweils ein Zeichen zu
geben, wenn sie den im Pegel ansteigenden Ton gerade eben hört
bzw. wenn sie den im Pegel fallenden Ton gerade eben nicht mehr
hört.
Als (die im Audiogramm eingetragene) "Schwelle" gilt
der Mittelwert zwischen diesen beiden Werten. Dieses
Verfahren hat den Vorteil, schnell, preisgünstig und
international standardisiert zu sein.
Nachteilig
ist allerdings, daß nur wenige Frequenzen verwendet werden
können und die so gemessene Schwelle stark von der
Aufmerksamkeit und der Motivation der
Untersuchungsperson abhängt. So ist z.B. das Kriterium
für
die Entscheidung, wann ein Ton im vaskulären Rauschen
entdeckt wird bzw. wann das Rauschen überwiegt, nicht
kontrollierbar.
Etwas
günstiger erscheint die sog. Békésy-Audiometrie
(benannt nach dem bereits erwähnten Georg v.Békésy),
bei der die Frequenz des Testtons kontinuierlich und automatisch von
sehr tief bis sehr hoch variiert wird. Die Untersuchungsperson
drückt
einen Knopf, sobald sie den Ton hört - dies führt zu einer
automatischen Verringerung des Pegels, bis die Untersuchungsperson
den Knopf wieder losläßt; dann steigt der Pegel wieder an.
Diese Interaktion zwischen Mensch und Maschine erbringt
viele Meßwerte über den ganzen Frequenzbereich und
ist für die meisten Untersuchungspersonen interessant. Folglich
können auch Hörprobleme in sehr engen Frequenzbereichen
entdeckt und größere Hörempfindlichkeiten
nachgewiesen werden als beim klassischen Verfahren. Nachteilig sind
vor allem die Gerätekosten, und auch hier kann das
Antwortkriterium der Untersuchungsperson für das
Entdecken des Tons nicht kontrolliert werden.
Aufwendiger
und oft ermüdend, aber noch exakter ist die
Signal-Entdeckungsmethode, die schon in Kap. 2
beschrieben wurde. Hier sei nur daran erinnert, daß sie es
gestattet, die tatsächliche Empfindlichkeit einer Person von
ihrem Antwortkriterium und der Ratetendenz zu trennen.
4.2.6
Lautstärke und Lautheit
Wir
bezeichnen das psychologische Attribut der (physikalischen)
Lautstärke als Lautheit. Dies ist ein sehr
abstraktes
Attribut, das die im Schall enthaltene örtliche und inhaltliche
Information ignoriert. Mit zunehmendem Schallpegel eines
Geräusches steigt die Lautheit an, jedoch nicht linear,
sondern als Exponentialfunktion der physikalischen Intensität.
Dies hat Stevens (z.B. 1956) für Sinustöne gezeigt, indem
er die Methode der Größenschätzung benutzte:
Eine Untersuchungsperson hört einen Standardton (z.B. 1000 Hz
mit 40 dB Schallpegel) und soll ihn mit demselben Ton bei
unterschiedlichen Schallpegeln vergleichen. Für die
Lautheit des Standardtons wird eine willkürliche numerische
Größe vereinbart - z.B. 1 oder 10, und die
Untersuchungsperson soll die wahrgenommene Lautheit des
Testtons mit einer Zahl beschreiben. Unter diesen
Bedingungen ist die Lautheit L eine Exponentialfunktion des
Schallpegels P, multipliziert mit einer Konstanten k: L =
k*P0,6. Da der Exponent kleiner als 1 ist,
steigt die Lautheit bei zunehmender Lautstärke proportional
weniger an als die Lautstärke: Die Lautheit
verdoppelt
sich jeweils, wenn der Schallpegel um 10 dB angehoben wird.
Für
die Beschreibung der Lautheit haben Stevens & Davis (1938) die
Einheit sone vorgeschlagen (1 sone entspricht der
Lautheit eines 1000-Hz-Tons bei 40 dB Schallpegel). Da jedoch die
Lautheit natürlicher Geräusche nicht nur vom Schallpegel
abhängt, hat sich diese Einheit in der Praxis nicht
durchgesetzt.
Die
Unterschiedsschwelle
für Geräusche unterschiedlicher
Lautstärke hängt von einer Vielzahl von Faktoren ab, vor
allem von der Frequenzzusammensetzung, Dauer, Anstiegssteilheit
und dem Pegelbereich des Geräuschs. Für Sinustöne
oberhalb von 40 dB SPL kann eine Unterschiedsschwelle von etwa 1 dB
angenommen werden; bei geringeren Lautstärken steigt sie auf 4-5
dB (Zwicker 1982).
Die
unterschiedliche Empfindlichkeit des menschlichen Gehörs
für Töne unterschiedlicher Frequenz wirkt sich
nicht nur im Bereich der Hörschwelle, sondern auch
überschwellig
aus, wie u.a. Fletcher & Munson (1933) gezeigt haben: Die
Hörer hatten die Aufgabe, jeweils einen 1000-Hz-Ton mit einem
zweiten Ton (unterschiedlicher Frequenz) zu
vergleichen und den zweiten Ton so laut einzustellen, daß
er gleich laut erschien wie der 1000-Hz-Ton. Die in Abb. 4-28
eingetragenen Kurven gleicher Lautheit (Isophone) werden
jeweils mit dem Lautstärkepegel (in Phon) bezeichnet,
der für den 1000-Hz-Standardton gilt. Bemerkenswert
ist, daß diese Kurven mit zunehmendem Schallpegel im
unteren Frequenzbereich flacher werden: Das Gehör arbeitet
demnach bei höheren Pegeln "linearer" als bei
niedrigen Pegeln. Beim Lautheitsvergleich
natürlicher
Geräusche spielen jedoch neben der
Frequenzzusammensetzung
noch andere Faktoren eine wesentliche Rolle, vor allem die
Dauer, Anstiegssteilheit und der Pegelverlauf der Geräusche.

Abb.
4-28: Kurven gleicher Lautheit (Isophone) nach Fletcher &
Munson
(1933).
4.2.7
Reizdauer und Lautheit
Ähnlich
wie im visuellen Bereich, brauchen auch Schallereignisse
eine gewisse Mindestzeit, damit sie angemessen
wahrgenommen werden können. Tritt ein Geräusch
gleich welcher Art nur für wenige Millisekunden auf,
so kann nur ein "Klick" gehört werden. Zwischen
Lautheit und Darbietungszeit besteht unterhalb von 200 msec ein
gewisser Austausch. Soll z.B. ein Geräusch von 10 msec
Dauer gleich laut erscheinen wie ein Dauergeräusch, so
muß das 10-msec-Geräusch physikalisch etwa 10 dB lauter
sein als das Dauergeräusch. Die Beziehung zwischen Dauer und
Lautheitsverlust zeigt Abb. 4-29 für Sinustöne
von 1000 Hz (nach Gulick 1971).

Abb.
4-29: Beziehung zwischen Lautheitsminderung und Reizdauer
nach Gulick (1971).
Eine
Demonstration des Zusammenhangs zwischen Reizdauer
und Lautheit findet sich auf der Philips-CD 1126-061
(Auditory
Demonstrations), Demo 8, Spur 21. Dort werden kurze Pakete
Breitbandrauschens mit abnehmender Dauer bei
unterschiedlichen konstanten Pegeln angeboten. Wir
können
hören, dass die Lautheit mit kürzer werdenden Dauern
immer schneller abfällt.
4.2.8
Lautheitsadaptation
Wenn
wir in einen Raum kommen, in dem eine leise Klimaanlage
läuft,
werden wir das Rauschen zunächst bemerken, uns aber nach einigen
Minuten daran gewöhnen und das Geräusch nicht mehr
bewußt
wahrnehmen. Dann hat sich unser Gehör adaptiert. Handelt es sich
aber um eine sehr laute Anlage, so wird sie uns immer wieder
auffallen; unser Gehör adaptiert in diesem Fall nicht.
Solche Widersprüche haben zahlreiche empirische
Untersuchungen und Theorie-Diskussionen zum Auftreten der
Lautheitsadaptation ausgelöst. Die meisten Autoren
betonen dabei, daß sich das Gehör anders als andere
Sinnesorgane verhalte - während sich das Auge auf
wechselnde Lichtverhältnisse einstelle, die Nase auf
unterschiedliche Gerüche und die Wärmerezeptorem auf
unterschiedliche Temperaturen, würde sich das Gehör
nur in Ausnahmefällen adaptieren. Adaptation wird im
nicht-auditiven Fall verstanden als Einstellung des sensorischen
Systems auf einen bestimmten Bereich physikalischer Energie;
ist diese Einstellung vollzogen, werden die Umgebungshelligkeit, das
Klima und die Zusammensetzung der Luft jeweils als
"Normalzustand" erlebt.
Beim
Gehör finden offenbar andere Arten von Adaptations- bzw.
Nicht-Adaptationsprozessen statt: 1.) Wir kennen die zeitweilige
Vertäubung, die der Besuch einer Musikkneipe für
einige Minuten hinterläßt, 2.) wir kennen die
permanente
Vertäubung, die jahrelanges Arbeiten an lauten Maschinen
hinterläßt, 3.) wir kennen das Nachlassen der
(subjektiven) Lautheit bei leisen Dauergeräuschen, und 4.)
wir kennen das Nicht-Nachlassen der Lautheit bei lauten
Dauergeräuschen und bei den meisten diskontinuierlichen
Geräuschen. Während die ersten beiden Adaptationsprozesse
als Nachlassen der absoluten Empfindlichkeit betrachtet werden
können, ist der dritte Prozeß eher ein Nachlassen der
relativen Empfindlichkeit, und der vierte kennzeichnet ein
Nicht-Nachlassen, das zumindest beim Sehen nicht bekannt ist. Auch
dies weist auf die unterschiedlichen Funktionen von Sehen und
Hören hin.
Als
einfaches Beispiel für das unterschiedliche Nachlassen
der Lautheit eines kontinuierlichen Tones seien die Ergebnisse
von Fishken, Arpino, Testa & Scharf (1977) genannt: Die
Untersuchungspersonen hörten mit beiden Ohren 100
Sekunden lang einen kontinuierlichen Ton von 4000 Hz und sollten
mit Hilfe der Methode der Größenschätzung
die jeweilige Lautheit nach 20, 40, 70 und 100 sec angeben. Es
stellte sich (neben einer großen individuellen Streuung)
heraus, daß die Lautheitsschätzungen bei
hohen Schallpegeln über die Zeit konstant blieben,
aber mit abnehmender Lautstärke immer stärker
abnahmen (vgl. Abb. 4-30). Dieses Ergebnis wurde mehrfach
bestätigt (z.B. durch Canèvet, Germain,
Marchioni & Scharf 1981; Botte, Canèvet & Scharf
1982), ohne daß die genaue Funktion der beteiligten Prozesse
aufgeklärt werden konnte.

Abb.
4-30: Unterschiedliche Lautheitsadaptation bei einem
kontinuierlichen 4000-Hz-Ton mit unterschiedlichem Schallpegel
nach Fishken et al. (1977).
4.2.9
Tonhöhenwahrnehmung
Die
physikalische Basis für die Wahrnehmung unterschiedlich
hoher Töne ist zwar deren jeweilige Grundfrequenz, jedoch
ist die Beziehung zwischen Frequenz und wahrgenommener
Tonhöhe nicht linear. Stevens & Volkman (1940) haben
dies mit Hilfe der Fraktionierungsmethode
untersucht: Sie boten einen 1000-Hz-Sinuston mit einem Pegel von
40 dB als Standard an und ließen die Tonhöhe eines zweiten
Tons so einstellen, daß dieser ein bestimmtes
Tonhöhenverhältnis zum Standardton hatte -
beispielsweise
halb so hoch oder doppelt so hoch. Die so entstandene
psychologische Tonhöhen-Einheit nannten sie mel.
Eintausend mel wurde willkürlich für die
1000-Hz-Frequenz
festgelegt, und ein halb so hoher Ton hat folglich 500 mel; ein
doppelt so hoher Ton hat 2000 mel. Die Mittelwerte dieser
Untersuchung sind in Abb. 4-31 dargestellt. Wir sehen, daß
die Tonhöhe unterhalb von 1000 Hz schneller als die
Frequenz steigt, oberhalb langsamer.

Abb.
4-31: Abhängigkeit der wahrgenommenen Tonhöhe von der
Grundfrequenz nach Stevens & Volkman (1940).
Die
Unterschiedsschwelle
für Tonhöhen ist vom
Frequenzbereich abhängig: Unterhalb von 1000
Hz reichen etwa 3 Hz Differenz aus, um zwei Töne als
unterschiedlich hoch wahrzunehmen. Oberhalb von 1000 Hz
kann die Unterschiedsschwelle als "Weber-Konstante"
angesehen werden: df/f ist etwa 0,004. Das bedeutet, daß
bei einer Frequenz um 10 kHz etwa 40 Hz Unterschied bestehen
müssen, damit zwei Töne als unterschiedlich hoch
wahrgenommen werden können. Allerdings haben die
meisten Menschen Schwierigkeiten, Töne oberhalb von 4000 Hz
überhaupt differenziert als Töne wahrzunehmen.
4.2.10
Schwebungen und Kombinationstöne
Wenn
Musiker ihre Instrumente stimmen, erkennen sie einen
Tonhöhenunterschied zwischen zwei gleichzeitig
erklingenden Tönen meist an einer Schwebung, d.h.
einem wiederholten Anstieg und Abfallen der
Lautstärke. Dieses Phänomen hat eine einfache
physikalische Ursache: sind zwei etwa gleich laute Töne
in ihrer Frequenz verschieden, so stimmt ihre Phasenlage
manchmal überein (dann addieren sich die momentanen
Schalldrucke), manchmal nicht (dann können sich die jeweiligen
Schalldrucke gegenseitig auslöschen). Diese
Schalldruck-Interaktion bewirkt einen komplexen Ton, der nicht
als eigener Ton mit einer speziellen Tonhöhe
wahrgenommen wird, sondern als Intensitätsschwebung
der beteiligten Teiltöne. Diese Intensität
variiert mit der Differenzfrequenz der beteiligten
Tonfrequenzen. Sind z.B. die beiden Töne um 2 Hz
unterschiedlich, wird die Intensität des Komplextones
mit 2 Hz variieren (vgl. Abb. 4-32).

Abb.
4-32: Sind zwei Töne in ihrer
Frequenz leicht verschieden
(unten), so entsteht ein komplexer Ton, dessen Amplitude
mit der Differenzfrequenz variiert (oben).
Beispiel für eine Schwebung.
Mit
zunehmendem Frequenzabstand der beteiligten (etwa gleich lauten)
Teiltöne werden die Schwebungen geringer, und der Klang
wird rauher, bis sog. Kombinationstöne entstehen,
die als Summen- oder Differenztöne
gehört werden: Im Fall der Summentöne entspricht
die Grundfrequenz des Kombinationstons der Summe der Frequenzen
der beteiligten Teiltöne; im Fall der Differenztöne
entspricht sie ihrer Differenz. Für diese Phänomene
werden nicht physikalische Ursachen, sondern Verzerrungen in der
Cochlea verantwortlich gemacht. Allerdings ist die wahrgenommene
Lautstärke der Kombinationstöne wesentlich
geringer als die der Primärtöne.
Zurück
zum Inhaltsverzeichnis
Weiter zu Kap. 4.3.