Überarbeitet aus: Guski, Rainer (1996): Wahrnehmen - ein Lehrbuch. Stuttgart: Kohlhammer


4.2 Körperliche Ausstattung für das Hören


4.2.1 Anatomische Gesichts­punke


4.2.1.1 Allgemeines


Analog zur Ausstattung für das Sehen besitzen wir für das Hören zwei äußere Sinnesorgane, die mit einem horizontalen Abstand von 15-18 cm oberhalb aller übrigen Körperteile (mit Aus­nahme des Gehirns und der Augen) angeordnet sind. Die hohe Position der Ohrmuscheln über dem Boden hat akusti­sche Konsequenzen: Der vom Boden reflektierte Schall erreicht einen stehen­den Menschen früh­estens eine Hun­dert­stel­sekun­de später als der Direkt­schall.

Die horizontale Distanz der beiden Ohrmuscheln hat eben­falls Konsequenzen: Da die durchschnittliche Kopfbreite frontal 15 cm, late­ral 18 cm beträgt, werden Fre­quenz­anteile mit Wellenlängen un­ter­halb von 15 bis 18 cm (ober­halb 1,9 bis 2,3 KHz) in der Aus­breitung behindert. Eine Kon­sequenz ist, daß der von der Seite auftref­fende Schall auf der der Quelle abge­wand­ten Kopf­seite wegen der Dämpf­ung höherer Frequenzen tiefer (dunk­ler) klingt als auf der dem Schall zuge­wandten Seite. Der Ohrab­stand von 15 cm bedeutet zudem, daß es je nach Drehung des Kopfes um die ver­tikale Achse Laufzeitunterschiede des Schalls bis zu 4,4 msec zwischen rechtem und linkem Ohr gibt, wenn der Kopf von der Seite ge­troffen wird. Wir können davon ausgehen, daß die beiden Ohren normalerweise unterschiedliche akustische Informa­tionen aufnehmen - es sei denn, der Schall kommt direkt von vorn oder direkt von hinten.



4.2.1.2 Das periphere auditive System


Das periphere Hörsy­stem be­steht aus der Ohr­muschel und dem Ohrka­nal bis zum Trom­mel­fell. Die Ohr­mu­schel, latei­nisch oder eng­lisch "Pinna", jenes wei­che, etwa 5 x 2 cm große Gewe­be an den Seiten unse­res Kopfes, hat eine indivi­duell sehr unter­schiedliche Form, die sich mit dem Alter verändert. Zu ihren wichtigsten Merk­ma­len gehören die Helix, jene Wulst, die die Mu­schel begrenzt, die weitge­hend par­allel dazu in­nen verlaufen­de An­thelix so­wie die vor dem Ohrkanal befindliche Er­hebung, die man Tragus nennt.

Abb. 4-16

Abb. 4-16: Schematische Schnittzeich­nung von Außen-, Mittel- und Innenohr.


Nach D.W. Batteau (1967) arbeitet die Ohr­mu­schel wie ein kleines Feld von einzel­nen reflektierenden Elemen­ten, wobei die Ge­samt­zeit des Schall­durchgangs pro Refle­xion von der Richtung des ein­fallenden Schalls abhängt. Dadurch ist der Klang unmit­tel­bar vor dem Trom­mel­fell ganz anders als draußen vor der Ohr­muschel: Wenn z.B. ein Knall drau­ßen ertönt, kommt es durch die vielfäl­tigen Reflexio­nen in der Pinna zu einer Vielzahl von schwächeren Knal­len am Trommelfell, die ge­genüber dem Original verzögert sind. Diese Verzöge­rung ist ab­hängig von der Rich­tung, in der die Schall­welle auf die Pinna trifft. Zu­sätzlich wirken sich Form und Material der Pinna auf den Klang inso­fern aus, als "här­tere" Stel­len höhere Fre­quenzen reflek­tieren können als "weichere" Stellen.

Messungen mit Hilfe von winzigen Mikrofo­nen am Ein­gang des Ohrkanals ergaben, daß Töne ober­halb von 2 kHz, die in Ohrhöhe den fix­ierten Kopf treffen, in Abhän­gigkeit von ihrem horizontalen Ein­fallswinkel um etwa +/- 10 dB im Pegel variieren. Somit enthalten auch die gewöhnlich breitbandigen Alltagsgeräu­sche durch die Fre­quenz­selektivi­tät der Ohrmu­schel schon am Anfang des Ohrkanals Informationen über den seit­lichen Ein­falls­winkel, die möglicherweise aus­ge­wertet werden können. Wei­terhin wird oft an­genom­men, daß frequenzselektive Veränderungen durch die Form der Ohrmu­schel auch für die Wahr­nehmung des vertikalen Einfallswinkels von Geräuschen genutzt werden.


Da die Ohrmuscheln relativ starr am Kopf befestigt und nach vorn offen sind und die Neigung des Kopfes im ent­spannten Zu­stand ungefähr 24,5 beträgt, wird die Aufnahme von Schallwellen er­leichtert, die von vorn unten kommen. Will ein Mensch gezielt akustische Information aus anderen Richtungen aufneh­men, muß er den Kopf bewegen. Die Tatsache, daß die Ohr­mu­scheln nicht willkürlich verschließ­bar sind, weist darauf hin, daß das Gehör in stärkerem Maße globale Überwa­chungs- und Warnfunktionen hat als das Auge, das von vornherein eher selektiv und lokal arbeitet.


Der Ohrka­nal, eine unre­gel­mäßig geformte Röhre von etwa 2,5 cm Länge und 7 mm Durchmesser, ist das zweite Glied des peripheren Hörsystems. Da er am Trommel­fell endet, handelt es sich um eine halb geschlos­sene Röhre, die einen Reso­nanzkörper darstellt, der Frequenzen in einem relativ breiten Band zwischen 2 und 5 kHz verstärkt.

Abb. 4-17
Abb. 4-17: Einfluss des Ton-Einfallswinkels auf den Schalldruck vor dem Trommelfell.


Der Gesamteffekt des Sy­stems Ohr­muschel plus Pinna besteht vor allem in einer selek­tiven Verstärkung ein­zelner Fre­quenzan­tei­le (Abb. 4-17): Shaw (1974) hat den je­wei­ligen Schalldruck gemes­sen, der vor dem Trom­mel­fell herrscht, wenn Sinustö­ne mit unter­schied­li­chem hori­zon­talem Einfalls­winkel den Kopf treffen. Es zeigt sich, daß der Frequenzbe­reich 2 bis 7 kHz durch das Außenohr ge­genüber dem Freifeld um bis zu 20 dB verstärkt wird, und am deutlich­sten ist die Verstärkung, wenn der Schall den Kopf um 45 Grad von vorn trifft. Die richt­ungsabhän­gige frequenzselektive Ver­stärkung kann mit zur Loka­lisa­tion von Ge­räuschquellen benutzt wer­den.



4.2.1.3 Das Mittelohr


Das Mittelohr besteht aus der sog. Paukenhöhle, den darin befindlichen Gehörknö­chel­chen und der Eustachischen Röhre. Die Pauken­höhle ist eine mit Luft gefüllte kleine Kammer zwischen Trommelfell und ova­lem Fenster (dem Ein­gang zur Cochlea). In der Kammer be­findet sich die Gehörknöchelkette mit Ham­mer (mal­leus), Amboß (incus) und Steigbügel (sta­pes) sowie die zugehörigen Muskeln.

Abb. 4-18
                              
                                    Abb. 4-18: Schematische Darstel­lung des Mittel­ohr
s.


Das Mittelohr verbindet die Schallwel­len der Luft mit den im Innenohr liegenden Rezeptoren; seine Hauptauf­gabe besteht in der Druckan­passung zwi­schen den Medien Luft und Gewebsflüssigkeit. Wenn Schallwellen auf Flüs­sigkeit treffen, werden sie vor allem reflek­tiert - nur ein Tau­send­stel der in Luft über­trage­nen Ener­gie wird im Was­ser wei­tergelei­tet. Wenn die in der Flüs­sigkeit des Innen­ohres lie­gen­den Re­zep­toren erregt werden sollen, muß der Druck der Luftschallwellen erhöht werden. Dies geschieht mit Hilfe der He­bel­wir­kung, die die vom Trommelfell zum Schwingen gebrachten Gehörknöchelchen auf das ovale Fenster aus­üben: Durch die Flächenver­hältnisse zwischen Trommel­fell und ovalem Fenster und durch die Art der muskulären Verbindungen zwischen den Gehörknöchel­chen wird eine Konzen­tration des Drucks um den Faktor 80 erreicht.

Das Mittelohr kann die Druckanpassung nur dann befriedigend leisten, wenn der Luftdruck auf beiden Seiten des Trommelfells vergleichbar ist, und dies wird durch die Eusta­chische Röhre bewirkt, die mit dem Mund verbunden (aber gewöhn­lich verschlos­sen) ist. Bei äußeren Luftdruckveränderungen (z.B. im Flug­zeug) hören wir zunächst undeutlicher, weil die Druckanpassung zwischen Außen- und Mittelohr nicht optimal ist, bis wir den Mund weit öffnen, damit die Eustachische Röhre frei wird.

Das Mittelohr hat noch eine weitere Funktion, die unter dem Stichwort Mittelohr-Reflex bekannt ist: Wird die Gehörknö­chelkette durch sehr hohen Schalldruck in Vibrationen versetzt, kontrahieren der Musculus tympani (Trommelfellspanner) und der Musculus stapedi­us reflektorisch und behindern somit allzu starke Ausschläge der Knöchelchen. Dieser Reflex setzt bei Pegeln von etwa 70 dB ein und ist bei Pegeln über 90 dB am wirksamsten. Hier dämpft er die übertragene Schallintensität von Frequenzen unterhalb 2 kHz um 10 bis 15 dB. Allerdings hat er eine Latenz- und Ankling­zeit von zusammen fast 200 Milli­sekunden (bei Maximalbelastung), so daß er kaum als wirksamer Schutz gegen intensive Knalle fungieren kann, sondern eher zur vorübergehende Anpassung an hohe Pegel. Allerdings sind diese Mus­keln spätestens nach einer Sekunde nur noch zu 30 Prozent wirksam. Der Mittelohr-Reflex wird übrigens auch aktiviert, wenn wir selbst laut sprechen oder singen; auf diese Weise wird der eigenen Vertäubung entgegengewirkt und die Aufnahme relativ leiser Information auch dann verbessert, wenn wir selbst laut sind.



4.2.1.4 Das Innenohr


Das Innenohr besteht vor allem aus der Cochlea (Schnecke), einem 35 mm langen, zweiein­halbmal schneckenförmig gewundenen knöcher­nen Gebilde, in die das Cortische Organ einge­bettet ist. Hier findet die Umwand­lung von Druck­schwankun­gen der Flüs­sigkeit (Lymphe) in neura­le Signale statt. Daneben gehört noch das Gleichgewichtsorgan mit seinen Bogen­gängen zum Innenohr.

Abb. 4-19
Abb. 4-19: Schematische Darstellung von Mittel- und Innenohr. Die Pfeile deuten Druckwellen in Luft (links) und Flüssigkeit (rechts) an.


In Abb. 4-19 sind einige Teile des Mittel- und Innen­ohrs schematisch darge­stellt. Dabei geben Pfeile die Rich­tung der Druckwellen in Luft (vor dem Trommelfell) und in der Flüssigkeit der Schnecke dar. Die Mem­bran des ova­len Fen­sters überträgt den Druck auf die Lymphe. Der Druck wan­dert vom ovalen Fen­ster bis zur Spitze der Schnecke (Helico­tre­ma) und dann wieder zurück zum runden Fen­ster - eine Membran, die die Ver­bindung zum luftgefüll­ten Mit­telohr wieder herstellt. Beim Wandern des Drucks vom ovalen Fenster zum Helico­trema wird die Basilarmembran ver­bogen; auf die­ser befinden sich die eigentli­chen Rezep­to­ren, die Haarzel­len (Zilien) in einer wulstförmi­gen Verdickung, dem Cortischen Organ.


Die insgesamt etwa 15500 Haarzellen der Cochlea sind nicht selbst schallemp­find­lich, sondern geben elektrische Impul­se ab, wenn die Haarspitzen gegenüber dem ei­gent­lichen Haarzellkörper mecha­nisch ver­bogen werden. Diese mechani­sche Reizung wird durch die Druckschwankungen in der Scala tympani er­reicht. Die Nerven­fasern treten an der Seite der Cochlea aus und werden zum Ner­vus Acusticus gesammelt. Wie wir dem rechten Teil der Abbildung 4-20 entnehmen können, gibt es ca. dreimal so viele (12000) äußere Haar­zellen wie innere (3500), ande­rer­seits sind die ein­zelnen inne­ren Haarzel­len jeweils mit mehre­ren Nervenfasern ver­bunden, wäh­rend mehrere äußere Haarzellen sich jeweils eine Nerven­faser teilen. Etwa 90 Prozent der Ner­venfa­sern in der Cochlea (etwa 35000) haben Verbindung mit den inneren Haarzellen, der Rest zu den äuße­ren. Die Erregung einer inneren Haar­zelle wird auf verschiedenen Bahnen parallel auf die zentrale Hörbahn und in verschiedene Teile des Gehirns geleitet, wo sie mehrere Funk­tio­nen gleichzeitig ausüben kann.

Abb. 4-20
               Abb. 4-20: Schnitt durch eine Windung der Cochlea.


4.2.2 Zur Physik und Phy­siologie der Basilarmem­bran

Abb. 4-21

Abb. 4-21: Schematische Darstellung einer Wander­welle. A: zwei Wel­lenbilder zu ver­schiede­nen Zeitpunkten mit Hüll­kurve. B: räumli­che Dar­stel­lung einer Wanderwelle.

Animierte Darstellung einer Wanderwelle.


Einen Eindruck von der Druck­welle auf der Basi­lar­membran ver­mit­telt Abb. 4-21. Sie zeigt oben (A) zwei Zu­stän­de der­selben Welle (durch­gezo­gen und kurz gestri­chelt) sowie als Hüll­kurve (lang gestrichelt) das jewei­lige Aus­len­kungsmaximum. In Teil (B) ist eine Wel­le zu einem fe­sten Zeitpunkt räumlich dar­ge­stellt. Die Auslenkung der Basilar­mem­bran ist im vor­deren Teil kleiner als im hinte­ren, weil die Membran mit zu­neh­mender Nähe zum Helico­trema dün­ner und flexib­ler wird. Eine Konse­quenz der ab­neh­men­den Steif­heit ist die tonoto­pe Orga­nisa­tion (räumliche Abbildung) der Aus­lenkungs­maxi­ma für Töne un­ter­schiedlicher Frequenz: Tiefere Töne haben ihr Maximum am Ende der Membran, höhere am Anfang (vgl. Abb. 4-22).

Abb. 4-22

Abb. 4-22: Auslenkungsmaxima der Basilar­membran bei Anre­gung durch unterschiedliche Frequenzen.


Die Feststel­lung unter­schiedlicher Orte der maxima­len Auslen­kung der Basilar­mem­bran für unterschiedliche Tonhöhen hat den Anstoß für die sog. Ortstheorie der Fre­quenzun-terschei­dung gege­ben: Danach wird jeder Ort auf der Basilarmembran von einer be­stimmten Frequenz maximal erregt, und die neu­ralen Si­gnale von den inneren Haar­zellen behalten die Orts-Information. Diese Theo­rie stammt von G. v. Békésy, der dafür mit einem No­bel­preis ausgezeichnet wurde. Problematisch an dieser Er­klärung ist aller­dings, daß die Orts­-Informa­tion mit zunehmender Stär­ke des aku­stischen Signals immer schwächer wird, weil die Erre­gungs­breite auf der Basilar­membran mit zu­neh­mendem Pegel steigt - den­noch ändert sich die Unterscheidungsfä­higkeit für Fre­quenzen nicht mit deren Laut­stärke.

Die Auslenkung der Basi­larmem­bran erzeugt an den Haar­zel­len eine Depo­lari­sie­rung, jedoch kann die einzel­ne Faser nur bis zu Frequen­zen von 400 - 800 Hz dem Schall direkt fol­gen. Bei höheren Frequenzen wird das Salvenprinzip reali­siert: meh­rere Fasern wechseln sich beim "Feuern" ab, so daß die Ge­samtentla­dungsrate der beteiligten Fasern der Reizfre­quenz ent­spricht (Abb. 4-23).

Abb. 4-23

Abb. 4-23: Schematische Darstellung des Salven­prin­zips: Die Summen­aktivität der Fasern kann hohen Frequenzen folgen.


Diese Entdeckung hat zur Entwick­lung der sog. Peri­odentheorie der Frequenzunterscheidung geführt: da­nach korreliert das Gesamtdepolarisations­muster von Faserbündeln des Nervus acus­ticus zu­mindest in der Nähe der Coch­lea mit dem Frequenz­mu­ster des hereinkommenden Schalls, weil Einzel­fasern zu Gruppen zu­sammengefaßt sind und so synchronisiert feuern, daß das Ge­samt­muster der Ner­venakti­vität auch bei höheren Fre­quenzen noch den Schallschwin­gungen folgen kann.

Nicht alle Fasern des Ner­vus Acusticus reagieren auf alle Schallfre­quenzen, sondern jede Faser hat einen relativ engen Bereich sog. Best­fre­quen­zen: Bei niedrigen Inten­sitäten reagieren sie nur auf Töne einer bestimm­ten Frequenz. Bei höheren In­tensitä­ten wird dieser Fre­quenz­bereich vor allem zu den niedri­gen Frequenzen hin breiter. Die Nervenfa­ser in Abb. 4-24 hat ihre Bestfre­quenz bei etwa 2000 Hz, jedoch rea­giert sie fre­quenzse­lektiv nur bei sehr nied­rigen Schallpegeln; bei höheren Pegeln reagiert sie auch im Nachbar­bereich ihrer Best­fre­quenz. Anders ausge­drückt: Die Intensität des Schalls wird (auch) da­durch neural codiert, daß sich die Anzahl der erregten Nervenfasern erhöht. Diese Kor­rela­tion zwi­schen dem Schall­pegel und der Zahl der erreg­ten Fasern gilt jedoch nur eingeschränkt: Etwa 85 Pro­zent der Nervenfasern haben sehr geringe Reaktionsschwellen, reagieren aber nur in einem Pegelbereich zwischen 0 und 40 dB. Die restlichen 15 Pro­zent haben höhere Ansprechschwellen und zei­gen erst bei höheren Schall­pegeln eine Sättigung. Der Gesamt­bereich von etwa 130 dB, in dem unser Gehör gut Töne unter­schei­den kann, wird also durch diese beiden Prinzi­pien allein nicht erklärt. Ver­mutlich sind am Gesamt­pro­zeß noch Hem­mungsmechanis­men betei­ligt, auf die wir hier nicht einge­hen kön­nen.

Abb. 4-24

Abb. 4-24: Schema eines Reaktionsfeldes für eine einzelne auditive Nervenfaser.



4.2.3 Der Verlauf der Hörbahn


Das zentrale Hörsystem ist sehr redun­dant auf­gebaut: Es gibt mehrere Hirnregionen, in denen dieselbe neuronale Erre­gung ankommt, und gleichzeitig wird diese Erregung in Hir­narea­le projiziert, die mit spezifischen akustischen Aus­wertun­gen, mit der motorischen Steuerung oder mit der allgemei­nen Aktivie­rung des Körpers zu tun haben.


Noch stärker als im visuel­len Sy­stem zeigt sich, daß Infor­mationen von beiden Ohren auf frühen Stationen der Hörbahn gemeinsam verarbeitet werden. Außerdem muß die Information um so "komple­xer" (im physi­kali­schen Sinn) sein, je "hö­her" die zu erregenden neura­len Struk­turen liegen. Wäh­rend die pri­mären afferen­ten Neu­rone des Hör­nervs und des ventralen Coch­leariskerns noch durch Sinu­stö­ne erreg­bar sind, werden auf allen ande­ren Hörbahn-Sta­tionen kom­ple­xere Informationen verlangt, z.B. Pe­gel­ände­rungen, Fre­quenz­ände­run­gen, zeitliche und Laut­stärke-Differenzen zwischen rech­tem und lin­kem Ohr etc. Dies weist auf die große Bedeutung sog. Transienten im auditi­ven Be­reich hin: Cortikal werden vor allem auditi­ve Ände­rungs-Informa­tionen bearbei­tet.

Abb. 4-25

Abb. 4-25: Schema der wichtig­sten Stationen der Hör­bahn.


Anders als beim visuel­len System, in dem die Erre­gun­gen der Rezeptoren erst meh­re­re neurale Schichten (z.B. hori­zonta­le, bipola­re und amacrine Zellen) passieren müssen, bevor nichtvisuelle Areale erreicht werden (und z.B. das motorische System reagieren kann), gelan­gen die Erregungen der Haarzellen des auditi­ven Sy­stems schon relativ früh auch zu nicht-auditi­ven Systemem. So ist z.B. das Zerebel­lum (Klein­hirn) - eine Struktur, die vor allem motorische Steuerungsaufgaben hat - direkt mit den dorsa­len Coch­leariskernen verbunden, und ebenso wird das auf­stei­gende Reti­kulär­system (ARAS: ascending reticu­lar activation system), das den Gesamtorganismus aktiviert, auf derselben Ebene durch aku­stische Reize erregt. Spreng & Kei­del (1963) konn­ten zeigen, daß akusti­sche Reize etwa 40 bis 60 Millise­kunden früher als vergleichbare op­tische Reize zu kortikalen Reiz­antworten (Po­tentialschwan­kungen an der Kopfhaut) führen, und Analy­sen der Latenzzei­ten auf un­terschiedlichen Stationen der Hör­bahn machen plausibel , daß die "schnelle" Verbin­dung zwi­schen dem ventralen Nu­cleus Cochlearis und dem kon­trala­teralen Lemnis­cus Late­ralis wie auch zum kon­trala­teralen Colliculus Inferior dafür aus­schlaggebend ist: Diese Bahn ist trotz länge­ren Weges um bis zu 12 msec schneller als die ipsilatera­le Bahn zwischen dem Nucleus Coche­laris und dem Lemnis­cus latera­lis (vgl. Spreng et al. 1984).

Abb. 4-26
Abb. 4-26: Schema der afferen­ten Hörbahn mit ihren Ver­bindungen zum Zerebellum und der Retikulärformation.


Die direkte Verbindung zwischen den dorsalen Coch­learis­kernen und dem Zere­bel­lum (Kleinhirn) wird oft da­für herange­zo­gen, die um etwa 40 msec kürzeren Reak­tions­zeiten auf akustische Signale gegenüber optischen Signalen zu erklären (vgl. Welford 1980). Aller­dings hängen Reak­tionszeiten stark von der Reiz­intensität, deren An­stiegs­steilheit und der Reizdauer ab, und es ist schwierig, die Vergleich­bar­keit der opti­schen und akustischen Reize herzu­stellen, die Voraussetzung für einen Vergleich der Reak­tions­zeitbedingungen wäre.



4.2.4 Die absolute Empfindlichkeit des Gehörs


Die kleinste Schallenergie, die ein Mensch unter günstigsten Bedingungen als Geräusch wahrnehmen kann, beträgt etwa 10-16 Watt/cm2, die größte, die er schmerzfrei ertragen kann, 10-4 W/cm2. Dieser riesige Energiebereich wird aus praktischen Grün­den in einen Schallpegel umgerechnet und in Dezibel ange­geben (s. Kap. 3). Dabei ist die absolute Empfindlichkeit des Gehörs individuell recht unterschiedlich und zudem stark von der Meß­methode abhängig. Als sog. normale Hörschwelle wird derjenige Schallpegel bezeichnet, der sich unter Ruhebe­dingungen in einem reflexions­armen Raum als Mittelwert von Ja- und Nein-Antworten auf die Frage ergibt, ob ein Sinuston gerade eben gehört wird.


Hier eine Demonstration der frequenzabhängigen Empfindlichkeit unseres Gehörs: 7 Frequenzen mit stufenweise abnehmenden Pegeln werden jeweils zweimal hintereinander dargeboten. Bitte zählen Sie bei jeder Frequenz, wie viele Pegelstufen sie erkennen. Bei halbwefs linear arbeitenden Kopfhörern (empfohlen) oder Lautstrpecher zeigt sich, daß die Anzahl hörbarer Pegel bei den verschiedenen Frequenzen sehr unterschiedlich ist.


Eine typische Hörschwel­lenkurve nach Daten von Robinson & Dadson (1956) ist in Abb. 4-27 zusammen mit der Standardabweichung dargestellt. Es handelt sich dabei um Freifeld­messungen an etwa 50 jungen Menschen mit gesunden Ohren. (Bei Freifeldmessungen wird der Schall per Lautsprecher über­tragen; Kopfhörer-Messungen erbringen etwas flachere Kur­ven.) Bemerkenswert ist die hohe Frequenzabhängigkeit des Hörvermögens: Im Be­reich zwischen 500 Hz und 6 kHz ist das Gehör am emp­findlichsten; die maximale Empfindlich­keit liegt bei 3 kHz. In Richtung auf höhere und tiefere Frequenzen nimmt die Empfind­lichkeit deutlich ab. Unterhalb von 20 Hz und oberhalb von 20 kHz können Menschen Schallenergie nicht als Schall wahrnehmen. Da auch die menschliche Sprache ihre Hauptenergie im Fre­quenz­bereich zwischen 500 und 4000 Hz hat, scheinen Hörvermögen und Sprache gut aufeinander abgestimmt.

Abb. 4-27

Abb. 4-27: Hörschwellenkurve im Freifeld (mit Standard­abwei­chun­gen) nach Robinson & Dadson (1956).


Die Standardabweichungen um die Mittelwertskurve schwanken zwischen 4 und 10 dB. Dies weist daraufhin, daß die individuellen Schwellen­werte sehr unterschiedlich sein können; auch unter den Men­schen mit sog. "gesunden Oh­ren" hören manche wesentlich besser, manche wesentlich schlechter als der Durchschnitt. Die Zunahme der Streuungen bei Frequen­zen oberhalb von 4000 Hz weist einerseits auf die Zunahme der interindividuellen Unter­schiede bei höheren Frequenzen hin, andererseits auch auf zunehmende Unsicherheiten der Meßmethode.

Bei Menschen der indu­strialisierten Welt nimmt die Hörempfindlichkeit im Bereich um 3 kHz mit zunehmendem Alter ab. Dies ist keine reine Presbyakusis (Al­tersschwerhörigkeit), die nur durch Alterungs­prozesse zu erklären wäre, denn sie tritt bei sog. Naturvöl­kern kaum auf (Rosen et al. 1962). Ernährung und akustische Umwelt scheinen eine wesentliche Rolle zu spie­len. Beson­ders von Hörverlusten be­troffen sind industrielle Lärm­arbeiter, aber auch junge Menschen, die sich oft lauter Musik aussetzen, können anfangs vorübergehende Hörermüdungen (tempo­rary thres­hold shifts, TTS) zeigen, die später zu dau­erhaften Schäden (perma­nent threshold shifts, PTS) werden.



4.2.5 Methoden der Hörschärfebestimmung


Da die individuelle Hörschärfe sehr von der Methode ihrer Mes­sung abhängt, sollen hier kurz die gebräuchlichsten Verfahren und ihre jeweiligen Vor- und Nachteile erwähnt werden.

Die Standardmethode von Ohrenärzten ist die klassische Audiometrie mit Hilfe eines Audiometers. Hierbei sitzt die Untersuchungsperson in einer kleinen Meßkabine und hört über Kopfhörer 5 bis 10 Sinustöne, die jeweils in ihrem Pegel lang­sam ansteigen und später wieder fallen. Die Unter­suchungs­person hat die Aufgabe, jeweils ein Zeichen zu geben, wenn sie den im Pegel ansteigenden Ton gerade eben hört bzw. wenn sie den im Pegel fallenden Ton gerade eben nicht mehr hört. Als (die im Audiogramm eingetragene) "Schwelle" gilt der Mittelwert zwi­schen diesen beiden Wer­ten. Dieses Ver­fahren hat den Vorteil, schnell, preis­günstig und interna­tional stan­dardi­siert zu sein. Nach­tei­lig ist allerdings, daß nur weni­ge Frequenzen verwendet werden können und die so gemessene Schwelle stark von der Auf­merksam­keit und der Motiva­tion der Untersuchungsperson ab­hängt. So ist z.B. das Kriterium für die Entschei­dung, wann ein Ton im vaskulären Rauschen ent­deckt wird bzw. wann das Rauschen über­wiegt, nicht kontrol­lier­bar.


Etwas günstiger erscheint die sog. Békésy-Audiometrie (benannt nach dem bereits erwähnten Georg v.Békésy), bei der die Frequenz des Testtons kontinuierlich und automatisch von sehr tief bis sehr hoch variiert wird. Die Untersuchungsperson drückt einen Knopf, sobald sie den Ton hört - dies führt zu einer automatischen Verringerung des Pegels, bis die Untersu­chungsperson den Knopf wieder losläßt; dann steigt der Pegel wieder an. Diese Inter­aktion zwischen Mensch und Maschine er­bringt viele Meßwerte über den ganzen Frequenzbe­reich und ist für die meisten Untersuchungspersonen interessant. Folglich können auch Hörprobleme in sehr engen Frequenzbereichen ent­deckt und größere Hörempfindlichkeiten nachgewiesen werden als beim klassischen Verfahren. Nachteilig sind vor allem die Gerä­teko­sten, und auch hier kann das Antwortkriterium der Unter­suchungs­person für das Entdecken des Tons nicht kontrolliert werden.

Aufwendiger und oft ermüdend, aber noch exakter ist die Signal-Entdeckungs­methode, die schon in Kap. 2 beschrieben wurde. Hier sei nur daran erinnert, daß sie es gestattet, die tatsächliche Empfindlichkeit einer Person von ihrem Antwortkriterium und der Rateten­denz zu tren­nen.


4.2.6 Lautstärke und Lautheit


Wir bezeichnen das psychologische Attribut der (physikalischen) Lautstärke als Lautheit. Dies ist ein sehr abstraktes Attribut, das die im Schall enthaltene örtliche und inhaltliche Informa­tion ignoriert. Mit zunehmendem Schallpegel eines Geräusches steigt die Laut­heit an, jedoch nicht linear, sondern als Exponentialfunktion der physikalischen Intensität. Dies hat Stevens (z.B. 1956) für Sinustöne gezeigt, indem er die Methode der Größenschätzung benutzte: Eine Untersuchungsperson hört einen Standardton (z.B. 1000 Hz mit 40 dB Schallpegel) und soll ihn mit demselben Ton bei unterschiedlichen Schallpegeln ver­glei­chen. Für die Lautheit des Standardtons wird eine willkürliche numerische Größe vereinbart - z.B. 1 oder 10, und die Unter­suchungsperson soll die wahrgenommene Lautheit des Test­tons mit einer Zahl be­schreiben. Unter diesen Bedingungen ist die Laut­heit L eine Exponentialfunktion des Schall­pegels P, multipli­ziert mit einer Konstanten k: L = k*P0,6. Da der Expo­nent klei­ner als 1 ist, steigt die Lautheit bei zunehmender Laut­stärke proportional weniger an als die Lautstärke: Die Laut­heit ver­dop­pelt sich jeweils, wenn der Schallpegel um 10 dB angeho­ben wird. Für die Beschreibung der Lautheit haben Stevens & Davis (1938) die Einheit sone vorgeschlagen (1 sone ent­spricht der Lautheit eines 1000-Hz-Tons bei 40 dB Schallpegel). Da jedoch die Lautheit natürlicher Geräusche nicht nur vom Schall­pegel abhängt, hat sich diese Einheit in der Praxis nicht durchgesetzt.

Die Unterschiedsschwelle für Geräusche unterschiedlicher Lautstärke hängt von einer Vielzahl von Faktoren ab, vor allem von der Frequenzzusammensetzung, Dauer, Anstiegs­steilheit und dem Pegelbereich des Geräuschs. Für Sinustöne oberhalb von 40 dB SPL kann eine Unterschiedsschwelle von etwa 1 dB angenommen werden; bei geringeren Lautstärken steigt sie auf 4-5 dB (Zwicker 1982).


Die unterschiedliche Empfindlichkeit des mensch­lichen Gehörs für Töne unter­schiedli­cher Frequenz wirkt sich nicht nur im Bereich der Hörschwelle, sondern auch überschwellig aus, wie u.a. Fletcher & Mun­son (1933) gezeigt haben: Die Hörer hatten die Aufgabe, jeweils einen 1000-Hz-Ton mit einem zwei­ten Ton (unter­schiedli­cher Fre­quenz) zu vergleichen und den zweiten Ton so laut ein­zustellen, daß er gleich laut erschien wie der 1000-Hz-Ton. Die in Abb. 4-28 eingetragenen Kurven gleicher Laut­heit (Isophone) werden je­weils mit dem Lautstärkepe­gel (in Phon) bezeichnet, der für den 1000-Hz-Standard­ton gilt. Bemer­kenswert ist, daß diese Kurven mit zunehmen­dem Schall­pegel im unteren Frequenzbe­reich flacher werden: Das Gehör arbeitet demnach bei höheren Pegeln "linea­rer" als bei niedri­gen Pegeln. Beim Lautheitsver­gleich natürli­cher Geräusche spie­len jedoch neben der Frequenz­zusammensetzung noch andere Fakto­ren eine wesentliche Rolle, vor allem die Dauer, Anstiegssteil­heit und der Pegelverlauf der Geräusche.

Abb. 4-28
Abb. 4-28: Kurven gleicher Lautheit (Isophone) nach Fletcher & Mun­son (1933).


4.2.7 Reizdauer und Lautheit


Ähnlich wie im visuellen Be­reich, brauchen auch Schall­ereignis­se eine gewisse Min­destzeit, damit sie angemes­sen wahrge­nommen werden kön­nen. Tritt ein Geräusch gleich wel­cher Art nur für wenige Millise­kunden auf, so kann nur ein "Klick" gehört werden. Zwi­schen Lautheit und Darbietungszeit besteht un­terhalb von 200 msec ein ge­wisser Austausch. Soll z.B. ein Geräusch von 10 msec Dau­er gleich laut er­scheinen wie ein Dauergeräusch, so muß das 10-msec-Geräusch physikalisch etwa 10 dB lauter sein als das Dauergeräusch. Die Beziehung zwischen Dauer und Laut­heitsverlust zeigt Abb. 4-29 für Sinu­stöne von 1000 Hz (nach Gu­lick 1971).

Abb. 4-29
       Abb. 4-29: Beziehung zwischen Laut­heits­minderung und Reizdauer nach Gulick (1971).


Eine Demonstration des Zusammen­hangs zwi­schen Reizdauer und Laut­heit findet sich auf der Philips-CD 1126-061 (Audi­tory De­mon­strations), Demo 8, Spur 21. Dort werden kurze Pakete Breitbandrau­schens mit abneh­mender Dauer bei unterschiedli­chen konstan­ten Pegeln angeboten. Wir können hören, dass die Lautheit mit kürzer werdenden Dau­ern immer schnel­ler abfällt.



4.2.8 Lautheitsadaptation


Wenn wir in einen Raum kom­men, in dem eine leise Klimaanlage läuft, werden wir das Rauschen zunächst bemerken, uns aber nach einigen Minuten daran gewöhnen und das Geräusch nicht mehr bewußt wahrnehmen. Dann hat sich unser Gehör adaptiert. Handelt es sich aber um eine sehr laute Anlage, so wird sie uns immer wieder auffallen; unser Gehör adap­tiert in diesem Fall nicht. Solche Widersprüche haben zahl­reiche empiri­sche Unter­suchungen und Theorie-Diskussionen zum Auftreten der Lautheitsadaptation aus­gelöst. Die meisten Auto­ren betonen dabei, daß sich das Gehör anders als andere Sinnes­organe ver­halte - während sich das Auge auf wech­selnde Lichtverhältnisse einstelle, die Nase auf unterschiedliche Gerüche und die Wärme­rezeptorem auf unterschiedliche Tempera­turen, würde sich das Gehör nur in Aus­nahmefällen adaptieren. Adaptation wird im nicht-auditiven Fall verstanden als Einstellung des sensori­schen Systems auf einen bestimmten Bereich physika­lischer Ener­gie; ist diese Einstellung vollzogen, werden die Umgebungshelligkeit, das Klima und die Zusammen­setzung der Luft jeweils als "Nor­malzustand" erlebt.

Beim Gehör finden offenbar andere Arten von Adapta­tions- bzw. Nicht-Adaptationsprozessen statt: 1.) Wir kennen die zeitweilige Vertäubung, die der Be­such einer Musikkneipe für einige Minuten hinterläßt, 2.) wir kennen die perma­nente Vertäubung, die jahrelanges Arbeiten an lauten Maschinen hin­terläßt, 3.) wir kennen das Nachlassen der (subjektiven) Laut­heit bei leisen Dauergeräuschen, und 4.) wir kennen das Nicht-Nachlassen der Lautheit bei lauten Dauergeräuschen und bei den meisten diskontinuierlichen Geräuschen. Während die ersten beiden Adaptationsprozesse als Nachlassen der absoluten Emp­findlichkeit betrachtet werden können, ist der dritte Prozeß eher ein Nachlassen der relativen Empfindlichkeit, und der vierte kennzeichnet ein Nicht-Nachlassen, das zumindest beim Sehen nicht bekannt ist. Auch dies weist auf die unterschiedli­chen Funktionen von Sehen und Hören hin.


Als einfaches Beispiel für das unter­schiedliche Nachlas­sen der Laut­heit eines kontinuierlichen Tones seien die Ergebnisse von Fishken, Ar­pino, Testa & Scharf (19­77) genannt: Die Unter­su­chungs­personen hörten mit beiden Ohren 100 Sekunden lang einen kon­tinuierlichen Ton von 4000 Hz und sollten mit Hilfe der Methode der Grö­ßen­schätzung die jeweilige Laut­heit nach 20, 40, 70 und 100 sec angeben. Es stellte sich (neben einer großen individu­ellen Streuung) her­aus, daß die Laut­heitsschät­zungen bei hohen Schallpe­geln über die Zeit kon­stant blieben, aber mit abneh­men­der Lautstärke immer stär­ker abnahmen (vgl. Abb. 4-30). Dieses Ergebnis wurde mehr­fach bestätigt (z.B. durch Canè­vet, Ger­main, Mar­chioni & Scharf 1981; Botte, Canèvet & Scharf 1982), ohne daß die genaue Funktion der beteiligten Pro­zesse auf­geklärt werden konn­te.

Abb. 4-30

Abb. 4-30: Unterschiedliche Lautheits­adaptation bei einem kontinuierli­chen 4000-Hz-Ton mit unterschiedlichem Schallpegel nach Fishken et al. (1977).



4.2.9 Tonhöhenwahrnehmung


Die physikalische Basis für die Wahrnehmung unterschied­lich hoher Töne ist zwar de­ren jeweilige Grundfrequenz, jedoch ist die Beziehung zwi­schen Frequenz und wahrgenom­mener Tonhöhe nicht linear. Stevens & Volkman (1940) ha­ben dies mit Hilfe der Frak­tionie­rungs­methode unter­sucht: Sie boten einen 1000-Hz-Sinuston mit einem Pegel von 40 dB als Standard an und ließen die Tonhöhe eines zweiten Tons so einstellen, daß dieser ein be­stimmtes Tonhöhenverhältnis zum Standardton hatte - bei­spielsweise halb so hoch oder doppelt so hoch. Die so ent­stan­dene psychologische Tonhöhen-Einheit nann­ten sie mel.

Eintausend mel wurde willkür­lich für die 1000-Hz-Fre­quenz festgelegt, und ein halb so hoher Ton hat folglich 500 mel; ein doppelt so hoher Ton hat 2000 mel. Die Mittel­werte dieser Unter­suchung sind in Abb. 4-31 dargestellt. Wir sehen, daß die Ton­höhe unterhalb von 1000 Hz schneller als die Fre­quenz steigt, oberhalb langsa­mer.

Abb. 4-31

Abb. 4-31: Abhängigkeit der wahr­genommenen Tonhöhe von der Grund­frequenz nach Stevens & Volk­man (1940).


Die Unterschiedsschwelle für Tonhöhen ist vom Fre­quenzbe­reich ab­hängig: Un­terhalb von 1000 Hz reichen etwa 3 Hz Diffe­renz aus, um zwei Töne als unter­schiedlich hoch wahrzunehmen. Ober­halb von 1000 Hz kann die Unterschiedsschwel­le als "We­ber-Konstante" angesehen werden: df/f ist etwa 0,004. Das be­deutet, daß bei einer Frequenz um 10 kHz etwa 40 Hz Un­terschied bestehen müssen, damit zwei Töne als unter­schiedlich hoch wahr­genom­men werden können. Allerdings haben die meisten Men­schen Schwierigkeiten, Töne oberhalb von 4000 Hz überhaupt differen­ziert als Töne wahrzunehmen.


4.2.10 Schwebungen und Kombinations­töne


Wenn Musiker ihre Instrumente stimmen, erken­nen sie einen Ton­höhenunterschied zwischen zwei gleichzeitig erklingen­den Tönen meist an einer Schwebung, d.h. einem wieder­holten An­stieg und Ab­fallen der Lautstärke. Dieses Phäno­men hat eine einfache physi­kali­sche Ursache: sind zwei etwa gleich laute Töne in ihrer Fre­quenz verschie­den, so stimmt ihre Phasenlage manchmal über­ein (dann addie­ren sich die mo­mentanen Schalldrucke), manchmal nicht (dann können sich die jeweiligen Schall­drucke gegen­seitig aus­lö­schen). Diese Schalldruck-Inter­aktion bewirkt einen komplexen Ton, der nicht als eige­ner Ton mit einer spe­ziellen Tonhöhe wahrge­nommen wird, sondern als Intensi­täts­schwebung der betei­ligten Teiltöne. Diese Intensi­tät variiert mit der Differenzfrequenz der betei­ligten Ton­frequen­zen. Sind z.B. die bei­den Töne um 2 Hz unterschiedlich, wird die Intensi­tät des Kom­plex­tones mit 2 Hz vari­ieren (vgl. Abb. 4-32).

Abb. 4-32

Abb. 4-32: Sind zwei Töne in ihrer Frequenz leicht ver­schieden (unten), so entsteht ein kom­plexer Ton, dessen Am­plitude mit der Differenz­fre­quenz variiert (oben).

Beispiel für eine Schwebung.

Mit zunehmendem Frequenzabstand der beteilig­ten (etwa gleich lauten) Teiltöne werden die Schwebun­gen geringer, und der Klang wird rauher, bis sog. Kombi­nationstöne entstehen, die als Sum­men- oder Diffe­renztöne gehört werden: Im Fall der Sum­mentö­ne entspricht die Grundfrequenz des Kombina­tionstons der Summe der Frequenzen der beteiligten Teiltöne; im Fall der Differenztöne entspricht sie ihrer Differenz. Für diese Phäno­me­ne werden nicht physikalische Ursachen, sondern Verzerrungen in der Coch­lea verantwortlich gemacht. Allerdings ist die wahrgenommene Lautstärke der Kombina­tionstöne wesent­lich geringer als die der Primärtöne.

Zurück zum Inhaltsverzeichnis   Weiter zu Kap. 4.3.