Psychoakustik - Psychoacoustics

Psycho ist der Zweig der Psychophysik , die wissenschaftliche Studie der Einbeziehung Klangwahrnehmung und audiology -wie Menschen verschiedene Töne wahrnehmen. Genauer gesagt ist es der Zweig der Wissenschaft, der die psychologischen Reaktionen untersucht, die mit Geräuschen verbunden sind (einschließlich Lärm , Sprache und Musik ). Psychoakustik ist ein interdisziplinäres Gebiet mit vielen Bereichen, darunter Psychologie, Akustik, Elektrotechnik, Physik, Biologie, Physiologie und Informatik.

Hintergrund

Hören ist kein rein mechanisches Phänomen der Wellenausbreitung , sondern auch ein Sinnes- und Wahrnehmungsereignis; in anderen Worten, wenn eine Person hört etwas, dass etwas am ankommt Ohr als eine mechanische Schallwelle durch die Luft reisen, aber im Ohr ist es in neurale verwandelt Aktionspotentiale . Die äußeren Haarzellen (OHC) einer Säugetier- Cochlea führen zu einer erhöhten Empfindlichkeit und einer besseren Frequenzauflösung der mechanischen Reaktion der Cochlea-Trennwand. Diese Nervenimpulse wandern dann zum Gehirn, wo sie wahrgenommen werden. Daher ist es bei vielen Problemen in der Akustik, beispielsweise bei der Audioverarbeitung , von Vorteil, nicht nur die Mechanik der Umgebung zu berücksichtigen, sondern auch die Tatsache, dass sowohl das Ohr als auch das Gehirn am Hörerlebnis einer Person beteiligt sind.

Das Innenohr , zum Beispiel, hat erhebliche Signalverarbeitung Ton bei der Umwandlung von Wellenformen in neuronale Reiz, so gewisse Unterschiede zwischen Wellenformen können nicht wahrnehmbar sein. Datenkomprimierungstechniken wie MP3 machen sich diese Tatsache zunutze. Darüber hinaus reagiert das Ohr nichtlinear auf Geräusche unterschiedlicher Intensitätsstufen; diese nichtlineare Reaktion wird als Loudness bezeichnet . Telefonnetze und Audio- Rauschunterdrückungssysteme machen sich diese Tatsache zunutze, indem sie Datensamples vor der Übertragung nichtlinear komprimieren und dann für die Wiedergabe expandieren. Ein weiterer Effekt der nichtlinearen Reaktion des Ohrs besteht darin, dass Klänge mit ähnlicher Frequenz Phantom-Beat-Noten oder Intermodulationsverzerrungsprodukte erzeugen .

Der Begriff "Psychoakustik" taucht auch in Diskussionen über die kognitive Psychologie und die Auswirkungen auf, die persönliche Erwartungen, Vorurteile und Veranlagungen auf die relative Bewertung und den Vergleich von Klangästhetik und -schärfe durch die Hörer und auf die unterschiedlichen Feststellungen der Hörer über die relativen Qualitäten verschiedener Musicals haben können Instrumente und Interpreten. Der Ausdruck, dass man "hört, was man hören will (oder erwartet)" kann in solchen Diskussionen vorkommen.

Grenzen der Wahrnehmung

Eine Kontur gleicher Lautstärke . Beachten Sie die Spitzenempfindlichkeit um 2–4 kHz in der Mitte des Sprachfrequenzbands .

Das menschliche Ohr kann nominell Töne im Bereich von 20 Hz (0,02 kHz) bis 20.000 Hz (20 kHz) hören. Die Obergrenze nimmt tendenziell mit dem Alter ab; die meisten Erwachsenen können über 16 kHz nicht hören. Die niedrigste Frequenz, die als Musikton identifiziert wurde, beträgt unter idealen Laborbedingungen 12 Hz. Töne zwischen 4 und 16 Hz sind über den Tastsinn des Körpers wahrnehmbar .

Die Frequenzauflösung des Ohrs beträgt etwa 3,6 Hz innerhalb der Oktave von 1000–2000 Hz. Das heißt, Tonhöhenänderungen von mehr als 3,6 Hz können in einer klinischen Umgebung wahrgenommen werden. Aber auch kleinere Tonhöhenunterschiede können auf andere Weise wahrgenommen werden. Zum Beispiel ist die Interferenz zweier Tonhöhen oft als sich wiederholende Variation der Lautstärke des Tons zu hören. Diese Amplitudenmodulation erfolgt mit einer Frequenz gleich der Differenz der Frequenzen der beiden Töne , und ist bekannt als schlagen .

Die in der westlichen Musiknotation verwendete Halbtonskala ist keine lineare Frequenzskala, sondern logarithmisch . Andere Skalen wurden direkt aus Experimenten zur menschlichen Hörwahrnehmung abgeleitet, wie die Mel-Skala und die Bark-Skala (diese werden zum Studium der Wahrnehmung verwendet, aber normalerweise nicht in der Musikkomposition) und diese haben eine ungefähr logarithmische Frequenz am Hochfrequenzende , aber im niederfrequenten Bereich nahezu linear.

Der Intensitätsbereich der hörbaren Töne ist enorm. Menschliche Trommelfelle reagieren empfindlich auf Schalldruckschwankungen und können Druckänderungen von wenigen Mikropascal (μPa) bis über 100 kPa erkennen . Aus diesem Grund wird der Schalldruckpegel auch logarithmisch gemessen, wobei sich alle Drücke auf 20 μPa (oder 1,97385 × 10 –10 atm ) beziehen . Die untere Hörgrenze ist daher mit 0 dB definiert , aber die obere Grenze ist nicht so klar definiert. Die Obergrenze ist eher eine Frage der Grenze, an der das Ohr physisch geschädigt wird oder lärmbedingte Schwerhörigkeit verursachen kann .

Eine genauere Untersuchung der unteren Hörgrenzen stellt fest, dass die minimale Schwelle, bei der ein Ton gehört werden kann, frequenzabhängig ist. Durch Messen dieser minimalen Intensität zum Testen von Tönen verschiedener Frequenzen kann eine frequenzabhängige absolute Hörschwelle (ATH)-Kurve abgeleitet werden. Typischerweise zeigt das Ohr einen Empfindlichkeitspeak (dh seinen niedrigsten ATH) zwischen 1–5 kHz, obwohl sich die Schwelle mit dem Alter ändert, wobei ältere Ohren eine verringerte Empfindlichkeit oberhalb von 2 kHz aufweisen.

Die ATH ist die niedrigste der gleichlautenden Konturen . Konturen gleicher Lautstärke geben den Schalldruckpegel (dB SPL) über den Bereich der hörbaren Frequenzen an, der als gleich laut empfunden wird. Konturen gleicher Lautstärke wurden erstmals 1933 von Fletcher und Munson in den Bell Labs mit reinen Tönen gemessen, die über Kopfhörer reproduziert wurden, und die von ihnen gesammelten Daten werden Fletcher-Munson-Kurven genannt . Da die subjektive Lautstärke schwer zu messen war, wurden die Fletcher-Munson-Kurven über viele Probanden gemittelt.

Robinson und Dadson verfeinerten das Verfahren 1956, um einen neuen Satz von Kurven gleicher Lautstärke für eine frontale Schallquelle zu erhalten, die in einem reflexionsarmen Raum gemessen wurde . Die Robinson-Dadson-Kurven wurden 1986 als ISO 226 standardisiert . 2003 wurde ISO 226 als Kontur gleicher Lautstärke mit Daten aus 12 internationalen Studien überarbeitet .

Schalllokalisierung

Tonlokalisierung ist der Prozess , den Ort einer Schallquelle zu bestimmen. Das Gehirn nutzt subtile Unterschiede in Lautstärke, Ton und Timing zwischen den beiden Ohren, um uns die Lokalisierung von Schallquellen zu ermöglichen. Die Lokalisierung kann durch die dreidimensionale Position beschrieben werden: den Azimut- oder Horizontalwinkel, den Zenit- oder Vertikalwinkel und die Entfernung (für statische Geräusche) oder Geschwindigkeit (für bewegte Geräusche). Menschen, wie die meisten vierbeinigen Tiere , sind in der Lage, Richtungen in horizontaler Richtung zu erkennen, aber weniger in vertikaler Richtung, da die Ohren symmetrisch platziert sind. Einige Eulenarten haben asymmetrische Ohren und können Geräusche in allen drei Ebenen wahrnehmen, eine Anpassung an die Jagd auf kleine Säugetiere im Dunkeln.

Maskierungseffekte

Audiomaskierungsdiagramm

Angenommen, ein Zuhörer kann ein gegebenes akustisches Signal unter stummen Bedingungen hören. Wenn ein Signal abgespielt wird, während ein anderer Ton abgespielt wird (ein Masker), muss das Signal stärker sein, damit der Hörer es hören kann. Der Maskierer muss nicht über die Frequenzkomponenten des Originalsignals verfügen, damit eine Maskierung stattfindet. Ein maskiertes Signal ist zu hören, obwohl es schwächer als der Masker ist. Maskierung tritt auf, wenn ein Signal und ein Masker zusammen gespielt werden – zum Beispiel wenn eine Person flüstert, während eine andere schreit – und der Hörer das schwächere Signal nicht hört, da es von dem lauteren Masker maskiert wurde. Ein Signal kann auch maskiert werden, bevor ein Maskierer startet oder nachdem ein Maskierer stoppt. Beispielsweise kann ein einzelnes plötzliches lautes Klatschen Geräusche, die unmittelbar vorausgehen oder folgen, unhörbar machen. Die Wirkung der Rückwärtsmaskierung ist schwächer als die der Vorwärtsmaskierung. Der Maskierungseffekt wurde in der psychoakustischen Forschung umfassend untersucht. Man kann den Pegel des Maskers ändern und den Schwellenwert messen und dann ein Diagramm einer psychophysischen Abstimmungskurve erstellen, die ähnliche Merkmale zeigt. Maskierungseffekte werden auch bei verlustbehafteter Audiocodierung wie MP3 verwendet .

Fehlende Fundamentaldaten

Wenn eine harmonische Reihe von Frequenzen in der Beziehung 2 f , 3 f , 4 f , 5 f usw. präsentiert wird (wobei f eine spezifische Frequenz ist), neigen Menschen dazu, wahrzunehmen, dass die Tonhöhe f ist . Ein hörbares Beispiel finden Sie auf YouTube.

Software

Perceptual Audio Coding verwendet psychoakustische Algorithmen.

Das psychoakustische Modell sorgt für eine qualitativ hochwertige verlustbehaftete Signalkompression, indem es beschreibt, welche Teile eines bestimmten digitalen Audiosignals sicher entfernt (oder aggressiv komprimiert) werden können – d. h. ohne signifikante Verluste in der (bewusst) wahrgenommenen Qualität des Klangs.

Es kann erklären, wie ein scharfes Händeklatschen in einer ruhigen Bibliothek schmerzhaft laut erscheinen mag, aber kaum wahrnehmbar ist, nachdem ein Auto auf einer belebten Stadtstraße nach hinten losgegangen ist. Dies bietet einen großen Vorteil für das Gesamtkomprimierungsverhältnis, und die psychoakustische Analyse führt routinemäßig zu komprimierten Musikdateien, die 1/10 bis 1/12 der Größe von hochwertigen Mastern haben, jedoch mit einem erkennbar geringeren proportionalen Qualitätsverlust. Diese Komprimierung ist ein Merkmal fast aller modernen verlustbehafteten Audiokomprimierungsformate. Einige dieser Formate umfassen Dolby Digital (AC-3), MP3 , Opus , Ogg Vorbis , AAC , WMA , MPEG-1 Layer II (wird in mehreren Ländern für die digitale Audioübertragung verwendet ) und ATRAC , die in MiniDisc und einigen Walkman verwendete Komprimierung Modelle.

Die Psychoakustik basiert stark auf der menschlichen Anatomie , insbesondere auf den zuvor beschriebenen Einschränkungen des Ohrs bei der Wahrnehmung von Schall. Zusammenfassend sind diese Einschränkungen:

Ein Kompressionsalgorithmus kann Geräuschen außerhalb des menschlichen Hörbereichs eine niedrigere Priorität zuweisen. Durch vorsichtiges Verschieben von Bits weg von den unwichtigen Komponenten hin zu den wichtigen stellt der Algorithmus sicher, dass die Geräusche, die ein Hörer am wahrscheinlichsten wahrnimmt, am genauesten wiedergegeben werden.

Musik

Die Psychoakustik umfasst Themen und Studien, die für die Musikpsychologie und Musiktherapie relevant sind . Theoretiker wie Benjamin Boretz halten manche Ergebnisse der Psychoakustik nur im musikalischen Kontext für sinnvoll.

Irv Teibel ‚s Environments Serie LPs (1969-1979) sind ein frühes Beispiel für kommerziell verfügbaren Sounds freigegeben ausdrücklich für psychologische Fähigkeiten zu verbessern.

Angewandte Psychoakustik

Psychoakustisches Modell

Die Psychoakustik verbindet seit langem eine Symbiose mit der Informatik . Die Internetpioniere JCR Licklider und Bob Taylor absolvierten beide ihre Diplomarbeit in Psychoakustik, während BBN Technologies sich ursprünglich auf Akustikfragen spezialisierte, bevor es mit dem Bau des ersten paketvermittelten Netzwerks begann .

Licklider schrieb ein Papier mit dem Titel "A Duplex Theory of Pitch Perception".

Psychoakustik findet in vielen Bereichen der Softwareentwicklung Anwendung, wo Entwickler bewährte und experimentelle mathematische Muster in der digitalen Signalverarbeitung abbilden. Viele Audiokompressionscodecs wie MP3 und Opus verwenden ein psychoakustisches Modell, um die Kompressionsraten zu erhöhen. Der Erfolg herkömmlicher Audiosysteme für die Musikwiedergabe in Theatern und Heimen kann der Psychoakustik zugeschrieben werden und psychoakustische Überlegungen führten zu neuartigen Audiosystemen, wie der psychoakustischen Schallfeldsynthese . Darüber hinaus haben Wissenschaftler mit begrenztem Erfolg experimentiert, um neue akustische Waffen zu entwickeln, die Frequenzen aussenden, die beeinträchtigen, schädigen oder töten können. Psychoakustik wird auch bei der Sonifikation eingesetzt , um mehrere unabhängige Datendimensionen hörbar und leicht interpretierbar zu machen. Dies ermöglicht eine auditive Führung ohne räumliches Audio und in Sonifikations- Computerspielen und anderen Anwendungen wie Drohnenfliegen und bildgeführter Chirurgie . Es wird auch heute in der Musik angewendet, wo Musiker und Künstler weiterhin neue Hörerlebnisse schaffen, indem sie unerwünschte Frequenzen von Instrumenten maskieren, wodurch andere Frequenzen verstärkt werden. Eine weitere Anwendung liegt in der Konstruktion kleiner oder minderwertiger Lautsprecher, die das Phänomen fehlender Grundtöne nutzen können , um den Effekt von Basstönen bei niedrigeren Frequenzen zu erzielen, als die Lautsprecher physikalisch erzeugen können (siehe Referenzen).

Automobilhersteller konstruieren ihre Motoren und sogar Türen so, dass sie einen bestimmten Klang haben.

Siehe auch

Verwandte Felder

Psychoakustische Themen

Verweise

Anmerkungen

Quellen

Externe Links