Subband-Codierung - Sub-band coding

Subband-Codierungs- und Decodierungssignalflussdiagramm

In Signalverarbeitung , Subbandcodierung ( SBC ) ist jede Form der Transformationscodierung daß bricht ein Signal in einer Anzahl von verschiedenen Frequenzbändern , in der Regel durch Verwendung eines schnellen Fourier - Transformation , und unabhängig jeden kodiert. Diese Zerlegung ist häufig der erste Schritt bei der Datenkomprimierung für Audio- und Videosignale.

SBC ist die Kerntechnik, die in vielen gängigen verlustbehafteten Audiokomprimierungsalgorithmen einschließlich MP3 verwendet wird .

Audiosignale codieren

Der einfachste Weg, Audiosignale digital zu codieren, ist die Pulscodemodulation (PCM), die auf Audio-CDs , DAT- Aufnahmen usw. verwendet wird. Die Digitalisierung wandelt kontinuierliche Signale in diskrete um, indem die Amplitude eines Signals in gleichmäßigen Intervallen abgetastet und auf den nächsten Wert gerundet wird , der mit der verfügbaren Anzahl von Bits dargestellt werden kann . Dieses Verfahren ist grundlegend ungenaues und beinhaltet zwei Fehler: Diskretisierungsfehlers , aus in Abständen abgetastet und Quantisierungsfehlers , von Rundungen.

Je mehr Bits zur Darstellung jeder Probe verwendet werden, desto feiner ist die Granularität in der digitalen Darstellung und desto kleiner ist der Quantisierungsfehler. Solche Quantisierungsfehler können als eine Art Rauschen angesehen werden, da sie effektiv den Unterschied zwischen der ursprünglichen Quelle und ihrer binären Darstellung darstellen. Mit PCM können die hörbaren Auswirkungen dieser Fehler durch Zittern und durch Verwendung von genügend Bits gemindert werden, um sicherzustellen, dass das Rauschen niedrig genug ist, um entweder durch das Signal selbst oder durch andere Rauschquellen maskiert zu werden. Ein Signal hoher Qualität ist möglich, jedoch auf Kosten einer hohen Bitrate (z. B. über 700 kbit / s für einen CD-Audiokanal). Tatsächlich werden viele Bits beim Codieren maskierter Teile des Signals verschwendet, da PCM keine Annahmen darüber macht, wie das menschliche Ohr hört.

Codierungstechniken reduzieren die Bitrate, indem bekannte Eigenschaften des auditorischen Systems ausgenutzt werden. Eine klassische Methode ist nichtlineares PCM wie der μ-Law-Algorithmus . Kleine Signale werden feiner digitalisiert als große. Der Effekt besteht darin, Rauschen hinzuzufügen, das proportional zur Signalstärke ist. Das Au-Dateiformat von Sun für Sound ist ein beliebtes Beispiel für die Mu-Law-Codierung. Die Verwendung einer 8-Bit-Mu-Law-Codierung würde die Bitrate von CD-Audio pro Kanal auf etwa 350 kbit / s reduzieren, die Hälfte der Standardrate. Da diese einfache Methode Maskierungseffekte nur minimal ausnutzt, werden Ergebnisse erzielt, die im Vergleich zum Original oft hörbar schlechter sind.

Grundprinzipien

Der Nutzen von SBC lässt sich am besten anhand eines konkreten Beispiels veranschaulichen. Bei Verwendung für die Audiokomprimierung nutzt SBC die auditive Maskierung im auditorischen System . Menschliche Ohren reagieren normalerweise auf einen weiten Frequenzbereich. Wenn jedoch bei einer Frequenz ein ausreichend lautes Signal vorhanden ist, hört das Ohr bei nahe gelegenen Frequenzen keine schwächeren Signale. Wir sagen, dass das lautere Signal die leiseren maskiert.

Die Grundidee von SBC besteht darin, eine Datenreduktion zu ermöglichen, indem Informationen über maskierte Frequenzen verworfen werden. Das Ergebnis unterscheidet sich vom ursprünglichen Signal, aber wenn die verworfenen Informationen sorgfältig ausgewählt werden, ist der Unterschied nicht erkennbar oder, was noch wichtiger ist, zu beanstanden.

Erstens unterteilt eine digitale Filterbank das Eingangssignalspektrum in eine Anzahl (z. B. 32) von Teilbändern. Das psychoakustische Modell untersucht die Energie in jedem dieser Teilbänder sowie im ursprünglichen Signal und berechnet Maskierungsschwellen unter Verwendung psychoakustischer Informationen. Jedes der Teilbandabtastwerte wird quantisiert und codiert, um das Quantisierungsrauschen unter der dynamisch berechneten Maskierungsschwelle zu halten. Der letzte Schritt besteht darin, alle diese quantisierten Abtastwerte in Gruppen von Daten zu formatieren, die als Rahmen bezeichnet werden, um eine eventuelle Wiedergabe durch einen Decoder zu erleichtern.

Die Dekodierung ist viel einfacher als die Kodierung, da kein psychoakustisches Modell beteiligt ist. Die Rahmen werden entpackt, Teilbandabtastwerte werden decodiert und eine Frequenz-Zeit-Abbildung rekonstruiert ein ausgegebenes Audiosignal.

Anwendungen

Ab Ende der 1980er Jahre entwickelte ein Standardisierungsgremium, die Moving Picture Experts Group (MPEG), Standards für die Codierung von Audio und Video. Die Subband-Codierung ist beispielsweise das Herzstück des beliebten MP3-Formats (besser bekannt als MPEG-1 Audio Layer III ).

Die Subband-Codierung wird im G.722- Codec verwendet, der eine adaptive Subband-Differenzialpulscodemodulation (SB- ADPCM ) mit einer Bitrate von 64 kbit / s verwendet. Bei der SB-ADPCM-Technik wird das Frequenzband in zwei Teilbänder (höher und niedriger) aufgeteilt und die Signale in jedem Teilband werden unter Verwendung von ADPCM codiert.

Verweise

Dieser Artikel basiert auf Material, das vor dem 1. November 2008 aus dem Free Online Dictionary of Computing entnommen und unter den "Neuzulassungsbedingungen" der GFDL , Version 1.3 oder höher, aufgenommen wurde.

Externe Links