Medientechnik

Download Report

Transcript Medientechnik

MedienTechnik
Audio-Kompression: MPEG
Karlheinz
Brandenburg
Bernhard
Grill
Harald
Popp
MedienTechnik
Audio-Kompression: MPEG
MPEG 1:
ISO/IEC IS 11172 (1988-1992)
Ziel:
Digitales Video auf CD 1,5 Mbit/s
Moving
Pictures
Experts
Group
Offizieller Name
ISO/IEC JTC1/SC29/ WG11
MPEG 1 Audio:
ISO/IEC IS 11172-3
3 Schichten wachsender Komplexität
MPEG 1 Layer 3 = MP3
MedienTechnik
Audio-Kompression: MPEG
MPEG 2:
(1994)
Ziel:
Digitales Fernsehen, viele Bitraten
z.B. DVD, Videokonferenzen
Moving
Pictures
Experts
Group
Offizieller Name
ISO/IEC JTC1/SC29/ WG11
MPEG 2 Audio:
ISO/IEC 13818-3
Zusätzlich: 5-Kanal (Dolby Suround)
Kleinere Bitraten / Abtastfrequenzen
AAC = MPEG 2 Advanced Audio Coding
Verbesserte Codecs
Komprimierung: MP3
MedienTechnik
KomressionsRate für CD-Qualität
1:4
Layer 1 (384 kbps for a stereo signal)
1:6...1:8
Layer 2 (256..192 kbps for a stereo signal)
1:10...1:12
Layer 3 (128..112 kbps for a stereo signal)
MPEG Layer-3
sound quality
bandwidth
mode
bitrate reduction ratio
telephone sound
2.5 kHz
mono
8 kbps *
96:1
better than shortwave
4.5 kHz
mono
16 kbps
48:1
better than AM radio
7.5 kHz
mono
32 kbps
24:1
similar to FM radio
11 kHz
stereo 56...64 kbps
26...24:1
near-CD
15 kHz
stereo 96 kbps
16:1
CD
>15 kHz
stereo 112..128kbps
14..12:1
Komprimierung: Psycho-Akustik
MedienTechnik
AudioSoftware
ST-X
http://www.kfs.oeaw.ac.at/fsf/psa/index.html
Original-Spektrogramm aus der „Pastorale“
Komprimierung: Psycho-Akustik
MedienTechnik
Hörbarer
Anteil
Akustisch relevante Anteile
Komprimierung: Psycho-Akustik
MedienTechnik
Verdeckte
Komponenten
Differenz-Signal ohne „relevante“ Komponenten: „unhörbar“
Komprimierung: Psycho-Akustik
MedienTechnik
Psychoakustik:
Critical Band =
Frequenzbereiche
gleicher
Laut(stärke)empfindung
24 Kritische Bänder
im Bereich 0-15 kHz
MedienTechnik
Komprimierung: Psycho-Akustik
Simultane Maskierung
Hörbarkeitsschwelle
unhörbar
http://www.tecchannel.de/multimedia/58/index.html
Unhörbar bei
1000Hz-Ton
mit 100dB
MedienTechnik
Komprimierung: Psycho-Akustik
Verdeckung durch kurzes lautes Signal
(tonal)
(Rauschsignal)
Rauschsignale werden durch lautere
tonale Signale verdeckt.
Konsequenz:
Quantisierungsrauschen wird verdeckt.
http://www.tecchannel.de/multimedia/57/index.html
MedienTechnik
Komprimierung: Psycho-Akustik
Vor- und Nachmaskierung
Rückwärtsmaskierung:
Lauter Impuls „überholt“
leises Rauschhen
Vorwärtsmaskierung:
Lauter Impuls hebt die
Hörschwelle an
http://www.tecchannel.de/multimedia/57/index.html
20 ms
200 ms
Hörbeispiel 1: Rauschen verdeckt einzelne Töne
MedienTechnik
Demo1.wav
Testsignal
600 Hz
Testsignal
1000 Hz
Testsignal
1600 Hz
Jeweils um 10 dB ansteigendes Testsignal im Rauschsignal
Rauschsignal
900-1100 Hz
Hörbeispiel 2: Vorwärtsmaskierung
MedienTechnik
Demo2.wav
Impuls
Jeweils um 10 dB ansteigendes Testsignal im Rauschsignal
Rauschsignal
Hörbeispiel 3: Rückwärtsmaskierung
MedienTechnik
Demo3.wav
Impuls
Rauschsignal
MedienTechnik
QMF
Quadrature Mirror Filter
VLC
variable-length coding
MPEG 1 Audio
Sub-Band Coding SBC
MedienTechnik
Zerlegung in 32
Frequenzbänder
MPEG 1/2 Audio Layer 3
Jedes Band
18 mal zerlegen
MPEG 1/2 Audio Layer 3
MedienTechnik
Zerlegung in 32
Frequenzbänder
Jedes Band
18 mal zerlegen
Störsignal
minimieren
Verdeckte
Komponenten
ermitteln
Innere Schleife:
Optimale Codierung
finden (Bitrate)
Mehrere Hufman-Tabellen, Verstärkungsfaktoren
Starkes Signal = grobe Kodierung, schwaches Signal = feine Codierung
MPEG 1/2 Audio Layer 3
MedienTechnik
Zerlegung in 32
Frequenzbänder
Jedes Band
18 mal zerlegen
EntropieKodierung
Verdeckte
Komponenten
ermitteln
Aufbau
Frames
MedienTechnik
MPEG 1/2 Audio Layer 3
http://www.iis.fhg.de/amm/techinf/layer3/layer3_block.gif
MedienTechnik
Mp3 Bitstream
Jeder Frame
kann für sich
dekodiert werden
Jeder Frame
kann andere
Samplingrate
und Modus
besitzen (III)
Header:
Copyright
Syncword:
Layercode:
Bitrate:
Sampling-F.:
Mode: 2bit
Padding 1bit
2bits
12bits
2bits (I,II,II)
4bits (s. Tabelle)
2bits (48,44.1,32 kHz)
(stereo, mono, 2-sprachig, joint stereo)
Joint Stereo:
o MS-Stereo:
Mittensignal,
Seitensignal
o Intensity
Stereo
nur hörbare
Differenzen
MPEG 1 Layers / Bitraten
MedienTechnik
44,1 kHz
typewriter1.wav
3,8 MB
Bitrate (kHz)
Index
Layer I
Layer II
Layer III
0000
frei
frei
frei
0001
32
32
32
0010
64
48
40
0011
96
56
48
0100
128
64
56
0101
160
80
64
0110
192
96
80
0111
224
112
96
1000
256
128
112
1001
288
160
128
1010
320
192
160
1011
352
224
192
1100
384
256
224
1101
416
320
256
1110
448
384
320
Typewriter1-4.mp3
43 kB, joint stereo
Typewriter1-3.mp3
171 kB, joint stereo
Typewriter1-2.mp3
342 kB, joint stereo
Typewriter1-1.mp3
834 kB, joint stereo
MedienTechnik
Psychoakustik in MPEG
Modell I:
FFT (512/1024) Werte und
Bandfilter berechnen
Schalldruck in jedem Band
Stille Regionen berechnen
Tonale und nichttonale
verdeckende Komponenten
aus FFT
Verdeckte Komponenten
entfernen
Modell II:
FFT in wie in Modell I,
jedoch für kurze (192) und
lange Blöcke (576)
Spreading function auf benachbarte Critical Bands anwenden
MedienTechnik
MPEG Audio Übersicht
Http://sound.media.mit.edu/mpeg4/audio/faq
MPEG-1
MPEG-2
Iso/IEC 11172-3 (1993) Iso/IEC 13818-3 (1995)
mono/stereo/2-channel/joint Iso/IEC 13818-7 (1997)
Abstastraten 48, 44.1, 32 KHz mono/stereo/multichannel
viele Abstastraten, Datenströme < 64 kBit/sec, AAC
Ziel: Video & Audio-CD
Layer I
Layer II
Layer III
Kommunikation
MedienTechnik
MPEG 4 Audio
Http://sound.media.mit.edu/mpeg4/audio/faq
MPEG-7
Multimedia Content
Description Interface
MedienTechnik
Harmonic
Vector
eXcitation
Coding
Code Excited
Linear Predictive
MPEG-2 AAC
MPEG 4 Natural Audio
MedienTechnik
MPEG 4 Synthesized Audio
TTSI Text to Speech Interface
 Text mit Ausspracheinformationen
Score driven Synthesis
SAOL Structured Audio Orchestra Language
 Instrumente definieren
als Sammlung einfacher Signalprozessoren
 Noten für diese Instrument (abstraktes MIDI)
 Wavetables mit Effektfiltern
MedienTechnik
Vorlesung „Medientechnik WS 1999/2000“
Dr. Manfred Jackel
Studiengang Computervisualistik
Institut für Informatik
Universität Koblenz-Landau
Rheinau 1
56075 Koblenz
Literatur zu diesem Kapitel
Brandenburg, Karlheinz:
MP3 and AAC explained
Hyperlinks zu diesem Kapitel
© Manfred Jackel
E-Mail: [email protected]
WWW: www.uni-koblenz.de/~jkl
mtech.uni-koblenz.de
Grafik-Quellen