Medientechnik

Download Report

Transcript Medientechnik

MedienTechnik
Audio-Kompression
MPEG Audio
MPEG
MPEG
MPEG
MPEG
MPEG
Moving Pictures Experts Group
1 / H.261: Video mit 1,5 Mbit/s
2: n*64kBit/s
3: AAC Advanced Audio Coding
4 / H.263: erst low bit rate,
dann „universelles Verfahren“
parametric audio coding,
synthetic audio,
speech coding
subband/transform coding
t/f -coders (time/frequency)
Komprimierung: MP3
MedienTechnik
KomressionsRate für CD-Qualität
1:4
Layer 1 (384 kbps for a stereo signal)
1:6...1:8
Layer 2 (256..192 kbps for a stereo signal)
1:10...1:12
Layer 3 (128..112 kbps for a stereo signal)
MPEG Layer-3
sound quality
bandwidth
mode
bitrate reduction ratio
telephone sound
2.5 kHz
mono
8 kbps *
96:1
better than shortwave
4.5 kHz
mono
16 kbps
48:1
better than AM radio
7.5 kHz
mono
32 kbps
24:1
similar to FM radio
11 kHz
stereo 56...64 kbps
26...24:1
near-CD
15 kHz
stereo 96 kbps
16:1
CD
>15 kHz
stereo 112..128kbps
14..12:1
Komprimierung: Psycho-Akustik
MedienTechnik
AudioSoftware
ST-X
http://www.kfs.oeaw.ac.at/fsf/psa/index.html
Original-Spektrogramm aus der „Pastorale“
Komprimierung: Psycho-Akustik
MedienTechnik
Hörbarer
Anteil
Akustisch relevante Anteile
Komprimierung: Psycho-Akustik
MedienTechnik
Verdeckte
Komponenten
Differenz-Signal ohne „relevante“ Komponenten: „unhörbar“
Komprimierung: Psycho-Akustik
MedienTechnik
Psychoakustik:
Critical Band =
Frequenzbereiche
innerhalb derer
sich mehrere Signale
beeinflussen
(Harmonie, Disharmonie
etc. )
MedienTechnik
QMF
Quadrature Mirror Filter
VLC
variable-length coding
MPEG 1 Audio
Sub-Band Coding SBC
MedienTechnik
MPEG 1 Audio Encoder
SMR: single-to-mask ratio
MDCT: Modified DCT
Header:
Syncword: 12bits
Layercode: 2bits
(I,II,II)
Bitrate: 4bits
(s. Tabelle)
Sampling-F.: 2bits
(48,44.1,32 kHz)
Mode: 2bit
(stereo, mono,
2-sprachig, joint
stereo)
Padding 1bit
MedienTechnik
MPEG-Layer I
32 Filterbänder
gleicher Breite
Psychoakustische
Maskierung
in jedem Band
1 Frame=
12 Samples*32
=384 Informationen
MUSICAM MPEG Audio Codec
MedienTechnik
ASPEC MPEG Audio Codec
MedienTechnik
Psychoakustik in MPEG
Modell I:
FFT (512/1024) Werte und
Bandfilter berechnen
Schalldruck in jedem Band
Stille Regionen berechnen
Tonale und nichttonale
verdeckende Komponenten
aus FFT
Verdeckte Komponenten
entfernen
Modell II:
FFT in wie in Modell I,
jedoch für kurze (192) und
lange Blöcke (576)
Spreading function auf benachbarte Critical Bands anwenden
MedienTechnik
MPEG Audio Übersicht
Http://sound.media.mit.edu/mpeg4/audio/faq
MPEG-1
MPEG-2
MPEG-4
Iso/IEC 11172-3 (1993) Iso/IEC 13818-3 (1995) (1998 ?)
mono/stereo/2-channel/joint Iso/IEC 13818-7 (1997) Bitratenadaption, Codecs für
Abstastraten 48, 44.1, 32 KHz mono/stereo/multichannel
viele Abstastraten, Datenströme < 64 kBit/sec, AAC
Ziel: Video & Audio-CD
Layer I
Layer II
Layer III
Kommunikation
kleinste Bitraten, zusätzlich
„synthetische“ Elemente:
MIDI/SAOL (structured
audio orchestra language),
SASBF (structured audio
sample bank format) TTS
(text to speech)
Audio-Objekte (Sprache,
Geräusche, Musik)
MPEG-7
Multimedia Content
Description Interface
Komprimierung: MPEG 2 AAC
MedienTechnik
Filter: MDCT
http://www.iis.fhg.de
TNS: temporal noise shapng
Reduktion von Quantisierungsfehlern
DAB: Digital Audio Broadcasting
MPEG 1 Layers / Bitraten
MedienTechnik
Bitrate (kHz)
Index
Layer I
Layer II
Layer III
0000
frei
frei
frei
0001
32
32
32
0010
64
48
40
0011
96
56
48
0100
128
64
56
0101
160
80
64
0110
192
96
80
0111
224
112
96
1000
256
128
112
1001
288
160
128
1010
320
192
160
1011
352
224
192
1100
384
256
224
1101
416
320
256
1110
448
384
320