Transcript FORMAT WAVE
FORMAT WAVE
Opracował:
Marek Sawczuk
DŹWIĘK JEST SYGNAŁEM
ANALOGOWYM, CO
OZNACZA, ŻE WARTOŚĆ
CHWILOWA JEGO
NATĘŻENIA ZMIENIA SIĘ W
CZASIE W SPOSÓB CIĄGŁY.
ANALOGOWĄ METODĘ
ZAPISU DŹWIĘKÓW
WYNALAZŁ EDISON W
ROKU 1877, ALE BYŁA TO
METODA CZYSTO
MECHANICZNA.
W DRUGIEJ POŁOWIE XX
WIEKU DOMINOWAŁ JUŻ
ELEKTRYCZNY ZAPIS
DŹWIĘKU
WYKORZYSTUJĄCY W
CHARAKTERZE NOŚNIKA
TAŚMĘ MAGNETYCZNĄ
W TYM SAMYM CZASIE
WPROWADZONO TECHNIKĘ
CYFROWĄ DO TELEFONII.
DLA ZACHOWANIA
JEDNORODNOŚCI ROZWIĄZAŃ
KONSTRUKCYJNYCH
KONIECZNE STAŁO SIĘ
PRZEKSZTAŁCENIE
ANALOGOWEGO SYGNAŁU
DŹWIĘKOWEGO NA SYGNAŁ
CYFROWY.
DOKONANO TEGO ZA POMOCĄ
MODULACJI KODOWOIMPULSOWEJ (PULSE CODE
MODULATION - PCM).
Sygnał analogowy
METODA TA POLEGA NA SPRAWDZANIU Z
OKREŚLONĄ CZĘSTOTLIWOŚCIĄ CHWILOWYCH
WARTOŚCI SYGNAŁU ANALOGOWEGO
(PRÓBKOWANIE SYGNAŁU)
Chwile (miejsca)
pobierania próbek
ODCZYTANE W TEN SPOSÓB WARTOŚCI SĄ PRZELICZANE
NA LICZBY BINARNE. PO TYM PRZEKSZTAŁCENIU
CHWILOWE WARTOŚCI SYGNAŁU ANALOGOWEGO SĄ
PRZESYŁANE JAKO CIĄG LICZB BINARNYCH (CZYLI JAKO
CIĄG IMPULSÓW O JEDNAKOWEJ AMPLITUDZIE)
1101 1010 1001 0101 0010 ....
Wartości sygnału w poszczególnych punktach
próbkowania wyrażone binarnie
W URZĄDZENIU ODBIORCZYM DOKONUJE SIĘ PROCES
ODWROTNY. ODEBRANE WARTOŚCI BINARNE SĄ
ZAMIENIANE NA PROPORCJONALNE WARTOŚCI NAPIĘCIA.
W TEN SPOSÓB ZOSTAJE ODTWORZONY PRZYBLIŻONY
SYGNAŁ ANALOGOWY.
JAKOŚĆ DŹWIĘKU JEST TYM LEPSZA, IM BLIŻEJ
SIEBIE LEŻĄ KOLEJNE PRÓBKI, CZYLI IM
WIĘKSZA JEST CZĘSTOTLIWOŚĆ PRÓBKOWANIA.
JEŻELI CZĘSTOTLIWOŚĆ PRÓBKOWANIA JEST
DOSTATECZNIE DUŻA, TO SYGNAŁ KODOWANY
CYFROWO NIEWIELE RÓŻNI SIĘ JAKOŚCIOWO OD
ORYGINALNEGO SYGNAŁU ANALOGOWEGO.
W KOŃCU LAT OSIEMDZIESIĄTYCH
XX WIEKU ZOSTAŁY
WYPRODUKOWANE PIERWSZE
KARTY DŹWIĘKOWE DLA
KOMPUTERÓW IBM PC.
MICROSOFT I IBM OPRACOWAŁY,
OPARTY NA KODOWANIU PCM,
FORMAT PLIKÓW DO ZAPISU
DŹWIĘKU O NAZWIE WAV
(Z ANG. WAVEFORM).
Na jakość zachodzącej w cyfrowym przetworniku karty
dźwiękowej digitalizacji – konwersji wartości amplitudy
sygnałów analogowych do postaci liczbowej mają wpływ:
CZĘSTOTLIWOŚĆ PRÓBKOWANIA – liczba
próbek sygnału analogowego pobieranych w
ciągu jednej sekundy. Standardowo stosuje się
następujące częstotliwości próbkowania: 11025
Hz – digitalizacja mowy, 22050 Hz – muzyka o
jakości „przenośnego radia”, 44100 Hz – jakość
płyty CD.
ROZDZIELCZOŚĆ PRÓBKOWANIA – liczba bitów
przeznaczonych do zapisu każdej próbki. Ścieżki
płyty CD-Audio są digitalizowane z 16-bitową
rozdzielczością.
W systemie Windows jest stosowany format WAV
tworzący pliki audio bez kompresji.
Brak kompresji
oznacza, że plik
zawierający 3 minutowe
nagranie orkiestry
symfonicznej będzie
miał taką samą
wielkość jak
zawierający 3 minuty
absolutnej ciszy.
Dane zapisane w
plikach tego formatu
mają dużą objętość.
Jednominutowe
nagranie o jakości płyty
CD Audio zajmuje około
10 MB. Oznacza to
małą przydatność w
sieci.
Format WAV wykazuje pewną elastyczność:
Muzyka nagrana na kompakcie ma częstotliwość
próbkowania dźwięku 44,1 kHz. Muzyka z jakością
radiową to około 22 kHz. Jakość rozmowy telefonicznej to
około 11 kHz.
Ilość bitów przeznaczona na zapis jednej liczby binarnej
zapisanej w wyniku próbkowania („ramki dźwięku”) może
być różna. Jakość kompaktowa dźwięku to 16 bitów (2
bajty), jakość radiowa i telefoniczna to 8 bitów (1 bajt).
Dźwięk monofoniczny lub stereofoniczny.
44 kHz. 8 bit, stereo - 1 min 36 sekund - 8,11 MB
22 kHz. 16 bit, stereo - 1 min 56 sekund -9,75 MB
44 kHz, 16 bit, mono - 4 sekundy - 408 KB
22 kHz, 16 bit mono - 10 sekund - 447 KB
WAV – zalety i wady
Rozpowszechniona
obsługa przez
popularne
oprogramowanie
komputerowe
Prosta struktura pliku
Łatwość obróbki
Możliwa wysoka jakość
dźwięku
Duży rozmiar (aby
zmniejszyć wielkość
trzeba zrezygnować z
jakośći)
Nie nadaje się do
Internetu
Pliki WAV można poddawać różnego rodzaju
kompresji. Przykładowe kodeki.
PCM (Pulse Code Modulation) – Pliki w formacie PCM wymagają dużo pamięci, ale ich
odtwarzanie nie obciąża zbytnio procesora. PCM zachowuje informacje o każdym punkcie
przebiegu akustycznego w postaci próbek. W tym formacie kompresji zapisywane są
zazwyczaj pliki WAV;
ADPCM (Adaptative Differential PCM) – Przyczyną powstania ADPCM była chęć zmniejszenia
objętości plików PCM. DPCM zapisuje, zwykle z użyciem 4 bitów, różnice pomiędzy kolejnymi
próbkami. Format ADPCM dostosowuje liczbę bitów do zapisywanych różnic;
A-law – format 8-bitowy stosowany w telefonii cyfrowej mający zastosowanie w Europie;
Mu-law - format 8-bitowy stosowany w telefonii cyfrowej mający zastosowanie w Ameryce
Północnej oraz Japonii;
LPC (Linear Predictive Coding) – format kompresji LPC odczytuje zapisany sygnał mowy i
dopasowuje go do modelu głosu ludzkiego, po czym odrzuca zapisany głos i zachowuje jedynie
wyzwalacze modelu;
CELP (Code Excited Linear Prediction) - format kompresji LPC odczytuje zapisany sygnał mowy
i dopasowuje go do modelu głosu ludzkiego, różnice między modelem i właściwym nagraniem
mowy zapisywane są w przechowywanych wraz z plikiem „książkach kodowych”;
G.721 – standard kompresji Adaptive DPCM wykorzystujący 24 i 40 kilobity na sekundę;
G.723 - standard kompresji Adaptive DPCM wykorzystujący 32 kilobity na sekundę;
G.711 – standard kompresji cyfrowego przekazu telefonicznego;
ACM (Microsoft Audio Compression Manager) – pozwala korzystać z kodeków zainstalowanych
jako element system operacyjnego;
Z zapisem i odtwarzaniem dźwięku wiąże się
pojęcie „kodeka” (kodowanie – dekodowanie).
Jest to urządzenie lub program służący do
zakodowania lub rozkodowania sygnału.
W efekcie zakodowania powstaje plik dyskowy.
Aby ten plik odsłuchać konieczne jest
zainstalowanie w systemie tego samego kodeka,
który służył do zakodowania.
Źródła:
Krzymowski Bogdan, MP3 – czyli muzyka z Internetu, Komputerowa
Oficyna Wydawnicza „HELP”, 2008
http://www.promusic.pl
http://www.pentagram.pl
http://www.fizykon.org