Formaty plików audio uczeń.doc

(35 KB) Pobierz
Formaty plików audio

Formaty plików audio

1. Ogólna charakterystyka pliku dźwiękowego.

Dźwięk analogowy przekształcony do postaci cyfrowej może być utrwalony w postaci pliku. Sposób porządkowania danych w pliku określa jego format.  Plik dźwiękowy oprócz bloków danych stanowiących zapisany dźwięk zawierać może również nagłówek z dodatkowymi informacjami. Informacje te nazywamy tagami. W nagłówku umieszczone są informacje opisujące format pliku, jego długość, liczbę kanałów, rozdzielczość bitową, częstotliwość próbkowania, rodzaj i stopień kompresji. Całość tych informacji nazywamy metadanymi.

2. Rodzaje plików dźwiękowych

         WAVE - wprowadzony przesz Microsoft i IBM, związany jest z platformą Windows;

         AIFF - wprowadzony przez Apple i związany z platformą Macintosh;

         AU - opracowany przez Sun Microsystem dla środowiska unixowego;

3. Zapisywanie dźwięku.

Modulacja kodowo – impulsowa tj. PCM (ang. Pulse Code Modulation) to metoda binarnego przedstawiania chwilowych wartości amplitudy mierzonej w równych odstępach czasu, a więc swoistego kodowania analogowego dźwięku w strumień zer i jedynek wykreślających przebieg impulsów o zmiennej częstotliwości. Powstały w ten sposób sygnał cyfrowy należy pogrupować w pakiety danych (słowa lub bajty) i zapisać na dowolnym nośniku w postaci pliku dźwiękowego. Przekształcenie sygnału cyfrowego w analogowy przebiega na odwrót.

Zapisywanie dźwięku w formie czystego kodu PCM to najwygodniejszy sposób, a odtworzenie takiego pliku nie obciąża zbytnio procesora. Wymaga jednak dużej ilości miejsca na dysku. Jedna minuta stereofonicznego nagrania jakości CD (44,1 kHz, 16 bitów) zajmuje ok. 10 MB przestrzeni dyskowej.

4. Format WAVE (.wav) – domyślnie dźwięk zapisany w tym formacie nie jest poddany żadnej kompresji. Dlatego pliki WAVE mają zwykle duży rozmiar. Format ten pozwala także na kompresję danych wykorzystując kodek MPEG-1 Layer 3 co prowadzi do utworzenia pliku MP3. Format ten często stosowany jest z uwagi na brak utraty jakości. Dlatego jeżeli plik chcemy poddać dalszej edycji, to zapisanie go w formacie WAVE jest dobrym pomysłem.

5. Format MP3 (.mp3) – jest to obecnie najbardziej rozpowszechniony format kompresji stratnej, znacznie redukuje rozmiar pliku niewiele przy tym degradując dźwięk. Formalnie format MP3 nosi nazwę MPEG-1 Audio Layer 3. Przeciętny rozmiar pliku MP3 stosowany w Internecie to około 1 MB na każdą minutę utworu muzycznego. Jakość dźwięku jest gorsza ale różnice te są prawie niesłyszalne dla większości ludzi.

6. Zasada działania kompresji MP3

Mechanizm kompresji MP3 jest dość złożony. W bardzo dużym uproszczeniu polega on na tym, że sygnał dźwiękowy dzielony jest na tzw. ramki. W każdej ramce sprawdzone są możliwości wykorzystania maskowania tonów celem usunięcia części danych. Ponadto wyszukiwane są różnice między ramkami, tak aby mechanizm zapamiętał tylko zmiany, a nie każdą ramkę z osobna. Częstotliwości słabiej słyszalne są obcinane. Tak przygotowane dane binarne kodowane są specjalnym algorytmem. Standard MP3 nie określa dokładnie metody kodowania (kompresji), toteż istnieje wiele różnych programów kodujących (tzw. enkoderów) MP3.

Najpopularniejszym jest LAME, który dobrze radzi sobie z kompresowaniem plików o wysokiej wartości przepływności.  Wybranie wysokiej przepływności np. 320 kbps, zapewnia bardzo dobrą jakość dźwięku, ale również większy rozmiar pliku. Zmniejszenie przepływności prowadzi do słyszalnych efektów. Gdy przepływność jest zbyt mała, w pliku pojawiają się artefakty. Są to dźwięki, których nie ma w oryginalnym pliku dźwiękowym.

Dźwięki bardziej regularne i bardziej przewidywalne można kompresować z mniejszą przepływnością i ciągle unikać powstawania artefaktów i innych zauważalnych oznak pogorszenia jakości.

Właściwość ta legła u podstaw metody zmiennej przepływności (VBR).

Chodzi o to by kompresować z mniejszą przepływnością te fragmenty pliku dźwiękowego, które są łatwiejsze w kompresji (bardziej regularne), a większej przepływności użyć tam, gdzie dźwięk jest bardziej zmienny.

Zastosowanie tej metody pozwala poprawić jakość pliku dźwiękowego poprzez dopasowanie parametrów kompresji MP3 do chwilowych potrzeb.
Przeciwieństwem zmiennej przepływności jest metoda stałej przepływności (CBR).

7. Inne formaty audio.

         AAC – zaawansowane kodowanie audio. Format ten wprowadza wiele usprawnień m.in. obsługę do 48 kanałów, większą liczbę różnych częstotliwości próbkowania i lepsze algorytmy kompresji. Plik w formacie AAC jest znacznie mniejszy niż plik MP3 tej samej jakości.

         WMA (.wma) – oferuje różne stopnie kompresji, dla małych przepustowości 20-48 kb/s, brzmi lepiej od MP3.   Przy kodowaniu z prędkością 128 kb/s różnice się zacierają;

         AIFF (.aif) – oferuje opcje podobne dla częstotliwości próbkowania, rozdzielczości, liczby dostępnych kanałów jak .wav. Standard związany z komputerami Apple Macintosh.

         MIDI (.mid) – pliki, które zawierają ciąg instrukcji dla instrumentów elektronicznych spełniających wymagania standardu MIDI. Zamiast dźwięków przechowują informacje o tym, jaki klawisz został, kiedy i z jaką siłą, jak szybko i na jak długo, jak skonfigurowany był instrument.

         MP3Pro (.mp3) – zapewnia jeszcze większy stopień upakowania danych przy tej samej jakości dźwięku;

         RealMedia (.rm, .ra) – opracowany na użytek Internetu, umożliwia kodowanie w jednym pliku kilku podstrumieni co gwarantuje dynamiczne dopasowanie prędkości pobierania pliku z serwera do aktualnych warunków łączności, a więc płynne odtwarzanie sieciowego dźwięku.

8. Konwersja między formatami.

Do konwersji między różnymi formatami plików dźwiękowych można użyć różnych programów.

W zasadzie każdy program do zgrywania muzyki z CD lub edycji dźwięku ma funkcję Zapisz jako ... lub Eksportuj, co pozwala otworzyć plik w jednym formacie i zapisać w innym.

 

Zgłoś jeśli naruszono regulamin