PROGRAMOWANIE APLIKACJI MULTIMEDIALNYCH

Wielkość: px
Rozpocząć pokaz od strony:

Download "PROGRAMOWANIE APLIKACJI MULTIMEDIALNYCH"

Transkrypt

1 PROGRAMOWANIE APLIKACJI MULTIMEDIALNYCH PRZETWARZANIE OBRAZÓW I DŹWIĘKÓW wykład 6 KOMPRESJA SYGNAŁÓW AKUSTYCZNYCH Prowadzący: Tomasz Kowalski

2 Natura i percepcja dźwięków 2 Dźwięk - zarówno mowa, jak i muzyka, jest z fizycznego punktu widzenia złożoną falą akustyczną. Ma ona charakterystyczne cechy, zależne przede wszystkim od własności źródła dźwięków oraz warunków, w jakich się rozchodzi. Podstawowymi parametrami, określającymi dźwięk w sposób subiektywny są: wysokość i natężenie.

3 Natura i percepcja dźwięków Dźwięki mogą być wysokie lub niskie, słabo słyszalne bądź bardzo głośne. Mogą rozchodzić się w wolnej przestrzeni bądź ulegać odbiciom, tworząc pogłos czy echo. Miary subiektywne zależą od wykonującego pomiar, są więc niejednoznaczne - niewymierne liczbowo. Utrudnia to ocenę i porównywanie urządzeń. Z tego m.in. powodu ustalono wielkości, związane z parametrami subiektywnymi, dające się mierzyć metodami fizycznymi, pozwalające na obiektywny i wymierny opis odczuć, doznawanych przy odbiorze dźwięku. 3

4 4 Natura i percepcja dźwięków Dźwięk jest falą akustyczną czyli drganiami rozchodzącymi się przede wszystkim w powietrzu. Każdą falę można przedstawić w postaci wykresu, obrazującego zmianę jej parametrów w funkcji czasu bądź odległości od źródła. Podstawowym dla dźwięku wykresem będzie przedstawienie zmian natężenia (głośności) dźwięku w danym punkcie przestrzeni w funkcji czasu. Najprostszą formą dźwięku jest ton prosty, a jego przedstawieniem graficznym jest sinusoida.

5 5 Natura i percepcja dźwięków Przebieg sinusoidalny dźwięku charakteryzuje się częstotliwością oraz natężeniem. Miarą natężenia dźwięku jest amplituda zmian ciśnienia akustycznego. Zmiany tego ciśnienia odnosimy do średniego ciśnienia akustycznego. Natężenie dźwięku można podawać w kilku jednostkach, np. jako moc akustyczną padającą na jednostkę powierzchni ustawionej prostopadle do kierunku padania fali (W/m2).

6 6 Natura i percepcja dźwięków W rzeczywistości najczęściej występują dźwięki złożone. Nawet proste tony o tej samej częstotliwości, ale wytworzone przez różne źródła, np. flet lub fortepian, różnią się barwą. Wynika to stąd, że oprócz fali o częstotliwości podstawowej każde źródło dźwięku wytwarza tzw. sygnały harmoniczne, tj. dodatkowe fale o mniejszym natężeniu i częstotliwościach na ogół większych niż podstawowa.

7 7 Natura i percepcja dźwięków Zakres częstotliwości słyszalnych przez człowieka jest niewielki i zawiera się w umownych granicach od 20 Hz do 20 khz. W praktyce jest on węższy, różny dla różnych osób i zmniejsza się z wiekiem.

8 8 Natura i percepcja dźwięków Nieco bardziej skomplikowana jest sprawa głośności. Własności ucha ludzkiego sprawiają, że dźwięki o różnej częstotliwości są słyszalne z różnym natężeniem. Najbardziej zauważalne jest to dla dźwięków znajdujących się na granicy słyszalności, dla której zależność ta jest najsilniejsza. Im dźwięk jest silniejszy, tym bardziej słyszalność się wyrównuje.

9 9 Natura i percepcja dźwięków Czasowy przebieg sygnału akustycznego może być zapisany w postaci ciągu wartości liczbowych, odpowiadających amplitudom sygnału mierzonym w ustalonych, zwykle jednakowo odległych od siebie momentach czasu.

10 Natura i percepcja dźwięków W wyniku otrzymujemy jednak strumień informacji rzędu 1,4Mb/s (sygnał stereofoniczny, próbkowanie z częstotliwością 44,1 khz, 16 bitów na próbkę), który sprawia trudności przy przesyłaniu go w formie cyfrowej na odległość a ponadto w błyskawicznym tempie wypełnia pamięć urządzenia przetwarzającego. Problem oszczędnego kodowania sygnału akustycznego jest więc centralnym zagadnieniem warunkującym efektywność cyfrowego przetwarzania dźwięku. 10

11 11 Model psychoakustyczny Jest to model zakresu sygnałów słyszalnych, w którym usunięte zostały wszystkie redundantne (nadmiarowe) informacje oraz dźwięki zamaskowane. W modelu psychaktustycznym przewiduje się zakres słyszalności od 20Hz-20kHz (dlatego właśnie większość współczesnych odtwarzaczy muzyki cyfrowej ma pasmo przenoszenia 20Hz- 20kHz) i maksymalną czułość od 2kHz do 4kHz.

12 12 Model psychoakustyczny W modelu psychoakustycznym różnica pomiędzy najcichszym sygnałem a górną granicą słyszalności wynosi ~96dB. W modelu tym zależność pomiędzy częstotliwością a czułością jest następująca:

13 13 Model psychoakustyczny W modelu psychoakustycznym zostaje określona specyfikacja maskowania, np. wygenerowany zostaje sygnał testowy o częstotliwości 1kHz (tzw. częstotliwość podstawowa (lub główna) i natężeniu 60 db i zostaje wyznaczony próg słyszalność wokół sygnału testowego. Podobną czynność wykonuje się dla innych sygnałów testowych.

14 14 Model psychoakustyczny Zastosowana także specyfikacja maskowania niesymultanicznego (maskowanie czasowe). Wygenerowany zostaje ton o częstotliwości 1kHz i natężeniu testowym 60dB. Badane jest prawdopodobieństwo usłyszenia następujących po nim dźwięków (o różnych natężeniach). W zależności od natężenia dźwięku następującego po tonie maskującym różna jest wartość opóźnienia.

15 15 Model psychoakustyczny Warto także prześledzić sytuację, kiedy ton maskujący ma natężenie 60dB, jednakże zmienia się wartość częstotliwości. Zmiana natężenia tonu maskującego nie zmieni krzywizn wykresu, spowoduje jedynie przeskalowanie osi y (poziom w db) w skali proporcjonalnej do zmiany wartości natężenia.

16 Algorytm SCB Proces kodowania standardu MPEG opiera się na metodzie SBC (Sub-Band Coding). Jest to bardzo silny algorytm używany do wszystkich rodzajów sygnałów audio. Metoda SBC posiada pewną zaletę, która stawia ją powyżej innych metod, a mianowicie fakt, iż w odróżnieniu od algorytmów bazujących na typie źródła (jak na przykład LPC Linear Predictive Coding), SBC działa niezależnie od strumienia wejściowego, dlatego może być wykorzystywany do każdego rodzaju dźwięku. 16

17 17 Algorytm SCB Warto zauważyć, iż LPC znajduje głównie zastosowanie przy kodowaniu głosu - dlatego właśnie większość cyfrowych dyktafonów opiera swój proces kompresji na algorytmach LPC.

18 18 SCB zjawisko maskowania MPEG zawdzięcza swój niesamowity współczynnik kompresji zjawisku zachodzącemu w ludzkim uchu. Zjawisko to znane już od wielu lat po raz pierwszy wykorzystała grupa Moving Pictures Expert Group. Zauważyli oni, że ludzkie ucho, zdolne odbierać szeroki zakres częstotliwości, gdy otrzyma dużą dawkę energii na określonej częstotliwości, staje się nieczułe na sygnały o zbliżonej częstotliwości, lecz o wiele mniejszej energii.

19 19 SCB zjawisko maskowania Zjawisko to zostało nazwane maskowaniem symultanicznym. W odróżnieniu od maskowania niesymultanicznego, polegającego na maskowaniu w czasie (po otrzymaniu dźwięku o wysokiej energii, ludzkie ucho nie jest w stanie przez pewien czas odbierać kolejnych sygnałów), jest to maskowanie częstotliwości.

20 20 SCB zjawisko maskowania Algorytm SBC jest więc algorytmem kompresji typu stratnego (lossy), czyli dekodowanie zakodowanego źródła nie da w wyniku źródła. Jednakże mimo to ludzkie ucho nie jest w stanie wychwycić różnicy pomiędzy oryginałem a zdekodowanym zakodowanym źródłem.

21 21 SCB zjawisko maskowania Istnieje wąska grupa ludzi maniaków, którzy z niemalże 100% skutecznością rozróżniają utwory z dwóch powyższych grup pod względem jakości, jednakże potrafią oni także wyczuć różnicę jakościową dźwięku przesyłanego za pomocą dwóch różnych przewodów.

22 22 SCB liniowy PCM Jedną z metod kompresji SBC jest algorytm linearny PCM (Pulse Code Modulation). Zakłada on wstępne maskowanie, po czym podczas dekompresji usunięte sygnały zastępuje cyfrowo wygenerowanymi szumami.

23 23 SCB liniowy PCM Niestety stopień kompresji jest wysoce niezadowalający. Zakodowane sygnały muszą być przecież "głośniejsze" aby zagłuszyć wygenerowane szumy, co pociąga za sobą konieczność zastosowania bitrate u o wartości co najmniej 700 kbps. Stopień kompresji wyniesie więc ok. 1:1.5~2.

24 SCB struktura (de)kompresji Podczas kompresji sygnałów algorytm SBC wykonuje 5 czynności: 1. Wstępny skaning sygnałów wejścia pod względem częstotliwości długości poszczególnych dźwięków 2. Podział sygnałów na grupy 3. Kontrola zgodności z modelem psychoakustycznym (zarówno sygnałów oryginalnych jak i zeskanowanych) 4. Kwantowanie i kodowanie sygnałów 5. Rozdzielanie do poszczególnych ramek 24

25 25 SCB struktura (de)kompresji Wstępny skaning wejścia pozwala na odpowiedni podział sygnałów wejściowych na podzakresy, na których będą wykonywane dalsze operacje. W przypadku MPEG-1 Layer 1 są to 32 subpasma. Podczas wstępnego skaningu dokonuje się analizy spektrum częstotliwości akustycznych dla każdego z subpasm. Używa się do tego zestawu 32 filtrów pasmowych bądź algorytmu FFT.

26 26 SCB struktura (de)kompresji Następnie dokonuje się porównań z modelem psychoakustycznym. Sygnały leżące poza zakresem słyszalności ludzkiego ucha są odrzucane i nie uwzględniane w dalszym procesie. Podczas procesu kwantowania i kodowania w MPEG-1 stosuje się głównie blokowe adaptacyjne przyporządkowywanie bitów ze stałym współczynnikiem skalowania.

27 27 SCB struktura (de)kompresji Jednakże precyzja kwantowania MPEG-1 okazała się zbyt mała i dlatego w MPEG-2 współczynnik skalowania podczas procesu kwantowania nie jest ustalony, lecz zmienia się w czasie. Ponadto w każdym z 32 subpasm dokonuje się podobny proces jak w przypadku wstępnego skaningu.

28 28 SCB struktura (de)kompresji Następnie proces kwantowania i kodowania zostaje zakończony kwantowaniem logarytmicznym i segmentacją adaptacyjną. Na zakończenie procesu kompresji MPEG dla dźwięku dokonuje się rozdziału do ramek, aby dekoder mógł poradzić sobie ze strumień danych w czasie rzeczywistym, podczas którego następuje jeszcze kompresja danych kodami Huffmana.

29 SCB struktura (de)kompresji 29

30 SCB struktura (de)kompresji Proces dekompresji algorytmu SBC jest o wiele mniej złożony niż kompresji. Sygnały, które zostały podczas kodowania rozmieszczone do ramek są teraz odczytywane. Podczas odczytu danych z ramek są one dekodowane kodami Huffmana. Kolejną czynnością jest połączenie sygnałów z 32 subpasm w jedno pasmo główne. Następnie dokonuje się rekonstrukcji sygnału głównego poprzez odwrócenie procesu skaningu sygnałów pod względem ich częstotliwości i długości. 30

31 SCB struktura (de)kompresji 31

32 INNE ALGORYTMY

33 Kwantyzacja Najprostszą metodą kompresji dźwięku jest kwantyzacja, zaliczana do metod stratnych. Błąd kwantyzacji jest łatwy do zmierzenia i zależy od liczby poziomów kwantyzacji. W systemach cyfrowych kwantyzacja jest używana do konwersji sygnałów analogowych na postać cyfrową przed zasadniczym procesem przetwarzania lub zastosowaniem bardziej zaawansowanych metod kompresji. 33

34 Kwantyzacja W większości przypadków kwantyzacji podlega tylko jedna próbka w danej chwili czasu. Czasami stosuje się jednak kwantyzację wektorową, czyli jednoczesne przetwarzanie ciągu próbek w jedną wartość liczbową. Metoda ta opiera się silnie na liniowych, nieliniowych i probabilistycznych zależnościach pomiędzy kolejnymi próbkami. W przypadku dźwięku osiąga się w ten sposób wysoki stopień kompresji dzięki usunięciu informacji nadmiarowych, jednakże wymaga to zaangażowania dużej ilości pamięci na bufory oraz stosowania procesorów sygnałowych. 34

35 Kodowanie Huffmana Jest to bezstratna metoda kodowania statystycznego, przedstawiona przez Davida A. Huffman w roku Wykorzystuje fakt, że pewne wartości danych występują częściej niż inne. Jeżeli zatem zakodujemy częściej występujące wartości za pomocą krótszych słów kodowych, a rzadziej występujące za pomocą dłuższych to sumarycznie ogólna długość zakodowanych danych będzie krótsza niż przed kodowaniem. 35

36 Kodowanie Huffmana Oznacza to konieczność wprowadzenia jednoznacznego systemu prefiksów - krótsze słowo kodowe nie może być początkiem dłuższego słowa kodowego (np. 110 i nie mogą być jednocześnie słowami kodowymi). Algorytm konstrukcji kodu Huffmana jest bardzo prosty. Na początku wszystkie symbole występujące w wejściowym strumieniu danych są sortowane w kolejności malejącej według ich częstości występowania. Stanowią one liście drzewa binarnego. 36

37 Kodowanie Huffmana Następnie tworzy się nowe węzły poprzez łączenie dwóch symboli o najmniejszych częstościach występowania w jeden symbol o częstości będącej sumą składowych. Algorytm kończy się, gdy zostanie tylko jeden symbol. Wystarczy teraz jednoznacznie oznaczyć gałęzie drzewa (np. wszystkie lewe przez 0 a wszystkie prawe przez 1) i poczynając od korzenia drzewa można rozpocząć odczytywanie słów kodowych dla symboli umieszczonych na liściach. 37

38 Kodowanie Huffmana Istnieją trzy możliwe warianty kodowania metodą Huffmana: statyczny: tabela częstotliwości symboli ustalana jest z góry, niezależnie od tego jakie dane są kodowane. dynamiczny: w celu wypełnienia tabeli częstotliwościami, dokładnie dla tych danych które są kodowane, przed rozpoczęciem kodowania dokonywana jest analiza częstotliwości symboli w strumieniu wejściowym. adaptacyjny: wstępne założenia o częstotliwości występowania symboli zostają w trakcie kodowania dostosowane do częstotliwości rzeczywiście występujących. 38

39 Kodowanie Huffmana Na początku zakodowanej informacji przekazywana jest tabela kodowa, która pozwala na przyporządkowanie kodom odpowiadających im wartości początkowych. Celem kodowania statystycznego jest przekazywanie jednej próbki za pomocą średnio krótszego ciągu bitów i tym samym redukowanie ilości danych aż do granic wyznaczanych przez entropię. Dlatego w przypadku tych metod mówi się o kodowaniu entropijnym (entropy coding). 39

40 Kodowanie Huffmana Istnieją trzy podstawowe wady metody Huffmana: 1. Z reguły częstości występowania poszczególnych symboli nie są znane przed rozpoczęciem kodowania. 2. Metoda jest nieskuteczna, gdy wszystkie symbole występują w strumieniu źródłowym z jednakową częstością. 3. Niemożliwość przewidzenia rozmiaru bufora na analizowane symbole do zakodowania. 40

41 Kodowanie arytmetyczne Jest to również metoda kodowania bezstratnego, ale w przeciwieństwie do kodowania Huffmana nie wymaga, aby każdy symbol był indywidualnie zakodowany przy użyciu najmniejszej możliwej ilości bitów. W większości przypadków pozwala to osiągnąć wyższy stopień kompresji, bliższy teoretycznej granicy wyznaczanej przez entropię, jednakże również wymaga przekazania słownika symboli do dekodera. 41

42 Kodowanie arytmetyczne Przy kodowaniu arytmetycznym częstości występowania poszczególnych symboli są zamieniane w pewien proporcjonalny do ich wartości zakres prawdopodobieństwa z przedziału [0,1]. Podczas kodowania kolejnych symboli ze strumienia danych prawdopodobieństwa te nakładają się na siebie, tworząc zakres zmniejszający się proporcjonalnie do wartości prawdopodobieństw nadchodzących symboli. 42

43 Kodowanie arytmetyczne W rezultacie otrzymujemy jedną liczbę rzeczywistą dla całego bloku podlegającemu kodowaniu. Dekodowanie następuje poprzez analizowanie tej liczby w odwrotnej kolejności. 43

44 Metody słownikowe Są to metody bezstratne, w których ciągi dowolnych symboli kodowane są za pomocą pojedynczych odwołań do słownika fraz. Można te metody podzielić na: statyczne (ze stałym słownikiem) i dynamiczne (ze słownikiem fraz tworzonym dynamicznie w trakcie kodowania i dekodowania). 44

45 Metody słownikowe Bardzo efektywnym algorytmem z tej grupy jest algorytm LZ77, opracowany w roku 1977 przez Lempela i Ziva, będący podstawą działania programu PKZIP. Słownik jest tutaj tworzony dynamicznie z wykorzystaniem okna analizy, podzielonym na okno słownikowe i okno robocze. 45

46 Metody słownikowe Proces kompresji strumienia danych napływających do okna analizy polega na zastępowaniu możliwie długich ciągów symboli z okna roboczego przez położenie (adres lub indeks) i długość identycznych ciągów w oknie słownikowym. Powstający strumień wyjściowy składa się z tzw. tokenów zawierających adres ciągu w oknie słownikowym, długość tego ciągu oraz pierwszy symbol występujący po ostatnio kodowanym ciągu. 46

47 Metody słownikowe Przy oknie słownikowym o długości 1024 symboli (adres 10-bitowy) i oknie roboczym mieszczącym 64 symbole (długość ciągu można zapisać na 6 bitach) można za pomocą 16 bitów opisać dwa pierwsze pola tokenu. Jeżeli pojedynczy symbol zajmuje jeden bajt, to maksymalna kompresja może dać zamiast 64 bajtów tylko 3. 47

48 Metody słownikowe Wady tej metody wynikają z ograniczonej wielkości okna słownikowego. Dawno użyte symbole przy napływie nowych danych stopniowo muszą opuszczać okno, a mogłyby być jeszcze użyteczne. 48

49 Metody słownikowe Konkurencyjnym algorytm został stworzony w roku 1984 i otrzymał nazwę LZW. Jest obecnie stosowany przy zapisie skompresowanych plików graficznych w formacie GIF. Zrezygnowano tu z okna roboczego a sam słownik (podobnie jak w LZ77) tworzony jest dynamicznie i automatycznie odtwarzany po stronie dekodera. 49

50 Metody słownikowe Na początku słownik zostaje wstępnie zapełniony jednoelementowymi frazami reprezentującymi wszystkie możliwe symbole wejściowe. Następnie ze strumienia wejściowego zostaje wybrany ciąg elementów o maksymalnej długości, dla którego w słowniku znajduje się identyczna fraza. 50

51 Metody słownikowe Jest on dodawany do słownika razem z kolejnym elementem ze strumienia wejściowego. Na wyjście wyprowadzany jest token zawierający kod (numer) znalezionego ciągu. Pierwszy symbol po ostatnim pobranym z wejścia ciągu staje się początkiem dalej analizowanej sekwencji. 51

52 Metody słownikowe Wadą algorytmu jest to, że słownik bardzo szybko się rozrasta, co wymusza albo zerowanie słownika co jakiś czas albo zaprzestanie dokładania do niego kolejnych fraz. 52

53 Metody słownikowe Wszystkie omówione powyżej metody bezstratne lepiej nadają się do kompresji tekstów niż do kompresji cyfrowego dźwięku. Zostały jednak omówione, gdyż często są wykorzystywane na ostatnim etapie kompresji po użyciu metod stratnych. 53

54 DCM Różnicowa modulacja kodowo-impulsowa (Differential Pulse Code Modulation - DPCM) to metoda kompresji stratnej, przeznaczona specjalnie dla sygnałów dźwiękowych i oparta o konwencjonalną modulację kodowo-impulsową. Różnica polega na tym, że koder PCM daje na wyjściu wartość aktualnej próbki podczas gdy koder DPCM jedynie wartość reprezentującą różnicę pomiędzy kolejnymi próbkami. 54

55 DCM Jeżeli częstotliwość próbkowania jest odpowiednio wysoka, wartości te powinny dać się zakodować przy pomocy mniejszej liczby bitów niż w tradycyjnym PCM. Opierając się na metodach predykcji, koder DPCM koduje różnicę między przewidywaną i rzeczywistą wartością każdej próbki. 55

56 DCM Dekoder natomiast odtwarza oryginalny sygnał akustyczny używając przewidzianej przez siebie wartości oraz zakodowanej różnicy. Jak w każdej metodzie predykcyjnej, efektywność DPCM zależy od zdolności algorytmu predykcji do nadążania za zmianami w sygnale wejściowym. 56

57 DM Modulacja Delta (Delta Modulation - DM) może być rozpatrywana jako szczególny przypadek DPCM. Różnica objawia się tym, że DM używa tylko jednego bitu do zakodowania różnicy między wartością przewidzianą a aktualną. Chociaż ułatwia to bardzo realizację sprzętową oraz samą operację kodowania, to wymaga jednak wyższej częstotliwości próbkowania sygnału w porównaniu do konwencjonalnego PCM. 57

58 DM Poza tym, ponieważ tylko dwie wartości (0 lub 1) są używane do zakodowania różnicy, wielkość przyrostu po stronie dekodera jest krytyczna. Projektując system DM należy zatem dokonać kompromisu pomiędzy częstotliwością próbkowania a wspomnianą wielkością przyrostu. 58

59 DM Dla wysokich częstotliwości na wejściu osiągnięcie odpowiedniej częstotliwości próbkowania staje się bardzo trudne, a ze względu na istnienie tylko dwóch poziomów kwantyzacji, błąd kwantyzacji staje się bardzo widoczny. Z drugiej strony jednak dekoder DM nie musi zawierać przetworników A/C i C/A, które mogą zostać zastąpione przez znacznie tańsze układy całkujące. 59

60 ADM Adaptacyjna modulacja Delta (Adaptive Delta Modulation - ADM) to modyfikacja modulacji Delta, przezwyciężająca kilka jej niedogodności. W szczególności techniki adaptacyjne zostały tutaj zaimplementowane w celu zredukowania zniekształceń impulsowych i błędu kwantyzacji. Wielkość przyrostu może się zatem zmieniać w zależności od chwilowych potrzeb. 60

61 ADM Jeżeli sygnał wejściowy zmienia się szybciej, wielkość przyrostu również wzrasta. Jeżeli sygnał wejściowy pozostaje w przybliżeniu stały, wielkość przyrostu jest zmniejszana aby lepiej śledzić zmiany sygnału z mniejszym błędem kwantyzacji. Również i w tej metodzie trzeba dokonać kompromisu pomiędzy złożonością projektu a dokładnością algorytmu predykcji. 61

62 ADPCM Adaptacyjna modulacja kodowo-impulsowa Delta (Adaptive Delta Pulse Code Modulation - ADPCM), często nazywana również adaptacyjnoróżnicową modulacją kodowo-impulsową (Adaptive Differential Pulse Code Modulation) łączy w sobie zalety metod ADM i PCM. 62

63 ADPCM Mówiąc ściśle, jednobitowy schemat kodowania został zastąpiony schematem wielobitowym. Poza zwiększeniem ilości poziomów kwantyzacji, osiągnięto większą dokładność i efektywność przy generowaniu zmiennej wielkości przyrostu poprzez przypisanie każdemu poziomowi kwantyzacji własnego współczynnika skalowalności. 63

64 STANDARD MPEG

65 MPEG Layer-2 Format ten - jak łatwo się domyślić - poprzedzał wejście MP3. Zastosowano tu mniej wyrafinowane algorytmy kompresji. Używany (obecnie rzadko) tylko wśród profesjonalistów, gdyż powstało sporo sprzętowych dekoderów do tego formatu: zużywa bardzo mało zasobów podczas odtwarzania niekomercyjny mało wydajny algorytm kompresji (standardowy bitrate to 192 kbps) 65

66 MPEG Layer-2 Format MPEG-Audio (Wydanie II) zbudowany jest podobnie jak algorytm PASC (Precision Adapptive Subband Coding) firmy Philips, stosowany na kasetach DCC (Digital Compact Cassete - cyfrowa kaseta kompaktowa). Chodzi tu, podobnie jak w przypadku formatu MPEG-Video, o najefektywniejszą w chwili obecnej metodę kompresji. 66

67 MPEG Layer-2 Punktem wyjścia dla omawianej metody jest model psychoakustyczny. Jak we wszystkich algorytmach kompresji pracujących ze stratami, wykorzystuje się tu niedostatki możliwości percepcyjnych człowieka. Z przetwarzanego sygnału usuwa się nie tylko informacje redundantne (nadmiarowe), lecz także częstotliwości, które nie będą zauważone. Przy użyciu 32 filtrów pasmowych analizuje się spektrum częstotliwości akustycznych z podziałem na subpasma. 67

68 MPEG Layer-2 Sygnały leżące poza zakresem słyszalności człowieka nie są uwzględniane. Wykorzystuje się przy tym efekt maskowania - sygnały głośniejsze zagłuszają sąsiadujące z nimi sygnały słabsze, tak więc te słabsze są maskowane i nie muszą być rejestrowane. Może się wiec zmieniać długość słowa bitowego. 68

69 MPEG Layer-2 Stosując format MPEG-Audio można, w zależności od możliwej szybkości transmisji danych, uzyskać bardzo rożne efekty. Osiągalna jest nawet jakość klasy Redbook-Audio - i to przy o wiele mniejszej prędkości bitowej rzędu 256 kb/s dla przekazu stereo (dla porównania: prędkość bitowa dla CD-Audio sięga około 1,4 Mb/s). Zależnie od rodzaju zastosowania i dostępnego sprzętu dodatkowego - do wyboru są trzy tzw. "wydania" formatu MPEG-Audio o różnych parametrach. 69

70 MPEG Layer-2 Wydania I i II formatu umożliwiają uzyskanie, w oparciu o bank filtrów, wspomnianych wyżej 32 prezentacji subpasmowych sygnału wejściowego, następnie ich kwantowanie i kodowanie z uwzględnieniem modelu psychoakustycznego, w oparciu o który następuje również blokowe adaptacyjne przyporządkowanie bitów. 70

71 MPEG Layer-2 Uwzględniając wszystkie wymogi Wydania I, Wydanie II realizuje ponadto dalszą kompresję, eliminując występujące redundancje i dokonując zmian współczynnika skalowania, umożliwiając tym samym precyzyjniejsze kwantowanie. W Wydaniu III każde z subpasm podlega dodatkowej analizie poprzez wykonanie dla każdego z nich dodatkowych 12 próbek. Aby uzyskać większa efektywność kodowania, stosuje się kwantowanie nieliniowe, segmentację adaptacyjną i kodowanie metodą Huffmana. 71

72 MPEG Layer-2 Skala możliwych prędkości bitowych sięga (dla obu kanałów) od 64 kb/s do 448 kb/s. Standard dopuszcza również kodowanie z prędkością 32 kb/s dla jednego kanału. Możliwe częstotliwości próbkowania wynoszą 44,1 khz, 48 khz i 32 khz. We wszystkich wydaniach formatu MPEG może być stosowany specjalny tryb Joint Stereo, który umożliwia wyszukiwanie w poszczególnych subpasmach redundantnych informacji, będących rezultatem trybu stereo. 72

73 MPEG Layer-3 Bardziej zaawansowany, złożony i jak dotąd najpopularniejszy standard Layer3 został opracowany w niemieckim instytucie Fraunhofer, a konkretnie w departamencie Audio i Multimedia, gdzie około 30 inżynierów pracuje nad rozwojem oraz implementacja w czasie rzeczywistym algorytmów przetwarzania sygnałów dla potrzeb komunikacji audiowizualnej. 73

74 MPEG Layer-3 Prace rozpoczęto w roku 1987, przy ścisłej współpracy z uniwersytetem Erlangen, w celu opracowania zaawansowanego algorytmu kodowania sygnałów audio dla przyszłych stacji nadawczych (np. Eureka 147, DAB radio ). W roku 1991 prace nad algorytmem kodowania Layer3 zostały ukończone i stał się on najbardziej optymalnym sposobem kodowania sygnałów audio w rodzinie określanej przez międzynarodowe normy ISO-MPEG. 74

75 MPEG Layer-3 Używając tego algorytmu (znanego powszechnie w internecie jako MP3, ze względu na rozszerzenie) do kodowania plików audio, jakość prawie CD tj. stereo, 44KHz, 16 bitów, można uzyskać przy kbps (stopień kompresji 11:1-13:1). 75

76 MPEG Layer-3 Wszystkie standardy mpeg audio używają tego samego schematu kodowania. Może być on określony jako maskowanie szumów. Koder analizuje widmo sygnału i następnie dostosowuje go do modelu psuchoakustycznego poprzez oszacowanie dopuszczalnego, niesłyszalnego poziomu szumów. 76

77 MPEG Layer-3 Koder standardu Layer2 dzieli widmo sygnału ( od 20Hz do 20KHz ) na 32 podzakresy. W każdym podzakresie zawarta jest część analizowanego dźwięku. Na przykład, w podzakresie 8 obecny jest ton o częstotliwości 6500 Hz i poziomie 60dB. 77

78 MPEG Layer-3 Obliczany jest wówczas efekt maskujący tego dźwięku - okazuje się że w obrębie tego podzakresu maskowane są dźwięki o poziomie niższym od 35 db. Dopuszczalny s/n wynosi zatem = 25dB. To odpowiada rozdzielczości 4 bitów. 78

79 MPEG Layer-3 Dodatkowo maskowanie występuje również w podzakresach 9-13 oraz 5-7.Maleje ono wraz z odległością od zakresu 8. W rzeczywistości dźwięki występują we wszystkich podzakresach i efekt maskowania sumuje się. Dodatkowo koder wykorzystuje zmienną czułość ucha ludzkiego dla różnych częstotliwości. Ucho jest mniej czułe na wysokie i niskie dźwięki, szczyt czułości leży w okolicach 2-4 khz. 79

80 MPEG Layer-3 W standardzie MPEG Layer2 każdy podzakres posiada szerokość 750Hz (dla częstotliwości próbkowania 48kHz), ale lepiej jest gdy podzakresów jest więcej, oraz są one węższe dla niskich częstotliwości i szersze dla wysokich. Layer3 (MP3) posiada 18 razy większą rozdzielczość i dodatkowo wykorzystuje efekt maskowania przed i po wystąpieniu silnego dźwięku. 80

81 MPEG Layer-3 Wytłumaczyć go można ograniczonymi możliwościami mózgu (szybkość transportu bodźca nerwowego). Przedmaskowanie występuje w bardzo krótkim czasie od 2 d 5 ms, natomiast czas maskowania po sygnale to ponad 100 ms Inną własnością, tym razem sygnału stereo, wykorzystywaną podczas kompresji to występowanie korelacji pomiędzy kanałami. Używany jest wówczas tryb joint-stereo, co więcej Layer3 redukuje ten nadmiar poprzez użycie kodowania Huffmana. 81

82 MPEG Layer-3 Koder kompresuje dany wycinek sygnału metodą iteracyjną tak długo aż osiągnie pożądaną dokładność. W standardach Layer2 i Layer3 prowadzi on obliczenia na odcinkach trwających 24 ms (zawierających 1152 próbek i fs = 48 khz). Dla niektórych dźwięków może to stanowić problem, np. dla sygnału w którym różnica pomiędzy dźwiękiem bardzo silnym i słabym wynosi ponad 24 ms (np. wystrzał). 82

83 MPEG Layer-3 Efekt maskowania obliczany jest dla najsilniejszego dźwięku po którym można usłyszeć szum kwantyzacji (jest to odbierane przez ucho jako szumowe echo ). Layer 3 radzi sobie z tym poprzez analizę mniejszego okna (4 ms), gdy koder wykryje powyższą sytuację. 83

84 MPEG4 MPEG4 Audio określa także kodowanie dźwięku naturalnego, dla pasma przesyłania począwszy od 2 kbps. Stosowane są 3 rodzaje kodeków: PARA (Parametric Codec) dla najniższych przepustowości, CELP (Code Excited Linear Predictive) dla średnich, oraz TF (Time- Frequency), zawierający MPEG-2 AAC, który pozwala na uzyskanie najwyższej jakości dźwięku. 88

85 MPEG4 MPEG4 oferuje także nowe możliwości, jak kontrola szybkości przesyłania i położenia widma sygnału, wyciszanie błędów oraz skalowalność, w której skład wchodzi: skalowalność prędkości przesyłania (bitrate scalability), pozwala na przekształcenie określonego strumienia bitów w strumień o niższej szybkości przesyłania, umożliwiając bezbłędną transmisję w zmiennych warunkach, skalowalność pasma przenoszenia (bandwidth scalability) gdzie określone części strumienia bitów przesyłają odpowiednie fragmenty widma sygnału. W gorszych warunkach możliwe jest zawężenie przesyłanego widma, bez szkody dla zrozumiałości materiału, 89

86 90 MPEG4 skalowalność złożoności kodera (coder complexity scalability), pozwala koderom o różnym stopniu złożoności na generowanie poprawnego oraz zgodnego z normą sygnału, skalowalność złożoności dekodera (decoder complexity scalability), pozwala na poprawne dekodowanie sygnału przez dekodery o różnym stopniu złożoności Najogólniej, jakość dźwięku zależy od stopnia złożoności kodera i dekodera, system korekcji błędów (error robustness) umożliwia dekoderowi korekcję lub ukrycie słyszalnych zniekształceń spowodowanych błędami w trakcie transmisji.

87 MPEG4 W MPEG4 jednym ze skalowanych formatów jest standard BASC (Bit Sliced Arithmetic Coding), sposób kodowania zbliżony jest do AAC, koder różni się jedynie ulepszonym modułem odpowiedzialnym za dynamikę. Dzięki temu, przy zawężeniu pasma transmisji poniżej 40 kbps, pogorszenie jakości jest prawie niezauważalne. W praktyce, podczas transmisji koder jest w stanie zmieniać pasmo od 16 do 64 kbps, z krokiem 1 kbps. 91

88 MPEG4 SAOL (Structured Audio Orchestra Language) definiuje orkiestrę za pomocą poszczególnych instrumentów. Instrument jest to niewielka sieć danych dla procesora sygnałowego, pozwalająca na emulację naturalnego brzmienia instrumentu muzycznego. 92

89 MPEG4 SASL (Structured Audio Score Language) jest używany do tworzenia nowych efektów oraz zawiera informacje służące modyfikowaniu istniejącego dźwięku Pozwala na lepszą kontrolę syntezy oraz bardziej naturalny efekt końcowy. W przypadku, gdy nie jest wymagana szczegółowa kontrola, do przesyłania danych o instrumentach może być wykorzystany protokół MIDI. 93

90 MPEG4 W formacie MPEG4 po raz pierwszy pojawia się także pojęcie "obiektu audio". Najprościej można go zdefiniować jako słyszalną część docierającego do odbiorcy materiału dźwiękowego, zakodowaną za pomocą pojedynczego strumienia bitów. Może to być np. głos jednego lub kilku mówców, dźwięk jednego lub kilku instrumentów lub tło akustyczne. Obiekty audio mogą być grupowane oraz miksowane, przy czym rozdzielenie pojedynczego obiektu na mniejsze składowe jest już dosyć trudne. 94

91 MPEG4 Możliwości wykorzystania tego sposobu transmisji są bardzo rozległe: do odbiorcy, poprzez 5 kanałów przesyłany jest dźwięk z pięciu różnych instrumentów wchodzących w skład orkiestry. Odbiorca może np. wyłączyć jeden z instrumentów i grać razem z pozostałymi członkami zespołu, 95

92 96 MPEG4 transmisja wydarzeń sportowych w kilku językach interaktywne filmy oraz aplikacje video, korzystające z obiektowego opisu sceny, np. w typowej sekwencji z filmu, rozgrywającej się na dworcu kolejowym, można wyróżnić kilka obiektów audio: rozmowa pomiędzy aktorami, najważniejszy element sceny, tło akustyczne, np. gwar dworcowy oraz odgłosy nadjeżdżających pociągów, zapowiedzi speakera o przyjazdach i odjazdach pociągów, tło muzyczne (ścieżka dźwiękowa).

93 MPEG4 Każdy z obiektów dźwiękowych może być dowolnie modyfikowany, zależnie od potrzeb. W trudniejszych warunkach transmisji, możliwe jest ograniczenie pasma lub całkowite usunięcie obiektów nie mających wpływu na treść przekazu. 97

94 MPEG4 Format MPEG4 oferuje znacznie więcej niż jego poprzednicy: MPEG1 oraz MPEG2. Oprócz narzędzi umożliwiających kompresję i przesyłanie dźwięku naturalnego, wzbogacony został o możliwości syntezy dźwięku po stronie odbiorcy oraz skalowania przesyłanego strumienia bitów. 98

95 MPEG4 Trwają także prace nad formatem MPEG7, który ma połączyć większość aplikacji multimedialnych w jedną całość. Pozwoli to na łatwe zarządzanie multimedialnymi zasobami Internetu: wyszukiwanie, sprzedaż lub udostępnianie utworów oraz filmów. 99

96 MPEG Layer-3 PRO W mp3 pro zastosowano prosty i skuteczny jednocześnie trik: program dzieli dźwięk na dwa odrębne strumienie. Pierwszy to częstotliwości 0-11 khz (czyli jakość pliku wav o częstotliwości 22kHz), drugi to strumień khz (tony wysokie). Przypominam, że częstotliwość słyszalna jest dwa razy mniejsza od częstotliwości próbkowania w pliku. Np. audio CD ma 44.1 khz/16bit dźwięk, więc słychać max. do 22 khz (w praktyce ludzkie ucho wyłapuje częstotliwości od 20Hz do 19kHz, więc do przechowywania dźwięku na CD wystarczyłoby próbkowanie 38kHz). 100

97 MPEG Layer-3 PRO Takie rozdzielenie jak się okazało daje o wiele lepsze rezultaty, niż zakodowanie wszystkiego naraz. Plik mp3 pro 64 kbps ma jakość zbliżoną do mp3 112 kbps. 101

98 MPEG Layer-3 PRO Muzyka skompresowanej do formatu mp3 przy 128 kbps brzmi świetnie. Ale wraz ze zmniejszeniem bitrate u zaczyna brakować wysokich częstotliwości. Przy bitrate 64 kbps i niżej muzyka może zacząć brzmieć kiepsko. Powodem tego jest to, że mp3 przy tak niskich bitrate'ach zaczyna brakować bitów, aby skompresować muzykę w pełnym paśmie dźwiękowym i detalach. 102

99 MPEG Layer-3 PRO W tej sytuacji twórcy mp3 musieli zdecydować, czy ich kodek powinien produkować mp3 ze zniekształceniami (tak zwane artefakty kodowania ), czy z ograniczonym pasmem przenoszenia. Zdecydowali się na ograniczenie pasma. 103

100 MPEG Layer-3 PRO Tak więc w rezultacie otrzymujemy mp3 o niskim bitrate'cie jako muzykę z ograniczonym pasmem przenoszenia z niewielką ilością zniekształceń. 104

101 MPEG Layer-3 PRO Aby polepszyć jakość dźwięku przy niskich bitrate'ach, Coding Technologies opracowało rozszerzenie, które pozwala odtworzyć wysokie częstotliwości. Ta technologia nazywa się Spectral Band Replication (SBR). SBR jest bardzo wydajną metodą służącą do generowania wysokich częstotliwości sygnału audio. 105

102 MPEG Layer-3 PRO Łącząc mp3 z technologią SBR uzyskujemy sygnał audio zawierający wysokie częstotliwości przy niskich bitrate'ach. Mp3PRO, uzyskany format audio składa się z dwóch składowych, części mp3 dla niskich częstotliwości i części SBR lub "PRO" dla wysokich częstotliwości. Ponieważ część "PRO" wymaga jedynie kilku kbps, nowy format mógł zostać stworzony w sposób, który wciąż jest kompatybilny z oryginalnym mp3. 106

103 MPEG Layer-3 PRO Pozwala to na odtwarzanie plików mp3pro za pomocą już istniejących odtwarzaczy mp3. Po prostu ignorują one część PRO. Jedynym wymogiem jest, aby wspierały odtwarzanie próbkowania 16, 22.5 i 24 khz wraz z 32, 44.1 i 48 khz. 107

Kompresja dźwięku w standardzie MPEG-1

Kompresja dźwięku w standardzie MPEG-1 mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 7, strona 1. Kompresja dźwięku w standardzie MPEG-1 Ogólne założenia kompresji stratnej Zjawisko maskowania psychoakustycznego Schemat blokowy

Bardziej szczegółowo

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania Kodowanie podpasmowe Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania Zasada ogólna Rozkład sygnału źródłowego na części składowe (jak w kodowaniu transformacyjnym) Wada kodowania

Bardziej szczegółowo

Kwantowanie sygnałów analogowych na przykładzie sygnału mowy

Kwantowanie sygnałów analogowych na przykładzie sygnału mowy Kwantowanie sygnałów analogowych na przykładzie sygnału mowy Treść wykładu: Sygnał mowy i jego właściwości Kwantowanie skalarne: kwantyzator równomierny, nierównomierny, adaptacyjny Zastosowanie w koderze

Bardziej szczegółowo

Sprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów

Sprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów Sprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów 1. Przekształcenie sygnału analogowego na postać cyfrową określamy mianem: a. digitalizacji

Bardziej szczegółowo

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Spis treści Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Formaty plików audio różnią się od siebie przede wszystkim zastosowanymi algorytmami kompresji. Kompresja danych polega na

Bardziej szczegółowo

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Spis treści Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Formaty plików audio różnią się od siebie przede wszystkim zastosowanymi algorytmami kompresji. Kompresja danych polega na

Bardziej szczegółowo

Cechy karty dzwiękowej

Cechy karty dzwiękowej Karta dzwiękowa System audio Za generowanie sygnału dźwiękowego odpowiada system audio w skład którego wchodzą Karta dźwiękowa Głośniki komputerowe Większość obecnie produkowanych płyt głównych posiada

Bardziej szczegółowo

Przygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa

Przygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa Przygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa Dźwięk wrażenie słuchowe, spowodowane falą akustyczną rozchodzącą się w ośrodku sprężystym (ciele stałym, cieczy, gazie). Częstotliwości fal, które

Bardziej szczegółowo

Teoria przetwarzania A/C i C/A.

Teoria przetwarzania A/C i C/A. Teoria przetwarzania A/C i C/A. Autor: Bartłomiej Gorczyński Cyfrowe metody przetwarzania sygnałów polegają na przetworzeniu badanego sygnału analogowego w sygnał cyfrowy reprezentowany ciągiem słów binarnych

Bardziej szczegółowo

Autorzy: Tomasz Sokół Patryk Pawlos Klasa: IIa

Autorzy: Tomasz Sokół Patryk Pawlos Klasa: IIa Autorzy: Tomasz Sokół Patryk Pawlos Klasa: IIa Dźwięk wrażenie słuchowe, spowodowane falą akustyczną rozchodzącą się w ośrodku sprężystym (ciele stałym, cieczy, gazie). Częstotliwości fal, które są słyszalne

Bardziej szczegółowo

Neurobiologia na lekcjach informatyki? Percepcja barw i dźwięków oraz metody ich przetwarzania Dr Grzegorz Osiński Zakład Dydaktyki Fizyki IF UMK

Neurobiologia na lekcjach informatyki? Percepcja barw i dźwięków oraz metody ich przetwarzania Dr Grzegorz Osiński Zakład Dydaktyki Fizyki IF UMK Neurobiologia na lekcjach informatyki? Percepcja barw i dźwięków oraz metody ich przetwarzania Dr Grzegorz Osiński Zakład Dydaktyki Fizyki IF UMK IV Konferencja Informatyka w Edukacji 31.01 01.02. 2007

Bardziej szczegółowo

DŹWIĘK. Dźwięk analogowy - fala sinusoidalna. Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona

DŹWIĘK. Dźwięk analogowy - fala sinusoidalna. Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona DŹWIĘK Dźwięk analogowy - fala sinusoidalna Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona Dźwięk cyfrowy 2-bitowy 2 bity 4 możliwe stany (rozdzielczość dwubitowa) 8 bitów - da

Bardziej szczegółowo

Kwantyzacja wektorowa. Kodowanie różnicowe.

Kwantyzacja wektorowa. Kodowanie różnicowe. Kwantyzacja wektorowa. Kodowanie różnicowe. Kodowanie i kompresja informacji - Wykład 7 12 kwietnia 2010 Kwantyzacja wektorowa wprowadzenie Zamiast kwantyzować pojedyncze elementy kwantyzujemy całe bloki

Bardziej szczegółowo

2. STRUKTURA RADIOFONICZNYCH SYGNAŁÓW CYFROWYCH

2. STRUKTURA RADIOFONICZNYCH SYGNAŁÓW CYFROWYCH 1. WSTĘP Radiofonię cyfrową cechują strumienie danych o dużych przepływnościach danych. Do przesyłania strumienia danych o dużych przepływnościach stosuje się transmisję z wykorzystaniem wielu sygnałów

Bardziej szczegółowo

Dźwięk podstawowe wiadomości technik informatyk

Dźwięk podstawowe wiadomości technik informatyk Dźwięk podstawowe wiadomości technik informatyk I. Formaty plików opisz zalety, wady, rodzaj kompresji i twórców 1. Format WAVE. 2. Format MP3. 3. Format WMA. 4. Format MIDI. 5. Format AIFF. 6. Format

Bardziej szczegółowo

Percepcja dźwięku. Narząd słuchu

Percepcja dźwięku. Narząd słuchu Percepcja dźwięku Narząd słuchu 1 Narząd słuchu Ucho zewnętrzne składa się z małżowiny i kanału usznego, zakończone błoną bębenkową, doprowadza dźwięk do ucha środkowego poprzez drgania błony bębenkowej;

Bardziej szczegółowo

Kompresja Kodowanie arytmetyczne. Dariusz Sobczuk

Kompresja Kodowanie arytmetyczne. Dariusz Sobczuk Kompresja Kodowanie arytmetyczne Dariusz Sobczuk Kodowanie arytmetyczne (lata 1960-te) Pierwsze prace w tym kierunku sięgają początków lat 60-tych XX wieku Pierwszy algorytm Eliasa nie został opublikowany

Bardziej szczegółowo

Technika audio część 2

Technika audio część 2 Technika audio część 2 Wykład 12 Projektowanie cyfrowych układów elektronicznych Mgr inż. Łukasz Kirchner lukasz.kirchner@cs.put.poznan.pl http://www.cs.put.poznan.pl/lkirchner Wprowadzenie do filtracji

Bardziej szczegółowo

dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db

dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db 1 Sygnał foniczny poziom analogowy czas cyfrowy poziom czas

Bardziej szczegółowo

Psychoakustyka. Dźwięk zapisany w formie nieskompresowanej na przykład na CD zawiera więcej informacji niż jest w stanie przetworzyć ludzki mózg.

Psychoakustyka. Dźwięk zapisany w formie nieskompresowanej na przykład na CD zawiera więcej informacji niż jest w stanie przetworzyć ludzki mózg. Standard MP3 Historia Standard MPEG-1 - "Layer3" został opracowany w niemieckim instytucie Fraunhofer, a konkretnie w departamencie "Audio i Multimedia", gdzie około 30 inżynierów pracuje nad rozwojem

Bardziej szczegółowo

Przygotowała: prof. Bożena Kostek

Przygotowała: prof. Bożena Kostek Przygotowała: prof. Bożena Kostek Ze względu na dużą rozpiętość mierzonych wartości ciśnienia (zakres ciśnień akustycznych obejmuje blisko siedem rzędów wartości: od 2x10 5 Pa do ponad 10 Pa) wygodniej

Bardziej szczegółowo

Kompresja sekwencji obrazów - algorytm MPEG-2

Kompresja sekwencji obrazów - algorytm MPEG-2 Kompresja sekwencji obrazów - algorytm MPEG- Moving Pictures Experts Group (MPEG) - 988 ISO - International Standard Organisation CCITT - Comité Consultatif International de Téléphonie et TélégraphieT

Bardziej szczegółowo

Wybrane metody kompresji obrazów

Wybrane metody kompresji obrazów Wybrane metody kompresji obrazów Celem kodowania kompresyjnego obrazu jest redukcja ilości informacji w nim zawartej. Redukcja ta polega na usuwaniu informacji nadmiarowej w obrazie, tzw. redundancji.

Bardziej szczegółowo

Audio i video. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

Audio i video. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski Audio i video R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski s-rg@siwy.il.pw.edu.pl Fale dźwiękowe Dźwięk jest drganiem powietrza rozchodzącym się w postaci fali. Fala ma określoną amplitudę i częstotliwość.

Bardziej szczegółowo

Co to jest dźwięk. Dźwięk to wyrażenie słuchowe wywołane przez falę akustyczną. Ludzki narząd wyłapuje dźwięki z częstotliwością 16 do 20 Hz

Co to jest dźwięk. Dźwięk to wyrażenie słuchowe wywołane przez falę akustyczną. Ludzki narząd wyłapuje dźwięki z częstotliwością 16 do 20 Hz Dźwięk Co to jest dźwięk Dźwięk to wyrażenie słuchowe wywołane przez falę akustyczną. Ludzki narząd wyłapuje dźwięki z częstotliwością 16 do 20 Hz Próbkowanie Cyfrowy zapis dźwięku opiera się na procedurze

Bardziej szczegółowo

Rozpoznawanie i synteza mowy w systemach multimedialnych. Analiza i synteza mowy - wprowadzenie. Spektrogram wyrażenia: computer speech

Rozpoznawanie i synteza mowy w systemach multimedialnych. Analiza i synteza mowy - wprowadzenie. Spektrogram wyrażenia: computer speech Slajd 1 Analiza i synteza mowy - wprowadzenie Spektrogram wyrażenia: computer speech Slide 1 Slajd 2 Analiza i synteza mowy - wprowadzenie Slide 2 Slajd 3 Analiza i synteza mowy - wprowadzenie Slide 3

Bardziej szczegółowo

Transformata Fouriera

Transformata Fouriera Transformata Fouriera Program wykładu 1. Wprowadzenie teoretyczne 2. Algorytm FFT 3. Zastosowanie analizy Fouriera 4. Przykłady programów Wprowadzenie teoretyczne Zespolona transformata Fouriera Jeżeli

Bardziej szczegółowo

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki Studia Podyplomowe INFORMATYKA Podstawy Informatyki Wykład II Reprezentacja danych w technice cyfrowej 1 III. Reprezentacja danych w komputerze Rodzaje danych w technice cyfrowej 010010101010 001010111010

Bardziej szczegółowo

Spis treści. 1. Cyfrowy zapis i synteza dźwięku Schemat blokowy i zadania karty dźwiękowej UTK. Karty dźwiękowe. 1

Spis treści. 1. Cyfrowy zapis i synteza dźwięku Schemat blokowy i zadania karty dźwiękowej UTK. Karty dźwiękowe. 1 Spis treści 1. Cyfrowy zapis i synteza dźwięku... 2 2. Schemat blokowy i zadania karty dźwiękowej... 4 UTK. Karty dźwiękowe. 1 1. Cyfrowy zapis i synteza dźwięku Proces kodowania informacji analogowej,

Bardziej szczegółowo

Założenia i obszar zastosowań. JPEG - algorytm kodowania obrazu. Geneza algorytmu KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG

Założenia i obszar zastosowań. JPEG - algorytm kodowania obrazu. Geneza algorytmu KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG Założenia i obszar zastosowań KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG Plan wykładu: Geneza algorytmu Założenia i obszar zastosowań JPEG kroki algorytmu kodowania obrazu Założenia: Obraz monochromatyczny

Bardziej szczegółowo

Formaty kompresji audio

Formaty kompresji audio Formaty kompresji audio Kompresja bezstratna Kompresja bezstratna zachowuje pełną informację o przebiegu sygnału dźwiękowego. Polega ona na sprytnej zmianie sposobu zapisu danych, dzięki czemu zapis jest

Bardziej szczegółowo

Przetwarzanie i transmisja danych multimedialnych. Wykład 5 Kodowanie słownikowe. Przemysław Sękalski.

Przetwarzanie i transmisja danych multimedialnych. Wykład 5 Kodowanie słownikowe. Przemysław Sękalski. Przetwarzanie i transmisja danych multimedialnych Wykład 5 Kodowanie słownikowe Przemysław Sękalski sekalski@dmcs.pl Politechnika Łódzka Katedra Mikroelektroniki i Technik Informatycznych DMCS Przemysław

Bardziej szczegółowo

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 4, strona 1. GOLOMBA I RICE'A

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 4, strona 1. GOLOMBA I RICE'A mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 4, strona 1. KOMPRESJA ALGORYTMEM ARYTMETYCZNYM, GOLOMBA I RICE'A Idea algorytmu arytmetycznego Przykład kodowania arytmetycznego Renormalizacja

Bardziej szczegółowo

Program wykładu. informatyka + 2

Program wykładu. informatyka + 2 Program wykładu 1. Jak słyszymy podstawy fizyczne i psychofizyczne, efekty maskowania 2. Sposoby zapisu sygnałów dźwiękowych 3. Sposoby kodowania sygnałów dźwiękowych ze szczególnym uwzględnieniem MP3

Bardziej szczegółowo

Kodowanie i kompresja Streszczenie Studia dzienne Wykład 9,

Kodowanie i kompresja Streszczenie Studia dzienne Wykład 9, 1 Kody Tunstalla Kodowanie i kompresja Streszczenie Studia dzienne Wykład 9, 14.04.2005 Inne podejście: słowa kodowe mają ustaloną długość, lecz mogą kodować ciągi liter z alfabetu wejściowego o różnej

Bardziej szczegółowo

2. Próbkowanie Sygnały okresowe (16). Trygonometryczny szereg Fouriera (17). Częstotliwość Nyquista (20).

2. Próbkowanie Sygnały okresowe (16). Trygonometryczny szereg Fouriera (17). Częstotliwość Nyquista (20). SPIS TREŚCI ROZDZIAŁ I SYGNAŁY CYFROWE 9 1. Pojęcia wstępne Wiadomości, informacje, dane, sygnały (9). Sygnał jako nośnik informacji (11). Sygnał jako funkcja (12). Sygnał analogowy (13). Sygnał cyfrowy

Bardziej szczegółowo

Podstawy Przetwarzania Sygnałów

Podstawy Przetwarzania Sygnałów Adam Szulc 188250 grupa: pon TN 17:05 Podstawy Przetwarzania Sygnałów Sprawozdanie 6: Filtracja sygnałów. Filtry FIT o skończonej odpowiedzi impulsowej. 1. Cel ćwiczenia. 1) Przeprowadzenie filtracji trzech

Bardziej szczegółowo

Kompresja sekwencji obrazów

Kompresja sekwencji obrazów Kompresja sekwencji obrazów - algorytm MPEG-2 Moving Pictures Experts Group (MPEG) - 1988 ISO - International Standard Organisation CCITT - Comité Consultatif International de Téléphonie T et TélégraphieT

Bardziej szczegółowo

Przesył mowy przez internet

Przesył mowy przez internet Damian Goworko Zuzanna Dziewulska Przesył mowy przez internet organizacja transmisji głosu, wybrane kodeki oraz rozwiązania podnoszące jakość połączenia głosowego Telefonia internetowa / voice over IP

Bardziej szczegółowo

Konwersja dźwięku analogowego do postaci cyfrowej

Konwersja dźwięku analogowego do postaci cyfrowej Konwersja dźwięku analogowego do postaci cyfrowej Schemat postępowania podczas przetwarzania sygnału analogowego na cyfrowy nie jest skomplikowana. W pierwszej kolejności trzeba wyjaśnić kilka elementarnych

Bardziej szczegółowo

Fale dźwiękowe. Jak człowiek ocenia natężenie bodźców słuchowych? dr inż. Romuald Kędzierski

Fale dźwiękowe. Jak człowiek ocenia natężenie bodźców słuchowych? dr inż. Romuald Kędzierski Fale dźwiękowe Jak człowiek ocenia natężenie bodźców słuchowych? dr inż. Romuald Kędzierski Podstawowe cechy dźwięku Ze wzrostem częstotliwości rośnie wysokość dźwięku Dźwięk o barwie złożonej składa się

Bardziej szczegółowo

Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.

Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2. Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2. Technika obrazu 24 W.3. Normalizacja w zakresie obrazu cyfrowego

Bardziej szczegółowo

Kompresja danych DKDA (7)

Kompresja danych DKDA (7) Kompresja danych DKDA (7) Marcin Gogolewski marcing@wmi.amu.edu.pl Uniwersytet im. Adama Mickiewicza w Poznaniu Poznań, 22 listopada 2016 1 Kwantyzacja skalarna Wprowadzenie Analiza jakości Typy kwantyzatorów

Bardziej szczegółowo

Pomiary w technice studyjnej. TESTY PESQ i PEAQ

Pomiary w technice studyjnej. TESTY PESQ i PEAQ Pomiary w technice studyjnej TESTY PESQ i PEAQ Wprowadzenie Problem: ocena jakości sygnału dźwiękowego. Metody obiektywne - np. pomiar SNR czy THD+N - nie dają pełnych informacji o jakości sygnału. Ważne

Bardziej szczegółowo

Andrzej Leśnicki Laboratorium CPS Ćwiczenie 9 1/5 ĆWICZENIE 9. Kwantowanie sygnałów

Andrzej Leśnicki Laboratorium CPS Ćwiczenie 9 1/5 ĆWICZENIE 9. Kwantowanie sygnałów Andrzej Leśnicki Laboratorium CP Ćwiczenie 9 1/5 ĆWICZEIE 9 Kwantowanie sygnałów 1. Cel ćwiczenia ygnał przesyłany w cyfrowym torze transmisyjnym lub przetwarzany w komputerze (procesorze sygnałowym) musi

Bardziej szczegółowo

Wprowadzenie do cyfrowej obróbki dźwięku

Wprowadzenie do cyfrowej obróbki dźwięku Wprowadzenie do cyfrowej obróbki dźwięku Na czym polega kompresja plików audio? Zapis dźwięku w formacie cyfrowym polega na zapisaniu kształtu sygnału w postaci ciągu liczb. Procedura powyższa nazywana

Bardziej szczegółowo

Kodowanie Huffmana. Platforma programistyczna.net; materiały do laboratorium 2014/15 Marcin Wilczewski

Kodowanie Huffmana. Platforma programistyczna.net; materiały do laboratorium 2014/15 Marcin Wilczewski Kodowanie Huffmana Platforma programistyczna.net; materiały do laboratorium 24/5 Marcin Wilczewski Algorytm Huffmana (David Huffman, 952) Algorytm Huffmana jest popularnym algorytmem generującym optymalny

Bardziej szczegółowo

Przetworniki cyfrowo analogowe oraz analogowo - cyfrowe

Przetworniki cyfrowo analogowe oraz analogowo - cyfrowe Przetworniki cyfrowo analogowe oraz analogowo - cyfrowe Przetworniki cyfrowo / analogowe W cyfrowych systemach pomiarowych często zachodzi konieczność zmiany sygnału cyfrowego na analogowy, np. w celu

Bardziej szczegółowo

Przetworniki A/C. Ryszard J. Barczyński, 2010 2015 Materiały dydaktyczne do użytku wewnętrznego

Przetworniki A/C. Ryszard J. Barczyński, 2010 2015 Materiały dydaktyczne do użytku wewnętrznego Przetworniki A/C Ryszard J. Barczyński, 2010 2015 Materiały dydaktyczne do użytku wewnętrznego Parametry przetworników analogowo cyfrowych Podstawowe parametry przetworników wpływające na ich dokładność

Bardziej szczegółowo

Przetwornik analogowo-cyfrowy

Przetwornik analogowo-cyfrowy Przetwornik analogowo-cyfrowy Przetwornik analogowo-cyfrowy A/C (ang. A/D analog to digital; lub angielski akronim ADC - od słów: Analog to Digital Converter), to układ służący do zamiany sygnału analogowego

Bardziej szczegółowo

KOMPRESJA STRATNA SYGNAŁU MOWY. Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP

KOMPRESJA STRATNA SYGNAŁU MOWY. Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP KOMPRESJA STRATNA SYGNAŁU MOWY Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP Śledzenie i upraszczanie zmian dynamicznych sygnałów ADPCM

Bardziej szczegółowo

Podstawy transmisji multimedialnych podstawy kodowania dźwięku i obrazu Autor Wojciech Gumiński

Podstawy transmisji multimedialnych podstawy kodowania dźwięku i obrazu Autor Wojciech Gumiński Podstawy transmisji multimedialnych podstawy kodowania dźwięku i obrazu Autor Wojciech Gumiński Podstawy transmisji multimedialnych Plan wykładu Wprowadzenie 1. Wprowadzenie 2. Ilość informacji 3. Kodowanie

Bardziej szczegółowo

Technika audio część 1

Technika audio część 1 Technika audio część 1 Wykład 9 Technologie na urządzenia mobilne Łukasz Kirchner Lukasz.kirchner@cs.put.poznan.pl http://www.cs.put.poznan.pl/lkirchner Wprowadzenie technologii audio Próbkowanie Twierdzenie

Bardziej szczegółowo

Przetwarzanie i transmisja danych multimedialnych. Wykład 6 Metody predykcyjne. Przemysław Sękalski.

Przetwarzanie i transmisja danych multimedialnych. Wykład 6 Metody predykcyjne. Przemysław Sękalski. Przetwarzanie i transmisja danych multimedialnych Wykład 6 Metody predykcyjne Przemysław Sękalski sekalski@dmcs.pl Politechnika Łódzka Katedra Mikroelektroniki i Technik Informatycznych DMCS Wykład opracowano

Bardziej szczegółowo

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j Kompresja transformacyjna. Opis standardu JPEG. Algorytm JPEG powstał w wyniku prac prowadzonych przez grupę ekspertów (ang. Joint Photographic Expert Group). Prace te zakończyły się w 1991 roku, kiedy

Bardziej szczegółowo

Temat: Algorytm kompresji plików metodą Huffmana

Temat: Algorytm kompresji plików metodą Huffmana Temat: Algorytm kompresji plików metodą Huffmana. Wymagania dotyczące kompresji danych Przez M oznaczmy zbiór wszystkich możliwych symboli występujących w pliku (alfabet pliku). Przykład M = 2, gdy plik

Bardziej szczegółowo

Podstawowe funkcje przetwornika C/A

Podstawowe funkcje przetwornika C/A ELEKTRONIKA CYFROWA PRZETWORNIKI CYFROWO-ANALOGOWE I ANALOGOWO-CYFROWE Literatura: 1. Rudy van de Plassche: Scalone przetworniki analogowo-cyfrowe i cyfrowo-analogowe, WKŁ 1997 2. Marian Łakomy, Jan Zabrodzki:

Bardziej szczegółowo

Fale akustyczne. Jako lokalne zaburzenie gęstości lub ciśnienia w ośrodkach posiadających gęstość i sprężystość. ciśnienie atmosferyczne

Fale akustyczne. Jako lokalne zaburzenie gęstości lub ciśnienia w ośrodkach posiadających gęstość i sprężystość. ciśnienie atmosferyczne Fale akustyczne Jako lokalne zaburzenie gęstości lub ciśnienia w ośrodkach posiadających gęstość i sprężystość ciśnienie atmosferyczne Fale podłużne poprzeczne długość fali λ = v T T = 1/ f okres fali

Bardziej szczegółowo

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 1, strona 1.

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 1, strona 1. mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 1, strona 1. SYSTEMY MULTIMEDIALNE Co to jest system multimedialny? Elementy systemu multimedialnego Nośniki danych i ich wpływ na kodowanie Cele

Bardziej szczegółowo

Teoria Informacji - wykład. Kodowanie wiadomości

Teoria Informacji - wykład. Kodowanie wiadomości Teoria Informacji - wykład Kodowanie wiadomości Definicja kodu Niech S={s 1, s 2,..., s q } oznacza dany zbiór elementów. Kodem nazywamy wówczas odwzorowanie zbioru wszystkich możliwych ciągów utworzonych

Bardziej szczegółowo

Ze względu na dużą rozpiętość mierzonych wartości ciśnienia (zakres ciśnień akustycznych obejmuje blisko siedem rzędów wartości: od 2x10 5 Pa do

Ze względu na dużą rozpiętość mierzonych wartości ciśnienia (zakres ciśnień akustycznych obejmuje blisko siedem rzędów wartości: od 2x10 5 Pa do Ze względu na dużą rozpiętość mierzonych wartości ciśnienia (zakres ciśnień akustycznych obejmuje blisko siedem rzędów wartości: od 2x10 5 Pa do ponad 10 Pa) wygodniej jest mierzone ciśnienie akustyczne

Bardziej szczegółowo

MODULACJE IMPULSOWE. TSIM W10: Modulacje impulsowe 1/22

MODULACJE IMPULSOWE. TSIM W10: Modulacje impulsowe 1/22 MODULACJE IMPULSOWE TSIM W10: Modulacje impulsowe 1/22 Fala nośna: Modulacja PAM Pulse Amplitude Modulation Sygnał PAM i jego widmo: y PAM (t) = n= x(nt s ) Y PAM (ω) = τ T s Sa(ωτ/2)e j(ωτ/2) ( ) t τ/2

Bardziej szczegółowo

Kompresja JPG obrazu sonarowego z uwzględnieniem założonego poziomu błędu

Kompresja JPG obrazu sonarowego z uwzględnieniem założonego poziomu błędu Kompresja JPG obrazu sonarowego z uwzględnieniem założonego poziomu błędu Mariusz Borawski Wydział Informatyki Zachodniopomorski Uniwersytet Technologiczny w Szczecinie Zbieranie danych Obraz sonarowy

Bardziej szczegółowo

Formaty - podziały. format pliku. format kompresji. format zapisu (nośnika) kontener dla danych WAV, AVI, BMP

Formaty - podziały. format pliku. format kompresji. format zapisu (nośnika) kontener dla danych WAV, AVI, BMP dr inż. Piotr Odya Formaty - podziały format pliku kontener dla danych WAV, AVI, BMP format kompresji bezstratna/stratna ADPCM, MPEG, JPEG, RLE format zapisu (nośnika) ściśle określona struktura plików

Bardziej szczegółowo

ZAKŁAD SYSTEMÓW ELEKTRONICZNYCH I TELEKOMUNIKACYJNYCH Laboratorium Podstaw Telekomunikacji WPŁYW SZUMÓW NA TRANSMISJĘ CYFROWĄ

ZAKŁAD SYSTEMÓW ELEKTRONICZNYCH I TELEKOMUNIKACYJNYCH Laboratorium Podstaw Telekomunikacji WPŁYW SZUMÓW NA TRANSMISJĘ CYFROWĄ Laboratorium Podstaw Telekomunikacji Ćw. 4 WPŁYW SZUMÓW NA TRANSMISJĘ CYFROWĄ 1. Zapoznać się z zestawem do demonstracji wpływu zakłóceń na transmisję sygnałów cyfrowych. 2. Przy użyciu oscyloskopu cyfrowego

Bardziej szczegółowo

Systemy i Sieci Telekomunikacyjne laboratorium. Modulacja amplitudy

Systemy i Sieci Telekomunikacyjne laboratorium. Modulacja amplitudy Systemy i Sieci Telekomunikacyjne laboratorium Modulacja amplitudy 1. Cel ćwiczenia: Celem części podstawowej ćwiczenia jest zbudowanie w środowisku GnuRadio kompletnego, funkcjonalnego odbiornika AM.

Bardziej szczegółowo

LABORATORIUM POMIARY W AKUSTYCE. ĆWICZENIE NR 4 Pomiar współczynników pochłaniania i odbicia dźwięku oraz impedancji akustycznej metodą fali stojącej

LABORATORIUM POMIARY W AKUSTYCE. ĆWICZENIE NR 4 Pomiar współczynników pochłaniania i odbicia dźwięku oraz impedancji akustycznej metodą fali stojącej LABORATORIUM POMIARY W AKUSTYCE ĆWICZENIE NR 4 Pomiar współczynników pochłaniania i odbicia dźwięku oraz impedancji akustycznej metodą fali stojącej 1. Cel ćwiczenia Celem ćwiczenia jest poznanie metody

Bardziej szczegółowo

Formaty plików audio

Formaty plików audio Formaty plików audio Spis treści 1.Formaty plików audio.... 2 Wav... 2 Aac... 2 AIFF... 2 Ogg... 2 Asf... 2 Mp1... 2 Mp2... 2 Mp3... 2 MP3PRO... 3 Mp4... 3 Wma... 3 Midi... 3 Ac3... 3 2. Różnica miedzy

Bardziej szczegółowo

Aproksymacja funkcji a regresja symboliczna

Aproksymacja funkcji a regresja symboliczna Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą

Bardziej szczegółowo

Kodowanie informacji

Kodowanie informacji Kodowanie informacji Tomasz Wykład 4: kodowanie arytmetyczne Motywacja Podstawy i własności Liczby rzeczywiste Motywacje 1 średnia długość kodu Huffmana może odbiegać o p max + 0.086 od entropii, gdzie

Bardziej szczegółowo

Klasyfikacja metod przetwarzania analogowo cyfrowego (A/C, A/D)

Klasyfikacja metod przetwarzania analogowo cyfrowego (A/C, A/D) Klasyfikacja metod przetwarzania analogowo cyfrowego (A/C, A/D) Metody pośrednie Metody bezpośrednie czasowa częstotliwościowa kompensacyjna bezpośredniego porównania prosta z podwójnym całkowaniem z potrójnym

Bardziej szczegółowo

Data wykonania Część praktyczna

Data wykonania Część praktyczna Grupa ćwicz. IIIb Nr ćwicz./ wersja 4 Imiona i nazwiska. Grupa lab. 7 Grzegorz Gliński Rok 3 IS Temat ćwiczenia. Internet Radio Broadcasting Data wykonania. 19.11.09 Data odbioru Ocena i uwagi Część praktyczna

Bardziej szczegółowo

O sygnałach cyfrowych

O sygnałach cyfrowych O sygnałach cyfrowych Informacja Informacja - wielkość abstrakcyjna, która moŝe być: przechowywana w pewnych obiektach przesyłana pomiędzy pewnymi obiektami przetwarzana w pewnych obiektach stosowana do

Bardziej szczegółowo

TECHNIKI MULTIMEDIALNE

TECHNIKI MULTIMEDIALNE Studia Podyplomowe INFORMATYKA TECHNIKI MULTIMEDIALNE dr Artur Bartoszewski Karty dźwiękowe Karta dźwiękowa Rozwój kart dźwiękowych Covox Rozwój kart dźwiękowych AdLib Rozwój kart dźwiękowych Gravis Ultrasound

Bardziej szczegółowo

KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG

KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG Joint Photographic Expert Group - 1986 ISO - International Standard Organisation CCITT - Comité Consultatif International de Téléphonie et Télégraphie Standard

Bardziej szczegółowo

AKD Metody słownikowe

AKD Metody słownikowe AKD Metody słownikowe Algorytmy kompresji danych Sebastian Deorowicz 2009 03 19 Sebastian Deorowicz () AKD Metody słownikowe 2009 03 19 1 / 38 Plan wykładu 1 Istota metod słownikowych 2 Algorytm Ziva Lempela

Bardziej szczegółowo

Demodulator FM. o~ ~ I I I I I~ V

Demodulator FM. o~ ~ I I I I I~ V Zadaniem demodulatora FM jest wytworzenie sygnału wyjściowego, który będzie proporcjonalny do chwilowej wartości częstotliwości sygnału zmodulowanego częstotliwościowo. Na rysunku 12.13b przedstawiono

Bardziej szczegółowo

1. Po upływie jakiego czasu ciało drgające ruchem harmonicznym o okresie T = 8 s przebędzie drogę równą: a) całej amplitudzie b) czterem amplitudom?

1. Po upływie jakiego czasu ciało drgające ruchem harmonicznym o okresie T = 8 s przebędzie drogę równą: a) całej amplitudzie b) czterem amplitudom? 1. Po upływie jakiego czasu ciało drgające ruchem harmonicznym o okresie T = 8 s przebędzie drogę równą: a) całej amplitudzie b) czterem amplitudom? 2. Ciało wykonujące drgania harmoniczne o amplitudzie

Bardziej szczegółowo

Kompresja danych Streszczenie Studia Dzienne Wykład 10,

Kompresja danych Streszczenie Studia Dzienne Wykład 10, 1 Kwantyzacja wektorowa Kompresja danych Streszczenie Studia Dzienne Wykład 10, 28.04.2006 Kwantyzacja wektorowa: dane dzielone na bloki (wektory), każdy blok kwantyzowany jako jeden element danych. Ogólny

Bardziej szczegółowo

Drgania i fale sprężyste. 1/24

Drgania i fale sprężyste. 1/24 Drgania i fale sprężyste. 1/24 Ruch drgający Każdy z tych ruchów: - Zachodzi tam i z powrotem po tym samym torze. - Powtarza się w równych odstępach czasu. 2/24 Ruch drgający W rzeczywistości: - Jest coraz

Bardziej szczegółowo

Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy

Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy Grupa: wtorek 18:3 Tomasz Niedziela I. CZĘŚĆ ĆWICZENIA 1. Cel i przebieg ćwiczenia. Celem ćwiczenia

Bardziej szczegółowo

Kompresja video (MPEG)

Kompresja video (MPEG) mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 8, strona 1. Kompresja video (MEG) Zasadniczy schemat kompresora video Typy ramek przy kompresji czasowej Analiza ramek przez syntezę Sposób detekcji

Bardziej szczegółowo

PRACA DYPLOMOWA STUDIA PIERWSZEGO STOPNIA. Łukasz Kutyła Numer albumu: 5199

PRACA DYPLOMOWA STUDIA PIERWSZEGO STOPNIA. Łukasz Kutyła Numer albumu: 5199 PRACA DYPLOMOWA STUDIA PIERWSZEGO STOPNIA Łukasz Kutyła Numer albumu: 5199 Temat pracy: Metody kompresji obrazu implementowane we współczesnych systemach telewizji cyfrowej opartej o protokół IP Cel i

Bardziej szczegółowo

Nierówność Krafta-McMillana, Kodowanie Huffmana

Nierówność Krafta-McMillana, Kodowanie Huffmana Nierówność Krafta-McMillana, Kodowanie Huffmana Kodowanie i kompresja informacji - Wykład 2 1 marca 2010 Test na jednoznaczna dekodowalność Kod a jest prefiksem kodu b jeśli b jest postaci ax. x nazywamy

Bardziej szczegółowo

Def. Kod jednoznacznie definiowalny Def. Kod przedrostkowy Def. Kod optymalny. Przykłady kodów. Kody optymalne

Def. Kod jednoznacznie definiowalny Def. Kod przedrostkowy Def. Kod optymalny. Przykłady kodów. Kody optymalne Załóżmy, że mamy źródło S, które generuje symbole ze zbioru S={x, x 2,..., x N } z prawdopodobieństwem P={p, p 2,..., p N }, symbolom tym odpowiadają kody P={c, c 2,..., c N }. fektywność danego sposobu

Bardziej szczegółowo

Mapa akustyczna Torunia

Mapa akustyczna Torunia Mapa akustyczna Torunia Informacje podstawowe Mapa akustyczna Słownik terminów Kontakt Przejdź do mapy» Słownik terminów specjalistycznych Hałas Hałasem nazywamy wszystkie niepożądane, nieprzyjemne, dokuczliwe

Bardziej szczegółowo

Systemy plezjochroniczne (PDH) synchroniczne (SDH), Transmisja w sieci elektroenergetycznej (PLC Power Line Communication)

Systemy plezjochroniczne (PDH) synchroniczne (SDH), Transmisja w sieci elektroenergetycznej (PLC Power Line Communication) Politechnika Śląska Katedra Elektryfikacji i Automatyzacji Górnictwa Systemy plezjochroniczne (PDH) synchroniczne (SDH), Transmisja w sieci elektroenergetycznej (PLC Power Line Communication) Opracował:

Bardziej szczegółowo

Teoria informacji i kodowania Ćwiczenia

Teoria informacji i kodowania Ćwiczenia Teoria informacji i kodowania Ćwiczenia Piotr Chołda, Andrzej Kamisiński Katedra Telekomunikacji Akademii Górniczo-Hutniczej Kod źródłowy Kodem źródłowym nazywamy funkcję różnowartościową, która elementom

Bardziej szczegółowo

Dźwięk. Cechy dźwięku, natura światła

Dźwięk. Cechy dźwięku, natura światła Dźwięk. Cechy dźwięku, natura światła Fale dźwiękowe (akustyczne) - podłużne fale mechaniczne rozchodzące się w ciałach stałych, cieczach i gazach. Zakres słyszalnej częstotliwości f: 20 Hz < f < 20 000

Bardziej szczegółowo

Fundamentals of Data Compression

Fundamentals of Data Compression Załącznik nr 7 do Zarządzenia Rektora nr 10/12 z dnia 21 lutego 2012r. KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2012/2013

Bardziej szczegółowo

Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej

Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej Politechnika Białostocka Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej Instrukcja do zajęć laboratoryjnych z przedmiotu: Przetwarzanie Sygnałów Kod: TS1C400027 Temat ćwiczenia:

Bardziej szczegółowo

Politechnika Warszawska

Politechnika Warszawska Politechnika Warszawska Wydział Elektryczny Laboratorium Teletechniki Skrypt do ćwiczenia T.03 Podstawowe zasady modulacji amlitudy na przykładzie modulacji DSB 1. Podstawowe zasady modulacji amplitudy

Bardziej szczegółowo

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania Kodowanie podpasmowe Plan 1. Zasada. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania Zasada ogólna Rozkład sygnału źródłowego na części składowe (jak w kodowaniu transformacyjnym) Wada kodowania

Bardziej szczegółowo

Karta dźwiękowa. Architektura systemów komputerowych Ćwiczenie 3

Karta dźwiękowa. Architektura systemów komputerowych Ćwiczenie 3 Architektura systemów komputerowych Ćwiczenie 3 Karta dźwiękowa Cyfrowy zapis dźwięku Digitalizowanie dźwięku kompresja Budowa i działanie karty dźwiękowej ewolucja kart dźwiękowych Budowa karty dźwiękowej

Bardziej szczegółowo

Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11,

Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11, 1 Kwantyzacja skalarna Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11, 10.05.005 Kwantyzacja polega na reprezentowaniu dużego zbioru wartości (być może nieskończonego) za pomocą wartości

Bardziej szczegółowo

Zastowowanie transformacji Fouriera w cyfrowym przetwarzaniu sygnałów

Zastowowanie transformacji Fouriera w cyfrowym przetwarzaniu sygnałów 31.01.2008 Zastowowanie transformacji Fouriera w cyfrowym przetwarzaniu sygnałów Paweł Tkocz inf. sem. 5 gr 1 1. Dźwięk cyfrowy Fala akustyczna jest jednym ze zjawisk fizycznych mających charakter okresowy.

Bardziej szczegółowo

Kodowanie transformacyjne. Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG

Kodowanie transformacyjne. Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG Kodowanie transformacyjne Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG Zasada Zasada podstawowa: na danych wykonujemy transformacje która: Likwiduje korelacje Skupia energię w kilku komponentach

Bardziej szczegółowo

Przykładowe zadanie praktyczne

Przykładowe zadanie praktyczne Przykładowe zadanie praktyczne Opracuj projekt realizacji prac związanych z uruchomieniem i testowaniem kodera i dekodera PCM z układem scalonym MC 145502 zgodnie z zaleceniami CCITT G.721 (załączniki

Bardziej szczegółowo

Wykład III: Kompresja danych. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Wykład III: Kompresja danych. Studia Podyplomowe INFORMATYKA Podstawy Informatyki Studia Podyplomowe INFORMATYKA Podstawy Informatyki Wykład III: Kompresja danych 1 I. Reprezentacja danych w komputerze Rodzaje danych w technice cyfrowej 010010101010 001010111010 101101001001 2 Kompresja

Bardziej szczegółowo

Zjawisko aliasingu. Filtr antyaliasingowy. Przecieki widma - okna czasowe.

Zjawisko aliasingu. Filtr antyaliasingowy. Przecieki widma - okna czasowe. Katedra Mechaniki i Podstaw Konstrukcji Maszyn POLITECHNIKA OPOLSKA Komputerowe wspomaganie eksperymentu Zjawisko aliasingu.. Przecieki widma - okna czasowe. dr inż. Roland PAWLICZEK Zjawisko aliasingu

Bardziej szczegółowo