Modele psychofizyczne w zastosowaniu do kompresji treści multimedialnych
|
|
- Andrzej Sobolewski
- 4 lat temu
- Przeglądów:
Transkrypt
1 1/65 Modele psychofizyczne w zastosowaniu do kompresji treści multimedialnych Paweł Forczmański pforczmanski@wi.zut.edu.pl
2 2/65 dr inż. Paweł Forczmański
3 Kompresja a nośnik informacji Nośnik danych systemu multimedialnego ma zasadniczy wpływ na rodzaj wybranego kodowania. 3/65 Różnorodność kanałów transmisyjnych powoduje różnorodność standardów kodowania, choć daje się zaobserwować pewien trend do tworzenia systemów uniwersalnych (np. MPEG-4). Warto też pamiętać o tym, że często kanał transmisyjny składa się z kilku różnych części, np. media transmitowane przez Internet są składowane po stronie nadawczej (a często i odbiorczej) w pamięci masowej.
4 Kompresja a nośnik informacji Transmisja radiowa Szerokość pasma średnia i duża. Poziom zakłóceń wysoki. Ilość jednoczesnych odbiorców nieograniczona. Dostęp swobodny brak. Kanał zwrotny brak. Transmisja kablowa Szerokość pasma duża. Poziom zakłóceń niski. Ilość jednoczesnych odbiorców średnia i duża. Dostęp swobodny brak. Kanał zwrotny najczęściej brak. Pamięci masowe Szerokość pasma duża i bardzo duża. Poziom zakłóceń żaden. Ilość jednoczesnych odbiorców 1. Dostęp swobodny jest. Kanał zwrotny brak. Ograniczona pojemność. Internet 4/65 Szerokość pasma mała lub średnia. Poziom zakłóceń niski lub bardzo niski. Ilość jednoczesnych odbiorców umiarkowana. Dostęp swobodny może być zapewniony. Kanał zwrotny bez problemu.
5 Szerokość strumienia danych a/v Zastosowanie Wideotelefonie w publicznych sieciach telefonicznych Wideotelefonie i wideokonferencje w sieciach ISDN Zdalne nauczanie 5/65 Systemy multimedialne wykorzystujące CD-ROM Telewizja, Video On Demand Telewizja wysokiej rozdzielczości (HDTV) Przepływność [Mb/s] bez kompresji z kompresją 9,1 30,4 0,01 0,025 30,4 0,064 0, ,064 4,00 30,4 1,15 3, ,00 8, ,00 20,00
6 Redundancja percepcyjna Kompresja stratna jest charakterystyczna dla danych medialnych, ponieważ wykorzystuje redundancję percepcyjną. Opiera się ona na tym, że ludzkie zmysły i mózg nie analizują całej informacji zawartej w strumieniu multimedialnym. 6/65 W związku z tym część danych może zostać z tego strumienia usunięta, podczas gdy percepcja tego strumienia pozostanie niezmieniona, lub (częściej) strata jakości percepcji jest w danych warunkach akceptowalna.
7 Redundancja percepcyjna Pewnym problemem jest tu indywidualność percepcji. Autorzy kompresorów konstruują uśrednione modele percepcji w oparciu o wyniki eksperymentów (np. model psychoakustyczny MPEG Audio).Trzeba się liczyć z tym, że indywidualne osoby mogą mieć percepcję inną niż uśredniony model. Na przykład większość ludzi kompresję MPEG 1 Audio warstwę 3 (popularne MP3) o przepływności 192 kbit/s traktuje jako jakość CD, podczas gdy są osoby, które odczuwają stratę jakości nawet przy 256 kbit/s. 7/65 Większość algorytmów kompresji stratnej na koniec pakuje przetransformowane dane dodatkowo algorytmem bezstratnym.
8 Obraz statyczny JPEG - oparty na DCT i dający relatywnie słabe rezultaty. JPEG oparty na falkach, dający znacznie lepsze wyniki DjVu j.w., kompresja dokumentów (skanów) Video MPEG1,2,4 DCT bardzo wysoka jakość, połączona z większymi objętościowo plikami (100MB MPEG-4 = 350MB MPEG2). Real Video, niską jakość obrazu rekompensuje mała objętość dzięki czemu wykorzystywany jest przy transmisjach na żywo. H.263, H.264 kompresja w kanałach o niskiej przepływności Audio MP3 (MPEG-1 Layer3), najpopularniejsze kodowanie stratne audio, oparte na MDCT, stosuje model psychoakustyczny Instytutu Fraunhoffera i firmy Thomson Ogg Vorbis, oparte na MDCT Real Audio, podobnie jak Real Video, rekompensuje straty jakości małą objętością, jest stosowany głównie do transmisji na żywo. AAC (Advanced Audio Coding, MPEG-4 Audio) nowy standard o wysokim stopniu kompresji 8/65 Przykładowe algorytmy
9 Budowa oka i kory wzrokowej 9/65 W 2006 r. na University of Pennsylvania przeprowadzono badania, które wykazały, że pasmo transmisyjne siatkówki okaz ludzkiego to około 8960 kbps, natomiast świnki morskiej tylko 875 kbps.
10 HVS human visual system Model ludzkiego systemu postrzegania (Human Visual System Model), często zwany po prostu HVS, stosowany jest w zadaniach przetwarzania i rozpoznawania obrazu przez badaczy z zakresu widzenia komputerowego (computer vision) w celu opisywania biologicznych i psychologicznych procesów, które nie są do końca zrozumiałe. Model ten stosuje się w celu uproszczenia zachowań skomplikowanego systemu. Wiedza o systemie postrzegania cały czas się pogłębia, więc HVS jest na bieżąco poprawiany i udoskonalany 10/65 Wiele cech HVS wynika z ewolucji i ma zastosowania szczególnie w przypadkach zagrożenia życia, czy też polowania. Częstym przykładem działania HVS są złudzenia optyczne.
11 Założenia dot. HVS Charakterystyka niskoczęstotliwościowa (ograniczona liczba pręcików w oku) -> pasma Macha Niska rozdzielczość postrzegania kolorów (czopków jest mniej niż pręcików) Stosunkowo wysoka czułość w stosunku do ruchu Bardziej czułe w widzeniu peryferyjnym Dużo większa czułość niż w stosunku do tekstur, patrz kamuflaż zwierząt Większa czułość dla tekstur niż rozbieżność punktów w przestrzeni rozdzielczość przestrzenna nie jest bardzo dokładna Wrodzone rozpoznawanie twarzy (nawet małe dzieci śmieją się gdy widzą twarz) Twarz wklęsła (nie wypukła!) wygląda normalnie (cechy twarzy ważniejsze niż informacja 3D) 11/65 Twarz obrócona o 180st. Z odwróconymi (poprawnie) oczami i ustami wygląda normalnie) -> Paradoks Margaret Thatcher
12 12/65 Pasma Macha (Ernesta) Charakterystyka niskoczęstotliwościowa (ograniczona liczba pręcików w oku) -> pasma Macha
13 Czułość koloru Dane wejściowe 13/65 Po dokonaniu subsamplingu kolorów
14 14/65 Interlace Interlace (międzyliniowość) to technika poprawy jakości obrazów ruchomych (eliminacji migotania, zwiększenia częstotliwości odświeżania) bez zwiększania wymaganego pasma transmisyjnego opracowana przez Randalla C. Ballarda z firmy RCA w 1932r.
15 Złudzenia to podstawa... Dzięki znajomości złudzeń, którym ulegamy istnieje możliwość konstruowania wydajnych algorytmów kompresji treści multimedialnych Złudzenia wizualne Złudzenia akustyczne Model psychofizyczny (psychoakustyczny, psychowizualny) 15/65 Obraz, dźwięk Algorytm kompresji Zapis cyfrowy
16 16/65 Złudzenia (Bjørn Borg)
17 17/65 Złudzenia (Bjørn Borg)
18 18/65 Złudzenia (paradoks Margaret Thatcher)
19 19/65 Złudzenia (paradoks Margaret Thatcher)
20 20/65 Złudzenia (na zdjęciu jest twarz)
21 21/65 Złudzenia (na zdjęciu jest twarz)
22 22/65 Złudzenia (tworzenie obrazu wirtualnego)
23 23/65 Złudzenia (postrzeganie kolorów)
24 24/65 Złudzenia (postrzeganie kolorów)
25 25/65 Złudzenia
26 26/65 Złudzenia
27 27/65 Złudzenia (obrazy niemożliwe)
28 28/65 Złudzenia (obrazy niemożliwe)
29 29/65 Złudzenia (obrazy niemożliwe)
30 30/65 Złudzenia (obrazy niemożliwe)
31 31/65 Złudzenia
32 32/65 Złudzenia
33 33/65 Złudzenia
34 34/65 Złudzenia (w służbie polityki) Horatio Herbert Kitchener, lepiej znany jako Lord Kitchener, jest najbardziej rozpoznawany jako twarz wykorzystana na plakacie, który rekrutował obywateli Wielkiej Brytanii podczas Pierwszej Wojny Światowej. Potem ten pomysl był wielokrotnie kopiowany)
35 Metody kompresji 35/65 Kodowanie Kodowanie źródła Entropijne (Entropy coding) (Source coding) Kodowanie Hybrydowe (Hybrid coding) W kodowaniu źródła wykorzystywane są ograniczenia i niedoskonałości ludzkiego wzroku i słuchu. Kodowanie źródła należy do grupy metod stratnych (lossy), co oznacza, że plik po dekompresji nie będzie w 100% zgodny z plikiem źródłowym.
36 Definicja Kompresja stratna to metody zmniejszania ilości bitów potrzebnych do wyrażenia danej informacji, które nie dają gwarancji, że odtworzona informacja będzie identyczna z oryginałem. Dla niektórych danych algorytm kompresji stratnej może odtworzyć informację w sposób identyczny. Kompresja stratna jest możliwa ze względu na sposób działania ludzkich zmysłów, tj. wyższą wartość pewnych części danych nad innymi. Algorytmy kompresji stratnej zazwyczaj posługują się modelami psychoakustycznymi, psychowizualnymi itd., aby odrzucić najmniej istotne dane o dźwięku, obrazie, pozostawiając dane o wyższej wartości dla rozpoznawania tej informacji (akustycznej, wizualnej) przez zmysły. 36/65 Ilość odrzucanych danych jest zazwyczaj określana przez stopień kompresji. Stopień kompresji wyraża się często w %. Nowoczesne algorytmy operują na przepływności wyrażanej w bps.
37 Kompresja stratna obrazów nieruchomych Wzrok człowieka oszukać trudniej niż słuch, stąd wiele formatów obrazu pozostaje przy kompresji bezstratnej (GIF, BMP), ewentualnie wspomagając się usuwaniem korelacji między sąsiednimi pikselami (PNG). Kompresja stratna sprawdza się w przypadku obrazów naturalnych (zdjęcia). Najbardziej rozpowszechnionym formatem jest JPEG, który opiera się na transformacie obrazu w dziedzinę częstotliwości (DCT), a następnie stratnym kwantowaniu współczynników transformaty. 37/65 Nowsze formaty (JPEG2000, DjVu) wykorzystują transformatę falkową, która lepiej dopasowana jest do sposobu przetwarzania obrazu przez mózg (przy tej samej kompresji, artefakty są mniej widoczne). Ważną techniką jest też zmniejszanie pasma przenoszenia chrominancji (formaty YUV).
38 Kompresja stratna obrazów nieruchomych 8kB - JPEG 38/65 45kB - JPEG 8kB - JPG2000
39 39/65 Subsampling koloru Schemat subsamplingu jest często opisywany jako stosunek trzech elementów (np. 4:2:2), części te to (w kolejności): Luminancja (Luma, Y) pozioma wartość próbkowania (początkowo, jako wielokrotność MHz w systemie NTSC) Chrominancja R (Cr) współczynnik poziomego próbkowania (w stosunku do pierwszej wartości) Chrominancja B (Cb) współczynnik poziomego próbkowania (w stosunku do pierwszej wartości). Wyjątkiem jest zero, co oznacza że wartość Cb jest równa Cr i jednocześnie Cb i Cr są próbkowane w stosunku 2:1 w kierunku pionowym.
40 40/65 Subsampling koloru Schemat 4:2:0 jest stosowany w: wszystkie wersje MPEG video (MPEG-1, MPEG-2/DVD). Niektóre wyższe profile MPEG-4 stosują 4:4:4 PAL, DV, DVCAM większość implementacji JPEG/JFIF, H.261 i MJPEG
41 Kompresja stratna obrazów ruchomych O ile rozdzielczość percepcyjna obrazów nieruchomych u człowieka jest niezła, o tyle w przypadku video możliwości oszustwa jest więcej. Większość ludzi odbiera ruch pokazany z prędkością powyżej 25 klatek na sekundę jako płynny. To podstawa ograniczenia strumienia danych. Do każdej klatki dają się zastosować techniki stosowane przy obrazach nieruchomych, przede wszystkim format YUV i skwantowane transformaty częstotliwościowe. 41/65 Oprócz tego dochodzi wiele nowych technik wykorzystujących korelację międzyklatkową: predykcja i interpolacja klatek, predykcja ruchu bloków obrazu.
42 JPEG (1) Najbardziej powszechniejszym algorytmem kompresji obrazów jest JPEG. Wiele rozwiązań użytych w JPEG jest używanych także w innych algorytmach. Kolejne kroki algorytmu JPEG to: zamiana przestrzeni kolorów z RGB na kanał jasności i dwa kanały koloru. Ludzie znacznie dokładniej postrzegają drobne różnice jasności od drobnych różnic barwy, a więc użyteczne jest tutaj użycie różnych parametrów kompresji. obniżenie rozdzielczości kanałów koloru, zwykle odrzuca się co drugą wartość wzdłuż osi poziomej, i każdą na pionowej, choć możliwe są też inne ustawienia. Tak radykalne cięcie danych nieznacznie wpływa na jakość, ponieważ rozdzielczość postrzegania kolorów przez ludzkie oko jest słaba. Krok nie jest obowiązkowy. 42/65
43 43/65 JPEG (2) Kolejne kroki algorytmu JPEG to: podział każdego kanału obrazka na bloki 8x8. W przypadku kanałów kolorów, jest to 8x8 aktualnych danych, a więc zwykle 16x8. transformata kosinusowa każdego z bloków. Zamiast wartości pikseli mamy teraz średnią wartość wewnątrz bloku oraz częstotliwości zmian wewnątrz bloku, obie wyrażone przez liczby zmiennoprzecinkowe. Transformata DCT jest odwracalna, więc na razie nie tracimy żadnych danych. Zastąpienie średnich wartości bloków przez różnicę wobec wartości poprzedniej. Poprawia to w pewnym stopniu współczynnik kompresji. Kwantyzacja, czyli zastąpienie danych zmiennoprzecinkowych przez liczby całkowite. To właśnie tutaj występują straty danych. Zależnie od parametrów kompresora, odrzuca się mniej lub więcej danych. Zasadniczo większa dokładność jest stosowana do danych dotyczących niskich częstotliwości niż wysokich. Kompresja algorytmem bezstratnym, w tym przypadku algorytmem Huffmana. Użyta transformata powoduje efekty blokowe w przypadku mocno skompresowanych obrazków.
44 44/65 JPEG (schemat)
45 Kompresja obrazów: inne algorytmy Inne algorytmy kompresji obrazków opierają się głównie na: użyciu innej transformaty zmodyfikowanej transformaty kosinusowej, która nie powoduje efektu bloków, a więc jest korzystniejsza w przypadku mocno skompresowanych obrazków. Nie odbiega ona wynikami znacząco od DCT w przypadku obrazów o średniej i niskiej kompresji. transformat falkowych - mogą one dać znacznie lepsze wyniki. Zazwyczaj nie powodują efektu bloków. 45/65 użyciu innego algorytmu kompresji bezstratnej kompresja wszystkich kanałów naraz, w szczególności ich wspólna kwantyzacja. Daje lepsze wyniki jeśli wartości w różnych kanałach są mocno skorelowane.
46 46/65 Kompresja fraktalna Opisuje ona obraz w postaci parametrów funkcji fraktalnej, która daje w efekcie przybliżoną postać obrazu. Dotychczas kompresja fraktalna daje znacznie słabszą jakość w przypadku obrazów o niskim i średnim stopniu kompresji. Dla obrazów silnie skompresowanych może dawać lepsze rezultaty niż JPEG, przede wszystkim nie powoduje efektu bloków, jednak jest słabsza od znacznie prostszych metod opartych na MDCT czy falkach. Na razie nic nie wskazuje na to, że kompresja fraktalna znajdzie szersze zastosowanie.
47 47/65 Kompresja video (1) Najprostsze systemy kompresji ruchomych obrazów po prostu kompresują wszystkie klatki indywidualnie i niezależnie. Jest to bardzo nieefektywne, ponieważ kolejne klatki są zwykle bardzo podobne do siebie. W najbardziej popularnych metodach używa się zestawu klatek kluczowych, które kompresuje się tak samo jak samodzielne obrazki. Pozostałe klatki kompresuje się natomiast korzystając z danych z klatek poprzednich (lub następnych). Lepsze wyniki dałoby wykorzystanie danych o poprzednich klatkach przy kompresji każdej klatki, jednak utrudniało by to znacznie przewijanie.
48 48/65 Kompresja video (2) Prostym sposobem wykorzystania danych o poprzednich klatkach jest kodowanie różnicy wartości pikseli o tym samym położeniu zamiast samych wartości. Tym sposobem można dobrze skompresować sceny w których kamera jest nieruchoma, jednak nie da to znaczących efektów w scenach z ruchomą kamerą. Zwykle wykorzystuje się więc różne rodzaje kompensacji ruchu. Np. dla każdego bloku podaje się który niewielki wektor przesunięcia, np. <+2,-1>, czyli zamiast tego samego bloku klatki poprzedniej używamy bloku o 2 piksele w prawo i jeden w górę (czy też w lewo i w dół).
49 Kompresja video (3) Inną ważną techniką wykorzystywaną przy kompresji ruchomych obrazów jest zmienna przepływność (VBR, variable bitrate), czyli używanie różnej dokładności dla różnych klatek. Jest wiele sposobów dobierania takich różnic, algorytmy wyboru jakości zwykle są cechą bardziej enkodera niż formatu. 49/65 Często enkodery stosują metody dwuprzebiegowe, pierwszy przebieg działający na danych wejściowych zbiera informacje potrzebne algorytmowi zmiennej przepływności, a dopiero drugi kompresuje dane.
50 50/65 Budowa ucha
51 Model psychoakustyczny (1) Model psychoakustyczny to matematyczny model mówiący jakie informacje o dźwięku są rozpoznawalne przez ludzkie ucho, jakie natomiast nie są. 51/65 Modele psychoakustyczne są podstawą między innymi kompresji dźwięku, algorytmów oceny jakości transmisji mowy, systemów automatycznie rozpoznających mowę oraz rozpoznających mówców.
52 52/65 Model psychoakustyczny (2) Modele psychoakustyczne są szczególną grupą modeli układu słuchowego. W tej grupie wytyczne do modelowania pochodzą z pomiarów psychoakustycznych (odsłuchowych), w których słuchacze oceniają wrażenia wywołane różnymi sygnałami testowymi prezentowanymi w określonym kontekście (np. czy słyszą ton sinusoidalny prezentowany na tle szumu). Model przetwarza sygnał w taki sposób, aby jego wyjście stanowiło predykcję ocen subiektywnych słuchaczy. Zjawiskami słuchowymi najczęściej wykorzystywanymi przy opracowywaniu modeli psychoakustycznych są: maskowanie dźwięków, percepcja wysokości dźwięków oraz dyskryminacja modulacji amplitudy.
53 Elementy psychoakustyki: System słuchowy System słuchowy człowieka przetwarza dźwięk w pewnych podpasmach, zwanych pasmami krytycznymi. W każdym z nich sygnał jest analizowany w sposób niezależny od dźwięku w pozostałych pasmach krytycznych. Każdemu pasmu krytycznemu odpowiada pewien odcinek na błonie podstawnej ślimaka równy 1,3 mm. 53/65 Szerokość tych pasm nie jest wielkością stałą. Mianowicie poniżej 500 Hz jest ona stała i wynosi 100 Hz, zaś powyżej 500 Hz szerokość każdego następnego pasma jest o 20% większa niż dla poprzedniego pasma.
54 54/65 Cechy modelu psychoakustycznego (1) Modele psychoakustyczne przewidują zwykle zakres słyszalności od 20 Hz do 20 khz (dlatego właśnie większość współczesnych odtwarzaczy muzyki zapisanej cyfrowo ma takie pasmo przenoszenia) i maksymalną czułość w zakresie od 2 khz do 4 khz
55 55/65 Cechy modelu psychoakustycznego (2) maskowanie sąsiednich częstotliwości (maskowanie jednoczesne): ciche dźwięki o częstotliwościach zbliżonych do częstotliwości dźwięku głośnego nie są słyszalne maskowanie dźwięków następujących (maskowanie pobodźcowe): głośny dźwięk potrafi zagłuszyć cichsze dźwięki następujące zaraz po nim maskowanie dźwięków poprzedzających (maskowanie wsteczne): cichy dźwięk poprzedzający w krótkim czasie dźwięk głośny nie jest słyszalny - ta własność układu słuchowego jest szczególnie ciekawa gdyż nie da się jej wyjaśnić na gruncie adaptacji krótkoterminowej układu słuchowego, równocześnie pokazuje ona, że układ słuchowy nosi pewne cechy układu nieprzyczynowego (problem nieprzyczynowości można rozwiązać dopuszczając, pewne opóźnienie w odbiorze bodźców dźwiękowych).
56 56/65 Warstwice równej głośności
57 Intensywność tonu maskującego Intensywność tonu testowego która jest ledwo słyszalna [db] Krzywe maskowania jednoczesnego 57/65 Częstotliwość tonu maskującego Częstotliwość tonu testowego [Hz]
58 58/65 Maskowanie niejednoczesne
59 Kompresja stratna dźwięku Najprostszą kompresją stratną dźwięku jest nieliniowe kwantowanie próbek, stosowane między innymi w formatach A-law i μ-law. Osiąga się kompresję 2:1 przy nieznacznym pogorszeniu stosunku sygnału do szumu. 59/65 Kolejnym stopniem jest wykorzystanie korelacji międzypróbkowej ADPCM z predyktorami różnego stopnia.
60 60/65 Kompresja stratna dźwięku Powszechnie obecnie jest stosowana transformata w dziedzinę częstotliwości, następnie przy pomocy modelu psychoakustycznego usuwa się składowe percepcyjnie nieistotne, dzięki zjawisku maskowania tonalnego i szumowego. Prostą metodą stosowaną przy dźwięku wielokanałowym jest wykorzystanie wysokiej korelacji między kanałami (najczęściej stosowana wraz z innymi metodami).
61 61/65 Typowy koder psychoakustyczny
62 62/65 Kompresja stratna dźwięku Najnowsze standardy (AAC+) wykorzystują też sztuczki z powieleniem dolnej połowy widma w górną (spectral band replication).
63 Kompresja stratna dźwięku: głos Odrębną gałęzią jest kompresja sygnałów mowy. Tu podstawowym kryterium jest raczej zrozumiałość mowy niż wierne odtworzenie. Powszechnie stosowaną techniką jest dynamiczne modelowanie układu głosowego człowieka i przesyłanie parametrów modelu, oraz pobudzenia szczątkowego (szum + ton). 63/65 Na technice tej opiera się np. standard kompresji telefonii komórkowej GSM.
64 Kompresja dźwięku: MPEG Audio sygnał akustyczny (2*768 kbit/s) zakodowany sygnał (2*32 kbit/s)... 2*192 kbit/s Podpasmo 0 Bank filtrów dla 32 pasm... Kwantyzacja liniowa Formatowanie sygnału skompreswanego 31 Kodowanie informacji dodatkowej 64/65 FFT Model psychoakustyczny Kontrola zewnętrzna Dane pomocnicze
65 65/65 Kompresja dźwięku: Vorbis OGG (1) Dwa najpopularniejsze publicznie dostępne algorytmy - MP3 i Vorbis, używają podobnych technik. Warto tu omówić algorytm Vorbis, ponieważ używa on bardziej efektywnych rozwiązań. Strumień jest dzielony na okna. Okna występują w dwóch rozmiarach - duże (zwykle 2048 próbek) i małe (zwykle 256 próbek). Małe służą do przedstawienia szybko zmieniającego się dźwięku oraz nagłego wzrostu intensywności dźwięku w danej częstotliwości. Nie używa się ich w przypadku spadków intensywności, ponieważ ludzkie ucho jest na nie znacznie mniej czułe. Okna nie są po prostu grupą kolejnych wartości natężenia dźwięku. Okna częściowo się pokrywają i jedna wartość należy w tych obszarach częściowo do kilku okien. Dla obszarów zachodzenia na siebie okien, dana wartość należy do lewego okna w stopniu sin(pi/2 sin2(pi/2 t)), gdzie t=0 dla początku obszaru i t=1 dla jego końca.
66 66/65 Kompresja dźwięku: Vorbis OGG (2) Na każdym oknie jest przeprowadzana zmodyfikowana transformata kosinusowa. Zamiast poszczególnych wartości mamy teraz w bloku widmo parametrów MDCT czyli (pomijając szczegóły) częstotliwości. Dane z MDCT są upraszczane zależnie od parametrów kompresji zgodnie z modelem psychoakustycznym. Dane o energii przypadającej na daną częstotliwość są skalowane, co umożliwia równie dobrą kompresje głośnych jak i cichych dźwięków. Dane są kwantowane i kompresowane bezstratnie.
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 1, strona 1.
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 1, strona 1. SYSTEMY MULTIMEDIALNE Co to jest system multimedialny? Elementy systemu multimedialnego Nośniki danych i ich wpływ na kodowanie Cele
Bardziej szczegółowoKompresja dźwięku w standardzie MPEG-1
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 7, strona 1. Kompresja dźwięku w standardzie MPEG-1 Ogólne założenia kompresji stratnej Zjawisko maskowania psychoakustycznego Schemat blokowy
Bardziej szczegółowoNeurobiologia na lekcjach informatyki? Percepcja barw i dźwięków oraz metody ich przetwarzania Dr Grzegorz Osiński Zakład Dydaktyki Fizyki IF UMK
Neurobiologia na lekcjach informatyki? Percepcja barw i dźwięków oraz metody ich przetwarzania Dr Grzegorz Osiński Zakład Dydaktyki Fizyki IF UMK IV Konferencja Informatyka w Edukacji 31.01 01.02. 2007
Bardziej szczegółowoKodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania
Kodowanie podpasmowe Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania Zasada ogólna Rozkład sygnału źródłowego na części składowe (jak w kodowaniu transformacyjnym) Wada kodowania
Bardziej szczegółowoWykład III: Kompresja danych. Studia Podyplomowe INFORMATYKA Podstawy Informatyki
Studia Podyplomowe INFORMATYKA Podstawy Informatyki Wykład III: Kompresja danych 1 I. Reprezentacja danych w komputerze Rodzaje danych w technice cyfrowej 010010101010 001010111010 101101001001 2 Kompresja
Bardziej szczegółowoDźwięk podstawowe wiadomości technik informatyk
Dźwięk podstawowe wiadomości technik informatyk I. Formaty plików opisz zalety, wady, rodzaj kompresji i twórców 1. Format WAVE. 2. Format MP3. 3. Format WMA. 4. Format MIDI. 5. Format AIFF. 6. Format
Bardziej szczegółowoSpis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami
Spis treści Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Formaty plików audio różnią się od siebie przede wszystkim zastosowanymi algorytmami kompresji. Kompresja danych polega na
Bardziej szczegółowoWymiana i Składowanie Danych Multimedialnych Mateusz Moderhak, EA 106, Pon. 11:15-12:00, śr.
Wymiana i Składowanie Danych Multimedialnych 2019 Mateusz Moderhak, matmod@biomed.eti.pg.gda.pl, EA 106, Pon. 11:15-12:00, śr. 12:15-13:00 Zaliczenie: 60% wykład, 40% laboratorium Zerówka w formie dwóch
Bardziej szczegółowoWedług raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j
Kompresja transformacyjna. Opis standardu JPEG. Algorytm JPEG powstał w wyniku prac prowadzonych przez grupę ekspertów (ang. Joint Photographic Expert Group). Prace te zakończyły się w 1991 roku, kiedy
Bardziej szczegółowoWykład VI. Dźwięk cyfrowy. dr inż. Janusz Słupik. Gliwice, Wydział Matematyki Stosowanej Politechniki Śląskiej. c Copyright 2014 Janusz Słupik
Wykład VI Wydział Matematyki Stosowanej Politechniki Śląskiej Gliwice, 2014 c Copyright 2014 Janusz Słupik Kompresja dźwięku Kompresja dźwięku bezstratna podczas odtwarzania otrzymujemy wierne odwzorowanie
Bardziej szczegółowoKompresja video (MPEG)
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 8, strona 1. Kompresja video (MEG) Zasadniczy schemat kompresora video Typy ramek przy kompresji czasowej Analiza ramek przez syntezę Sposób detekcji
Bardziej szczegółowoSpis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami
Spis treści Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Formaty plików audio różnią się od siebie przede wszystkim zastosowanymi algorytmami kompresji. Kompresja danych polega na
Bardziej szczegółowodr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db
dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db 1 Sygnał foniczny poziom analogowy czas cyfrowy poziom czas
Bardziej szczegółowoDŹWIĘK. Dźwięk analogowy - fala sinusoidalna. Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona
DŹWIĘK Dźwięk analogowy - fala sinusoidalna Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona Dźwięk cyfrowy 2-bitowy 2 bity 4 możliwe stany (rozdzielczość dwubitowa) 8 bitów - da
Bardziej szczegółowoKwantowanie sygnałów analogowych na przykładzie sygnału mowy
Kwantowanie sygnałów analogowych na przykładzie sygnału mowy Treść wykładu: Sygnał mowy i jego właściwości Kwantowanie skalarne: kwantyzator równomierny, nierównomierny, adaptacyjny Zastosowanie w koderze
Bardziej szczegółowoPercepcja dźwięku. Narząd słuchu
Percepcja dźwięku Narząd słuchu 1 Narząd słuchu Ucho zewnętrzne składa się z małżowiny i kanału usznego, zakończone błoną bębenkową, doprowadza dźwięk do ucha środkowego poprzez drgania błony bębenkowej;
Bardziej szczegółowoWstęp do techniki wideo
Wstęp do techniki wideo Wykład 11 Technologie dla urządzeń mobilnych Mgr inż. Łukasz Kirchner lukasz.kirchner@cs.put.poznan.pl http://www.cs.put.poznan.pl/lkirchner Standardy przesyłania obrazu wideo Luminancja
Bardziej szczegółowodr inż. Piotr Odya Wprowadzenie
dr inż. Piotr Odya Wprowadzenie Dane multimedialne to przede wszystkim duże strumienie danych liczone w MB a coraz częściej w GB; Mimo dynamicznego rozwoju technologii pamięci i coraz szybszych transferów
Bardziej szczegółowoCyfrowe przetwarzanie i kompresja danych. dr inż.. Wojciech Zając
Cyfrowe przetwarzanie i kompresja danych dr inż.. Wojciech Zając Wykład 7. Standardy kompresji obrazów nieruchomych Obraz cyfrowy co to takiego? OBRAZ ANALOGOWY OBRAZ CYFROWY PRÓBKOWANY 8x8 Kompresja danych
Bardziej szczegółowodr inż. Piotr Odya dr inż. Piotr Suchomski
dr inż. Piotr Odya dr inż. Piotr Suchomski Podział grafiki wektorowa; matematyczny opis rysunku; małe wymagania pamięciowe (i obliczeniowe); rasteryzacja konwersja do postaci rastrowej; rastrowa; tablica
Bardziej szczegółowoPomiary w technice studyjnej. TESTY PESQ i PEAQ
Pomiary w technice studyjnej TESTY PESQ i PEAQ Wprowadzenie Problem: ocena jakości sygnału dźwiękowego. Metody obiektywne - np. pomiar SNR czy THD+N - nie dają pełnych informacji o jakości sygnału. Ważne
Bardziej szczegółowoPrzedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.
Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2. Technika obrazu 24 W.3. Normalizacja w zakresie obrazu cyfrowego
Bardziej szczegółowoProgram wykładu. informatyka + 2
Program wykładu 1. Jak słyszymy podstawy fizyczne i psychofizyczne, efekty maskowania 2. Sposoby zapisu sygnałów dźwiękowych 3. Sposoby kodowania sygnałów dźwiękowych ze szczególnym uwzględnieniem MP3
Bardziej szczegółowoWybrane metody kompresji obrazów
Wybrane metody kompresji obrazów Celem kodowania kompresyjnego obrazu jest redukcja ilości informacji w nim zawartej. Redukcja ta polega na usuwaniu informacji nadmiarowej w obrazie, tzw. redundancji.
Bardziej szczegółowoPrzygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa
Przygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa Dźwięk wrażenie słuchowe, spowodowane falą akustyczną rozchodzącą się w ośrodku sprężystym (ciele stałym, cieczy, gazie). Częstotliwości fal, które
Bardziej szczegółowoTransformata Fouriera
Transformata Fouriera Program wykładu 1. Wprowadzenie teoretyczne 2. Algorytm FFT 3. Zastosowanie analizy Fouriera 4. Przykłady programów Wprowadzenie teoretyczne Zespolona transformata Fouriera Jeżeli
Bardziej szczegółowoKlasyfikacja metod kompresji
dr inż. Piotr Odya Klasyfikacja metod kompresji Metody bezstratne Zakodowany strumień danych po dekompresji jest identyczny z oryginalnymi danymi przed kompresją, Metody stratne W wyniku kompresji część
Bardziej szczegółowoCo to jest dźwięk. Dźwięk to wyrażenie słuchowe wywołane przez falę akustyczną. Ludzki narząd wyłapuje dźwięki z częstotliwością 16 do 20 Hz
Dźwięk Co to jest dźwięk Dźwięk to wyrażenie słuchowe wywołane przez falę akustyczną. Ludzki narząd wyłapuje dźwięki z częstotliwością 16 do 20 Hz Próbkowanie Cyfrowy zapis dźwięku opiera się na procedurze
Bardziej szczegółowoPodstawy transmisji multimedialnych podstawy kodowania dźwięku i obrazu Autor Wojciech Gumiński
Podstawy transmisji multimedialnych podstawy kodowania dźwięku i obrazu Autor Wojciech Gumiński Podstawy transmisji multimedialnych Plan wykładu Wprowadzenie 1. Wprowadzenie 2. Ilość informacji 3. Kodowanie
Bardziej szczegółowoZałożenia i obszar zastosowań. JPEG - algorytm kodowania obrazu. Geneza algorytmu KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG
Założenia i obszar zastosowań KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG Plan wykładu: Geneza algorytmu Założenia i obszar zastosowań JPEG kroki algorytmu kodowania obrazu Założenia: Obraz monochromatyczny
Bardziej szczegółowoTechnika audio część 2
Technika audio część 2 Wykład 12 Projektowanie cyfrowych układów elektronicznych Mgr inż. Łukasz Kirchner lukasz.kirchner@cs.put.poznan.pl http://www.cs.put.poznan.pl/lkirchner Wprowadzenie do filtracji
Bardziej szczegółowoKlasyfikacja metod kompresji
dr inż. Piotr Odya Klasyfikacja metod kompresji Metody bezstratne Zakodowany strumień danych po dekompresji jest identyczny z oryginalnymi danymi przed kompresją, Metody stratne W wyniku kompresji część
Bardziej szczegółowoFormaty - podziały. format pliku. format kompresji. format zapisu (nośnika) kontener dla danych WAV, AVI, BMP
dr inż. Piotr Odya Formaty - podziały format pliku kontener dla danych WAV, AVI, BMP format kompresji bezstratna/stratna ADPCM, MPEG, JPEG, RLE format zapisu (nośnika) ściśle określona struktura plików
Bardziej szczegółowoPrzetwarzanie i transmisja danych multimedialnych. Wykład 10 Kompresja obrazów ruchomych MPEG. Przemysław Sękalski.
Przetwarzanie i transmisja danych multimedialnych Wykład 10 Kompresja obrazów ruchomych MPEG Przemysław Sękalski sekalski@dmcs.pl Politechnika Łódzka Katedra Mikroelektroniki i Technik Informatycznych
Bardziej szczegółowoMetodyka i system dopasowania protez słuchu w oparciu o badanie percepcji sygnału mowy w szumie
Metodyka i system dopasowania protez w oparciu o badanie percepcji sygnału mowy w szumie opracowanie dr inż. Piotr Suchomski Koncepcja metody korekcji ubytku Dopasowanie szerokiej dynamiki odbieranego
Bardziej szczegółowoKomputerowe modelowanie ludzkiego słuchu w kompresji dźwięku
Matematyka i informatyka może i trudne, ale nie nudne Wykład 6 Komputerowe modelowanie ludzkiego słuchu w kompresji dźwięku prelegent: mgr inż Krzysztof Popowski 23 wrzesień 2009 Plan wykładu Podstawowe
Bardziej szczegółowoNowoczesne metody emisji ucyfrowionego sygnału telewizyjnego
Nowoczesne metody emisji ucyfrowionego sygnału telewizyjnego Bogdan Uljasz Wydział Elektroniki Wojskowej Akademii Technicznej ul. Kaliskiego 2 00-908 Warszawa Konferencja naukowo-techniczna Dzisiejsze
Bardziej szczegółowoPrzygotowała: prof. Bożena Kostek
Przygotowała: prof. Bożena Kostek Ze względu na dużą rozpiętość mierzonych wartości ciśnienia (zakres ciśnień akustycznych obejmuje blisko siedem rzędów wartości: od 2x10 5 Pa do ponad 10 Pa) wygodniej
Bardziej szczegółowoMetody kodowania i przechowywania sygnałów dźwiękowych. Andrzej Majkowski Politechnika Warszawska amajk@ee.pw.edu.pl
Metody kodowania i przechowywania sygnałów dźwiękowych Andrzej Majkowski Politechnika Warszawska amajk@ee.pw.edu.pl < 74 > Informatyka + Wszechnica Popołudniowa > Metody kodowania i przechowywania sygnałów
Bardziej szczegółowoWybrane algorytmu kompresji dźwięku
[1/28] Wybrane algorytmu kompresji dźwięku [dr inż. Paweł Forczmański] Katedra Systemów Multimedialnych, Wydział Informatyki, Zachodniopomorski Uniwersytet Technologiczny w Szczecinie [2/28] Podstawy kompresji
Bardziej szczegółowoRozpoznawanie i synteza mowy w systemach multimedialnych. Analiza i synteza mowy - wprowadzenie. Spektrogram wyrażenia: computer speech
Slajd 1 Analiza i synteza mowy - wprowadzenie Spektrogram wyrażenia: computer speech Slide 1 Slajd 2 Analiza i synteza mowy - wprowadzenie Slide 2 Slajd 3 Analiza i synteza mowy - wprowadzenie Slide 3
Bardziej szczegółowoKodowanie źródeł sygnały video. Sygnał video definicja i podstawowe parametry
Kodowanie źródeł sygnały video (A) (B) (C) Sygnał video definicja i podstawowe parametry Liczba klatek na sekundę Przeplot Rozdzielczość obrazu Proporcje obrazu Model barw Przepływność binarna Kompresja
Bardziej szczegółowoWszechnica Popołudniowa: Multimedia, grafika i technologie internetowe Metody kodowania i przechowywania sygnałów dźwiękowych
Wszechnica Popołudniowa: Multimedia, grafika i technologie internetowe Metody kodowania i przechowywania sygnałów dźwiękowych Andrzej Majkowski Człowiek najlepsza inwestycja Rodzaj zajęć: Wszechnica Popołudniowa
Bardziej szczegółowoKompresja JPG obrazu sonarowego z uwzględnieniem założonego poziomu błędu
Kompresja JPG obrazu sonarowego z uwzględnieniem założonego poziomu błędu Mariusz Borawski Wydział Informatyki Zachodniopomorski Uniwersytet Technologiczny w Szczecinie Zbieranie danych Obraz sonarowy
Bardziej szczegółowoAutorzy: Tomasz Sokół Patryk Pawlos Klasa: IIa
Autorzy: Tomasz Sokół Patryk Pawlos Klasa: IIa Dźwięk wrażenie słuchowe, spowodowane falą akustyczną rozchodzącą się w ośrodku sprężystym (ciele stałym, cieczy, gazie). Częstotliwości fal, które są słyszalne
Bardziej szczegółowoSystemy i Sieci Telekomunikacyjne laboratorium. Modulacja amplitudy
Systemy i Sieci Telekomunikacyjne laboratorium Modulacja amplitudy 1. Cel ćwiczenia: Celem części podstawowej ćwiczenia jest zbudowanie w środowisku GnuRadio kompletnego, funkcjonalnego odbiornika AM.
Bardziej szczegółowoMicha Strzelecki Metody przetwarzania i analizy obrazów biomedycznych (2)
Micha Strzelecki Metody przetwarzania i analizy obrazów biomedycznych (2) Prezentacja multimedialna współfinansowana przez Unię Europejską w ramach Europejskiego Funduszu Społecznego w projekcie Innowacyjna
Bardziej szczegółowoDiagnostyka i protetyka słuchu i wzroku APARATY SŁUCHOWES
Diagnostyka i protetyka słuchu i wzroku APARATY SŁUCHOWES Wprowadzenie Aparat słuchowy (ang. hearing aid) urządzenie, którego zadaniem jest przetwarzanie odbieranych sygnałów w taki sposób, aby: dźwięki
Bardziej szczegółowoWszechnica Popołudniowa: Multimedia, grafika i technologie internetowe Metody kodowania i przechowywania sygnałów dźwiękowych
Wszechnica Popołudniowa: Multimedia, grafika i technologie internetowe Metody kodowania i przechowywania sygnałów dźwiękowych Andrzej Majkowski Człowiek najlepsza inwestycja Rodzaj zajęć: Wszechnica Popołudniowa
Bardziej szczegółowoPsychoakustyka. Dźwięk zapisany w formie nieskompresowanej na przykład na CD zawiera więcej informacji niż jest w stanie przetworzyć ludzki mózg.
Standard MP3 Historia Standard MPEG-1 - "Layer3" został opracowany w niemieckim instytucie Fraunhofer, a konkretnie w departamencie "Audio i Multimedia", gdzie około 30 inżynierów pracuje nad rozwojem
Bardziej szczegółowoKompresja sekwencji obrazów - algorytm MPEG-2
Kompresja sekwencji obrazów - algorytm MPEG- Moving Pictures Experts Group (MPEG) - 988 ISO - International Standard Organisation CCITT - Comité Consultatif International de Téléphonie et TélégraphieT
Bardziej szczegółowoAudio i video. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski
Audio i video R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski s-rg@siwy.il.pw.edu.pl Fale dźwiękowe Dźwięk jest drganiem powietrza rozchodzącym się w postaci fali. Fala ma określoną amplitudę i częstotliwość.
Bardziej szczegółowoAkwizycja obrazów. Zagadnienia wstępne
Akwizycja obrazów. Zagadnienia wstępne Wykorzystane materiały: R. Tadeusiewicz, P. Korohoda, Komputerowa analiza i przetwarzanie obrazów, Wyd. FPT, Kraków, 1997 A. Przelaskowski, Techniki Multimedialne,
Bardziej szczegółowoWprowadzenie do cyfrowej obróbki dźwięku
Wprowadzenie do cyfrowej obróbki dźwięku Na czym polega kompresja plików audio? Zapis dźwięku w formacie cyfrowym polega na zapisaniu kształtu sygnału w postaci ciągu liczb. Procedura powyższa nazywana
Bardziej szczegółowoPython: JPEG. Zadanie. 1. Wczytanie obrazka
Python: JPEG Witajcie! Jest to kolejny z serii tutoriali uczący Pythona, a w przyszłości być może nawet Cythona i Numby Jeśli chcesz nauczyć się nowych, zaawansowanych konstrukcji to spróbuj rozwiązać
Bardziej szczegółowoKompresja Stratna i Bezstratna Przegląd Najważniejszych Formatów Graficznych
Kompresja Stratna i Bezstratna Przegląd Najważniejszych Formatów Graficznych Idea Kompresji Kompresja danych - polega na zmianie sposobu zapisu informacji w taki sposób, aby zmniejszyć redundancję czyli
Bardziej szczegółowoFormaty kompresji audio
Formaty kompresji audio Kompresja bezstratna Kompresja bezstratna zachowuje pełną informację o przebiegu sygnału dźwiękowego. Polega ona na sprytnej zmianie sposobu zapisu danych, dzięki czemu zapis jest
Bardziej szczegółowoSprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów
Sprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów 1. Przekształcenie sygnału analogowego na postać cyfrową określamy mianem: a. digitalizacji
Bardziej szczegółowoZastosowanie kompresji w kryptografii Piotr Piotrowski
Zastosowanie kompresji w kryptografii Piotr Piotrowski 1 Plan prezentacji I. Wstęp II. Kryteria oceny algorytmów III. Główne klasy algorytmów IV. Przykłady algorytmów selektywnego szyfrowania V. Podsumowanie
Bardziej szczegółowoNauka o słyszeniu. Wykład III +IV Wysokość+ Głośność dźwięku
Nauka o słyszeniu Wykład III +IV Wysokość+ Głośność dźwięku Anna Preis, email: apraton@amu.edu.pl 21-28.10.2015 Plan wykładu - wysokość Wysokość dźwięku-definicja Periodyczność Dźwięk harmoniczny Wysokość
Bardziej szczegółowoKodowanie transformacyjne. Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG
Kodowanie transformacyjne Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG Zasada Zasada podstawowa: na danych wykonujemy transformacje która: Likwiduje korelacje Skupia energię w kilku komponentach
Bardziej szczegółowo2. STRUKTURA RADIOFONICZNYCH SYGNAŁÓW CYFROWYCH
1. WSTĘP Radiofonię cyfrową cechują strumienie danych o dużych przepływnościach danych. Do przesyłania strumienia danych o dużych przepływnościach stosuje się transmisję z wykorzystaniem wielu sygnałów
Bardziej szczegółowoTECHNIKI MULTIMEDIALNE
Studia Podyplomowe INFORMATYKA TECHNIKI MULTIMEDIALNE dr Artur Bartoszewski Film ile klatek na sekundę? Impulsy świetlne działają na komórki nerwowe jeszcze przez kilka ułamków sekundy po ustąpieniu faktycznego
Bardziej szczegółowoZe względu na dużą rozpiętość mierzonych wartości ciśnienia (zakres ciśnień akustycznych obejmuje blisko siedem rzędów wartości: od 2x10 5 Pa do
Ze względu na dużą rozpiętość mierzonych wartości ciśnienia (zakres ciśnień akustycznych obejmuje blisko siedem rzędów wartości: od 2x10 5 Pa do ponad 10 Pa) wygodniej jest mierzone ciśnienie akustyczne
Bardziej szczegółowoNauka o słyszeniu Wykład IV Głośność dźwięku
Nauka o słyszeniu Wykład IV Głośność dźwięku Anna Preis, email: apraton@amu.edu.pl 26.10.2016 Plan wykładu - głośność Próg słyszalności Poziom ciśnienia akustycznego SPL a poziom dźwięku SPL (A) Głośność
Bardziej szczegółowoKOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG
KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG Joint Photographic Expert Group - 1986 ISO - International Standard Organisation CCITT - Comité Consultatif International de Téléphonie et Télégraphie Standard
Bardziej szczegółowoKonwersja dźwięku analogowego do postaci cyfrowej
Konwersja dźwięku analogowego do postaci cyfrowej Schemat postępowania podczas przetwarzania sygnału analogowego na cyfrowy nie jest skomplikowana. W pierwszej kolejności trzeba wyjaśnić kilka elementarnych
Bardziej szczegółowoKompresja sekwencji obrazów
Kompresja sekwencji obrazów - algorytm MPEG-2 Moving Pictures Experts Group (MPEG) - 1988 ISO - International Standard Organisation CCITT - Comité Consultatif International de Téléphonie T et TélégraphieT
Bardziej szczegółowoAutomatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści
Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, 2011 Spis treści Przedmowa 11 Rozdział 1. WPROWADZENIE 13 1.1. Czym jest automatyczne rozpoznawanie mowy 13 1.2. Poziomy
Bardziej szczegółowo2. Próbkowanie Sygnały okresowe (16). Trygonometryczny szereg Fouriera (17). Częstotliwość Nyquista (20).
SPIS TREŚCI ROZDZIAŁ I SYGNAŁY CYFROWE 9 1. Pojęcia wstępne Wiadomości, informacje, dane, sygnały (9). Sygnał jako nośnik informacji (11). Sygnał jako funkcja (12). Sygnał analogowy (13). Sygnał cyfrowy
Bardziej szczegółowoGrafika Komputerowa Wykład 1. Wstęp do grafiki komputerowej Obraz rastrowy i wektorowy. mgr inż. Michał Chwesiuk 1/22
Wykład 1 Wstęp do grafiki komputerowej rastrowy i wektorowy mgr inż. 1/22 O mnie mgr inż. michalchwesiuk@gmail.com http://mchwesiuk.pl Materiały, wykłady, informacje Doktorant na Wydziale Informatyki Uniwersytetu
Bardziej szczegółowoFale akustyczne. Jako lokalne zaburzenie gęstości lub ciśnienia w ośrodkach posiadających gęstość i sprężystość. ciśnienie atmosferyczne
Fale akustyczne Jako lokalne zaburzenie gęstości lub ciśnienia w ośrodkach posiadających gęstość i sprężystość ciśnienie atmosferyczne Fale podłużne poprzeczne długość fali λ = v T T = 1/ f okres fali
Bardziej szczegółowoKOMPRESJA STRATNA SYGNAŁU MOWY. Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP
KOMPRESJA STRATNA SYGNAŁU MOWY Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP Śledzenie i upraszczanie zmian dynamicznych sygnałów ADPCM
Bardziej szczegółowoJoint Photographic Experts Group
Joint Photographic Experts Group Artur Drozd Uniwersytet Jagielloński 14 maja 2010 1 Co to jest JPEG? Dlaczego powstał? 2 Transformata Fouriera 3 Dyskretna transformata kosinusowa (DCT-II) 4 Kodowanie
Bardziej szczegółowoPROGRAMOWANIE APLIKACJI MULTIMEDIALNYCH
PROGRAMOWANIE APLIKACJI MULTIMEDIALNYCH PRZETWARZANIE OBRAZÓW I DŹWIĘKÓW wykład 6 KOMPRESJA SYGNAŁÓW AKUSTYCZNYCH Prowadzący: Tomasz Kowalski Natura i percepcja dźwięków 2 Dźwięk - zarówno mowa, jak i
Bardziej szczegółowomgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 4, strona 1. GOLOMBA I RICE'A
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 4, strona 1. KOMPRESJA ALGORYTMEM ARYTMETYCZNYM, GOLOMBA I RICE'A Idea algorytmu arytmetycznego Przykład kodowania arytmetycznego Renormalizacja
Bardziej szczegółowoPL B BUP 16/04. Kleczkowski Piotr,Kraków,PL WUP 04/09
RZECZPOSPOLITA POLSKA (12) OPIS PATENTOWY (19) PL (11) 201536 (13) B1 (21) Numer zgłoszenia: 358531 (51) Int.Cl. G10L 21/02 (2006.01) H03G 3/00 (2006.01) Urząd Patentowy Rzeczypospolitej Polskiej (22)
Bardziej szczegółowoOdtwarzanie i kompresja wideo
Odtwarzanie i kompresja wideo dr inż. Piotr Steć Rodzaje plików wideo Kontenery AVI Audio Video Interleave WMV Windows Media Video MOV QuickTime MKV Matroska Standardy kompresji MPEG Motion Pictures Expert
Bardziej szczegółowoZAKŁAD SYSTEMÓW ELEKTRONICZNYCH I TELEKOMUNIKACYJNYCH Laboratorium Podstaw Telekomunikacji WPŁYW SZUMÓW NA TRANSMISJĘ CYFROWĄ
Laboratorium Podstaw Telekomunikacji Ćw. 4 WPŁYW SZUMÓW NA TRANSMISJĘ CYFROWĄ 1. Zapoznać się z zestawem do demonstracji wpływu zakłóceń na transmisję sygnałów cyfrowych. 2. Przy użyciu oscyloskopu cyfrowego
Bardziej szczegółowoVÉRITÉ rzeczywistość ma znaczenie Vérité jest najnowszym, zaawansowanym technologicznie aparatem słuchowym Bernafon przeznaczonym dla najbardziej wymagających Użytkowników. Nieprzypadkowa jest nazwa tego
Bardziej szczegółowoPrzesył mowy przez internet
Damian Goworko Zuzanna Dziewulska Przesył mowy przez internet organizacja transmisji głosu, wybrane kodeki oraz rozwiązania podnoszące jakość połączenia głosowego Telefonia internetowa / voice over IP
Bardziej szczegółowo1 LEKCJA. Definicja grafiki. Główne działy grafiki komputerowej. Programy graficzne: Grafika rastrowa. Grafika wektorowa. Grafika trójwymiarowa
1 LEKCJA Definicja grafiki Dział informatyki zajmujący się wykorzystaniem komputerów do generowania i przetwarzania obrazów (statycznych i dynamicznych) oraz wizualizacją danych. Główne działy grafiki
Bardziej szczegółowoKodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania
Kodowanie podpasmowe Plan 1. Zasada. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania Zasada ogólna Rozkład sygnału źródłowego na części składowe (jak w kodowaniu transformacyjnym) Wada kodowania
Bardziej szczegółowoSystemy multimedialne. Instrukcja 5 Edytor audio Audacity
Systemy multimedialne Instrukcja 5 Edytor audio Audacity Do sprawozdania w formacie pdf należy dołączyc pliki dźwiękowe tylko z podpunktu 17. Sprawdzić poprawność podłączenia słuchawek oraz mikrofonu (Start->Programy->Akcesoria->Rozrywka->Rejestrator
Bardziej szczegółowoKodowanie transformujace. Kompresja danych. Tomasz Jurdziński. Wykład 11: Transformaty i JPEG
Tomasz Wykład 11: Transformaty i JPEG Idea kodowania transformujacego Etapy kodowania 1 Wektor danych x 0,...,x N 1 przekształcamy (odwracalnie!) na wektor c 0,...,c N 1, tak aby: energia była skoncentrowana
Bardziej szczegółowoSpis treści. 1. Cyfrowy zapis i synteza dźwięku Schemat blokowy i zadania karty dźwiękowej UTK. Karty dźwiękowe. 1
Spis treści 1. Cyfrowy zapis i synteza dźwięku... 2 2. Schemat blokowy i zadania karty dźwiękowej... 4 UTK. Karty dźwiękowe. 1 1. Cyfrowy zapis i synteza dźwięku Proces kodowania informacji analogowej,
Bardziej szczegółowoGrafika komputerowa. mgr inż. Remigiusz Pokrzywiński
Grafika komputerowa mgr inż. Remigiusz Pokrzywiński Spis treści Grafika komputerowa Grafika wektorowa Grafika rastrowa Format graficzny, piksel, raster Rozdzielczość, głębia koloru Barwa Modele barw Kompresja
Bardziej szczegółowodr inż. Piotr Odya Kontener
dr inż. Piotr Odya Kontener 1 Formaty - podziały format pliku kontener dla danych WAV, AVI, BMP format kompresji bezstratna/stratna ADPCM, MPEG, JPEG, RLE format zapisu (nośnika) ściśle określona struktura
Bardziej szczegółowoStandardy telewizji kolorowej (SD)
dr inż. Piotr Odya Standardy telewizji kolorowej (SD) Europa PAL/SECAM standard 625linii/50Hz rozdzielczości: 768x576, 720x576, 704x576 (tzw. pełny PAL), 384x288, 352x288 (tzw. połówka PAL'u) Ameryka NTSC
Bardziej szczegółowodr inż. Jacek Naruniec
dr inż. Jacek Naruniec J.Naruniec@ire.pw.edu.pl Entropia jest to średnia ilość informacji przypadająca na jeden znak alfabetu. H( x) n i 1 p( i)log W rzeczywistości określa nam granicę efektywności kodowania
Bardziej szczegółowoPodstawy transmisji sygnałów
Podstawy transmisji sygnałów 1 Sygnał elektromagnetyczny Jest funkcją czasu Może być również wyrażony jako funkcja częstotliwości Sygnał składa się ze składowych o róznych częstotliwościach 2 Koncepcja
Bardziej szczegółowoFormaty plików. graficznych, dźwiękowych, wideo
Formaty plików graficznych, dźwiękowych, wideo Spis treści: Wstęp: Co to jest format? Rodzaje formatów graficznych Właściwości formatów graficznych Porównanie formatów między sobą Formaty plików dźwiękowych
Bardziej szczegółowoKOMPRESJA STRATNA DŹWIĘKU
ZESZYTY NAUKOWE 39-58 Leszek Grad 1 KOMPRESJA STRATNA DŹWIĘKU Streszczenie W artykule przedstawione zostały elementarne wiadomości z zakresu kompresji stratnej dźwięku. Przedstawiony został liniowy model
Bardziej szczegółowoPlan wykładu. Wprowadzenie Program graficzny GIMP Edycja i retusz zdjęć Podsumowanie. informatyka +
Plan wykładu Wprowadzenie Program graficzny GIMP Edycja i retusz zdjęć Podsumowanie 2 Po co obrabiamy zdjęcia Poprawa jasności, kontrastu, kolorów itp. Zdjęcie wykonano w niesprzyjających warunkach (złe
Bardziej szczegółowoPoznawcze znaczenie dźwięku
Poznawcze znaczenie dźwięku Justyna Maculewicz Uniwersytet im. A. Mickiewicza, kognitywistyka (IV rok) akustyka (II rok) e-mail: justynamaculewicz@gmail.com Klasyczne ujęcie słyszenia jako percepcji zdarzeń
Bardziej szczegółowoZagadnienia egzaminacyjne ELEKTRONIKA I TELEKOMUNIKACJA studia rozpoczynające się przed r.
(EAE) Aparatura elektroniczna 1. Podstawowe statyczne i dynamiczne właściwości czujników. 2. Prawa gazów doskonałych i ich zastosowania w pomiarze ciśnienia. 3. Jakie właściwości mikrokontrolerów rodziny
Bardziej szczegółowoCechy formatu PNG Budowa bloku danych Bloki standardowe PNG Filtrowanie danych przed kompresją Wyświetlanie progresywne (Adam 7)
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 5, strona 1. PNG (PORTABLE NETWORK GRAPHICS) Cechy formatu PNG Budowa bloku danych Bloki standardowe PNG Filtrowanie danych przed kompresją Wyświetlanie
Bardziej szczegółowo4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...
Spis treści 1 Wstęp 11 1.1 Do kogo adresowana jest ta książka... 12 1.2 Historia badań nad mową i językiem... 12 1.3 Obecne główne trendy badań... 16 1.4 Opis zawartości rozdziałów... 18 2 Wyzwania i możliwe
Bardziej szczegółowoPrzetwarzanie i transmisja danych multimedialnych. Wykład 6 Metody predykcyjne. Przemysław Sękalski.
Przetwarzanie i transmisja danych multimedialnych Wykład 6 Metody predykcyjne Przemysław Sękalski sekalski@dmcs.pl Politechnika Łódzka Katedra Mikroelektroniki i Technik Informatycznych DMCS Wykład opracowano
Bardziej szczegółowo