Modelowanie zaawansowanych koderów wizyjnych
|
|
- Adrian Kubicki
- 8 lat temu
- Przeglądów:
Transkrypt
1 Politechnika Poznańska Wydział Elektroniki i Telekomunikacji Katedra Telekomunikacji Multimedialnej i Mikroelektroniki Autoreferat rozprawy doktorskiej Modelowanie zaawansowanych koderów wizyjnych Tomasz Grajek Promotor: Prof. dr hab. inŝ. Marek Domański Poznań, 2010
2
3 Spis treści Spis treści Wprowadzenie Modelowanie koderów wizyjnych Cele i teza pracy Przegląd pracy Zasadnicze osiągnięcia rozprawy Wprowadzenie Metodologia prowadzenia badań Oryginalne modele kodera wizyjnego standardu MPEG-4 AVC/H Wprowadzenie Modelowanie średniej liczby bitów potrzebnych do reprezentacji skompresowanego obrazu Modelowanie liczby bitów reprezentacji pojedynczego obrazu Modelowanie łącznej liczby bitów potrzebnych do reprezentacji składowych luminancji i chrominancji pojedynczego obrazu Podsumowanie i wnioski Wnioski Oryginalne osiągnięcia Dorobek naukowy autora Publikacje naukowe autora Oryginalne osiągnięcia autora nie ujęte w rozprawie, a zastosowane w praktyce
4
5 1. Wprowadzenie 1.1. Modelowanie koderów wizyjnych Rozprawa dotyczy zaawansowanych technik kompresji obrazów ruchomych (sekwencji wizyjnych). Przez zaawansowane techniki kompresji sekwencji wizyjnych rozumie się najnowsze techniki rozwinięte po roku 2000, zwłaszcza techniki ujęte w najnowszych standardach takich jak MPEG-4 AVC/H.264, AVS i VC-1 (ten ostatni jest związany z powszechnie znaną techniką WMV 1 9.0). Techniki te wykorzystują nowe, często skomplikowane narzędzia kodowania, przez co osiągają lepszą sprawność kompresji w porównaniu z dotychczas powszechnie stosowanymi algorytmami (MPEG-1, MPEG-2, H.263). Stosuje się je w systemach telekomunikacyjnych i teleinformatycznych nowych generacji, w telewizji cyfrowej, wideotelefonii, cyfrowych systemach nadzoru wizyjnego, transmisji obrazu w sieciach komputerowych itd. W hybrydowych koderach wizyjnych ilościowe zaleŝności między jakością obrazu, szybkością bitową strumienia danych i parametrami sterującymi kodera zawsze silnie zaleŝą od treści kodowanej sekwencji (od charakteru i ilości ruchu, liczby szczegółów itd.). Szeroko stosowany adaptacyjny wybór trybów kodowania w koderach zaawansowanych czyni ten związek jeszcze bardziej skomplikowanym. Zaawansowane kodery sekwencji wizyjnych są regulowane przez wiele parametrów, z których część powinna być automatycznie wyznaczana przez procedurę sterowania. Algorytm sterowania dobiera parametry kodera tak, aby uzyskać maksymalną jakość kodowanej sekwencji wizyjnej przy załoŝonej prędkości bitowej 1 Windows Media Video 5
6 (tryb stałej prędkości bitowej CBR 1 ). W innym scenariuszu algorytm sterowania dąŝy do utrzymania stałej jakości i minimalizacji ogólnej liczby bitów reprezentujących sekwencję wizyjną (tryb stałej jakości przy zmiennej prędkości bitowej VBR 2 ). Ponadto, opisane wyŝej procesy muszą uwzględniać wielkość dopuszczalnego opóźnienia kodowania. Znalezienie optymalnych wartości parametrów sterujących pracą kodera wymaga duŝych nakładów obliczeniowych. Dlatego w praktycznych implementacjach stosuje się róŝnego rodzaju uproszczenia. Jednym z moŝliwych rozwiązań jest wykorzystanie modelu opisującego związki pomiędzy parametrami takiego kodera, prędkością bitową strumienia danych na wyjściu kodera, a parametrami treści kodowanej sekwencji wizyjnej. Wykorzystanie modelu pozwala na szybkie wyznaczenie parametrów sterujących w odpowiedzi na gwałtowną zmianę warunków transmisyjnych. W klasycznych zastosowaniach kompresji sygnałów wizyjnych szybkość transmisji była najczęściej stała lub rzadko modyfikowana (rozsiewcza telewizja cyfrowa naziemna, kablowa i satelitarna). Obecnie, w systemach internetowych i przy wykorzystaniu sieci bezprzewodowych i mobilnych, sytuacja się zmieniła. Kodery wizyjne muszą szybko reagować na zmiany w sieci i w kanałach transmisyjnych. Dlatego rośnie znaczenie praktyczne dobrych modeli koderów. Sformułowanie choćby przybliŝonych zaleŝności ilościowych pomiędzy prędkością bitową danych na wyjściu kodera, parametrami sterującymi kodera i parametrami treści sekwencji ma olbrzymie znaczenie poznawcze. Posługując się takimi modelami moŝna zbadać zachowanie się kodera w róŝnych stanach. Dla zaawansowanych technik kompresji dotychczas opracowane modele nie są wystarczające. Brakuje modeli analogicznych do tych, które zostały wcześniej opracowane dla starszych technik kompresji sygnałów wizyjnych. PoniewaŜ zaawansowane kodery hybrydowe są bardzo złoŝone, to zbiór parametrów sterujących koderem jest duŝy. Większość tych parametrów dobiera się w celu uzyskania jak najlepszej relacji miedzy jakością zakodowanej sekwencji wizyjnej a załoŝoną prędkością bitową. Natomiast jedynym parametrem pozwalającym na zmianę prędkości bitowej strumienia danych na wyjściu kodera w bardzo szerokim zakresie jest Q - parametr określający szerokość przedziałów kwantyzacji. Dlatego do modelowania hybrydowych koderów wizyjnych, wykorzystuje się głównie parametr Q. 1 Constant Bit Rate 2 Variable Bit Rate 6
7 Międzynarodowe standardy kompresji sygnałów wizyjnych (np. MPEG-2, MPEG-4 (część 2), H.263, MPEG-4 AVC/H.264) definiują tylko proces dekodowania wraz z semantyką i składnią strumienia bitowego (rysunek 1.1). Tym samym dają duŝą swobodę konstruktorom sprzętu i oprogramowania, którzy mogą stosunkowo dowolnie optymalizować kodery ze względu na ich szybkość działania i sprawność kompresji. Swoboda projektowania dotyczy takŝe procedur sterowania koderami. Takie procedury nie są objęte standardami i ciągle trwają badania dotyczące ich ulepszania. Sekwencja wejściowa Przetwarzanie wstępne Koder Kanał transmisyjny Sekwencja wyjściowa Przetwarzanie końcowe i maskowanie błędów Dekoder Zakres standaryzacji Rysunek 1.1. Zakres standaryzacji koderów wizyjnych Procedury sterowania często wykorzystują modele koderów. Modele są potrzebne takŝe dla opisu i zrozumienia sposobu działania koderów. Modele związane są z poszczególnymi odmianami koderów. Aby zaproponowane w rozprawie modele miały uniwersalny charakter i mogły być w prosty sposób adaptowane do róŝnych zaawansowanych technik kompresji, autor do badań wykorzystał oprogramowanie referencyjne standardu MPEG-4 AVC/H.264 w wersji JM Jest to oprogramowanie ogólnodostępne, w którym zaimplementowano wszystkie narzędzia przewidziane przez standard. Ponadto, jest ono wykorzystywane jako odniesienie dla innych zaawansowanych kodeków wizyjnych w badaniach naukowych i testach. Rozprawa jest wynikiem przemyśleń, analiz, badań, jak równieŝ doświadczeń zdobytych przez doktoranta podczas realizacji wielu projektów badawczo-rozwojowych wykonywanych na zlecenia duŝych firm zarówno polskich, jak i zagranicznych. 7
8 1.2. Cele i teza pracy Celem pracy jest zaproponowanie ilościowych modeli matematycznych koderów standardu MPEG-4 AVC/H.264, których sprawność kompresji reprezentowana zaleŝnościami prędkość bitowa jakość obrazu zdekodowanego jest w przybliŝeniu równa sprawności implementacji referencyjnej kodera standardu MPEG-4 AVC/H.264. Modele te mają opisywać związki pomiędzy prędkością bitową strumienia danych na wyjściu kodera i szerokością przedziałów kwantyzacji Q. Ponadto, celem pracy jest analiza dokładności modelowania kodera standardu MPEG-4 AVC/H.264 za pomocą zaproponowanych modeli. Teza pracy: MoŜliwe jest opracowanie matematycznych modeli zaawansowanych koderów wizyjnych pozwalających na wyznaczenie liczby bitów generowanych przez koder w zaleŝności od szerokości przedziałów kwantyzacji Q. Modele zostały zaproponowane na podstawie analizy danych eksperymentalnych uzyskanych z wykorzystaniem referencyjnej implementacji kodeka standardu MPEG-4 AVC/H.264 dla szerokiej klasy sekwencji wizyjnych o standardowej rozdzielczości telewizyjnej Przegląd pracy Praca dotyczy modelowania zaawansowanych koderów wizyjnych, a w szczególności koderów wytwarzających strumienie binarne zgodne ze standardem MPEG-4 AVC/H.264, który jest coraz szerzej stosowany w systemach multimedialnych. W szczególności przedstawione w rozprawie modelowanie dotyczy koderów, których sprawność kompresji jest równa sprawności kompresji referencyjnej implementacji kodera wizyjnego standardu MPEG-4 AVC/H.264. W rozdziale 2 rozprawy przedstawiono sposób reprezentacji skompresowanych sekwencji wizyjnych na wyjściu kodera MPEG-4 AVC/H.264 zgodnego z profilem głównym. 8
9 W rozdziale 3 dokonano przeglądu literatury dotyczącej modelowania hybrydowych koderów wizyjnych ze szczególnym uwzględnieniem modelowania koderów wykorzystujących zaawansowane techniki kompresji. Rozdziały 4 do 6 zawierają autorskie propozycje ilościowych modeli kodera wizyjnego standardu MPEG-4 AVC/H.264 wraz z opisem kolejnych etapów tworzenia tych modeli. Ponadto, umieszczono w nich wyniki analizy dokładności zaproponowanych modeli przeprowadzonej dla wielu reprezentatywnych sekwencji wizyjnych o standardowej rozdzielczości telewizyjnej. NaleŜy zaznaczyć, Ŝe w rozdziale 4 zreferowano badania eksperymentalne ze wszystkimi wynikami cząstkowymi. Natomiast w rozdziałach 5 i 6, ze względu na bogaty zbiór wyników, zamieszczono tylko zbiorcze opracowania rezultatów badań z pominięciem wyników cząstkowych. Wyniki rozprawy podsumowano w rozdziale 7. Przedstawiono w nim główne wnioski z przeprowadzonych badań oraz zaprezentowano najwaŝniejsze osiągnięcia. Wskazano takŝe moŝliwe kierunki dalszych badań. 9
10
11 2. Zasadnicze osiągnięcia rozprawy 2.1. Wprowadzenie Opracowanie modeli matematycznych koderów wizyjnych ma duŝe znaczenie zarówno poznawcze, jak i praktyczne. Znajomość modelu opisującego relację pomiędzy parametrami kodera a wielkością zakodowanego strumienia pozwala na przewidywanie zachowania się kodera w róŝnych warunkach. Ponadto, taki model moŝe zostać wykorzystany w algorytmie sterowania koderem do ustalania wartości szerokości przedziałów kwantyzacji Q dla zadanej liczby bitów. Dlatego w literaturze dotyczącej technik hybrydowego kodowania sekwencji wizyjnych modelowanie koderów wizyjnych jest stosunkowo często poruszanym tematem. Analizując literaturę z zakresu modelowania hybrydowych koderów wizyjnych, moŝna znaleźć szereg przykładów pokazujących, Ŝe dla wcześniejszych standardów kodowania sekwencji wizyjnych udało się opracować modele wyraŝające liczbę bitów na wyjściu kodera w funkcji parametru kwantyzacji. Jednak ciągle brakuje dobrych modeli dla koderów standardu MPEG-4 AVC/H.264. Jednym z powodów jest to, Ŝe rozwiązania znane ze starszych technik kodowania sekwencji wizyjnych, nie dają się bezpośrednio zaadaptować do koderów standardu MPEG-4 AVC/H.264 (głównie ze względu na wykorzystywanie w koderze optymalizacji prędkość bitowa zniekształcenie (RDO 1 )). Co więcej, duŝy stopień komplikacji zaawansowanych koderów wizyjnych, skutecznie utrudnia wyprowadzenie modeli matematycznych opierających się na analizie struktury kodera i wykorzystywanych w nim algorytmów. Większość proponowanych modeli dla takich koderów dotyczy wyłącznie obrazów 1 Rate Distortion Optimization 11
12 typu P. Obecnie brakuje dokładnych modeli matematycznych opisujących obrazy pozostałych typów, a w szczególności obrazy typu B. PowyŜsze argumenty skłoniły autora do podjęcia badań nad modelowaniem koderów wizyjnych, co zaowocowało zaproponowaniem własnych modeli kodera wizyjnego standardu MPEG-4 AVC/H Metodologia prowadzenia badań Tworzenie modelu autor podzielił na dwa główne etapy: zaplanowanie i przeprowadzenie eksperymentów, łącznie z zebraniem odpowiednich danych eksperymentalnych, opracowanie zebranych danych eksperymentalnych, tj. wyznaczenie modelu i ocena jego dokładności. Proponowane modele zostały zbudowane w oparciu o analizę statystyczną danych eksperymentalnych zebranych dla zbioru sekwencji testowych o rozdzielczości przestrzennej 704x576 punktów (4CIF 1 ) i częstotliwościach obrazu 25 lub 30 Hz. Zbiór ten obejmuje sekwencje testowe wykorzystywane do badań porównawczych prowadzonych w ramach działalności grup ekspertów MPEG 2 (działa z ramienia ISO 3 ) i VCEG 4 (działa z ramienia ITU-T 5 ). Wspomniane grupy ekspertów stosują te sekwencje do testowania koderów wizyjnych i podczas tworzenia nowych standardów kompresji sekwencji wizyjnych. Wybrane sekwencje są bardzo zróŝnicowane pod względem treści oraz charakteru i dynamiki ruchu. KaŜda sekwencja testowa zawierała obrazy tylko z pojedynczego ujęcia, czyli w sekwencjach wizyjnych nie występowały cięcia. NaleŜy zaznaczyć, Ŝe kiedy rozpoczynano badania nie było ustalonego zbioru reprezentatywnych sekwencji testowych wysokiej rozdzielczości (HD 6 ). Dlatego badania przeprowadzono na sekwencjach o standardowej rozdzielczości telewizyjnej, a dostępne sekwencje o wyŝszej rozdzielczości niŝ 4CIF zostały odpowiednio zdecymowane. 1 4 Common Intermediate Format 2 Motion/Moving Pictures Experts Group 3 International Organization for Standardization 4 Video Coding Experts Group 5 International Telecommunication Union - Telecommunication Standardization Sector 6 High Definition 12
13 Sekwencje zostały zakodowane kolejno ze wszystkimi dozwolonymi szerokościami przedziałów kwantyzacji Q (jedno zakodowanie sekwencji dla jednej, stałej szerokości przedziałów kwantyzacji Q). Do kodowania przyjęto strukturę grupy obrazów GOP 1 typową dla zastosowań telewizyjnych (4P2B 2 ). Dodatkowo, Ŝeby dla danej szerokości przedziałów kwantyzacji Q i konkretnych ustawień pozostałych parametrów kodera, kodowanie powodowało moŝliwie najmniejsze straty jakości kompresowanej sekwencji, włączono optymalizację prędkość bitowa zniekształcenie (RDO). Dla kaŝdego takiego kodowania zebrano informacje dotyczące wielkości strumienia danych na wyjściu kodera. W ten sposób otrzymano krzywe eksperymentalne przedstawiające liczbę bitów potrzebnych do reprezentowania zarówno całych obrazów, jak równieŝ poszczególnych składników strumienia danych w funkcji szerokości przedziałów kwantyzacji Q. Dla takich krzywych, autor szukał prostych opisów matematycznych z moŝliwie małą liczbą parametrów. Do znalezienia wzoru matematycznego i parametrów opisujących otrzymaną krzywą eksperymentalną autor zastosował metodę dopasowania funkcji do danych eksperymentalnych. W pierwszym kroku tej metody, spośród róŝnych klas funkcji (wykładniczych, logarytmicznych, potęgowych, itd.) wybiera się te, których wykresy są najbardziej podobne do badanej krzywej. Przydatność wybranego wzoru sprawdza się metodą rektyfikacji. Rektyfikacja polega na tym, Ŝe przy załoŝeniu istnienia zaleŝności funkcyjnej między wielkościami x i y, znajdujemy nowe wielkości X i Y postaci:,,,, (2.1) które są ze sobą powiązane w przybliŝeniu liniowo, tzn.. Następnie sprawdza się, czy po wyliczeniu nowych X i Y dla wszystkich x i y oraz przedstawieniu ich na wykresie, otrzymano punkty układające się w przybliŝeniu wzdłuŝ linii prostej. Wartości parametrów A i B moŝna wyznaczyć np. metodą najmniejszych kwadratów. Do stwierdzenia, na ile otrzymane w ten sposób dane są zgodne z liniową zaleŝnością autor wykorzystał współczynnik determinacji liniowej. Procedura poszukiwania i weryfikacji jest powtarzana do czasu znalezienia funkcji o moŝliwie małej liczbie parametrów i dobrze dopasowanej do danych 1 Group of Pictures 2 4P2B grupa obrazów składająca się z kolejnych obrazów typu: I, B, B, P, B, B, P, B, B, P, B, B, P, B, B 13
14 eksperymentalnych. Takie podejście jest dokładnie opisane w literaturze i powszechnie stosowane do rozwiązywania podobnych problemów. Następnie, stosując minimalizację maksymalnego względnego błędu aproksymacji, autor wyznaczał wartości parametrów znalezionej funkcji opisującej dane eksperymentalne. Do minimalizacji zastosowano metodę quasi-newtonowską, a jako punkty startowe do procedury optymalizacji wykorzystano wartości parametrów wyznaczone metodą najmniejszych kwadratów dla zrektyfikowanych danych. Dla tak wyznaczonych modeli i ich parametrów, autor określał maksymalny i/lub średni względny błąd aproksymacji danych eksperymentalnych (wzory 2.3 i 2.4). Względny błąd aproksymacji oznaczono jako: gdzie: ε(x i ) to względny błąd aproksymacji, y z (x i ) to wartość zmierzona, y(x i ) to wartość oszacowana przy pomocy modelu. 100%, (2.2) Maksymalny względny błąd aproksymacji danych eksperymentalnych wyznaczano jako: a średni względny błąd aproksymacji jako: max, (2.3) gdzie: n to liczebność zbioru. 1, (2.4) Oceny dokładności oszacowania (aproksymacji) danych eksperymentalnych przez badany model dokonywano na podstawie wartości średniego względnego błędu 14
15 aproksymacji (wzór 2.4). W rozprawie dokładność aproksymacji danych przez badany model jest nazywana w skrócie dokładnością modelu. Do analizy danych eksperymentalnych i opracowania modeli matematycznych autor wykorzystał pakiet matematyczny Mathcad firmy PTC w wersji Oryginalne modele kodera wizyjnego standardu MPEG-4 AVC/H Wprowadzenie Rozprawa przedstawia wyniki badań własnych, których celem było stworzenie modeli matematycznych opisujących związki pomiędzy liczbą bitów wytwarzanych przez koder i szerokością przedziałów kwantyzacji Q, co ogólnie moŝna opisać jako:, (2.5) gdzie: B to liczba bitów produkowanych przez koder, Q to szerokość przedziałów kwantyzacji. Model f( ) zaleŝy od treści kodowanej sekwencji wizyjnej, która zmienia się gwałtownie na granicach ujęć (w punktach cięć). Co więcej, wartość B zaleŝy od typu obrazu (I, P lub B). Im większa jest liczba parametrów modelu, tym więcej pomiarów naleŝy wykonać dla estymacji tych parametrów. Dlatego model f( ) powinien być opisany moŝliwie małą liczbą parametrów. W literaturze dobrze znane są metody pozwalające na znalezienie funkcji, która przechodzi dokładnie przez punkty pomiarowe (np. interpolacja wielomianowa). Niestety zastosowanie takich metod w przypadku poszukiwania dopasowania do wielu punktów pomiarowych oznaczałoby konieczność wyznaczenia wartości wielu parametrów niezaleŝnie dla kaŝdego typu obrazu w ramach pojedynczego ujęcia. A to z kolei, mocno komplikowałoby, a moŝe nawet czyniło niemoŝliwym, ewentualne 15
16 zastosowanie takiego modelu w rozwiązaniach praktycznych. Dlatego autor zdecydował się na wykorzystanie metody dopasowania funkcji do danych eksperymentalnych przedstawionej w poprzednim punkcie. Jest to takie samo podejście, które z sukcesem zastosowano dla koderów standardu MPEG-2 i H.263. Niestety nie powiodły się próby stworzenia dokładnych modeli dla dowolnej wartości szerokości przedziałów kwantyzacji Q. Dlatego zaproponowane modele określono niezaleŝnie dla przyjętych 3 przedziałów wartości Q. Granice przedziałów zostały dobrane tak (tabela 2.1), aby środkowy przedział obejmował wartości Q odpowiadające uŝytecznemu zakresowi prędkości bitowej sekwencji wizyjnych formatu 4CIF, tj. od 1 do 3 Mbit/s dla badanych sekwencji testowych (rysunek 2.1). Tabela 2.1. Granice przedziałów Przedział Zakres Q Zakres QP 1 <0,625; 4,5> <0;17> 2 <5; 64> <18;40> 3 <72; 224> <41;51> Wykres 2.1. Przyjęte granice przedziałów na przykładzie 3 sekwencji wizyjnych. Dla przejrzystości wykresu obcięto zakres wartości B i Q 16
17 NaleŜy zaznaczyć, Ŝe dla poszczególnych sekwencji wizyjnych, uŝytecznemu zakresowi prędkości bitowych strumienia danych odpowiada róŝny zakres wartości Q. Dlatego granice drugiego przedziału ustalono, z jednej strony jako najmniejszą wartość Q odpowiadającą prędkości 3 Mbit/s, a z drugiej strony jako największą wartość Q odpowiadającą prędkości 1 Mbit/s (rysunek 2.1). W strumieniu danych nie umieszcza się wartości szerokości przedziałów kwantyzacji Q wprost, tylko poprzez podanie indeksu parametru kwantyzacji QP 1 dla składowej luminancji. Dlatego w tabeli 2.1 obok zakresów wartości Q podano odpowiadające im zakresy indeksu QP. Podobny podział wartości Q został przyjęty do badań w wielu innych pracach. Jednak autorzy tych prac ograniczali się do analizy kodera tylko dla wartości Q naleŝących do przedziału drugiego Modelowanie średniej liczby bitów potrzebnych do reprezentacji skompresowanego obrazu Rozdział 4 rozprawy zawiera autorskie propozycje modeli średniej liczby bitów potrzebnych do reprezentowania skompresowanego obrazu danego typu. Wspomniana średnia liczba bitów jest traktowana jako cecha charakterystyczna obrazów danego typu w ramach pojedynczego ujęcia. Dlatego modele i ich parametry, zostały wyznaczone indywidualnie dla kaŝdego typu obrazu dla kaŝdego z trzech przedziałów Q. W przedziale pierwszym autor zaproponował model wielomianowy 3-go stopnia z 1 parametrem i zestawem uniwersalnych stałych: ś,, (2.6) gdzie: d to parametr modelu, B śred to średnia liczba bitów reprezentacji obrazu danego typu (I, P lub B), Q to szerokość przedziałów kwantyzacji, a 1, a 2, b 1, b 2, c 1 i c 2 to uniwersalne stałe modelu dla obrazów danego typu (I, P lub B). 1 Quantization Parameter 17
18 Dla zaproponowanego modelu (wzór 2.6) średni względny błąd aproksymacji dla większości sekwencji testowych jest poniŝej 3% dla obrazów typu I, 6% dla obrazów typu P i 7% dla obrazów typu B. W przedziale drugim, gdzie szczególnie istotna jest dokładność aproksymacji danych, wybrano model hiperboliczny z 3 parametrami: ś,,,, (2.7) gdzie: a, b, c to parametry modelu, Q to szerokość przedziałów kwantyzacji, B śred to średnia liczba bitów reprezentacji obrazu danego typu (I, P lub B). Średni względny błąd dopasowania dla większości sekwencji testowych jest poniŝej 2, 3 i 8%, odpowiednio dla obrazów typu I, P i B. Na wykresie 2.2. pokazano przykładowe krzywe eksperymentalne i ich oszacowania modelem hiperbolicznym dla kilku sekwencji wizyjnych dla przedziału drugiego, dla obrazów typu I. B śred [kbit] flow flow-apr. football football-apr. riverbed riverbed-apr Q Wykres 2.2. Krzywe eksperymentalne (linia ciągła) i oszacowane modelem hiperbolicznym (linia przerywana) dla obrazów typu I dla 3 przykładowych sekwencji wizyjnych (przedział 2) 18
19 W przedziale trzecim autor takŝe zaproponował uproszczony model wielomianowy (wzór 2.6). Średni względny błąd aproksymacji dla tego modelu dla większości sekwencji wizyjnych jest poniŝej 6%, 9% i 28% odpowiednio dla obrazów typu I, P i B. Dodatkowo, dla uproszczonego modelu wielomianowego (wzór 2.6) w przedziałach pierwszym i trzecim autor przeprowadził eksperymenty z wykorzystaniem dodatkowego zbioru kontrolnego, który składał się z 8 sekwencji wizyjnych formatu 4CIF. Sekwencje te nie występowały w zbiorze testowym uŝytym do wyznaczenia wartości uniwersalnych stałych. Wyniki eksperymentu potwierdziły, Ŝe zaproponowany uproszczony model wielomianowy z zestawem uniwersalnych stałych dobrze aproksymuje dane eksperymentalne uzyskane takŝe dla sekwencji spoza zbioru testowego dla obrazów typu I, P i B. Zaproponowane modele określają średnią liczbę bitów reprezentacji obrazów w ramach pojedynczego ujęcia. Z tego względu mogą one posłuŝyć do oszacowania liczby bitów potrzebnej do reprezentacji całej grupy obrazów GOP o strukturze typowej dla zastosowań telewizyjnych. Autorowi nie są znane Ŝadne pozycje literaturowe, w których dokonano modelowania średniej liczby bitów potrzebnej do reprezentowania skompresowanego obrazu danego typu w ramach pojedynczego ujęcia Modelowanie liczby bitów reprezentacji pojedynczego obrazu W poprzednim punkcie przedstawiono nowe modele wyraŝające, liczoną w ramach jednego ujęcia, średnią liczbę bitów potrzebnych do reprezentacji obrazu określonego typu w zaleŝności od szerokości przedziałów kwantyzacji Q. DuŜa dokładność zaproponowanych modeli skłoniła autora do przeprowadzenia kolejnych badań mających na celu sprawdzenie, czy takie same modele mogą zostać wykorzystane do opisywania liczby bitów reprezentujących pojedynczy obraz danego typu. Dodatkową motywacją do podjęcia takich badań była obserwacja dotycząca duŝego podobieństwa obrazów w ramach jednego ujęcia. Jeśli model dokładnie opisuje średnią liczbę bitów reprezentacji obrazu wyznaczoną na podstawie obrazów o podobnej treści, to moŝna domniemywać, Ŝe sprawdzi się teŝ w przypadku osobnego modelowania kaŝdego z tych obrazów. 19
20 Ze względu na duŝy zbiór danych eksperymentalnych w pracy nie zamieszczono wyników cząstkowych dotyczących poszczególnych obrazów (analizowano ponad 5,5 tysiąca obrazów). Wyniki badań przedstawiono poprzez wyznaczenie wartości kilku wybranych statystyk opisujących uzyskane średnie względne błędy aproksymacji. Te wybrane statystyki, to wartości: maksymalna, minimalna i średnia oraz odchylenie standardowe wyznaczone niezaleŝnie dla obrazów typu I, P i B. Dodatkowo autor wyznaczał wartości wymienionych statystyk dla sytuacji, w której wartości parametrów modelu dla bieŝącego obrazu są wyznaczane na podstawie wartości parametrów z poprzedniego obrazu danego typu w ramach tego samego ujęcia. Wartości statystyk uzyskane dla modelu z parametrami wyznaczonymi indywidualnie dla kaŝdego obrazu będą określane mianem dopasowania wprost, a uzyskane przez predykcję wartości parametrów z poprzedniego obrazu tego samego typu, będą określane mianem predykcji parametrów. W tabeli 2.2 podsumowano wartości średniego względnego błędu aproksymacji uśrednionego po wszystkich obrazach poszczególnych typów. Tabela 2.2. Średni względny błąd dopasowania wyznaczony dla bieŝącego obrazu i przy predykcji parametrów z poprzedniego obrazu danego typu uśredniony po obrazach danego typu (cyfra w nawiasie oznacza liczbę parametrów modelu) Model Obrazy typu I Obrazy typu P Obrazy typu B Wprost Predykcja Wprost Predykcja Wprost Predykcja Przedział 1 wielomianowy(4) 1,52 7,23 3,67 6,19 1,39 7,17 wielomianowy(1) 3,84 8,76 8,27 9,78 20,00 12,26 Przedział 2 hiperboliczny(3) 1,30 11,77 3,11 11,68 7,60 21,95 Przedział 3 wielomianowy(4) 1,62 10,53 3,20 15,91 6,54 28,61 wielomianowy(1) 6,06 13,03 14,70 22,35 38,32 50,17 Uzyskane wyniki potwierdzają, Ŝe modele zaproponowane do określania średniej liczby bitów reprezentacji obrazu danego typu moŝna zastosować do opisywania liczby bitów reprezentacji pojedynczego obrazu. Ponadto, wartości parametrów modelu dla bieŝącego obrazu moŝna ustalać na podstawie wcześniejszego obrazu danego typu w tym samym ujęciu. Uproszczenie modelu wielomianowego do jednego parametru pogarsza dokładność aproksymacji danych odpowiednio o około 2, 5 i 19 punktów 20
21 procentowych dla obrazów typu I, P i B dla pierwszego przedziału i 4, 12 oraz 32 punkty procentowe dla trzeciego przedziału. Dokonano takŝe weryfikacji dokładności uproszczonego modelu wielomianowego z wykorzystaniem kontrolnego zbioru sekwencji wizyjnych. Wyniki eksperymentu potwierdziły, Ŝe zaproponowany uproszczony model wielomianowy z zestawem uniwersalnych stałych dobrze aproksymuje dane eksperymentalne uzyskane takŝe dla sekwencji spoza zbioru testowego dla obrazów typu I, P i B. Dodatkowo dla obrazów typu I autor zaproponował miary charakteryzujące złoŝoność treści obrazów tego typu, których wykorzystanie pozwala zwiększyć dokładność modelu hiperbolicznego w przedziale drugim o około 7 punktów procentowych przy predykcji wartości parametrów z poprzedniego obrazu typu I naleŝącego do tego samego ujęcia. Zaproponowane miary złoŝoności treści obrazu, to: 1. odchylenie standardowe wartości próbek składowej luminancji obrazu wyznaczone w blokach o rozmiarze 4x4 uśrednione po takich blokach w całym obrazie: gdzie: 1, (2.8) to odchylenie standardowe wartości próbek składowej luminancji obrazu wyznaczone w blokach o rozmiarze 4 4 punkty uśrednione po wszystkich blokach w obrazie, to odchylenie standardowe wartości próbek składowej luminancji obrazu w i-tym bloku o rozmiarze 4 4 punkty, to liczba nienakładających się bloków luminancji o rozmiarze 4 4 punkty w obrazie. 2. suma uśrednionych odchyleń standardowych wartości próbek składowych luminancji (Y) i chrominancji (Cb i Cr) obrazu wyznaczonych w blokach o rozmiarze 4 4 punkty: 21
22 gdzie: 1 1 1, (2.9) to suma uśrednionych odchyleń standardowych wartości próbek składowych Y, Cb i Cr obrazu wyznaczonych w blokach o rozmiarze 4 4 punkty,,, to odchylenie standardowe wartości próbek składowej odpowiednio Y, Cb i Cr obrazu w i-tym bloku o rozmiarze 4 4 punkty,,, to liczba nienakładających się bloków o rozmiarze 4 4 punkty składowej odpowiednio Y, Cb i Cr. Szczegółowe wyniki dotyczące wykorzystania miar charakteryzujących złoŝoność treści obrazów typu I przedstawiono w punkcie 5.5 rozprawy. W literaturze dotyczącej modelowania hybrydowych koderów wizyjnych moŝna znaleźć propozycje modelowania liczby bitów reprezentacji pojedynczego obrazu danego typu. Natomiast nie są dostępne implementacje takich rozwiązań. Dlatego trudno byłoby przeprowadzić eksperymentalne badania porównawcze Modelowanie łącznej liczby bitów potrzebnych do reprezentacji składowych luminancji i chrominancji pojedynczego obrazu Na wykresie (2.3) pokazano, uśredniony po badanych sekwencjach, udział wybranych typów danych w całkowitym strumieniu bitowym reprezentującym skompresowaną sekwencję wizyjną zakodowaną ze strukturą grupy obrazów GOP 4P2B 1 (wybrano QP ze względu na większą przejrzystość wykresu niŝ dla Q). Z analizy wykresu wynika, Ŝe do reprezentacji skwantowanych wartości próbek transformaty błędu predykcji składowych luminancji i chrominancji potrzeba od 41% do 94% całkowitej liczby bitów reprezentujących skompresowaną sekwencję wizyjną. Ponadto, stosunkowo duŝą część całkowitego strumienia bitowego zajmują dane 1 4P2B grupa obrazów składająca się z kolejnych obrazów typu: I, B, B, P, B, B, P, B, B, P, B, B, P, B, B 22
23 określające tryb kodowania makrobloku oraz wektory ruchu (łącznie od 4% do 50 %). Im większa szerokość przedziałów kwantyzacji Q, tym większy udział danych nagłówkowych w całkowitym strumieniu danych. Udział w skompresowanym strumieniu danych [%] 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% QP Próbki transformaty Y Próbki transformaty CbCr Wektory ruchu Tryb kodowania makrobloku CABAC - Bity wypełniające Pozostałe Wykres 2.3. Procentowy udział poszczególnych typów danych w skompresowanym strumieniu bitowym zgodnym z profilem głównym MPEG-4 AVC/H.264 w zaleŝności od wartości indeksu QP uśredniony po badanych sekwencjach wizyjnych. Struktura GOP 4P2B (IBBPBBPBBPBBPBB) Na podstawie obserwacji dotyczących udziału poszczególnych typów danych w skompresowanym strumieniu bitowym autor podjął dalsze badania mające na celu opisanie zaleŝności między sumaryczną liczbą bitów potrzebnych do reprezentacji skwantowanych wartości próbek transformaty błędu predykcji składowych luminancji i chrominancji a szerokością przedziałów kwantyzacji Q. Autor postanowił sprawdzić, czy modele zaproponowane w poprzednich punktach moŝna wykorzystać równieŝ do opisania wspomnianej zaleŝności. TakŜe w referencyjnej implementacji kodera standardu MPEG-4 AVC/H.264 modeluje się wspomnianą zaleŝność, ale tylko dla obrazów typu P. Do modelowania liczby bitów potrzebnych do reprezentacji składowych luminancji i chrominancji autor zaproponował wykorzystanie takich samych modeli jak opisanych w rozdziałach 4 i 5 rozprawy. Podsumowanie uzyskanych wyników 23
24 umieszczono w tabeli 2.3. W tabeli tej nie podano dokładności modelu zastosowanego w referencyjnej implementacji kodera dla obrazów typu I i B, poniewaŝ model ten wykorzystuje się tylko do opisu obrazów typu P. Z analizy danych z tabeli 2.3 moŝna wywnioskować, Ŝe zaproponowane modele dobrze aproksymują dane eksperymentalne z wyjątkiem danych dla obrazów typu B w trzecim przedziale wartości Q. Z tabeli tej wynika równieŝ, Ŝe dla zaproponowanych modeli uzyskano niŝsze wartości błędów aproksymacji danych w porównaniu z modelem referencyjnym. Uproszczenie modelu wielomianowego w trzecim przedziale wartości Q spowodowało znaczny wzrost wartości błędu aproksymacji, szczególnie dla obrazów typu P i B. NaleŜy zaznaczyć, Ŝe oszacowanie liczby bitów w przedziale trzecim jest trudniejsze niŝ w przedziałach pierwszy i drugim, poniewaŝ dla duŝych wartości Q koder produkuje małą liczbę bitów (zwłaszcza dla obrazów typu P i B). Dlatego nawet niewielka pomyłka w oszacowaniu liczby bitów powoduje duŝe względne błędy aproksymacji. Tabela 2.3. Średni względny błąd dopasowania uśredniony po obrazach danego typu Typ obrazu Model I P B Przedział 1 wielomianowy (4) 0,98 3,00 3,38 wielomianowy (1) 4,58 8,21 10,09 referencyjny(2) x 8,63 x Przedział 2 hiperboliczny(3) 1,56 4,27 13,61 referencyjny(2) x 15,87 x Przedział 3 wielomianowy (4) 1,86 10,98 140,98 wielomianowy (1) 8,33 121,09 237,94 referencyjny(2) x 11,04 x Analogicznie jak w dwóch poprzednich punktach dokonano weryfikacji dokładności uproszczonego modelu wielomianowego z zestawem uniwersalnych stałych z wykorzystaniem kontrolnego zbioru sekwencji wizyjnych. Poza modelem zaproponowanym w referencyjnej implementacji kodera standardu MPEG-4 AVC/H.264 w literaturze moŝna znaleźć inne propozycje modelowania liczby bitów reprezentacji składowych luminancji i chrominancji obrazu. Niestety nie są dostępne implementacje takich rozwiązań. Dlatego trudno byłoby przeprowadzić eksperymentalne badania porównawcze. 24
25 3. Podsumowanie i wnioski 3.1. Wnioski Celem badań przedstawionych w rozprawie było zaproponowanie ilościowych modeli matematycznych zaawansowanych koderów wizyjnych, wyraŝających liczbę bitów generowanych przez koder w funkcji szerokości przedziałów kwantyzacji Q. Na przykładzie kodera standardu MPEG-4 AVC/H.264 autor pokazał, Ŝe moŝna wyznaczyć proste modele matematyczne opisujące wspomnianą zaleŝność, co potwierdza tezę rozprawy. Modele zostały zaproponowane na podstawie analizy danych eksperymentalnych uzyskanych z wykorzystaniem referencyjnej implementacji kodeka standardu MPEG-4 AVC/H.264 dla szerokiej klasy sekwencji wizyjnych o standardowej rozdzielczości telewizyjnej. Dalsze badania powinny dotyczyć moŝliwości zastosowania zaproponowanych modeli w algorytmie sterowania zaawansowanego kodera wizyjnego. Autor zaproponował osobne modele dla trzech typów obrazów, a obecnie modeluje się przewaŝnie tylko obrazy typu P. Przy kodowaniu sekwencji zaawansowanymi koderami wizyjnymi mamy do czynienia ze znacznym udziałem danych nagłówkowych w całkowitym strumieniu danych. Dlatego dalsze prace mogłyby dotyczyć modelowania takŝe innych elementów składni strumienia bitowego. Modele przedstawione w rozprawie zostały zaproponowane dla danych eksperymentalnych uzyskanych przy wykorzystaniu kodera standardu MPEG-4 AVC/H.264 zgodnego z profilem głównym. Obecnie, coraz bardziej upowszechnia się telewizja wysokiej jakości. Dlatego dalsze badania powinny dotyczyć modelowania 25
26 zaawansowanych koderów wizyjnych na potrzeby takich zastosowań, np. koderów profilu wysokiego lub profili rozszerzonego zakresu dokładności (FRExt) Oryginalne osiągnięcia Zasadniczym, oryginalnym, naukowym osiągnięciem rozprawy jest zaproponowanie modeli określających liczbę bitów produkowanych przez koder w zaleŝności od szerokości przedziałów kwantyzacji Q. Modele te zostały wyznaczone z wykorzystaniem bogatego zbioru danych uzyskanych w wyniku przeprowadzenia ponad 3000 eksperymentów kodowania sekwencji wizyjnych. Dokładność zaproponowanych modeli została zweryfikowana eksperymentalnie. W szczególności w pracy zaproponowano nowe globalne modele strumienia bitowego wyraŝające zaleŝności między szerokością przedziałów kwantyzacji Q a: 1. średnią liczbą bitów potrzebnych do reprezentacji obrazu danego typu w ramach jednego ujęcia, 2. liczbą bitów potrzebnych do reprezentacji pojedynczego obrazu danego typu, 3. łączną liczbą bitów potrzebnych do reprezentacji skwantowanych wartości próbek transformaty błędu predykcji składowych luminancji i chrominancji obrazu danego typu. Istotnym elementem rozprawy jest analiza dokładności zaproponowanych modeli w róŝnych zakresach wartości szerokości przedziałów kwantyzacji Q. Ad. 1. Autor określił dokładność zaproponowanych modeli dla 3 zakresów wartości Q dla obrazów typu I, P i B. Modele pozwalające na wyznaczenie średniej liczby bitów reprezentacji obrazu danego typu w ramach jednego ujęcia nie są znane z literatury. 26
27 Ad. 2. W rozprawie określono dokładność zaproponowanych modeli w dwóch wariantach: wartości parametrów modeli zostały wyznaczone indywidualnie dla kaŝdego obrazu, wartości parametrów modeli dla bieŝącego obrazu danego typu zostały wyznaczone na podstawie wartości parametrów z wcześniejszego obrazu tego samego typu. Dodatkowo w rozprawie zaproponowano globalny model strumienia bitowego z parametrem (miarą) charakteryzującym złoŝoność treści obrazów typu I. Zbadano dokładność modeli wykorzystujących następujące miary charakteryzujące złoŝoność treści obrazów typu I w sekwencji wizyjnej: odchylenie standardowe dla wartości próbek składowej luminancji wyznaczone w blokach o rozmiarze 4 4 punkty uśrednione po całym obrazie, suma uśrednionych odchyleń standardowych wartości próbek składowych luminancji i chrominancji wyznaczonych w blokach o rozmiarze 4 4 punkty. Zaproponowany globalny model strumienia bitowego z parametrem (miarą) charakteryzującym złoŝoność treści obrazów typu I nie jest znany z literatury. Ad. 3. Autor określił dokładność zaproponowanych modeli dla 3 zakresów wartości Q dla obrazów typu I, P i B. W rozprawie porównano równieŝ dokładność zaproponowanego modelu z modelem opisanym w części informacyjnej standardu MPEG-4 AVC/H.264, który wykorzystuje się do modelowania liczby bitów reprezentacji składowych luminancji i chrominancji obrazów typu P. Dla uŝytecznego zakresu prędkości transmisji model zaproponowany przez autora jest bardziej dokładny od modelu zastosowanego w referencyjnej implementacji kodera średnio o około 11,5 punktów procentowych. NaleŜy podkreślić, Ŝe model z referencyjnej implementacji kodera standardu MPEG-4 AVC/H.264 jest 27
28 szeroko stosowany w praktycznych implementacjach zaawansowanych koderów wizyjnych. Uzyskane wyniki wskazują na potencjalne moŝliwości praktycznych zastosowań opracowanych modeli. Dodatkowo w rozprawie zaproponowano model strumienia bitowego z parametrem (miarą) charakteryzującym złoŝoność treści obrazów typu I. Zbadano dokładność modelu wykorzystującego sumę uśrednionych odchyleń standardowych wartości próbek składowych luminancji i chrominancji wyznaczonych w blokach o rozmiarze 4 4 punkty jako miarę charakteryzującą złoŝoność treści obrazów typu I w sekwencji wizyjnej. Zaproponowane modele mają duŝe znaczenie poznawcze, gdyŝ dotychczas w literaturze nie opisano globalnych modeli analogicznych do tych przedstawionych w rozprawie. Modele te opisują charakter zaleŝności między liczbą bitów produkowanych na wyjściu zaawansowanego kodera wizyjnego i szerokością przedziałów kwantyzacji Q, która jest podstawową wielkością sterującą koderem. Opracowane modele pozwalają wyznaczać przybliŝoną wielkość strumienia generowanego przez zaawansowany koder wizyjny przy róŝnym charakterze treści kodowanego materiału wizyjnego. Jest to bardzo istotne z punktu widzenia przyszłych zastosowań zaproponowanych modeli w procedurach sterowania zaawansowanymi koderami wizyjnymi. 28
29 4. Dorobek naukowy autora 4.1. Publikacje naukowe autora Konferencje międzynarodowe o światowym zasięgu i surowym procesie recenzowania: 1. T. Grajek, M. Domański: A Global Model of AVC/H.264 Video Encoders, 27th Picture Coding Symposium, PCS, 6-8 maja 2009, str. 1-4, Chicago, Illinois, USA (2009), takŝe: IEEE Xplore Digital Library ( Wydawnictwa z tzw. listy filadelfijskiej : 2. T. Grajek, M. Domański: A Simple Quantitative Model of AVC/H.264 Video Coders w L. Bolc, J.L. Kulikowski, and K. Wojciechowski (eds.): Computer Vision and Graphics, International Conference, ICCVG 2008, Lecture Notes in Computer Science - LNCS 5337, pp , Springer-Verlag (2009). 3. T. Grajek, M. Domański: Single Frame Rate-Quantization Model for MPEG-4 AVC/H.264 Video Encoders w L. Bolc, R. Tadeusiewicz, and L.J. Chmielewski (eds.): Computer Vision and Graphics, Proc. ICCVG 2010, Lecture Notes in Computer Science, Springer-Verlag (2010) zgłoszony, dwie pozytywne recenzje. Konferencje międzynarodowe: 4. M. Domański, T. Grajek, K. Klimaszewski, M. Kurc, O. Stankiewicz, J. Stankowski, K. Wegner, Poznań Multiview Video Test Sequences and Camera Parameters, ISO/IEC JTC1/SC29/WG11 MPEG 2009/M17050, Xian, Chiny, (2009). 29
30 Czasopisma krajowe: 5. M. Domański, T. Grajek, J. Marek, Zaawansowana kompresja cyfrowych sygnałów wizyjnych - standard AVC/H.264, Systemy Alarmowe, nr 2, marzeckwiecień 2005, rok wyd. XIV, vol. 75, str , Warszawa (2005). 6. T. Grajek Model ilościowy kodera wizyjnego standardu MPEG-4 AVC/H.264 z parametrem charakteryzującym treść sekwencji, Przegląd Telekomunikacyjny, równieŝ: Krajowa Konferencja Radiokomunikacji, Radiofonii i Telewizji, KKRRiT, czerwca 2010, Kraków (2010) przyjęty do druku po pozytywnych recenzjach. Konferencje krajowe: 7. T. Grajek, D. Karwowski, ZłoŜoność obliczeniowa i efektywność kodowania entropijnego w standardzie H.264/AVC, Krajowa Konferencja Radiokomunikacji, Radiofonii i Telewizji, KKRRiT, czerwca 2005, str , Kraków (2005). 8. T. Dzięcielewski, T. Grajek, J. Marek, Eksperymentalna analiza częstotliwości wyboru trybów zaawansowanego kodowania wizyjnego, X Poznańskie Warsztaty Telekomunikacyjne, 8-9 grudnia 2005, str , Poznań (2005). 9. T. Dzięcielewski, T. Grajek, J. Marek, Eksperymentalna analiza efektywności trybów kodowania międzyobrazowego w zaawansowanym koderze wizyjnym", Krajowa Konferencja Radiokomunikacji, Radiofonii i Telewizji, KKRRiT, 7-9 czerwca 2006, str , Poznań (2006). Publikacje zgłoszone, oczekujące na recenzje: 10. T. Grajek, M. Domański: New Model of MPEG-4 AVC/H.264 Video Encoders, The International Conference on Image Processing, ICIP, września 2010, Hong Kong (2010) Oryginalne osiągnięcia autora nie ujęte w rozprawie, a zastosowane w praktyce 1. Koder skalowanych strumieni wizyjnych zgodnych z MPEG-4 AVC/H optymalizacja referencyjnego oprogramowania pozwalająca na kodowanie skalowalnych strumieni wizyjnych wysokich rozdzielczości. Praca zespołowa pod kierunkiem prof. dr. hab. inŝ. M. Domańskiego. Udział własny: Badania nad statystykami wyboru trybów kodowania makrobloków. 30
31 Opracowanie algorytmu wyboru trybów kodowania makrobloków w skalowalnym koderze wizyjnym. Autorska implementacja rozwiązań pozwalających na poprawę szybkości kodowania skalowalnych strumieni wizyjnych na komputerach osobistych. Wyniki prac zostały wykorzystane w oprogramowaniu kodera zakupionego przez Mitsubishi Electric Information Technology Centre Europe, UK. 2. Dekoder skalowanych strumieni wizyjnych zgodnych z MPEG-4 AVC/H optymalizacja referencyjnego oprogramowania pozwalająca na dekodowanie skalowalnych strumieni wizyjnych wysokich rozdzielczości. Praca zespołowa pod kierunkiem prof. dr. hab. inŝ. M. Domańskiego. Udział własny: Opracowanie i implementacja autorskich rozwiązań pozwalających na znaczną poprawę szybkości dekodowania skalowalnych strumieni wizyjnych na komputerach osobistych. Opracowany dekoder został zakupiony przez Mitsubishi Electric Information Technology Centre Europe, UK. 3. Transkoder sygnałów wizyjnych standardu MPEG-2 przetwarzanych do formatu MPEG-4 AVC/H autorska implementacja transkodera heterogenicznego. Praca zespołowa pod kierunkiem prof. dr. hab. inŝ. M. Domańskiego. Udział własny: Badania nad sterowaniem przepływnością w transkoderze wizyjnym. Prace nad integracją dekodera MPEG-2 i kodera MPEG-4 AVC/H.264. Wyniki prac badawczych zostały wykorzystane w transkoderze zakupionym przez Advanced Digital Broadcast Polska. 4. Koder wizyjny MPEG-4 AVC/H.264 PP - autorska implementacja i optymalizacja kodera wizyjnego standardu MPEG-4 AVC/H.264. Praca zespołowa pod kierunkiem prof. dr. hab. inŝ. M. Domańskiego. Udział własny: Prace badawcze nad algorytmami sterowania przepływnością kodera. Opracowanie autorskiego algorytmu sterowania przepływnością kodera w trybie stałej przepływności bitowej. Autorska implementacja modułów kodera hybrydowego standardu H.264/AVC w języku ANSI C oraz asembler realizujących kodowanie binarne. Oryginalna implementacja modułów kodera hybrydowego standardu H.264/AVC w języku ANSI C realizujących formater strumienia binarnego. Optymalizacja wydajnościowa powyŝszych modułów kodera. Koder zakupiony i wdroŝony przez Advanced Digital Broadcast Polska. 31
32 5. Kodek sygnałów wizyjnych autorska implementacja i optymalizacja kodeka wizyjnego zintegrowanego w systemie telewizji interaktywnej itvp. Praca zespołowa pod kierunkiem prof. dr. hab. inŝ. M. Domańskiego. Udział własny: Opracowanie oryginalnych modułów realizujących proces kodowania i dekodowania binarnego. Opracowanie wydajnych modułów realizujących formatowanie i parsowanie strumienia binarnego w autorskim kodeku czasu rzeczywistego. Kodek zakupiony przez Telewizję Polską S.A. 32
Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.
Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2. Technika obrazu 24 W.3. Normalizacja w zakresie obrazu cyfrowego
Kompresja sekwencji obrazów - algorytm MPEG-2
Kompresja sekwencji obrazów - algorytm MPEG- Moving Pictures Experts Group (MPEG) - 988 ISO - International Standard Organisation CCITT - Comité Consultatif International de Téléphonie et TélégraphieT
Eksperymentalna analiza częstotliwości wyboru trybów zaawansowanego kodowania wizyjnego.
Tomasz Dzięcielewski Tomasz Grajek Jarosław Marek Instytut Elektroniki i Telekomunikacji, Politechnika Poznańska [tomdz;tgrajek;jmarek]@multimedia.edu.pl 2005 Poznańskie Warsztaty Telekomunikacyjne Poznań
PRACA DYPLOMOWA STUDIA PIERWSZEGO STOPNIA. Łukasz Kutyła Numer albumu: 5199
PRACA DYPLOMOWA STUDIA PIERWSZEGO STOPNIA Łukasz Kutyła Numer albumu: 5199 Temat pracy: Metody kompresji obrazu implementowane we współczesnych systemach telewizji cyfrowej opartej o protokół IP Cel i
Kompresja dźwięku w standardzie MPEG-1
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 7, strona 1. Kompresja dźwięku w standardzie MPEG-1 Ogólne założenia kompresji stratnej Zjawisko maskowania psychoakustycznego Schemat blokowy
Algorytmy kompresji sekwencji wielowidokowych
Politechnika Poznańska Wydział Elektroniki i Telekomunikacji Katedra Telekomunikacji Multimedialnej i Mikroelektroniki Streszczenie rozprawy doktorskiej Algorytmy kompresji sekwencji wielowidokowych Krzysztof
Transkodowanie strumieni wizyjnych wykorzystujące zaawansowane techniki kompresji
Politechnika Poznańska Wydział Elektroniki i Telekomunikacji Katedra Telekomunikacji Multimedialnej i Mikroelektroniki Autoreferat rozprawy doktorskiej Transkodowanie strumieni wizyjnych wykorzystujące
Przedstawiamy Państwu tekst będący
Zaawansowana kompresja cyfrowych sygnałów wizyjnych standard AVC/H.264 MAREK DOMAŃSKI, TOMASZ GRAJEK, JAROSŁAW MAREK Politechnika Poznańska, Zakład Telekomunikacji Multimedialnej i Radioelektroniki Przedstawiamy
O sygnałach cyfrowych
O sygnałach cyfrowych Informacja Informacja - wielkość abstrakcyjna, która moŝe być: przechowywana w pewnych obiektach przesyłana pomiędzy pewnymi obiektami przetwarzana w pewnych obiektach stosowana do
Założenia i obszar zastosowań. JPEG - algorytm kodowania obrazu. Geneza algorytmu KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG
Założenia i obszar zastosowań KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG Plan wykładu: Geneza algorytmu Założenia i obszar zastosowań JPEG kroki algorytmu kodowania obrazu Założenia: Obraz monochromatyczny
Kodowanie transformacyjne. Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG
Kodowanie transformacyjne Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG Zasada Zasada podstawowa: na danych wykonujemy transformacje która: Likwiduje korelacje Skupia energię w kilku komponentach
PRZETWORNIKI C / A PODSTAWOWE PARAMETRY
PRZETWORIKI C / A PODSTAWOWE PARAMETRY Rozdzielczość przetwornika C/A - Określa ją liczba - bitów słowa wejściowego. - Definiuje się ją równieŝ przez wartość związaną z najmniej znaczącym bitem (LSB),
Kompresja sekwencji obrazów
Kompresja sekwencji obrazów - algorytm MPEG-2 Moving Pictures Experts Group (MPEG) - 1988 ISO - International Standard Organisation CCITT - Comité Consultatif International de Téléphonie T et TélégraphieT
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Anna Fabijańska. Algorytmy segmentacji w systemach analizy ilościowej obrazów
POLITECHNIKA ŁÓDZKA Wydział Elektrotechniki Elektroniki Informatyki i Automatyki Katedra Informatyki Stosowanej Anna Fabijańska Nr albumu: 109647 Streszczenie pracy magisterskiej nt.: Algorytmy segmentacji
Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania
Kodowanie podpasmowe Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania Zasada ogólna Rozkład sygnału źródłowego na części składowe (jak w kodowaniu transformacyjnym) Wada kodowania
dr inż. Piotr Odya Wprowadzenie
dr inż. Piotr Odya Wprowadzenie Dane multimedialne to przede wszystkim duże strumienie danych liczone w MB a coraz częściej w GB; Mimo dynamicznego rozwoju technologii pamięci i coraz szybszych transferów
Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j
Kompresja transformacyjna. Opis standardu JPEG. Algorytm JPEG powstał w wyniku prac prowadzonych przez grupę ekspertów (ang. Joint Photographic Expert Group). Prace te zakończyły się w 1991 roku, kiedy
Metody numeryczne Technika obliczeniowa i symulacyjna Sem. 2, EiT, 2014/2015
Metody numeryczne Technika obliczeniowa i symulacyjna Sem. 2, EiT, 2014/2015 1 Metody numeryczne Dział matematyki Metody rozwiązywania problemów matematycznych za pomocą operacji na liczbach. Otrzymywane
Aproksymacja funkcji a regresja symboliczna
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą
Systemy liczenia. 333= 3*100+3*10+3*1
Systemy liczenia. System dziesiętny jest systemem pozycyjnym, co oznacza, Ŝe wartość liczby zaleŝy od pozycji na której się ona znajduje np. w liczbie 333 kaŝda cyfra oznacza inną wartość bowiem: 333=
Sposoby opisu i modelowania zakłóceń kanałowych
INSTYTUT TELEKOMUNIKACJI ZAKŁAD RADIOKOMUNIKACJI Instrukcja laboratoryjna z przedmiotu Podstawy Telekomunikacji Sposoby opisu i modelowania zakłóceń kanałowych Warszawa 2010r. 1. Cel ćwiczeń: Celem ćwiczeń
OPTYMALIZACJA HARMONOGRAMOWANIA MONTAŻU SAMOCHODÓW Z ZASTOSOWANIEM PROGRAMOWANIA W LOGICE Z OGRANICZENIAMI
Autoreferat do rozprawy doktorskiej OPTYMALIZACJA HARMONOGRAMOWANIA MONTAŻU SAMOCHODÓW Z ZASTOSOWANIEM PROGRAMOWANIA W LOGICE Z OGRANICZENIAMI Michał Mazur Gliwice 2016 1 2 Montaż samochodów na linii w
Zastosowanie kompresji w kryptografii Piotr Piotrowski
Zastosowanie kompresji w kryptografii Piotr Piotrowski 1 Plan prezentacji I. Wstęp II. Kryteria oceny algorytmów III. Główne klasy algorytmów IV. Przykłady algorytmów selektywnego szyfrowania V. Podsumowanie
Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11,
1 Kwantyzacja skalarna Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11, 10.05.005 Kwantyzacja polega na reprezentowaniu dużego zbioru wartości (być może nieskończonego) za pomocą wartości
Wpływ kompresji obrazów i map głębi na syntezę widoków w systemie wielowidokowym
Wpływ kompresji obrazów i map głębi na syntezę widoków w systemie wielowidokowym Krzysztof Klimaszewski, Krzysztof Wegner Politechnika Poznańska Katedra Telekomunikacji Multimedialnej i Mikroelektroniki
Optymalizacja ciągła
Optymalizacja ciągła 5. Metoda stochastycznego spadku wzdłuż gradientu Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 04.04.2019 1 / 20 Wprowadzenie Minimalizacja różniczkowalnej
LABORATORIUM Z FIZYKI
LABORATORIUM Z FIZYKI LABORATORIUM Z FIZYKI I PRACOWNIA FIZYCZNA C w Gliwicach Gliwice, ul. Konarskiego 22, pokoje 52-54 Regulamin pracowni i organizacja zajęć Sprawozdanie (strona tytułowa, karta pomiarowa)
Nowoczesne metody emisji ucyfrowionego sygnału telewizyjnego
Nowoczesne metody emisji ucyfrowionego sygnału telewizyjnego Bogdan Uljasz Wydział Elektroniki Wojskowej Akademii Technicznej ul. Kaliskiego 2 00-908 Warszawa Konferencja naukowo-techniczna Dzisiejsze
Dopasowywanie modelu do danych
Tematyka wykładu dopasowanie modelu trendu do danych; wybrane rodzaje modeli trendu i ich właściwości; dopasowanie modeli do danych za pomocą narzędzi wykresów liniowych (wykresów rozrzutu) programu STATISTICA;
Ćwiczenie nr 2: ZaleŜność okresu drgań wahadła od amplitudy
Wydział PRACOWNIA FIZYCZNA WFiIS AGH Imię i nazwisko 1. 2. Temat: Rok Grupa Zespół Nr ćwiczenia Data wykonania Data oddania Zwrot do popr. Data oddania Data zaliczenia OCENA Ćwiczenie nr 2: ZaleŜność okresu
Regresja linearyzowalna
1 z 5 2007-05-09 23:22 Medycyna Praktyczna - portal dla lekarzy Regresja linearyzowalna mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie Data utworzenia:
ZAKŁAD SYSTEMÓW ELEKTRONICZNYCH I TELEKOMUNIKACYJNYCH Laboratorium Podstaw Telekomunikacji WPŁYW SZUMÓW NA TRANSMISJĘ CYFROWĄ
Laboratorium Podstaw Telekomunikacji Ćw. 4 WPŁYW SZUMÓW NA TRANSMISJĘ CYFROWĄ 1. Zapoznać się z zestawem do demonstracji wpływu zakłóceń na transmisję sygnałów cyfrowych. 2. Przy użyciu oscyloskopu cyfrowego
Ćw. 8 Bramki logiczne
Ćw. 8 Bramki logiczne 1. Cel ćwiczenia Celem ćwiczenia jest zapoznanie się z podstawowymi bramkami logicznymi, poznanie ich rodzajów oraz najwaŝniejszych parametrów opisujących ich własności elektryczne.
Wydział Elektryczny. Katedra Telekomunikacji i Aparatury Elektronicznej. Instrukcja do pracowni specjalistycznej
Politechnika Białostocka Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej Instrukcja do pracowni specjalistycznej Temat ćwiczenia: Badanie własności koderów PCM zastosowanych do sygnałów
Ćw. 7 Przetworniki A/C i C/A
Ćw. 7 Przetworniki A/C i C/A 1. Cel ćwiczenia Celem ćwiczenia jest zapoznanie się z zasadami przetwarzania sygnałów analogowych na cyfrowe i cyfrowych na analogowe poprzez zbadanie przetworników A/C i
Kompresja Kodowanie arytmetyczne. Dariusz Sobczuk
Kompresja Kodowanie arytmetyczne Dariusz Sobczuk Kodowanie arytmetyczne (lata 1960-te) Pierwsze prace w tym kierunku sięgają początków lat 60-tych XX wieku Pierwszy algorytm Eliasa nie został opublikowany
KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG
KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG Joint Photographic Expert Group - 1986 ISO - International Standard Organisation CCITT - Comité Consultatif International de Téléphonie et Télégraphie Standard
Przetwarzanie i transmisja danych multimedialnych. Wykład 6 Metody predykcyjne. Przemysław Sękalski.
Przetwarzanie i transmisja danych multimedialnych Wykład 6 Metody predykcyjne Przemysław Sękalski sekalski@dmcs.pl Politechnika Łódzka Katedra Mikroelektroniki i Technik Informatycznych DMCS Wykład opracowano
Rok akademicki: 2013/2014 Kod: IET-2-411-US-n Punkty ECTS: 3. Poziom studiów: Studia II stopnia Forma i tryb studiów: Niestacjonarne
Nazwa modułu: Nowoczesne technologie bezprzewodowe Rok akademicki: 2013/2014 Kod: IET-2-411-US-n Punkty ECTS: 3 Wydział: Informatyki, Elektroniki i Telekomunikacji Kierunek: Elektronika i Telekomunikacja
Algorytmy genetyczne w interpolacji wielomianowej
Algorytmy genetyczne w interpolacji wielomianowej (seminarium robocze) Seminarium Metod Inteligencji Obliczeniowej Warszawa 22 II 2006 mgr inż. Marcin Borkowski Plan: Przypomnienie algorytmu niszowego
Podsumowanie wyników ankiety
SPRAWOZDANIE Kierunkowego Zespołu ds. Programów Kształcenia dla kierunku Informatyka dotyczące ankiet samooceny osiągnięcia przez absolwentów kierunkowych efektów kształcenia po ukończeniu studiów w roku
1. Podstawowe pojęcia
1. Podstawowe pojęcia Sterowanie optymalne obiektu polega na znajdowaniu najkorzystniejszej decyzji dotyczącej zamierzonego wpływu na obiekt przy zadanych ograniczeniach. Niech dany jest obiekt opisany
Transkodowanie strumieni wizyjnych. wykorzystujące zaawansowane. techniki kompresji
Politechnika Poznańska Wydział Elektroniki i Telekomunikacji Katedra Telekomunikacji Multimedialnej i Mikroelektroniki Rozprawa doktorska Transkodowanie strumieni wizyjnych wykorzystujące zaawansowane
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Modelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka
Modelowanie jako sposób opisu rzeczywistości Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka 2015 Wprowadzenie: Modelowanie i symulacja PROBLEM: Podstawowy problem z opisem otaczającej
Definicje. Najprostszy schemat blokowy. Schemat dokładniejszy
Definicje owanie i symulacja owanie zastosowanie określonej metodologii do stworzenia i weryfikacji modelu dla danego rzeczywistego Symulacja zastosowanie symulatora, w którym zaimplementowano model, do
Konfiguracja kodeka 3ivx 4.5.1
Konfiguracja kodeka 3ivx 4.5.1 3ivx, podobnie jak bardziej popularne kodeki XviD i DivX, jest kodekiem MPEG-4. Jest on dostarczany w wersjach dla architektur Video for Windows, DirectShow oraz QuickTime
LABORATORIUM PODSTAW TELEKOMUNIKACJI
WOJSKOWA AKADEMIA TECHNICZNA im. Jarosława Dąbrowskiego w Warszawie Wydział Elektroniki LABORATORIUM PODSTAW TELEKOMUNIKACJI Grupa Podgrupa Data wykonania ćwiczenia Ćwiczenie prowadził... Skład podgrupy:
Analiza metod prognozowania kursów akcji
Analiza metod prognozowania kursów akcji Izabela Łabuś Wydział InŜynierii Mechanicznej i Informatyki Kierunek informatyka, Rok V Specjalność informatyka ekonomiczna Politechnika Częstochowska izulka184@o2.pl
Modelowanie glikemii w procesie insulinoterapii
Dawid Kaliszewski Modelowanie glikemii w procesie insulinoterapii Promotor dr hab. inż. Zenon Gniazdowski Cel pracy Zbudowanie modelu predykcyjnego przyszłych wartości glikemii diabetyka leczonego za pomocą
w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą
Kodowanie informacji o ruchu dla kompresji sekwencji trójwymiarowych
Politechnika Poznańska Wydział Elektroniki i Telekomunikacji Katedra Telekomunikacji Multimedialnej i Mikroelektroniki Streszczenie rozprawy doktorskiej Kodowanie informacji o ruchu dla kompresji sekwencji
Laboratorium przedmiotu Technika Cyfrowa
Laboratorium przedmiotu Technika Cyfrowa ćw.3 i 4: Asynchroniczne i synchroniczne automaty sekwencyjne 1. Implementacja asynchronicznych i synchronicznych maszyn stanu w języku VERILOG: Maszyny stanu w
Analiza składowych głównych. Wprowadzenie
Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących
Kompresja danych DKDA (7)
Kompresja danych DKDA (7) Marcin Gogolewski marcing@wmi.amu.edu.pl Uniwersytet im. Adama Mickiewicza w Poznaniu Poznań, 22 listopada 2016 1 Kwantyzacja skalarna Wprowadzenie Analiza jakości Typy kwantyzatorów
Najprostszy schemat blokowy
Definicje Modelowanie i symulacja Modelowanie zastosowanie określonej metodologii do stworzenia i weryfikacji modelu dla danego układu rzeczywistego Symulacja zastosowanie symulatora, w którym zaimplementowano
Wykład Prezentacja materiału statystycznego. 2. Rodzaje szeregów statystycznych.
Wykład 2. 1. Prezentacja materiału statystycznego. 2. Rodzaje szeregów statystycznych. 3. Wykresy: histogram, diagram i ogiwa. Prezentacja materiału statystycznego Przy badaniu struktury zbiorowości punktem
Systemy plezjochroniczne (PDH) synchroniczne (SDH), Transmisja w sieci elektroenergetycznej (PLC Power Line Communication)
Politechnika Śląska Katedra Elektryfikacji i Automatyzacji Górnictwa Systemy plezjochroniczne (PDH) synchroniczne (SDH), Transmisja w sieci elektroenergetycznej (PLC Power Line Communication) Opracował:
NOWOCZESNE METODY EMISJI UCYFROWIONEGO SYGNAŁU TELEWIZYJNEGO
dr inż. Bogdan Uljasz Wojskowa Akademia Techniczna, Wydział Elektroniki, Instytut Telekomunikacji ul. Gen. S.Kaliskiego 2, 00-908 Warszawa tel.: 0-22 6837696, fax: 0-22 6839038, e-mail: bogdan.uljasz@wel.wat.edu.pl
Cyfrowy system łączności dla bezzałogowych statków powietrznych średniego zasięgu. 20 maja, 2016 R. Krenz 1
Cyfrowy system łączności dla bezzałogowych statków powietrznych średniego zasięgu R. Krenz 1 Wstęp Celem projektu było opracowanie cyfrowego system łączności dla bezzałogowych statków latających średniego
Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.
Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych. Statystyka zajmuje się prawidłowościami zaistniałych zdarzeń. Teoria prawdopodobieństwa dotyczy przewidywania, jak często mogą zajść
Przetwarzanie AC i CA
1 Elektroniki Elektroniki Elektroniki Elektroniki Elektroniki Katedr Przetwarzanie AC i CA Instrukcja do ćwiczenia laboratoryjnego opracował: Łukasz Buczek 05.2015 1. Cel ćwiczenia 2 Celem ćwiczenia jest
Kompresja JPG obrazu sonarowego z uwzględnieniem założonego poziomu błędu
Kompresja JPG obrazu sonarowego z uwzględnieniem założonego poziomu błędu Mariusz Borawski Wydział Informatyki Zachodniopomorski Uniwersytet Technologiczny w Szczecinie Zbieranie danych Obraz sonarowy
Przetwarzanie i transmisja danych multimedialnych. Wykład 10 Kompresja obrazów ruchomych MPEG. Przemysław Sękalski.
Przetwarzanie i transmisja danych multimedialnych Wykład 10 Kompresja obrazów ruchomych MPEG Przemysław Sękalski sekalski@dmcs.pl Politechnika Łódzka Katedra Mikroelektroniki i Technik Informatycznych
Drzewa Decyzyjne, cz.2
Drzewa Decyzyjne, cz.2 Inteligentne Systemy Decyzyjne Katedra Systemów Multimedialnych WETI, PG Opracowanie: dr inŝ. Piotr Szczuko Podsumowanie poprzedniego wykładu Cel: przewidywanie wyniku (określania
DŹWIĘK. Dźwięk analogowy - fala sinusoidalna. Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona
DŹWIĘK Dźwięk analogowy - fala sinusoidalna Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona Dźwięk cyfrowy 2-bitowy 2 bity 4 możliwe stany (rozdzielczość dwubitowa) 8 bitów - da
Cel i zakres ćwiczenia
MIKROMECHANIZMY I MIKRONAPĘDY 2 - laboratorium Ćwiczenie nr 5 Druk 3D oraz charakteryzacja mikrosystemu Cel i zakres ćwiczenia Celem ćwiczenia jest charakteryzacja geometryczna wykonanego w ćwiczeniu 1
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI
WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI Stefan WÓJTOWICZ, Katarzyna BIERNAT ZAKŁAD METROLOGII I BADAŃ NIENISZCZĄCYCH INSTYTUT ELEKTROTECHNIKI ul. Pożaryskiego 8, 04-703 Warszawa tel. (0)
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Kwantyzacja wektorowa. Kodowanie różnicowe.
Kwantyzacja wektorowa. Kodowanie różnicowe. Kodowanie i kompresja informacji - Wykład 7 12 kwietnia 2010 Kwantyzacja wektorowa wprowadzenie Zamiast kwantyzować pojedyncze elementy kwantyzujemy całe bloki
Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania
Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania MODELOWANIE I IDENTYFIKACJA Studia niestacjonarne Estymacja parametrów modeli, metoda najmniejszych kwadratów.
2. STRUKTURA RADIOFONICZNYCH SYGNAŁÓW CYFROWYCH
1. WSTĘP Radiofonię cyfrową cechują strumienie danych o dużych przepływnościach danych. Do przesyłania strumienia danych o dużych przepływnościach stosuje się transmisję z wykorzystaniem wielu sygnałów
Niepewności pomiarów
Niepewności pomiarów Międzynarodowa Organizacja Normalizacyjna (ISO) w roku 1995 opublikowała normy dotyczące terminologii i sposobu określania niepewności pomiarów [1]. W roku 1999 normy zostały opublikowane
Przykładowe zadanie praktyczne
Przykładowe zadanie praktyczne Opracuj projekt realizacji prac związanych z uruchomieniem i testowaniem kodera i dekodera PCM z układem scalonym MC 145502 zgodnie z zaleceniami CCITT G.721 (załączniki
Przetwarzanie A/C i C/A
Przetwarzanie A/C i C/A Instrukcja do ćwiczenia laboratoryjnego opracował: Łukasz Buczek 05.2015 Rev. 204.2018 (KS) 1 1. Cel ćwiczenia Celem ćwiczenia jest zapoznanie się z przetwornikami: analogowo-cyfrowym
Klasyfikacja metod kompresji
dr inż. Piotr Odya Klasyfikacja metod kompresji Metody bezstratne Zakodowany strumień danych po dekompresji jest identyczny z oryginalnymi danymi przed kompresją, Metody stratne W wyniku kompresji część
Wykład 9. Terminologia i jej znaczenie. Cenzurowanie wyników pomiarów.
Wykład 9. Terminologia i jej znaczenie. Cenzurowanie wyników pomiarów.. KEITHLEY. Practical Solutions for Accurate. Test & Measurement. Training materials, www.keithley.com;. Janusz Piotrowski: Procedury
Teraz bajty. Informatyka dla szkoły podstawowej. Klasa VI
1 Teraz bajty. Informatyka dla szkoły podstawowej. Klasa VI 1. Obliczenia w arkuszu kalkulacyjnym Rozwiązywanie problemów z wykorzystaniem aplikacji komputerowych obliczenia w arkuszu kalkulacyjnym wykonuje
dr inż. Piotr Odya dr inż. Piotr Suchomski
dr inż. Piotr Odya dr inż. Piotr Suchomski Podział grafiki wektorowa; matematyczny opis rysunku; małe wymagania pamięciowe (i obliczeniowe); rasteryzacja konwersja do postaci rastrowej; rastrowa; tablica
Kwantyzacja wektorowa. Plan 1. Zasada działania 2. Projektowanie. Algorytm LBG 3. Kwantyzatory strukturalne 4. Modyfikacje
Kwantyzacja wektorowa Plan 1. Zasada działania 2. Projektowanie. Algorytm LBG 3. Kwantyzatory strukturalne 4. Modyfikacje Zasada kwantyzacji wektorowej Kwantyzacja skalarna koduje oddzielnie kaŝdą próbkę
Rachunek prawdopodobieństwa projekt Ilustracja metody Monte Carlo obliczania całek oznaczonych
Rachunek prawdopodobieństwa projekt Ilustracja metody Monte Carlo obliczania całek oznaczonych Autorzy: Marta Rotkiel, Anna Konik, Bartłomiej Parowicz, Robert Rudak, Piotr Otręba Spis treści: Wstęp Cel
MODELE LINIOWE. Dr Wioleta Drobik
MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą
Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych
dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo
Struktury specjalizowane wykorzystywane w mikrokontrolerach
Struktury specjalizowane wykorzystywane w mikrokontrolerach Przetworniki analogowo-cyfrowe i cyfrowoanalogowe Interfejsy komunikacyjne Zegary czasu rzeczywistego Układy nadzorujące Układy generacji sygnałów
Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego
IBS PAN, Warszawa 9 kwietnia 2008 Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego mgr inż. Marcin Jaruszewicz promotor: dr hab. inż. Jacek Mańdziuk,
przetworzonego sygnału
Synteza falek ortogonalnych na podstawie oceny przetworzonego sygnału Instytut Informatyki Politechnika Łódzka 28 lutego 2012 Plan prezentacji 1 Sformułowanie problemu 2 3 4 Historia przekształcenia falkowego
Regresja i Korelacja
Regresja i Korelacja Regresja i Korelacja W przyrodzie często obserwujemy związek między kilkoma cechami, np.: drzewa grubsze są z reguły wyższe, drewno iglaste o węższych słojach ma większą gęstość, impregnowane
PRZETWORNIKI CYFROWO - ANALOGOWE POMIARY, WŁAŚCIWOŚCI, ZASTOSOWANIA.
strona 1 PRZETWORNIKI CYFROWO - ANALOGOWE POMIARY, WŁAŚCIWOŚCI, ZASTOSOWANIA. Cel ćwiczenia Celem ćwiczenia jest przedstawienie istoty działania przetwornika C/A, źródeł błędów przetwarzania, sposobu definiowania
Natalia Gorynia-Pfeffer STRESZCZENIE PRACY DOKTORSKIEJ
Natalia Gorynia-Pfeffer STRESZCZENIE PRACY DOKTORSKIEJ Instytucjonalne uwarunkowania narodowego systemu innowacji w Niemczech i w Polsce wnioski dla Polski Frankfurt am Main 2012 1 Instytucjonalne uwarunkowania
POMIARY REZYSTANCJI. Cel ćwiczenia. Program ćwiczenia
Pomiary rezystancji 1 POMY EZYSTNCJI Cel ćwiczenia Celem ćwiczenia jest poznanie typowych metod pomiaru rezystancji elementów liniowych i nieliniowych o wartościach od pojedynczych omów do kilku megaomów,
Audio i video. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski
Audio i video R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski s-rg@siwy.il.pw.edu.pl Fale dźwiękowe Dźwięk jest drganiem powietrza rozchodzącym się w postaci fali. Fala ma określoną amplitudę i częstotliwość.
Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami
Spis treści Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Formaty plików audio różnią się od siebie przede wszystkim zastosowanymi algorytmami kompresji. Kompresja danych polega na
SZCZEGÓLNE ROZWAśANIA NAD UŚREDNIONYMI POMIARAMI Special Considerations for Averaged Measurements
UŚREDNIANIE PARAMETRÓW KaŜda funkcja analiz częstotliwości (funkcja Vis w LabVIEW posiada moŝliwość uśredniania. Kontrola uśredniania parametrów w analizie częstotliwościowej VIs określa, jak uśrednione
Teoria błędów pomiarów geodezyjnych
PodstawyGeodezji Teoria błędów pomiarów geodezyjnych mgr inŝ. Geodeta Tomasz Miszczak e-mail: tomasz@miszczak.waw.pl Wyniki pomiarów geodezyjnych będące obserwacjami (L1, L2,, Ln) nigdy nie są bezbłędne.
Analiza korelacyjna i regresyjna
Podstawy Metrologii i Technik Eksperymentu Laboratorium Analiza korelacyjna i regresyjna Instrukcja do ćwiczenia nr 5 Zakład Miernictwa i Ochrony Atmosfery Wrocław, kwiecień 2014 Podstawy Metrologii i
Walidacja metod analitycznych Raport z walidacji
Walidacja metod analitycznych Raport z walidacji Małgorzata Jakubowska Katedra Chemii Analitycznej WIMiC AGH Walidacja metod analitycznych (według ISO) to proces ustalania parametrów charakteryzujących