Raport z realizacji zadania badawczego: A.5 Tytuł raportu: Analiza i ocena metod subiektywnych i obiektywnych badania jakości sygnałów audio i wideo

Wielkość: px
Rozpocząć pokaz od strony:

Download "Raport z realizacji zadania badawczego: A.5 Tytuł raportu: Analiza i ocena metod subiektywnych i obiektywnych badania jakości sygnałów audio i wideo"

Transkrypt

1 Numer Projektu Badawczego Zamawianego: -MNiSW-02-II/2007 Tytuł projektu: Numer dokumentu: Usługi i sieci teleinformatyczne następnej generacji aspekty techniczne, aplikacyjne i rynkowe -MNiSW-02-II/2007/WUT/A.5 Tytuł raportu: Analiza i ocena metod subiektywnych i obiektywnych badania jakości Przewidywany termin dostarczenia raportu: 30/06/08 Rzeczywisty termin dostarczenia raportu: 25/06/08 Kierownik zadania: Wykonawcy: Sławomir Kula Przemysław Dymarski, Artur Janicki, Sławomir Kula Abstrakt: W pracy dokonano analizy i oceny wybranych metod badania jakości, oraz przeprowadzono analizę przydatności tych metod w realizacji projektu. Słowa kluczowe: metody subiektywne, metody obiektywne, audio, wideo, PESQ, PEAQ, PEVQ

2 Streszczenie W raporcie przedstawiono metody i badania jakości sygnałów audio (głównie mowy telefonicznej) i wideo. Podstawowe znaczenie mają tu metody subiektywne, bazujące na uśrednionej reakcji grupy słuchaczy (sygnał audio) lub obserwatorów. Opisano je w p.2.1, a w p.1.2 podano oparte na nich normy. Metody te wymagają przeprowadzania długotrwałych badań z udziałem grupy słuchaczy/obserwatorów, dlatego coraz częściej używa się mniej dokładnych, lecz łatwych w użyciu metod obiektywnych (p.2.3 i 3). Oparte są one na pomiarze sygnału audio i wideo (metody intruzyjne po stronie nadawczej i odbiorczej, nieintruzyjne wyłącznie po stronie odbiorczej) i niejako zastępują słuchacza/obserwatora, wykorzystując model percepcji (słuchowej i wzrokowej). Muszą być jednak kalibrowane z wykorzystaniem metod obiektywnych. Z kolei metody parametryczne (p.2.2) opierają się na pomiarze wybranych, charakterystycznych, fizycznych parametrów połączenia telekomunikacyjnego i na tej podstawie określeniu jakości sygnału, bez udziału odbiorców i bez pomiarów dźwięku i obrazu. Te ostatnie są najwygodniejsze w stosowaniu, lecz najmniej dokładne. Celem zadania realizowanego w projekcie jest dostarczenie narzędzi dla operatora, pozwalających mierzyć stopień zadowolenia (QoE) usługobiorcy z aplikacji, którą ma być VoIP Wideostreaming (aplikacja Wideo na żądanie ) Gra interaktywna Wymaga to testowania koniec - koniec pojedynczego połączenia, w związku z tym zakłada się, aby zapewniony był dostęp do obu terminali nadawczego i odbiorczego. W przypadku wideostreamingu wystarczy znajomość wysyłanej sekwencji wideo. Pomiar jakości przeprowadzany byłby po stronie odbiorczej, na podstawie porównania nadawanej i odebranej sekwencji wideo. Podstawowym narzędziem byłyby tu metody obiektywne, po odpowiedniej kalibracji z wykorzystaniem metod subiektywnych. W przypadku aplikacji interaktywnych (VoIP, gra) po obu stronach połączenia powinien być umieszczony agent, symulujący interlokutora (lub gracza). Automat mógłby reagować, natychmiast odpowiadając na przekaz głosowy lub wiadomość o zmianie stanu gry, umożliwiając tym pomiar opóźnienia i innych parametrów wpływających na jakość usługi. W odniesieniu do gry interaktywnej należałoby, w pierwszym etapie, przeprowadzić badania metodami subiektywnymi. Wyników tych badań można będzie użyć do kalibracji odpowiedniej metody obiektywnej (należałoby taką metodę opracować). W dalszej fazie projektu można by podjąć próbę skonstruowania, dla wymienionych na wstępie aplikacji, agentów pomiarowych działających na poziomie pakietów, bez symulacji rozmówcy czy gracza. Agenci, zainstalowani po obu stronach połączenia telekomunikacyjnego, wymienialiby się oznakowanymi pakietami, mierząc parametry połączenia (przepływność, opóźnienie pakietów, jitter opóźnienia, stopa utraty pakietów). Odpowiedni algorytm dokonywałby oszacowania QoE na podstawie wyników przeprowadzonej sesji pomiarowej. 2

3 Spis treści STRESZCZENIE WPROWADZENIE METODY BADANIA JAKOŚCI STAN NORMALIZACJI SUBIEKTYWNE I OBIEKTYWNE METODY BADANIA JAKOŚCI MOWY I SYGNAŁÓW AKUSTYCZNYCH SUBIEKTYWNE METODY BADANIA JAKOŚCI MOWY Kategoryzacja Testy konwersacyjne Testy odsłuchowe Metoda ACR Metoda DCR Metoda DRT/MRT Badanie wyrazistości PARAMETRYCZNE METODY BADANIA JAKOŚCI E-model OBIEKTYWNE METODY BADANIA JAKOŚCI Metoda PSQM Metoda MNB Metoda 3SQM OFERTY WYSPECJALIZOWANYCH FIRM WNIOSKI OBIEKTYWNE METODY OCENY JAKOŚCI SYGNAŁU WIDEO RODZAJE ZNIEKSZTAŁCEŃ I ZAKŁÓCEŃ OBRAZU RUCHOMEGO MODELE PERCEPCJI OBRAZU BADANIA PERCEPCJI OBRAZU W RAMACH VQEG Yonsei University (Korea)

4 3.3.2 CPqD IES (Brazylia) NASA NTIA/ITS OFERTY WYSPECJALIZOWANYCH FIRM WNIOSKI PODSUMOWANIE SUBIEKTYWNE A OBIEKTYWNE METODY BADANIA JAKOŚCI WNIOSKI ZWIĄZANE Z REALIZACJĄ PROJEKTU...33 LITERATURA...35 LISTA SKRÓTÓW...38 LISTA OZNACZEŃ

5 1 Wprowadzenie 1.1 Metody badania jakości We współczesnych systemach i sieciach telekomunikacyjnych i teleinformatycznych stosowanych jest wiele rozwiązań, w których sygnał mowy, sygnały akustyczne i sygnały wideo podlegają różnego rodzaju przekształceniom i przetworzeniom w celu jego sprawnego i efektywnego przesyłania, gromadzenia, rozpoznawania i syntetyzowania. Stosowanych jest wiele różnych typów koderów, sieci dostępowe i transmisyjne opierają się na nowych rozwiązaniach, a integracja sieci telekomunikacyjnych i informatycznych stała się faktem, również w kontekście realizacji połączeń telefonicznych (VoIP Voice over IP). Specyfika stosowanych rozwiązań oraz różnorodność systemów i sieci wykorzystywanych do tworzenia połączeń telefonicznych powoduje, że sygnały podlegają wielokrotnemu przetwarzaniu, przekodowywaniu i przeładowywaniu zanim dotrą do odbiorcy. Wszystko to może w rezultacie wpływać na ich jakość. Wpływ ten jest z reguły negatywny, a co gorsze czasami trudny lub niemożliwy do przewidzenia. Jakość mowy SQ (Speech Quality) jest jednym z elementów ogólnej oceny QOS (Quality Of Service) jakości usługi telekomunikacyjnej związanej z tworzeniem połączeń telefonicznych. Ocena jakości mowy SQ nie obejmuje na przykład skuteczności nawiązywania połączeń, częstości ich zrywania, czy skuteczności rozpoznawania mowy, które to parametry razem z SQ wpływają na ogólną ocenę QOS jakości usługi. Przesyłanie sygnału wizyjnego wykorzystuje się w usługach typu Wideo na żądanie, Wideostreaming, Wideokonferencja. Miarą zadowolenia klienta z tych usług jest w głównej mierze jakość odbieranego obrazu i skojarzonego z nim dźwięku. Jakość tę mierzy się metodami subiektywnymi, najczęściej w skali MOS (mean opinion score) od 1 do 5. Wymaga to przeprowadzania sformalizowanych odsłuchów dźwięku i pokazów ruchomego obrazu, co jest trudne od strony organizacyjnej, długotrwałe i kosztowne. W tej sytuacji dąży się do zastąpienia metod subiektywnych oceny jakości metodami obiektywnymi, polegającymi na obliczeniu parametru MOS na bazie automatycznego porównania sygnału oryginalnego (starannie dobranego, o dobrej jakości) i sygnału docierającego do klienta. Tego typu metody obiektywne, wymagające znajomości oryginału, są nazywane intruzyjnymi (ang. intrusive). Trudniejsze do opracowania i z reguły mniej dokładne, są metody nieintruzyjne (ang. nonintrusive), nie wymagające znajomości oryginału. Inną grupę metod oceny jakości stanowią metody parametryczne, pozwalające na oszacowanie jakości usługi na podstawie parametrów połączenia telefonicznego. Należy do nich E-model (zalecenie G.107 dla telefonii) i algorytm P.VTQ (dla VoIP). W kolejnych podrozdziałach raportu skoncentrowano się na prezentacji wybranych subiektywnych i obiektywnych metod oceny jakości mowy, sygnału audio i sygnału wideo dla potrzeb badania różnego rodzaju połączeń, którymi są przesyłane te sygnały oraz urządzeń, systemów i sieci realizujących takie połączenia. W podsumowaniu sformułowano wnioski dla realizacji projektu. 1.2 Stan normalizacji Większość norm odnosi się do subiektywnej oceny jakości mowy, sygnałów akustycznych i wizyjnych. Warunki przeprowadzania badań wyrazistości mowy dla potrzeb telefonii określa Pol- 5

6 ska Norma PN-90/T [PN-90]. Badania odsłuchowe w skali MOS opisano w zaleceniu ITU-T P.800 [P.800]. Rozszerzono tę normę na cyfrowe łącza i kodeki zalecenie ITU-T P.830. Metodę porównawczą określania jakości mowy definiuje zalecenie ITU-T P.810: Modulated Noise Reference Unit [MNRU]. Do subiektywnego pomiaru jakości mowy odnoszą się też normy ETSI: ETSI ETR 250 [ETR250] i ETSI EG [EG201]. Metodykę subiektywnych pomiarów jakości sekwencji wideo opisuje zalecenie ITU-R BT [BT500]. Dla potrzeb multimediów opracowano zalecenia [P.910] i [P.911] to ostatnie łącznie traktuje dźwięk i obraz. Dla sygnału mowy w paśmie telefonicznym opracowano odpowiednie testy obiektywne: Algorytm PSQM opisany w zaleceniu ITU-T P.861 [PSQM] Algorytm PESQ [PESQ] opisany w zaleceniu ITU-T P.862 jest to ulepszona wersja PSQM. Oba algorytmy są intruzyjne, uwzględniają niektóre zjawiska psychoakustyczne, np. maskowanie zakłóceń użytecznym sygnałem audio. Algorytm 3SQM zalecenie P.563 [3SQM]. Jest to metoda nieintruzyjna, tym niemniej zapewniająca dużą korelację wyników MOS z wynikami otrzymanymi dokładniejszą metodą PESQ. Dla sygnałów akustycznych o pełnym paśmie częstotliwości odbieranym przez człowieka opracowano metodę PEAQ norma BS.1387 [PEAQ]. Jest to metoda intruzyjna. Inną grupę metod oceny jakości stanowią metody parametryczne, pozwalające na oszacowanie jakości usługi na podstawie parametrów połączenia telefonicznego. Należy do nich E-model (zalecenie G.107) [G.107] i algorytm P.VTQ (Derivation of voice transmission quality from nonintrusive IP protocol analysis w opracowaniu). E-model został zmodyfikowany w zaleceniach ETSI [ETS101], [ETS102]. Mniej zaawansowane są prace nad obiektywnymi algorytmami oceny jakości ruchomego obrazu. Normy ANSI [ANSI801] nie uwzględniają maskowania i innych cech percepcji obrazu przez człowieka. Dopiero zalecenie J.144 [J.144] opracowane dla telewizji kablowej ma cechy użytecznej metody intruzyjnej. Odnosi się ono do sygnałów o jakości telewizyjnej, zakłada obserwację obrazu na dużym ekranie, w związku z tym nie może być wykorzystane do badania jakości strumieni wideo przesyłanych np. w systemie UMTS i obserwacji obrazu na małym terminalu (telefonie komórkowym). 6

7 2 Subiektywne i obiektywne metody badania jakości mowy i sygnałów akustycznych W tej części raportu omówiono metody subiektywne, obiektywne i parametryczne badania jakości mowy. Należy podkreślić, że metody subiektywne, angażujące grupę słuchaczy, są podstawowym narzędziem służącym do kalibracji pozostałych metod metod oceny jakości. Są one jednocześnie najbardziej kłopotliwe w stosowaniu, gdyż wymagają zorganizowania sformalizowanych odsłuchów. Metody obiektywne posługują się modelem percepcji w celu oceny postrzeganej przez odbiorcę jakości. Metody parametryczne (często uważane za szczególnego rodzaju metody obiektywne) posługują się parametrami połączenia telekomunikacyjnego dla oceny spodziewanej jakości przekazu. 2.1 Subiektywne metody badania jakości mowy Subiektywne metody badania jakości mowy sprowadzają się do bezpośredniego wykorzystania w eksperymencie osób, których zadaniem jest - na podstawie wrażeń słuchowych. określenie cech mowy pozwalających bezpośrednio lub pośrednio oszacować jej jakość. Na rysunku 2-1 pokazano schematycznie strukturę, w jakiej przeprowadza się testy subiektywne. Rysunek 2-1: Struktura, w której przeprowadza się testy subiektywne Kategoryzacja Osoby biorące udział w ocenie jakości mowy mają za zadanie ocenić mowę w ramach przyjętej kategorii. W testach subiektywnych używanych jest kilka typów kategorii. I tak da się wyróżnić następujące kategorie: bezwzględna porównawcza degradacyjna. W każdym przypadku osoba oceniająca jakość mowy przypisuje jej ocenę według przyjętej skali punktowej. W tabeli 2-1 przedstawiono skale punktowe dla wyżej wymienionych kategorii. 7

8 Tabela 2-1: Skala punktacji dla poszczególnych typów kategoryzacji Punktacja Kategoryzacja Bezwzględna Porównawcza Degradacyjna Jakość Porównanie jakości Pogorszenie jakości 5 Doskonała - Niesłyszalne 4 Dobra - Nie przeszkadzające 3 Zadowalająca Dużo lepsza Lekko przeszkadzające 2 Słaba Lepsza Przeszkadzające 1 Zła Nieznacznie lepsza Bardzo przeszkadzające 0 - Jednakowa Nieznacznie gorsza Gorsza Dużo gorsza Testy konwersacyjne W tym teście, dwóch jego uczestników (osoby przypadkowe, nie związane z personelem technicznym laboratorium, ani pomiarami jakości mowy) znajduje się w odrębnych kabinach o ściśle określonych gabarytach, umieszczonych w laboratorium badawczym Pomiędzy kabinami jest łączność telefoniczna. Parametry połączenia telefonicznego są modelowane. Zadaniem osób prowadzących rozmowę jest ocena jej jakości w skali 5-punktowej oraz udzielenie binarnej odpowiedzi na pytanie: czy występowały trudności w trakcie rozmowy? Dodatkowo mierzony jest poziom odbieranych sygnałów oraz czas trwania rozmowy. Na podstawie oceny rozmówców określa się wartość MOS Testy odsłuchowe Testy odsłuchowe nie uwzględniają wszystkich czynników występujących w trakcie korzystania z łączności telefonicznej. Niemniej są one wygodne na przykład w fazie opracowywania nowego systemu lub kodera mowy. Sygnał mowy jest wcześniej rejestrowany w pamięci komputera, a w czasie testu odczytywany i przesyłany przez badany system. Lektorzy biorący udział w przygotowaniu nagrań muszą spełniać odpowiednie wymagania. W teście odsłuchowym mowa podlega ocenia według skali bezwzględnej przez grupę słuchaczy. Do najważniejszych subiektywnych metod oceny jakości transmisji mowy obecnie zalicza się te metody, które dają ocenę MOS w pięciostopniowej skali jakości bezpośrednio. Są to następujące metody: 8

9 ACR Absolute Category Rating, DCR Degradation Category Rating Ocenę jakości można uzyskać też pośrednio, poprzez pomiary wyrazistości i zrozumiałości: metoda DRT Diagnostic Rhyme Test, metoda MRT Modified Rhyme Test. Integralną częścią metody niezależnie od sposobu dojścia do oceny MOS winna być miara odniesienia pozwalająca na porównanie i uśrednienie wyników MOS uzyskanych różnymi sposobami, w różnych ośrodkach i dla różnych języków Metoda ACR Metoda ACR, polegająca na bezpośrednim określeniu jakości mowy w pięciostopniowej skali ocen jest obecnie najczęściej stosowana, gdyż pozwala na stosunkowo szybki i tani (jak na metody subiektywne) pomiar. Umożliwia to przeprowadzenie badań dla wielu obiektów z różnymi wartościami parametrów wpływających na jakość transmisji lub kodowania. Dodatkowo metoda ACR, jest unormowana w zaleceniach ITU-T P.800 [P.800]. Wadą metody jest brak precyzji w zdefiniowaniu zadania dla grupy odsłuchowej i naturalna niezdolność słuchaczy do stabilnej i powtarzalnej oceny w skali punktowej takiej cechy, jak jakość transmisji mowy. Jest tu więc konieczne wykonanie pomiaru dla licznej ekipy słuchaczy (większej od 12), kilku głosów po stronie nadawczej, staranne przeszkolenie i trenowanie słuchaczy. W tej metodzie wykorzystywane są listy testowe złożone z prostych, krótkich, nie związanych z sobą semantycznie zdań. Lista podzielona jest na grupy złożone z pięciu zdań. Zdania nie powinny być zbyt krótkie, jak również zbyt długie; powinny trwać 2-3 s. Słuchacze, po wysłuchaniu grupy zdań podają swoja opinię w pięciostopniowej skali jakości odsłuchu, wysiłku słuchowego lub preferowanej głośności. Ocena 5 odpowiada bardzo dobrej jakości, natomiast 1 niedostatecznej. Ocena średnia (MOS) obliczana jest dla każdego badanego warunku transmisji mowy oraz dla każdej skali ocen, jako wynik uśrednienia po słuchaczach i mówcach Metoda DCR Metoda DCR, także unormowana zaleceniami ITU-T P.800 [P.800], jest alternatywnym rozwiązaniem dla metody ACR. Pomiar polega na porównaniu wzorcowego sygnału mowy o wysokiej jakości z sygnałem przesłanym przez badany kanał telekomunikacyjny. Sygnał wzorcowy prezentowany jest zawsze jako pierwszy. Słuchacze określają stopień pogorszenia jakości sygnału badanego w stosunku do sygnału wzorcowego w pięciostopniowej skali ocen. Pomiar wykonywany jest dla licznej ekipy słuchaczy i kilku mówców (podobnie jak w metodzie ACR). Ocena średnia (DMOS) obliczana jest dla każdego badanego warunku transmisji mowy oraz dla każdej skali ocen, jako wynik uśrednienia po słuchaczach i mówcach Metoda DRT/MRT W metodach opartych o testy DRT/MRT materiałem testowym jest zbiór słów jednosylabowych różniących się najczęściej między sobą początkową lub końcową głoską. Miarą oceny jakości mowy jest podobnie jak w metodach wyrazistościowych stosunek poprawnie odebranych jednostek do liczby jednostek nadanych. Zbiór jednostek testowych jest najczęściej ograniczony i nieliczny (np. 6 jednostek), natomiast dla danego pomiaru jednostki są prezentowane słuchaczom 9

10 wielokrotnie w losowej kolejności. Głoski różnicujące zbiór testowy dobierane są z tej samej grupy artykulacyjnej (typowy jest tu zbiór głosek zwartych: p, d, t, d, k, g). Testy DRT/MRT różnią się od metod wyrazistościowych liczebnością zbioru testowego, brakiem zrównoważenia fonematycznego i strukturalnego materiału testowego oraz możliwością (wykluczoną w metodach wyrazistościowych) wielokrotnego powtarzania tej samej jednostki. Metody DRT/MRT można stosunkowo łatwo zautomatyzować [Basc99] Badanie wyrazistości Jedną z częściej używanych w Polsce subiektywnych metod oceny jakości mowy jest badanie wyrazistości. Metoda ta nie daje pełnej informacji o jakości a jedynie uwzględnia aspekt rozumienia wypowiadanych jednostek akustycznych takich jak: logatomy, sylaby, wyrazy czy zdania. Najczęściej badania te dotyczą wyrazistości logatomowej. Logatomy to nic nie znaczące w danym języku wyrazy (jedno-, dwu- lub trzysylabowe). Rozpoznanie logatomu jest zatem wyłącznie wynikiem usłyszenia wszystkich wchodzących w jego skład fonemów, a nie skojarzenia ze znanym wyrazem lub analizy kontekstowej. Pomijając kwestie proceduralne można powiedzieć, że badanie wyrazistości logatomowej polega na określeniu procentowym stosunku poprawnie rozpoznanych przez N słuchaczy logatomów z L do całkowitej liczby logatomów odczytanych. W N L 1 W n, l n= 1 l= 1 = ( NL) Rów. 2-1 W podanym wzorze W n,l oznacza liczbę poprawnie rozpoznanych logatomów przez n-tego słuchacza z l-tej listy w stosunku do liczby logatomów odczytanych z tej listy. Szczegółowy opis metody podaje polska norma [PN-90]. 2.2 Parametryczne metody badania jakości E-model O jakości mowy transmitowanej decyduje wiele czynników wprowadzanych w procesie transmisji. Do niedawna istotne były jedynie tłumienie i zniekształcenie widma częstotliwościowego w kanale transmisyjnym. Ocenie wpływu na jakość mowy, przede wszystkim takich czynników służą modele: Transmission Rating (amerykański), Information Index (francuski), czy japoński o nazwie OPINE) Obecnie, gdy pojawiły się nowe systemy telefoniczne i systemy transmisyjne takie jak np. analogowa lub cyfrowa telefonia komórkowa oraz możliwości zarządzania jakością konieczne staje się udostępnienie operatorowi i projektantowi sieci telefonicznej nowych metod oceny jakości mowy w łańcuchu telefonicznym. Europejski Instytut Standardów Telekomunikacyjnych ETSI opracował model o nazwie E-model służący temu celowi [G.107]. E-model został zmodyfikowany w zaleceniach ETSI [ETS101], [ETS102]. E-model należy do metod parametrycznych, w których tworzony jest matematyczny model uwzględniający wszystkie elementy wchodzące w skład testowanej sieci lub systemu. Na jego podstawie obliczany jest parametr łączny. Dla szeregu wartości tego parametru określana jest metodą subiektywną jakość mowy. Otrzymana w ten sposób krzywa odwzorowania jest wykorzystywana do określenia, w następnych testach, jakości mowy wyłącznie na podstawie parametru łącznego. 10

11 W E-modelu wyznacza się parametr R będący łączną miarą jakości mowy. Może on być obliczony z następującej zależności: R = R I I I A Rów. 2-2 o s d e + gdzie: R o reprezentuje podstawowy stosunek mocy sygnału do mocy szumu, zależny zarówno od poziomu sygnału jak i szumów, I s reprezentuje zniekształcenia pojawiające się równocześnie z sygnałem mowy takie jak szumy kwantyzacji PCM, czy sygnały wybierania tonowego, I d reprezentuje zniekształcenia wynikające z opóźnień wnoszonych w procesie przetwarzania i transmisji, I e reprezentuje transmisyjne zniekształcenia wnoszone przez urządzenia takie jak niskoprzepływnościowe kodery, systemy DSI itp., A jest składnikiem korekcyjnym zależnym od specyfiki dostępu do łącza. Nowymi elementami wprowadzonymi do E-modelu są parametry I e oraz A. Parametr I e jest bezpośrednio zależny od zniekształceń wnoszonych przez kodery łańcucha. Może on być wyrażony jako suma parametrów K poszczególnych N koderów wchodzących w jego skład: N I e = n = K 1 n Rów. 2-3 W tabeli 2-2 podano wstępnie ustalone wartości parametru K dla najpopularniejszych typów koderów, zaś w tabeli 2-3 wartości składnika korekcyjnego A w zależności od typu systemu. Tabela 2-2: Wartość parametru K dla różnych typów koderów Typ kodera Przepływność [kbit/s] K PCM 64 0 ADPCM (G.726-7) LD-CELP (G.728) ACELP (G.729) 8 15 VSELP (IS 54 USA)

12 GSM (RPE RTP) GSM (ETS ) 6,5 25 Tabela 2-3: Wartości parametru A przyjmowane w E-modelu dla różnych systemów łączności System łączności A Tradycyjna telefonia przewodowa 0 DECT 5 GSM 10 Telefonia satelitarna 20 Współczynnik R może być obliczony na podstawie danych o systemach i sieciach. A zatem bez dokonywania pomiarów można określić jakość sygnału mowy, ponieważ związek pomiędzy parametrem R a subiektywną miarą jakość MOS jest określony (rys. 2-2) Rysunek 2-2: Zależność MOS od parametru R W wielu ośrodkach n-b kontynuowane są prace mające na celu lepsze dopasowanie E-modelu do nowych sposobów świadczenia usług telefonicznych, przede wszystkim VoIP [Ding],[Carvalho]. Prowadzone są również badania mające na celu powiązanie parametru R z innymi miarami subiektywnymi. W pracy [Trz00] pokazany jest związek pomiędzy parametrem R a wyrazistością logatomową. Niestety model nie został dokładnie przebadany z punktu widzenia zastosowań do sieci pakietowych i sieci o zmiennym opóźnieniu. 12

13 2.3 Obiektywne metody badania jakości Cechą charakterystyczną obiektywnych metod oceny jakości mowy jest wyznaczanie odległości - według przyjętej miary - pomiędzy wybranym lub wybranymi parametrami sygnału mowy oryginalnej i sygnału przetworzonego (przesłanego), a następnie na podstawie krzywej odwzorowania, określenie oceny w mierze subiektywnej. Na rysunku 2-3 pokazano ogólny schemat metody obiektywnej badania jakości mowy na podstawie analizy parametrów sygnału. Rysunek 2-3: Schemat blokowy obiektywnej metody oceny jakości mowy opartej na analizie parametrów sygnałów Uwzględniony na rys.2-3 sygnał odniesienia występuje jedynie w metodach intruzyjnych. W przypadku metod nieintruzyjnych jakość oceniana jest w oparciu o charakterystyczne zniekształcenia pojawiające się w transmisji, np. szumy i nieciągłości przebiegu czasowego (skutek przerw w transmisji) Metoda PSQM W pierwszej połowie lat dziewięćdziesiątych ITU prowadziło intensywne prace zmierzające do opracowania obiektywnej metody badania jakości mowy kodowanej. Ich efektem było opracowanie kilku metod (PAMS, PARCEWAL, PSQM, PAQM, z których w wyniku weryfikacji stwierdzono, że metodą dającą najlepsze wyniki dla koderów telefonicznych wąskopasmowych, tzn. najlepiej estymującą wyniki badań subiektywnych, niezależnie od języka, mówcy i kodera jest metoda nazywana PSQM (Perceptual Speech Quality Measure). Opisuje ją zalecenie P.861 [PSQM]. W przypadku koderów szerokopasmowych zdecydowano się na model PEAQ (zalecenie ITU-R, BS.1387 [PEAQ]). Istota metody PSQM sprowadza się do określenia odległości pomiędzy rzeczywistym sygnałem mowy, a sygnałem otrzymanym w wyniku jej przetworzenia (głównie kodowania). Przy czym, zanim porównanie zostanie dokonane obydwa sygnały podlegają transformacji z postaci fizycznej na postać psychofizyczną odzwierciedlającą przetwarzanie akustycznego sygnału mowy przez ucho człowieka. Jak wcześniej wspomniano percepcja sygnału mowy jest zróżnicowana w zależności od jego częstotliwości i mocy. Inaczej odbierane są różnice między poziomami głośności. Na operację transformacji sygnału z postaci fizycznej na postać psychofizyczną składa się: odwzorowanie czasowo-częstotliwościowe; przeskalowanie częstotliwości; 13

14 przeskalowanie poziomu natężenia. Pierwsza z operacji jest realizowana za pomocą ramkowania sygnału oknem Hanninga o czasie trwania 32 ms (N=256 próbek w przypadku częstotliwości próbkowania 8 khz albo N=512 próbek przy częstotliwości próbkowania 16 khz), a następnie obliczenia N-punktowej krótkookresowej dyskretnej transformaty Fouriera, i na jej podstawie obliczeniu krótkookresowej mocy sygnału. Druga z operacji ma na celu zrealizowanie filtracji za pomocą tzw. filtrów barkowych. Różnica częstotliwości środkowych i szerokości pasm dwóch sąsiednich filtrów barkowych zwiększa się z częstotliwością, co wraz z maskowaniem przez szum odzwierciedla właściwości percepcyjne ucha. Do sygnału dodawany jest szum Hoth a modelujący zakłócanie sygnału szumami otoczenia docierającymi do słuchawki telefonu. Przeskalowanie poziomu natężenia w decybelach na poziom głośności wyrażany w fonach, a następnie jego wyrażenie w skali sonowej ma na celu uwzględnienie faktu, że subiektywne odczucie głośności nie zależy liniowo od poziomu natężenia sygnału (przejście ze skali decybelowej na fonową), oraz że subiektywne wrażenie zwiększenia głośności zmienia się nieliniowo wraz ze zmianą głośności (przejście ze skali fonowej na sonową). Maskowanie jest uwzględniane w modelu w prosty sposób. Efekt maskowania jest brany pod uwagę tylko wówczas, gdy dwie składowe pojawiają się w tym samym czasie i mają identyczne częstotliwości. Opisane pokrótce przekształcenie z wykorzystaniem modelu percepcyjnego obejmuje zarówno sygnał oryginalny jak i sygnał przetworzony, którego jakość ma być określona. Uproszczony algorytm metody PSQM przedstawiono na rys.2-4. Reprezentacje wewnętrzne obu sygnałów są porównywane, a obliczona odległość między nimi (tzw. wskaźnik PSQM) jest bezpośrednio związana z jakością testowanej mowy. Ostatnim krokiem w metodzie PSQM jest odwzorowanie skali obiektywnej na subiektywną. Nie jest to konieczne, jeżeli metoda jest stosowana np. do porównywania różnych typów koderów. Metoda PSQM choć stosunkowo prosta realizacyjnie napotyka na szereg trudności. Dotyczą one przede wszystkim obliczenia widma w skali barkowej. Próbki widma obliczone za pomocą dyskretnej transformaty Fouriera nie trafiają w próbki widma barkowego, co zmusza do stosowania interpolacji do określania ich wartości. Rysunek 2-4: Uproszczony schemat algorytmu badania jakości mowy metodą PSQM 14

15 W ciągu ostatnich dwudziestu lat wiele ośrodków na całym świecie próbowało rozwiązać problem oceny jakości transmisji mowy w systemach telekomunikacyjnych widzianych od zewnątrz, to znaczy z punktu widzenia użytkowników, traktując badany system telekomunikacyjny jako czarną skrzynkę, w której może teoretycznie znajdować się wszystko (pomiary klasy koniec - koniec). Metoda PSQM ma symulować subiektywną percepcję mowy w warunkach rzeczywistych. W procesie przekształcania sygnału mowy na jego psychofizyczną reprezentację, która jest odpowiednikiem sygnału jaki dociera do mózgu, korzysta się z wielu charakterystyk i stałych odzwierciedlających sposób percepcji dźwięku przez człowieka. Transformacja dokonywana jest zarówno na sygnale wejściowym jak i wyjściowym z badanego kanału telekomunikacyjnego. Zasadnicza nielinearność modelu słuchowego zawiera w sobie to, że konieczne jest oddzielne przetwarzanie każdego sygnału, który ucho w danym momencie słyszy. Operacja przetwarzania zaczyna się od obliczenia widma mocy. Segment mowy jest ważony przez okno Hanninga, a następnie dyskretna transformacja Fouriera przekształca okienkowany segment mowy w dziedzinę częstotliwości. Składowe: rzeczywista i urojona widma krótkoterminowego są podnoszone do kwadratu i dodawane, w wyniku czego uzyskuje się krótkoterminowe widmo mocy. System słuchowy człowieka jest znany ze słabszej dyskryminacji w zakresie wysokich częstotliwości niż w zakresie częstotliwości niskich. To, wraz ze zjawiskiem maskowania przez szum, doprowadziło do zamodelowania analizy dokonywanej przez ucho ludzkie za pomocą filtrów barkowych. Model ten wymaga przetwarzania sygnałów przez grupę takich filtrów, z odległościami częstotliwości środkowych i szerokościami pasm rosnącymi wraz z częstotliwością. Filtry te mogą być traktowane jako krzywe przestrajania nerwów słuchowych. Ich rozstawienie odpowiada półtoramilimetrowym odcinkom wzdłuż membrany podstawowej. Ciągłe widmo uzyskane w wyniku tej operacji zostało nazwane rozkładem pobudzeń, gdyż odpowiada ono rozkładowi bodźców w nerwach słuchowych. Modyfikacje widmowe przedstawione dotychczas wynikały z charakterystyki częstotliwościowej ucha (transformacja skali hercowej na barkową) i nieliniowego efektu wygładzania wprowadzanego filtracją w pasmach krytycznych przez ślimak błędnika ucha. Teraz należy uwzględnić fakt, że ucho nie jest jednakowo czułe na bodźce o różnych częstotliwościach. W celu uwzględnienia przetwarzania dźwięku reprezentowanego przez krzywe jednakowego poziomu głośności, należy przeprowadzić zamianę poziomów natężenia wyrażonych w decybelach na poziomy głośności wyrażone w fonach [Kula01]. Widmo, jakie otrzymuje się w wyniku dotychczasowych operacji, jest skorygowane pod względem głośności. Ostatnim krokiem jest uwzględnienie faktu, że wzrost głośności w fonach potrzebny do podwojenia subiektywnego odczucia głośności nie jest stały, lecz zmienia się z poziomem głośności. Należy więc przejść ze skali fonowej na skalę sonową [Kula01]. Zarówno oryginalny sygnał mowy, jak i jego przetransmitowany odpowiednik są osobno przetwarzane w identyczny sposób, prowadząc do uzyskania tzw. widm barkowych - odpowiednio sygnału oryginalnego i przetransmitowanego. Miarą jakości jest wówczas odpowiednio zdefiniowana odległość między tymi widmami zwana wskaźnikiem PSQM. Wartość PSQM można przetransformować na wartość MOS, która odpowiada subiektywnej ocenie, przy czym zależność mię- 15

16 dzy MOS a PSQM może być różna dla różnych języków. Stosując metodę PSQM należy więc uwzględnić specyfikę danego języka. Wadą metody PSQM jest brak korelacji otrzymywanych wyników z subiektywnymi ocenami w przypadku telefonii internetowej. Przyczyną występowania takich rozbieżności są zaburzenia w dziedzinie czasu (bulk delays) występujące podczas transmisji sygnału mowy w sieciach pakietowych przeznaczonych pierwotnie do transmisji danych. Rozwiązaniem okazał się mariaż modułu synchronizacji czasowej zaczerpniętego z metody PAMS ze standardem PSQM. Nowo opracowaną metodę pomiaru znacznie udoskonalono i nazwano PESQ (Perceptual Evaluation of Speech Quality). W 2001 ITU-T zaaprobowało PESQ jako nowy standard P.862 [PESQ], który zastąpił wcześniej stosowaną metodę PSQM. Idea pomiaru PESQ opiera się podobnie jak w przypadku PSQM, na tzw. reprezentacji wewnętrznej będącej teoretyczną postacią sygnału mowy w umyśle człowieka. Sygnałem wzorcowym (oryginalnym) jest nagrany sygnał mowy naturalnej - najlepiej po jednym zdaniu dla głosu męskiego i żeńskiego. Tak przygotowany sygnał oryginalny przesyłany jest badanym kanałem telekomunikacyjnym tworząc na wyjściu systemu sygnał zdegradowany. Oba sygnały stanowią dalej podstawę oceny. W pierwszym etapie oceniane jest opóźnienie między próbkami i ewentualnie wprowadzana jest odpowiednia korekcja. Następnie oba sygnały zostają poddane szeregowi transformacji modelujących poszczególne etapy przetwarzania dźwięku w ludzkim układzie słuchowym, włączając w to przede wszystkim: specyficzną analizę w częstotliwości i nieliniowość przetwarzania intensywności dźwięku. Ewentualne przesunięcia próbek w czasie są uwzględniane w dalszych etapach obróbki sygnału. Na końcu zaimplementowano tak zwany model kognitywny, którego zadaniem jest wydanie ostatecznej oceny na podstawie porównania reprezentacji wewnętrznych obu sygnałów Metoda MNB Metoda PSQM, choć zalecana do badania jakości mowy kodowanej nie daje najlepszych rezultatów, gdy mowa jest transmitowana. Dlatego wciąż trwają prace mające na celu opracowanie właściwej w takich przypadkach metody badania jakości mowy. Jedną z propozycji jest metoda MNB (Measuring Normalizing Blocks). Jej przydatność tak jak wielu innych metod wymaga jeszcze badań, szczególnie w kontekście zastosowania do badania sieci pakietowych i sieci o zmiennym opóźnieniu. Opracowując metodę MNB uwzględniono fakt, że człowiek różnie odbiera zniekształcenia częstotliwościowe i czasowe sygnału mowy w różnych ich zakresach. W zastosowaniach, gdzie estymowana ma być jakość mowy, konieczne jest więc określenie tych przedziałów na skali czasu i częstotliwości, w których zniekształcenia są najbardziej odczuwalne i w nich badać różnice pomiędzy sygnałem odniesienia a sygnałem testowanym. Wymaga to jednak przeprowadzania analizy w wielu różnych skalach. Zauważono ponadto, że przejście ze skali o większej liczbie przedziałów na skalę o mniejszej liczbie przedziałów dobrze odzwierciedla właściwości słuchu z punktu widzenia adaptacji i zachowania w przypadku zniekształcania widma częstotliwościowego. Z tych powodów algorytm w metodzie MNB ma strukturę hierarchiczną. Schemat blokowy algorytmu metody MNB przedstawiono na rys.2-5. Sygnały: testowany t(t) i odniesienia r(t) podlegają najpierw wstępnej procedurze normalizacyjnej, której celem jest ich zsynchronizowanie (eliminacja wpływu opóźnienia), unormowanie mocy sygnałów i eliminacja składowych stałych. Kolejną operacją jest wyznaczenie widm sygnałów. W tym celu sygnały są najpierw ramkowane za pomocą okna Hamminga (128 próbek dla czę- 16

17 stotliwości 8 khz) z przesunięciem 50%. Po wyznaczeniu widma dyskretnego R(t,f) i T(t,f) metodą FFT (Fast Fourier Transform), dla każdej ramki obliczana jest jej energia. Energia ta zarówno dla ramki sygnału testowanego jak i sygnału odniesienia musi przekraczać określony próg. Jeżeli tak nie jest, albo jeżeli ramka zawiera choćby jedną składową częstotliwościową o zerowej amplitudzie to nie jest ona dalej analizowana. W bloku normalizacji częstotliwościowej FMNB obliczane są cztery miary m 1,m 2,m 3,m 4 pokrywające całe pasmo zajmowane przez sygnał telefoniczny, które nieco upraszczając można uznać za znormalizowane względem częstotliwości 1 khz wartości różnicy energii sygnału odniesienia i sygnału testowanego, w czterech podpasmach częstotliwości. Do bloków normalizacji czasowej TMNB w odpowiednich podpasmach częstotliwości (w skali barkowej) przekazywane są odpowiednie wartości próbek widma sygnału odniesienia obliczone w bloku przetwarzania wstępnego oraz skorygowane o wartość błędu próbki sygnału badanego. W blokach normalizacji czasowej obliczane są uśrednione po czasie wartości widma częstotliwościowego w zadanym paśmie częstotliwości (skala barkowa) i oznaczane symbolem m n oraz wartości próbek widma sygnału testowanego skorygowane o wartość odpowiedniej próbki sygnału błędu. Spośród 18 miar m n tylko 7 jest liniowo niezależnych (n=5-11). Wraz z miarami m 1 -m 4 i miarą błędu m 12 tworzą one zespół 12 współczynników, na podstawie których obliczana jest wartość odległości AD (Auditory Distance) z zależności: 12 AD = m w i= 1 i i Rów. 2-4 gdzie: w i oznacza wagę dla i-tej miary. Odległość AD ma zawsze wartość dodatnią, tym mniejszą im mniejsza jest różnica pomiędzy sygnałem badanym a sygnałem odniesienia. Wagi są tak dobierane, aby uzyskać maksymalną korelację pomiędzy odległością AD a miarą subiektywną. 17

18 Rysunek 2-5: Schemat algorytmu MNB ( B bark) Metoda 3SQM Jest to metoda nieintruzyjna, nie wymagająca znajomości sygnału oryginalnego. Jakość mowy jest oceniana na podstawie analizy typowych zniekształceń i zakłóceń: widm odbiegających od typowych widm mowy, obecności szumu, nieciągłości sygnału w czasie. Badania wykazują, że odbiorca koncentruje się na najbardziej dokuczliwym zniekształceniu i głównie to zniekształcenie wpływa na jego ocenę. Uwzględniono to w schemacie działań algorytmu (Rys.2.6). Badania przeprowadzone m.in. przez firmę Opticom [Opt] wykazują dużą korelację wyników (MOS) metody 3SQM i metody PESQ. 18

19 Rysunek 2-6: Przetwarzanie mowy w 3SQM 2.4 Oferty wyspecjalizowanych firm Ze względu na niezły stan normalizacji, firmy najczęściej oferują oprogramowanie działające wg znormalizowanych, obiektywnych algorytmów badania jakości: dla mowy o jakości telefonicznej - ITU-T P.861 [PSQM], ITU-T P.862 [PESQ] i P.563 [3SQM] dla szerokopasmowego sygnału audio BS.1387 [PEAQ] Przykładem może być niemiecka firma Opticom [Opt] oferująca zintegrowane oprogramowanie, obejmujące normy PSQM (w trzech edycjach tej normy: PSQM, PSQM+, PSQM/IP), PESQ oraz PEAQ. Do pakietu dołączono oprogramowanie analizatora echa. Firma oferuje także hardware w postaci stacjonarnych lub przenośnych analizatorów jakości. Całość jest obecna na rynku pod nazwą firmową OPERA. Firma oferuje też tester do sprawdzania jakości połączeń telefonii komórkowej oparty na algorytmie 3SQM. Podobne produkty są oferowane na rynku przez wiele firm, np. GL Communications lansuje system kontroli jakości połączeń głosowych w różnych sieciach produkt nosi nazwę VQuad. 2.5 Wnioski Dla oceny jakości aplikacji działających w sieci DiffServ, niezbędna jest ocena jakości mowy i sygnałów fonicznych. Ze względu na dostępność sprawdzonych rozwiązań (norm) można się tu oprzeć na algorytmach PESQ i PEAQ (obiektywne, intruzyjne). Nie rozwiązuje to jednak problemu synchronizacji dźwięku z obrazem. Oparcie się na badaniach obiektywnych (odsłuchy) może być potrzebne dla rozwiązania problemu jakości streamingu wideo. Należy jednak podkreślić, że tego typu badania są czasochłonne (zorganizowanie sesji z udziałem grupy odbiorców przekazu) i powinny być stosowane tylko w celu kalibracji metod obiektywnych. 19

20 3 Obiektywne metody oceny jakości sygnału wideo Jak wspomniano w punkcie Stan normalizacji, dla oceny jakości sekwencji wideo opracowano szereg metod subiektywnych. Metodyka jest tu zbliżona do stosowanej w odniesieniu do sygnałów audio (określanie MOS w skali 1-5, czasem 1-10 lub 1-100). Normy określają tylko warunki przeprowadzenia formalnych badań jakości z udziałem grupy odbiorców przekazu. Z tego względu w niniejszym rozdziale omówione zostaną metody obiektywne badania jakości. 3.1 Rodzaje zniekształceń i zakłóceń obrazu ruchomego W wyniku kompresji i rekonstrukcji, a także wskutek utraty transmitowanych pakietów, obraz ruchomy ulega zniekształceniu i nakładają się na niego zakłócenia. Te niekorzystne zjawiska zależą od rodzaju kodeka, przepływności binarnej (stopnia kompresji), samego obrazu, stopy utraconych pakietów. Najczęściej występują następujące zniekształcenia i zakłócenia: efekty blokowe, wynikające z zastosowania kompresji w blokach, np. 8x8 pikseli obserwator zauważa granice bloków przytrzymanie obrazu, wskutek podstawienia ostatniej poprawnie zdekodowanej ramki za szereg niepoprawnie zdekodowanych ramek (występuje przy dużych zakłóceniach w kanale transmisyjnym) chwilowy zanik obrazu lub jego części, często połączony z pojawieniem się na ekranie kolorowej tekstury występuje przy b. dużych zakłóceniach nieciągłość ruchu, związana z nazbyt wielką kompresją obrazu zniekształcenia konturów (nieostrość, załamania, poruszanie się, a także wystąpienie fałszywych konturów ) wynik kompresji błędy w odtworzeniu kolorów (zmiana odcieni, nasycenie) błędy kwantyzacji (szum typu sól i pieprz lub śnieżenie ) Wymienione czynniki charakteryzują się różną dokuczliwością dla odbiorcy. Ich wpływ na percepcję obrazu można stwierdzić przeprowadzając subiektywne badania jakości. Ich metodyka nie odbiega od odpowiednich badań dla mowy: stosuje się skalę MOS (najczęściej od 1 do 5, choć proponuje się również skale 1-10 i 0-100). Odpowiednie normy określają warunki przeprowadzania testów (była o tym mowa w podrozdziale Stan normalizacji ). Metody subiektywne służą do kalibracji algorytmów obiektywnych, obliczających MOS na podstawie porównania odebranej i nadanej sekwencji wideo (metody intruzyjne), na podstawie badania jakości połączenia (metody parametryczne) i na podstawie badania odebranej sekwencji (met. nieintruzyjne). Należy podkreślić, że stopień zaawansowania badań nad metodami obiektywnej oceny jakości sygnału wideo jest mniejszy od stopnia zaawansowania badań nad sygnałem audio. 3.2 Modele percepcji obrazu W normach ANSI proponuje się szereg wskaźników jakości sygnału wideo. Do badań używa się starannie wybranych sekwencji obrazów, naturalnych lub wygenerowanych sztucznie [AN- 20

21 SI801]. Najprostszym do obliczenia wskaźnikiem jest PSNR (peak signal to noise ratio). Jest to stosunek maksymalnej mocy zniekształcenia (w 8-bitowym zapisie ) do błędu średniokwadratowego (MSE): 1 2 MSE = ( d( p, m, n) o( p, m, n)) Rów. 3-1 P M N p m n gdzie indeksy m,n odnoszą sie do współrzędnych piksela, a p do kolejnych ramek sekwencji wideo. Korelacja tego wskaźnika z wrażeniami percepcyjnymi odbiorcy jest słaba (np. niewielka zmiana jasności lub kontrastu wpływa na obniżenie SNR, podczas gdy percepcyjnie jest ona nieistotna). Lepsze wyniki daje badanie krawędzi: dokonuje się ekstrakcji krawędzi w obrazie naturalnym i odtworzonym (np. z wykorzystaniem filtrów Sobela [Umb98]), a następnie porównuje się otrzymane krawędzie. Odejmując kolejne ramki od siebie, otrzymuje się oszacowanie ruchu. Przeprowadzając takie oszacowanie osobno dla sekwencji oryginalnej i odtworzonej można zbadać zakłócenia ruchu (niepłynność ruchu, zatrzymanie obrazu, itd.). Dokładność odtworzenia dużych plam i szczegółów można badać porównując obrazy przetransformowane lub ich części (z wykorzystaniem dwuwymiarowej transformaty DFT). Wadą wymienionych metod jest brak odniesienia do systemu percepcji obrazów przez człowieka. Cechy zmysłu wzroku mają wielkie znaczenie w procesie oceny jakości obrazu. Istotne znaczenie ma czułość wzroku, maskowanie obiektów tłem, wrażliwość na barwy (np. oko jest bardziej czułe na barwę zieloną, niż na czerwoną i niebieską), bezwładność (w dziedzinie czasu), rozdzielczość przestrzenna (kątowa). Zmysł wzroku szczególnie jest uwrażliwiony na kontrast, uwypuklając granice pomiędzy polami o niewiele różniącej się luminancji. Z drugiej strony, niejednorodne tło jest w stanie całkowicie zamaskować obiekt (staje się on niezauważalny). Percepcja kolorów zależy od tła, a także od czasu (uprzednio nadany obraz wpływa na odbiór kolejnego). Uprzednio oglądany obiekt utrzymuje się w pozornym polu widzenia (niekiedy jako negatyw tzw. powidok.) Niektóre kolory, po ich zmieszaniu, wywołują wrażenie innej barwy (np. czerwony+żółty = pomarańczowy), inne nie mają takiej właściwości nazywamy je przeciwstawnymi (opponent colors [Win99]). Podstawowe pary kolorów przeciwstawnych to czarny-biały (B-W), czerwony-zielony (R-G) i niebieski-żółty (B-Y). Konstrukcja algorytmu szacowania jakości obrazu ruchomego musi opierać się na modelu percepcji (HVS human visual system). W modelu należy uwzględnić zjawiska przestrzenne i zachodzące w czasie. Modelując zjawiska czasowe, uwzględnia się dwa rodzaje bezwładności oka: krótko- i długookresową. Wymaga to przepuszczenia sekwencji wideo przez dwa filtry dolnoprzepustowy i pasmowy (patrz rys.3-1). 21

22 Rysunek 3-1:. Filtry modelujące bezwładność oka (wg [Win99]) Najważniejszym problemem w modelowaniu HVS jest uwzględnienie wrażliwości na kontrast, oraz spadku tej wrażliwości w obecności niejednorodnego tła (maskowanie). Maksymalna wrażliwość na kontrast (minimalny próg detekcji) występuje w procesie obserwowania obiektów o rozmiarach ok. ¼ stopnia kątowego ( częstotliwość przestrzenna 4 cykle na stopień). Dla mniejszych częstotliwości przestrzennych wrażliwość na kontrast (CSF contrast sensitivity function, zdefiniowana jako odwrotność progu detekcji) powoli spada, a dla większych częstotliwości spada b. szybko (patrz rys.3-2). Rysunek 3-2: Wrażliwość na kontrast w funkcji częstotliwości przestrzennej (wg [Kut99]) W obecności kontrastowego tła CSF spada, tym bardziej, im bardziej kontrastowość tła przekracza kontrastowość obserwowanego obiektu. Modelowanie zjawiska maskowania polega na znalezieniu zależności CSF od tła. Na rysunku 3-3 pokazano wpływ kontrastu maskującego tła (C M ) na próg 22

23 detekcji zadanego obiektu. Przyjęto, że w obecności niekontrastowego (jednolitego) tła próg detekcji wynosi k=1. Jeśli kontrastowość tła osiąga wielkość porównywalną z wielkością kontrastu obiektu względem tła (C S ), wówczas próg detekcji obiektu podnosi się (wrażliwość oka maleje zaznaczają się maskujące właściwości tła). Rysunek 3-3: Maskowanie: próg detekcji obiektu w funkcji kontrastowości tła (wg [Kut99]) Na zjawisko maskowania ma wpływ rozmiar obiektu wymaga to odfiltrowania obrazu z wykorzystaniem filtrów przestrzennych (pierwszy filtr przepuszcza duże pola, a ostatni drobne szczegóły obrazu). Filtry te uwzględniają również orientację obiektów w płaszczyźnie obrazu osobne filtry reagują np. na pionowe i poziome pasy. Jest to potrzebne, gdyż np. tło złożone z poziomych pasów dobrze zamaskuje obiekt o orientacji poziomej, a w ogóle nie zamaskuje obiektu o orientacji pionowej. Na rysunku 3-4 podano wyidealizowane charakterystyki częstotliwościowe zastawu takich filtrów: uwzględniono 4 orientacje przestrzenne i 4-poziomową gradację wielkości obiektów (filtr dolnopasmowy, reagujący na duże plamy, ma charakterystykę izotropową nie uwzględnia orientacji obiektów). Rysunek 3-4: Zestaw filtrów przestrzennych zaczerniono ch-kę jednego z nich (wg [Win99]) 23

24 Po wykonaniu tak pomyślanej filtracji percepcyjnej można wyliczyć próg maskowania. Wyliczając percepcyjną odległość sygnału oryginalnego i odebranego (tzn. przewidując wynik badań subiektywnych, czyli MOS) uwzględnia się zakłócenia przekraczające próg maskowania. Schemat obliczeń MOS pokazano na rys.3-5. Rysunek 3-5: Obliczenie MOS z uwzględnieniem modelu percepcji obrazu 3.3 Badania percepcji obrazu w ramach VQEG W końcu lat 90-tych zawiązała się grupa badawcza (VQEG Video Quality Experts Group), stawiająca sobie za cel opracowanie i przedstawienie ITU-T do normalizacji, algorytmu obiektywnej oceny jakości sygnału wideo (VQM Video Quality Metric). Rozpisano konkurs, w którym wzięły udział zainteresowane ośrodki badawcze. VQEG przeprowadziła badania porównawcze jakości testowych sygnałów wideo porównując wyniki otrzymane metodami subiektywnymi i obiektywnymi. Wyniki obiektywne otrzymano wykorzystując metody i oprogramowanie dostarczone przez ośrodki badawcze biorące udział w konkursie (w skrócie nazwijmy je proponentami). Wyniki subiektywne otrzymano, prezentując (dwukrotnie) pary sekwencji wideo kilkudziesięciu osobom (nie informując tych osób, która z prezentowanych sekwencji jest oryginałem). Osoby te zaznaczały swoją ocenę jakości na ciągłej skali, dla obydwu porównywanych sekwencji. Następnie obliczano różnicę ocen (raw difference) między sekwencją oryginalną (SRC - source) i przetworzoną. Przetworzenie (HRC Hypothetical Reference Circuit) polegało na zapisie sekwencji wideo w różnych formatach, kodowaniu w systemie MPEG-2 z różną rozdzielczością, itp. Różnica ocen była następnie normalizowana do zakresu <0,1> i uśredniana dla grupy osób biorących udział w teście (przy czym wyniki zdecydowanie odbiegające od pozostałych były odrzucane). W końcu ocena subiektywna była porównywana z obiektywną, z wykorzystaniem szeregu narzędzi statystycznych (korelacja Pearsona itd.). Wyniki badań porównawczych VQEG zamieściła w dwóch raportach [VQEG1],[VQEG2]. W pierwszej edycji konkursu wzięło udział 10 ośrodków badawczych: CPqD, Tektronix/Sarnoff, NHK, KDD, EPFL, Tapestries, NASA, KPN/Swisscom, NTIA, IFN. Propozycja IFN nie została wzięta pod uwagę, gdyż uwzględniała jedynie zniekształcenia wtrącane w wyniku kodowania algorytmem MPEG-2. IFN nie przeprowadził testów w obecności innych rodzajów zakłóceń i zniekształceń. Pierwsza edycja konkursu nie przyniosła rozstrzygnięcia wszystkie proponowane metody charakteryzowały się podobną zgodnością z metodą subiektywną [VQEG1]. Jedynie algorytm Tapestries, w statystycznie istotnej mierze, odbiegał nieco od pozostałych, dając wyniki mniej skorelowane z wynikami otrzymanymi metodami subiektywnymi. Co więcej, prosta metoda PSNR nie odbiegała w statystycznie istotnej mierze, od pozostałych. 24

25 W związku z powyższym postanowiono ogłosić następny konkurs, a jednocześnie ulepszyć metody porównywania ocen obiektywnych i subiektywnych. W konkursie udział wzięły następujące ośrodki badawcze: NASA, British Telecom, Yonsei, CPqD, Chiba, NTIA. W wyniku wszechstronnych badań porównawczych, ostatecznie wyselekcjonowano 4 algorytmy: NASA, Yonsei, CPqD, NTIA. Metodami analizy statystycznej nie udało się udowodnić przewagi którejś z tych 4 metod [VQEG2]. W kolejnych punktach opisano pokrótce te cztery wyselekcjonowane algorytmy Yonsei University (Korea) Prace nad obiektywną techniką oceny jakości sygnału wideo prowadzone były na Uniwersytecie Yonsei (Seul, Korea) na Wydziale Inżynierii Elektrycznej i Elektronicznej. Twórcy algorytmu bazują na zjawisku różnej wrażliwości ludzkiego oka w zależności od parametrów przestrzennoczasowych sygnału wideo. Aby te parametry wyznaczyć, również tutaj wykorzystywana jest transformata falkowa [Lee03]. Jest ona obliczana dla każdej ramki sygnału źródłowego i przetworzonego. Następnie wyliczana jest różnica współczynników falkowych w poszczególnych podpasmach oraz sumowana, tak że dla każdej ramki powstaje wektor różnicy. W efekcie powstaje sekwencja wektorów różnicy, na podstawie których wyliczany jest także średni wektor różnicy, którego każdy składnik reprezentuje zniekształcenie w danym podpasmie. Aby była możliwa analiza parametrów czasowych, wyliczana jest trójwymiarowa transformata falkowa. Także i w tym wypadku wynikiem analizy jest pojedynczy wektor różnicy. Wynik analizy jakości obliczany jest poprzez sumowanie odpowiednio ważonych elementów wektora różnicy. Wagi wyznaczane są z zastosowaniem zaproponowanej procedury optymalizacji. Nowsze prace naukowców z Yonsei ([Lee04]) dotyczą analizy konturów obiektów w sekwencji filmowej. Autorzy wskazują na fakt, że oko ludzkie jest najbardziej wrażliwe na zniekształcenia obrazu w pobliżu konturów obiektów. Nawet jeśli obraz jest mało zaszumiony, ale ma zamazane kontury, zazwyczaj otrzymuje niskie oceny w badaniach subiektywnych. Dlatego też autorzy proponują metodę, której etapem wstępnym jest detekcja konturów, następnie zaś następuje wyliczanie błędu średniokwadratowego dla obszarów bezpośrednio sąsiadujących z konturami, a na jego podstawie PSNR (szczytowego współczynnika sygnał szum). Ich zdaniem, metoda ta jest skuteczna i porównywalna z innymi metodami obiektywnej oceny jakości sygnału wideo. Uniwersytet w Yonsei był jednym z proponentów w drugiej fazie prac grupy VQEG (rok 2002). Według autorów, ich model analizował sygnał wideo, biorąc pod uwagę percepcję degradacji jakości przez oko ludzkie. Korelacja wyników oceny jakości z zastosowaniem zaproponowanego modelu oraz ocen subiektywnych była wysoka współczynnik korelacji Pearsona na poziomie między 0,8 a 0,9. Brak natomiast informacji na temat szczegółów zaproponowanego rozwiązania CPqD IES (Brazylia) Model obiektywnej oceny jakości obrazu zwany CPqD-IES opracowało Centro de Pesquisa e Desenvolvimento z Brasil w Brazylii w 1998 r.. IES oznacza Image Evaluation based on Segmentation ocena obrazu w oparciu o segmentację. Wersja 2.0 modelu została przedłożona grupie VQEG do ewaluacji [VQEG1]. 25

Pomiary w technice studyjnej. TESTY PESQ i PEAQ

Pomiary w technice studyjnej. TESTY PESQ i PEAQ Pomiary w technice studyjnej TESTY PESQ i PEAQ Wprowadzenie Problem: ocena jakości sygnału dźwiękowego. Metody obiektywne - np. pomiar SNR czy THD+N - nie dają pełnych informacji o jakości sygnału. Ważne

Bardziej szczegółowo

Obiektywne metody pomiaru jakości obrazu

Obiektywne metody pomiaru jakości obrazu Systemy i Terminale Multimedialne Obiektywne metody pomiaru jakości obrazu Marcin Szykulski Wprowadzenie Kompresja Transmisja Jak osiągnąć kompromis przepływność/jakość? Podstawowe informacje Jakość obrazu

Bardziej szczegółowo

Kompresja dźwięku w standardzie MPEG-1

Kompresja dźwięku w standardzie MPEG-1 mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 7, strona 1. Kompresja dźwięku w standardzie MPEG-1 Ogólne założenia kompresji stratnej Zjawisko maskowania psychoakustycznego Schemat blokowy

Bardziej szczegółowo

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, 2011 Spis treści Przedmowa 11 Rozdział 1. WPROWADZENIE 13 1.1. Czym jest automatyczne rozpoznawanie mowy 13 1.2. Poziomy

Bardziej szczegółowo

Jakości usług telekomunikacyjnych

Jakości usług telekomunikacyjnych Jakości usług telekomunikacyjnych SŁAWOMIR KULA Instytut Telekomunikacji Wydział Elektroniki i Technik Informacyjnych Politechnika Warszawska Warszawa, 11 maja 2015 r. Zawartość tematyczna Wprowadzenie

Bardziej szczegółowo

Filtracja obrazu operacje kontekstowe

Filtracja obrazu operacje kontekstowe Filtracja obrazu operacje kontekstowe Podział metod filtracji obrazu Metody przestrzenne i częstotliwościowe Metody liniowe i nieliniowe Główne zadania filtracji Usunięcie niepożądanego szumu z obrazu

Bardziej szczegółowo

METODY OCENY JAKOŚCI DŹWIĘKU

METODY OCENY JAKOŚCI DŹWIĘKU Pomiary w technice studyjnej METODY OCENY JAKOŚCI DŹWIĘKU Testy subiektywne, PESQ i PEAQ Wprowadzenie Problem: ocena jakości sygnału dźwiękowego. Metody obiektywne - np. pomiar SNR czy THD+N - nie dają

Bardziej szczegółowo

Przygotowała: prof. Bożena Kostek

Przygotowała: prof. Bożena Kostek Przygotowała: prof. Bożena Kostek Ze względu na dużą rozpiętość mierzonych wartości ciśnienia (zakres ciśnień akustycznych obejmuje blisko siedem rzędów wartości: od 2x10 5 Pa do ponad 10 Pa) wygodniej

Bardziej szczegółowo

PL B BUP 16/04. Kleczkowski Piotr,Kraków,PL WUP 04/09

PL B BUP 16/04. Kleczkowski Piotr,Kraków,PL WUP 04/09 RZECZPOSPOLITA POLSKA (12) OPIS PATENTOWY (19) PL (11) 201536 (13) B1 (21) Numer zgłoszenia: 358531 (51) Int.Cl. G10L 21/02 (2006.01) H03G 3/00 (2006.01) Urząd Patentowy Rzeczypospolitej Polskiej (22)

Bardziej szczegółowo

Badanie jakości sygnałów audio

Badanie jakości sygnałów audio Badanie jakości sygnałów audio Przemysław Dymarski, Inst. Telekomunikacji PW Wykorzystano prace dypl. A.Kołodziejczyk, G. Kraciuk, M.Toczko, A.Sadowska Ocena jakości audio i wideo Metody subiektywne Metody

Bardziej szczegółowo

Przesył mowy przez internet

Przesył mowy przez internet Damian Goworko Zuzanna Dziewulska Przesył mowy przez internet organizacja transmisji głosu, wybrane kodeki oraz rozwiązania podnoszące jakość połączenia głosowego Telefonia internetowa / voice over IP

Bardziej szczegółowo

Nauka o słyszeniu Wykład IV Głośność dźwięku

Nauka o słyszeniu Wykład IV Głośność dźwięku Nauka o słyszeniu Wykład IV Głośność dźwięku Anna Preis, email: apraton@amu.edu.pl 26.10.2016 Plan wykładu - głośność Próg słyszalności Poziom ciśnienia akustycznego SPL a poziom dźwięku SPL (A) Głośność

Bardziej szczegółowo

Technika audio część 2

Technika audio część 2 Technika audio część 2 Wykład 12 Projektowanie cyfrowych układów elektronicznych Mgr inż. Łukasz Kirchner lukasz.kirchner@cs.put.poznan.pl http://www.cs.put.poznan.pl/lkirchner Wprowadzenie do filtracji

Bardziej szczegółowo

Kwantowanie sygnałów analogowych na przykładzie sygnału mowy

Kwantowanie sygnałów analogowych na przykładzie sygnału mowy Kwantowanie sygnałów analogowych na przykładzie sygnału mowy Treść wykładu: Sygnał mowy i jego właściwości Kwantowanie skalarne: kwantyzator równomierny, nierównomierny, adaptacyjny Zastosowanie w koderze

Bardziej szczegółowo

Parametryzacja obrazu na potrzeby algorytmów decyzyjnych

Parametryzacja obrazu na potrzeby algorytmów decyzyjnych Parametryzacja obrazu na potrzeby algorytmów decyzyjnych Piotr Dalka Wprowadzenie Z reguły nie stosuje się podawania na wejście algorytmów decyzyjnych bezpośrednio wartości pikseli obrazu Obraz jest przekształcany

Bardziej szczegółowo

Analiza obrazów - sprawozdanie nr 2

Analiza obrazów - sprawozdanie nr 2 Analiza obrazów - sprawozdanie nr 2 Filtracja obrazów Filtracja obrazu polega na obliczeniu wartości każdego z punktów obrazu na podstawie punktów z jego otoczenia. Każdy sąsiedni piksel ma wagę, która

Bardziej szczegółowo

Nauka o słyszeniu. Wykład III +IV Wysokość+ Głośność dźwięku

Nauka o słyszeniu. Wykład III +IV Wysokość+ Głośność dźwięku Nauka o słyszeniu Wykład III +IV Wysokość+ Głośność dźwięku Anna Preis, email: apraton@amu.edu.pl 21-28.10.2015 Plan wykładu - wysokość Wysokość dźwięku-definicja Periodyczność Dźwięk harmoniczny Wysokość

Bardziej szczegółowo

Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych

Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych autor: Robert Drab opiekun naukowy: dr inż. Paweł Rotter 1. Wstęp Zagadnienie generowania trójwymiarowego

Bardziej szczegółowo

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania Kodowanie podpasmowe Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania Zasada ogólna Rozkład sygnału źródłowego na części składowe (jak w kodowaniu transformacyjnym) Wada kodowania

Bardziej szczegółowo

Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy

Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy Grupa: wtorek 18:3 Tomasz Niedziela I. CZĘŚĆ ĆWICZENIA 1. Cel i przebieg ćwiczenia. Celem ćwiczenia

Bardziej szczegółowo

Transformata Fouriera

Transformata Fouriera Transformata Fouriera Program wykładu 1. Wprowadzenie teoretyczne 2. Algorytm FFT 3. Zastosowanie analizy Fouriera 4. Przykłady programów Wprowadzenie teoretyczne Zespolona transformata Fouriera Jeżeli

Bardziej szczegółowo

Spośród licznych filtrów nieliniowych najlepszymi właściwościami odznacza się filtr medianowy prosty i skuteczny.

Spośród licznych filtrów nieliniowych najlepszymi właściwościami odznacza się filtr medianowy prosty i skuteczny. Filtracja nieliniowa może być bardzo skuteczną metodą polepszania jakości obrazów Filtry nieliniowe Filtr medianowy Spośród licznych filtrów nieliniowych najlepszymi właściwościami odznacza się filtr medianowy

Bardziej szczegółowo

PL B1. Sposób i układ pomiaru całkowitego współczynnika odkształcenia THD sygnałów elektrycznych w systemach zasilających

PL B1. Sposób i układ pomiaru całkowitego współczynnika odkształcenia THD sygnałów elektrycznych w systemach zasilających RZECZPOSPOLITA POLSKA (12) OPIS PATENTOWY (19) PL (11) 210969 (13) B1 (21) Numer zgłoszenia: 383047 (51) Int.Cl. G01R 23/16 (2006.01) G01R 23/20 (2006.01) Urząd Patentowy Rzeczypospolitej Polskiej (22)

Bardziej szczegółowo

2. STRUKTURA RADIOFONICZNYCH SYGNAŁÓW CYFROWYCH

2. STRUKTURA RADIOFONICZNYCH SYGNAŁÓW CYFROWYCH 1. WSTĘP Radiofonię cyfrową cechują strumienie danych o dużych przepływnościach danych. Do przesyłania strumienia danych o dużych przepływnościach stosuje się transmisję z wykorzystaniem wielu sygnałów

Bardziej szczegółowo

Przekształcenia widmowe Transformata Fouriera. Adam Wojciechowski

Przekształcenia widmowe Transformata Fouriera. Adam Wojciechowski Przekształcenia widmowe Transformata Fouriera Adam Wojciechowski Przekształcenia widmowe Odmiana przekształceń kontekstowych, w których kontekstem jest w zasadzie cały obraz. Za pomocą transformaty Fouriera

Bardziej szczegółowo

Przetwarzanie obrazów wykład 4

Przetwarzanie obrazów wykład 4 Przetwarzanie obrazów wykład 4 Adam Wojciechowski Wykład opracowany na podstawie Komputerowa analiza i przetwarzanie obrazów R. Tadeusiewicz, P. Korohoda Filtry nieliniowe Filtry nieliniowe (kombinowane)

Bardziej szczegółowo

DZ.U. NR 150, POZ. 895

DZ.U. NR 150, POZ. 895 DZ.U. NR 150, POZ. 895 ROZPORZĄDZENIE KRAJOWEJ RADY RADIOFONII I TELEWIZJI z dnia 30 czerwca 2011 r. w sprawie sposobu prowadzenia w programach radiowych i telewizyjnych działalności reklamowej i telesprzedaży

Bardziej szczegółowo

PL 216396 B1. POLITECHNIKA GDAŃSKA, Gdańsk, PL 14.09.2009 BUP 19/09. ANDRZEJ CZYŻEWSKI, Gdynia, PL GRZEGORZ SZWOCH, Gdańsk, PL 31.03.

PL 216396 B1. POLITECHNIKA GDAŃSKA, Gdańsk, PL 14.09.2009 BUP 19/09. ANDRZEJ CZYŻEWSKI, Gdynia, PL GRZEGORZ SZWOCH, Gdańsk, PL 31.03. PL 216396 B1 RZECZPOSPOLITA POLSKA (12) OPIS PATENTOWY (19) PL (11) 216396 (13) B1 (21) Numer zgłoszenia: 384616 (51) Int.Cl. H04B 3/23 (2006.01) H04M 9/08 (2006.01) Urząd Patentowy Rzeczypospolitej Polskiej

Bardziej szczegółowo

Sposoby opisu i modelowania zakłóceń kanałowych

Sposoby opisu i modelowania zakłóceń kanałowych INSTYTUT TELEKOMUNIKACJI ZAKŁAD RADIOKOMUNIKACJI Instrukcja laboratoryjna z przedmiotu Podstawy Telekomunikacji Sposoby opisu i modelowania zakłóceń kanałowych Warszawa 2010r. 1. Cel ćwiczeń: Celem ćwiczeń

Bardziej szczegółowo

ROZPORZĄDZENIE KRAJOWEJ RADY RADIOFONII I TELEWIZJI. z dnia 30 czerwca 2011 r.

ROZPORZĄDZENIE KRAJOWEJ RADY RADIOFONII I TELEWIZJI. z dnia 30 czerwca 2011 r. Dziennik Ustaw Nr 150 9016 Poz. 895 895 ROZPORZĄDZENIE KRAJOWEJ RADY RADIOFONII I TELEWIZJI z dnia 30 czerwca 2011 r. w sprawie sposobu prowadzenia w programach radiowych i telewizyjnych działalności reklamowej

Bardziej szczegółowo

8. Analiza widmowa metodą szybkiej transformaty Fouriera (FFT)

8. Analiza widmowa metodą szybkiej transformaty Fouriera (FFT) 8. Analiza widmowa metodą szybkiej transformaty Fouriera (FFT) Ćwiczenie polega na wykonaniu analizy widmowej zadanych sygnałów metodą FFT, a następnie określeniu amplitud i częstotliwości głównych składowych

Bardziej szczegółowo

Przekształcenia sygnałów losowych w układach

Przekształcenia sygnałów losowych w układach INSTYTUT TELEKOMUNIKACJI ZAKŁAD RADIOKOMUNIKACJI Instrukcja laboratoryjna z przedmiotu Sygnały i kodowanie Przekształcenia sygnałów losowych w układach Warszawa 010r. 1. Cel ćwiczenia: Ocena wpływu charakterystyk

Bardziej szczegółowo

Metodyka i system dopasowania protez słuchu w oparciu o badanie percepcji sygnału mowy w szumie

Metodyka i system dopasowania protez słuchu w oparciu o badanie percepcji sygnału mowy w szumie Metodyka i system dopasowania protez w oparciu o badanie percepcji sygnału mowy w szumie opracowanie dr inż. Piotr Suchomski Koncepcja metody korekcji ubytku Dopasowanie szerokiej dynamiki odbieranego

Bardziej szczegółowo

Przetworniki A/C. Ryszard J. Barczyński, 2010 2015 Materiały dydaktyczne do użytku wewnętrznego

Przetworniki A/C. Ryszard J. Barczyński, 2010 2015 Materiały dydaktyczne do użytku wewnętrznego Przetworniki A/C Ryszard J. Barczyński, 2010 2015 Materiały dydaktyczne do użytku wewnętrznego Parametry przetworników analogowo cyfrowych Podstawowe parametry przetworników wpływające na ich dokładność

Bardziej szczegółowo

ROZPOZNAWANIE GRANIC SŁOWA W SYSTEMIE AUTOMATYCZNEGO ROZPOZNAWANIA IZOLOWANYCH SŁÓW

ROZPOZNAWANIE GRANIC SŁOWA W SYSTEMIE AUTOMATYCZNEGO ROZPOZNAWANIA IZOLOWANYCH SŁÓW ROZPOZNAWANIE GRANIC SŁOWA W SYSTEMIE AUTOMATYCZNEGO ROZPOZNAWANIA IZOLOWANYCH SŁÓW Maciej Piasecki, Szymon Zyśko Wydziałowy Zakład Informatyki Politechnika Wrocławska Wybrzeże Stanisława Wyspiańskiego

Bardziej szczegółowo

Ponieważ zakres zmian ciśnień fal akustycznych odbieranych przez ucho ludzkie mieści się w przedziale od 2*10-5 Pa do 10 2 Pa,

Ponieważ zakres zmian ciśnień fal akustycznych odbieranych przez ucho ludzkie mieści się w przedziale od 2*10-5 Pa do 10 2 Pa, Poziom dźwięku Decybel (db) jest jednostką poziomu; Ponieważ zakres zmian ciśnień fal akustycznych odbieranych przez ucho ludzkie mieści się w przedziale od 2*10-5 Pa do 10 2 Pa, co obejmuje 8 rzędów wielkości

Bardziej szczegółowo

Filtracja obrazu operacje kontekstowe

Filtracja obrazu operacje kontekstowe Filtracja obrazu operacje kontekstowe Główne zadania filtracji Usunięcie niepożądanego szumu z obrazu Poprawa ostrości Usunięcie określonych wad obrazu Poprawa obrazu o złej jakości technicznej Rekonstrukcja

Bardziej szczegółowo

Grafika Komputerowa Wykład 2. Przetwarzanie obrazów. mgr inż. Michał Chwesiuk 1/38

Grafika Komputerowa Wykład 2. Przetwarzanie obrazów. mgr inż. Michał Chwesiuk 1/38 Wykład 2 Przetwarzanie obrazów mgr inż. 1/38 Przetwarzanie obrazów rastrowych Jedna z dziedzin cyfrowego obrazów rastrowych. Celem przetworzenia obrazów rastrowych jest użycie edytujących piksele w celu

Bardziej szczegółowo

Cyfrowe przetwarzanie i kompresja danych

Cyfrowe przetwarzanie i kompresja danych Cyfrowe przetwarzanie i kompresja danych dr inż.. Wojciech Zając Wykład 5. Dyskretna transformata falkowa Schemat systemu transmisji danych wizyjnych Źródło danych Przetwarzanie Przesył Przetwarzanie Prezentacja

Bardziej szczegółowo

Akwizycja obrazów. Zagadnienia wstępne

Akwizycja obrazów. Zagadnienia wstępne Akwizycja obrazów. Zagadnienia wstępne Wykorzystane materiały: R. Tadeusiewicz, P. Korohoda, Komputerowa analiza i przetwarzanie obrazów, Wyd. FPT, Kraków, 1997 A. Przelaskowski, Techniki Multimedialne,

Bardziej szczegółowo

Aproksymacja funkcji a regresja symboliczna

Aproksymacja funkcji a regresja symboliczna Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą

Bardziej szczegółowo

BIBLIOTEKA PROGRAMU R - BIOPS. Narzędzia Informatyczne w Badaniach Naukowych Katarzyna Bernat

BIBLIOTEKA PROGRAMU R - BIOPS. Narzędzia Informatyczne w Badaniach Naukowych Katarzyna Bernat BIBLIOTEKA PROGRAMU R - BIOPS Narzędzia Informatyczne w Badaniach Naukowych Katarzyna Bernat Biblioteka biops zawiera funkcje do analizy i przetwarzania obrazów. Operacje geometryczne (obrót, przesunięcie,

Bardziej szczegółowo

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny

Bardziej szczegółowo

Jakość transmisji multimedialnej. Opracowanie: Marcin Szykulski

Jakość transmisji multimedialnej. Opracowanie: Marcin Szykulski Jakość transmisji multimedialnej Opracowanie: Marcin Szykulski Plan wykładu Transmisja multimedialna Czynniki wpływające na jakość transmisji Quality of Service Quality of Experience Badanie jakości transmisji

Bardziej szczegółowo

Systemy i Sieci Telekomunikacyjne laboratorium. Modulacja amplitudy

Systemy i Sieci Telekomunikacyjne laboratorium. Modulacja amplitudy Systemy i Sieci Telekomunikacyjne laboratorium Modulacja amplitudy 1. Cel ćwiczenia: Celem części podstawowej ćwiczenia jest zbudowanie w środowisku GnuRadio kompletnego, funkcjonalnego odbiornika AM.

Bardziej szczegółowo

Przedmowa Wykaz oznaczeń Wykaz skrótów 1. Sygnały i ich parametry 1 1.1. Pojęcia podstawowe 1 1.2. Klasyfikacja sygnałów 2 1.3.

Przedmowa Wykaz oznaczeń Wykaz skrótów 1. Sygnały i ich parametry 1 1.1. Pojęcia podstawowe 1 1.2. Klasyfikacja sygnałów 2 1.3. Przedmowa Wykaz oznaczeń Wykaz skrótów 1. Sygnały i ich parametry 1 1.1. Pojęcia podstawowe 1 1.2. Klasyfikacja sygnałów 2 1.3. Sygnały deterministyczne 4 1.3.1. Parametry 4 1.3.2. Przykłady 7 1.3.3. Sygnały

Bardziej szczegółowo

Mapa akustyczna Torunia

Mapa akustyczna Torunia Mapa akustyczna Torunia Informacje podstawowe Mapa akustyczna Słownik terminów Kontakt Przejdź do mapy» Słownik terminów specjalistycznych Hałas Hałasem nazywamy wszystkie niepożądane, nieprzyjemne, dokuczliwe

Bardziej szczegółowo

Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.

Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2. Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2. Technika obrazu 24 W.3. Normalizacja w zakresie obrazu cyfrowego

Bardziej szczegółowo

ZAKŁAD SYSTEMÓW ELEKTRONICZNYCH I TELEKOMUNIKACYJNYCH Laboratorium Podstaw Telekomunikacji WPŁYW SZUMÓW NA TRANSMISJĘ CYFROWĄ

ZAKŁAD SYSTEMÓW ELEKTRONICZNYCH I TELEKOMUNIKACYJNYCH Laboratorium Podstaw Telekomunikacji WPŁYW SZUMÓW NA TRANSMISJĘ CYFROWĄ Laboratorium Podstaw Telekomunikacji Ćw. 4 WPŁYW SZUMÓW NA TRANSMISJĘ CYFROWĄ 1. Zapoznać się z zestawem do demonstracji wpływu zakłóceń na transmisję sygnałów cyfrowych. 2. Przy użyciu oscyloskopu cyfrowego

Bardziej szczegółowo

ĆWICZENIE 15 BADANIE WZMACNIACZY MOCY MAŁEJ CZĘSTOTLIWOŚCI

ĆWICZENIE 15 BADANIE WZMACNIACZY MOCY MAŁEJ CZĘSTOTLIWOŚCI 1 ĆWICZENIE 15 BADANIE WZMACNIACZY MOCY MAŁEJ CZĘSTOTLIWOŚCI 15.1. CEL ĆWICZENIA Celem ćwiczenia jest poznanie podstawowych właściwości wzmacniaczy mocy małej częstotliwości oraz przyswojenie umiejętności

Bardziej szczegółowo

Podstawy Przetwarzania Sygnałów

Podstawy Przetwarzania Sygnałów Adam Szulc 188250 grupa: pon TN 17:05 Podstawy Przetwarzania Sygnałów Sprawozdanie 6: Filtracja sygnałów. Filtry FIT o skończonej odpowiedzi impulsowej. 1. Cel ćwiczenia. 1) Przeprowadzenie filtracji trzech

Bardziej szczegółowo

Podsumowanie wyników ankiety

Podsumowanie wyników ankiety SPRAWOZDANIE Kierunkowego Zespołu ds. Programów Kształcenia dla kierunku Informatyka dotyczące ankiet samooceny osiągnięcia przez absolwentów kierunkowych efektów kształcenia po ukończeniu studiów w roku

Bardziej szczegółowo

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j Kompresja transformacyjna. Opis standardu JPEG. Algorytm JPEG powstał w wyniku prac prowadzonych przez grupę ekspertów (ang. Joint Photographic Expert Group). Prace te zakończyły się w 1991 roku, kiedy

Bardziej szczegółowo

2. Próbkowanie Sygnały okresowe (16). Trygonometryczny szereg Fouriera (17). Częstotliwość Nyquista (20).

2. Próbkowanie Sygnały okresowe (16). Trygonometryczny szereg Fouriera (17). Częstotliwość Nyquista (20). SPIS TREŚCI ROZDZIAŁ I SYGNAŁY CYFROWE 9 1. Pojęcia wstępne Wiadomości, informacje, dane, sygnały (9). Sygnał jako nośnik informacji (11). Sygnał jako funkcja (12). Sygnał analogowy (13). Sygnał cyfrowy

Bardziej szczegółowo

Psychofizyka. Klasyfikacja eksperymentów psychofizycznych

Psychofizyka. Klasyfikacja eksperymentów psychofizycznych Psychofizyka Klasyfikacja eksperymentów psychofizycznych Plan II części zajęć Klasyfikacja eksperymentów psychofizycznych Różnorodność procedur psychofizycznych Funkcje psychometryczne Metody adaptacyjne

Bardziej szczegółowo

Modyfikacja algorytmów retransmisji protokołu TCP.

Modyfikacja algorytmów retransmisji protokołu TCP. Modyfikacja algorytmów retransmisji protokołu TCP. Student Adam Markowski Promotor dr hab. Michał Grabowski Cel pracy Celem pracy było przetestowanie i sprawdzenie przydatności modyfikacji klasycznego

Bardziej szczegółowo

Redukcja kosztów połączeń telekomunikacyjnych przy wykorzystaniu central ISDN PABX

Redukcja kosztów połączeń telekomunikacyjnych przy wykorzystaniu central ISDN PABX Andrzej Białas, Waldemar Fuczkiewicz Aksonet Poznań Wojciech Kabaciński Instytut Elektroniki i Telekomunikacji Politechnika Poznańska Redukcja kosztów połączeń telekomunikacyjnych przy wykorzystaniu central

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

USŁUGI DODATKOWE W SIECIACH BEZPRZEWODOWYCH VoIP oraz multimedia w sieciach WiFi problemy

USŁUGI DODATKOWE W SIECIACH BEZPRZEWODOWYCH VoIP oraz multimedia w sieciach WiFi problemy Seminarium poświęcone sieci bezprzewodowej w Politechnice Krakowskiej - projekt Eduroam USŁUGI DODATKOWE W SIECIACH BEZPRZEWODOWYCH VoIP oraz multimedia w sieciach WiFi problemy Wprowadzenie Problematyka

Bardziej szczegółowo

Klasyfikacja metod przetwarzania analogowo cyfrowego (A/C, A/D)

Klasyfikacja metod przetwarzania analogowo cyfrowego (A/C, A/D) Klasyfikacja metod przetwarzania analogowo cyfrowego (A/C, A/D) Metody pośrednie Metody bezpośrednie czasowa częstotliwościowa kompensacyjna bezpośredniego porównania prosta z podwójnym całkowaniem z potrójnym

Bardziej szczegółowo

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H W O J S K O W A A K A D E M I A T E C H N I C Z N A W Y D Z I A Ł E L E K T R O N I K I Drukować dwustronnie P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H Grupa... Data wykonania

Bardziej szczegółowo

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych. Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą

Bardziej szczegółowo

PRZEWODNIK PO PRZEDMIOCIE

PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu: Kierunek: Informatyka Rodzaj przedmiotu: moduł specjalności obowiązkowy: Sieci komputerowe Rodzaj zajęć: wykład, laboratorium I KARTA PRZEDMIOTU CEL PRZEDMIOTU PRZEWODNIK PO PRZEDMIOCIE

Bardziej szczegółowo

Zygmunt Wróbel i Robert Koprowski. Praktyka przetwarzania obrazów w programie Matlab

Zygmunt Wróbel i Robert Koprowski. Praktyka przetwarzania obrazów w programie Matlab Zygmunt Wróbel i Robert Koprowski Praktyka przetwarzania obrazów w programie Matlab EXIT 2004 Wstęp 7 CZĘŚĆ I 9 OBRAZ ORAZ JEGO DYSKRETNA STRUKTURA 9 1. Obraz w programie Matlab 11 1.1. Reprezentacja obrazu

Bardziej szczegółowo

Analiza składowych głównych. Wprowadzenie

Analiza składowych głównych. Wprowadzenie Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących

Bardziej szczegółowo

Politechnika Warszawska

Politechnika Warszawska Politechnika Warszawska Wydział Elektryczny Laboratorium Teletechniki Skrypt do ćwiczenia T.03 Podstawowe zasady modulacji amlitudy na przykładzie modulacji DSB 1. Podstawowe zasady modulacji amplitudy

Bardziej szczegółowo

Ćwiczenie 6. Transformacje skali szarości obrazów

Ćwiczenie 6. Transformacje skali szarości obrazów Politechnika Wrocławska Wydział Elektroniki Mikrosystemów i Fotoniki Przetwarzanie sygnałów laboratorium ETD5067L Ćwiczenie 6. Transformacje skali szarości obrazów 1. Obraz cyfrowy Obraz w postaci cyfrowej

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Zakres wymaganych wiadomości do testów z przedmiotu Metrologia. Wprowadzenie do obsługi multimetrów analogowych i cyfrowych

Zakres wymaganych wiadomości do testów z przedmiotu Metrologia. Wprowadzenie do obsługi multimetrów analogowych i cyfrowych Zakres wymaganych wiadomości do testów z przedmiotu Metrologia Ćwiczenie 1 Wprowadzenie do obsługi multimetrów analogowych i cyfrowych budowa i zasada działania przyrządów analogowych magnetoelektrycznych

Bardziej szczegółowo

Analogowa (para miedziana, radio, walkie-talkie, CB) Cyfrowa (ISDN, GSM, VoIP, DRB, DVB, Tetra, )

Analogowa (para miedziana, radio, walkie-talkie, CB) Cyfrowa (ISDN, GSM, VoIP, DRB, DVB, Tetra, ) Transmisja mowy Analogowa (para miedziana, radio, walkie-talkie, CB) Modulacje: amplitudowa (AM), częstotliwościowa (FM), fazowa (PM) Wysokie zapotrzebowanie na pasmo (np. AM df>2f) Niska sprawność energetyczna

Bardziej szczegółowo

Politechnika Krakowska im. Tadeusza Kościuszki. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2014/2015

Politechnika Krakowska im. Tadeusza Kościuszki. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2014/2015 Politechnika Krakowska im. Tadeusza Kościuszki Karta przedmiotu Wydział Inżynierii Lądowej obowiązuje studentów rozpoczynających studia w roku akademickim 01/015 Kierunek studiów: Transport Forma sudiów:

Bardziej szczegółowo

WYDZIAŁ FIZYKI I INFORMATYKI STOSOWANEJ

WYDZIAŁ FIZYKI I INFORMATYKI STOSOWANEJ WYDZIAŁ FIZYKI I INFORMATYKI STOSOWANEJ Hybrid Images Imię i nazwisko: Anna Konieczna Kierunek studiów: Informatyka Stosowana Rok studiów: 4 Przedmiot: Analiza i Przetwarzanie Obrazów Prowadzący przedmiot:

Bardziej szczegółowo

4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...

4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych... Spis treści 1 Wstęp 11 1.1 Do kogo adresowana jest ta książka... 12 1.2 Historia badań nad mową i językiem... 12 1.3 Obecne główne trendy badań... 16 1.4 Opis zawartości rozdziałów... 18 2 Wyzwania i możliwe

Bardziej szczegółowo

Politechnika Warszawska

Politechnika Warszawska Politechnika Warszawska Wydział Elektryczny Laboratorium Teletechniki Skrypt do ćwiczenia T.02. Woltomierz RMS oraz Analizator Widma 1. Woltomierz RMS oraz Analizator Widma Ćwiczenie to ma na celu poznanie

Bardziej szczegółowo

Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11,

Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11, 1 Kwantyzacja skalarna Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11, 10.05.005 Kwantyzacja polega na reprezentowaniu dużego zbioru wartości (być może nieskończonego) za pomocą wartości

Bardziej szczegółowo

Przetwarzanie obrazów wykład 6. Adam Wojciechowski

Przetwarzanie obrazów wykład 6. Adam Wojciechowski Przetwarzanie obrazów wykład 6 Adam Wojciechowski Przykłady obrazów cyfrowych i ich F-obrazów Parzysta liczba powtarzalnych wzorców Transformata Fouriera może być przydatna przy wykrywaniu określonych

Bardziej szczegółowo

Przetwarzanie sygnałów w telekomunikacji

Przetwarzanie sygnałów w telekomunikacji Przetwarzanie sygnałów w telekomunikacji Prowadzący: Przemysław Dymarski, Inst. Telekomunikacji PW, gm. Elektroniki, pok. 461 dymarski@tele.pw.edu.pl Wykład: Wstęp: transmisja analogowa i cyfrowa, modulacja

Bardziej szczegółowo

CZWÓRNIKI KLASYFIKACJA CZWÓRNIKÓW.

CZWÓRNIKI KLASYFIKACJA CZWÓRNIKÓW. CZWÓRNK jest to obwód elektryczny o dowolnej wewnętrznej strukturze połączeń elementów, mający wyprowadzone na zewnątrz cztery zaciski uporządkowane w dwie pary, zwane bramami : wejściową i wyjściową,

Bardziej szczegółowo

Demodulator FM. o~ ~ I I I I I~ V

Demodulator FM. o~ ~ I I I I I~ V Zadaniem demodulatora FM jest wytworzenie sygnału wyjściowego, który będzie proporcjonalny do chwilowej wartości częstotliwości sygnału zmodulowanego częstotliwościowo. Na rysunku 12.13b przedstawiono

Bardziej szczegółowo

Egzamin / zaliczenie na ocenę*

Egzamin / zaliczenie na ocenę* WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI Zał. nr 4 do ZW 33/01 KARTA PRZEDMIOTU Nazwa w języku polskim CYFROWE PRZETWARZANIE SYGNAŁÓW Nazwa w języku angielskim DIGITAL SIGNAL PROCESSING Kierunek studiów

Bardziej szczegółowo

Kompresja sekwencji obrazów - algorytm MPEG-2

Kompresja sekwencji obrazów - algorytm MPEG-2 Kompresja sekwencji obrazów - algorytm MPEG- Moving Pictures Experts Group (MPEG) - 988 ISO - International Standard Organisation CCITT - Comité Consultatif International de Téléphonie et TélégraphieT

Bardziej szczegółowo

Diagnostyka obrazowa

Diagnostyka obrazowa Diagnostyka obrazowa Ćwiczenie szóste Transformacje obrazu w dziedzinie częstotliwości 1 Cel ćwiczenia Ćwiczenie ma na celu zapoznanie uczestników kursu Diagnostyka obrazowa z podstawowymi przekształceniami

Bardziej szczegółowo

Analiza szeregów czasowych: 2. Splot. Widmo mocy.

Analiza szeregów czasowych: 2. Splot. Widmo mocy. Analiza szeregów czasowych: 2. Splot. Widmo mocy. P. F. Góra http://th-www.if.uj.edu.pl/zfs/gora/ semestr letni 2007/08 Splot Jedna z najważniejszych własności transformaty Fouriera jest to, że transformata

Bardziej szczegółowo

Dźwięk podstawowe wiadomości technik informatyk

Dźwięk podstawowe wiadomości technik informatyk Dźwięk podstawowe wiadomości technik informatyk I. Formaty plików opisz zalety, wady, rodzaj kompresji i twórców 1. Format WAVE. 2. Format MP3. 3. Format WMA. 4. Format MIDI. 5. Format AIFF. 6. Format

Bardziej szczegółowo

Ze względu na dużą rozpiętość mierzonych wartości ciśnienia (zakres ciśnień akustycznych obejmuje blisko siedem rzędów wartości: od 2x10 5 Pa do

Ze względu na dużą rozpiętość mierzonych wartości ciśnienia (zakres ciśnień akustycznych obejmuje blisko siedem rzędów wartości: od 2x10 5 Pa do Ze względu na dużą rozpiętość mierzonych wartości ciśnienia (zakres ciśnień akustycznych obejmuje blisko siedem rzędów wartości: od 2x10 5 Pa do ponad 10 Pa) wygodniej jest mierzone ciśnienie akustyczne

Bardziej szczegółowo

Odbiorniki superheterodynowe

Odbiorniki superheterodynowe Odbiorniki superheterodynowe Odbiornik superheterodynowy (z przemianą częstotliwości) został wynaleziony w 1918r przez E. H. Armstronga. Jego cechą charakterystyczną jest zastosowanie przemiany częstotliwości

Bardziej szczegółowo

NADESŁANE ARTYKUŁY METODY OCENY JAKOŚCI DŹWIĘKU W TELEFONII VOICE OVER IP

NADESŁANE ARTYKUŁY METODY OCENY JAKOŚCI DŹWIĘKU W TELEFONII VOICE OVER IP Studia i Materiały Informatyki Stosowanej, Tom 2, Nr 3, 2010 str. 13-20 NADESŁANE ARTYKUŁY Submitted Articles METODY OCENY JAKOŚCI DŹWIĘKU W TELEFONII VOICE OVER IP Łukasz Apiecionek Uniwersytet Kazimierza

Bardziej szczegółowo

Ile wynosi całkowite natężenie prądu i całkowita oporność przy połączeniu równoległym?

Ile wynosi całkowite natężenie prądu i całkowita oporność przy połączeniu równoległym? Domowe urządzenia elektryczne są często łączone równolegle, dzięki temu każde tworzy osobny obwód z tym samym źródłem napięcia. Na podstawie poszczególnych rezystancji, można przewidzieć całkowite natężenie

Bardziej szczegółowo

Diagnostyka obrazowa

Diagnostyka obrazowa Diagnostyka obrazowa Ćwiczenie szóste Transformacje obrazu w dziedzinie częstotliwości 1. Cel ćwiczenia Ćwiczenie ma na celu zapoznanie uczestników kursu Diagnostyka obrazowa z podstawowymi przekształceniami

Bardziej szczegółowo

Percepcja dźwięku. Narząd słuchu

Percepcja dźwięku. Narząd słuchu Percepcja dźwięku Narząd słuchu 1 Narząd słuchu Ucho zewnętrzne składa się z małżowiny i kanału usznego, zakończone błoną bębenkową, doprowadza dźwięk do ucha środkowego poprzez drgania błony bębenkowej;

Bardziej szczegółowo

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska. SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia

Bardziej szczegółowo

Zmienne zależne i niezależne

Zmienne zależne i niezależne Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }

Bardziej szczegółowo

Zagadnienia egzaminacyjne ELEKTRONIKA I TELEKOMUNIKACJA studia rozpoczynające się przed r.

Zagadnienia egzaminacyjne ELEKTRONIKA I TELEKOMUNIKACJA studia rozpoczynające się przed r. (EAE) Aparatura elektroniczna 1. Podstawowe statyczne i dynamiczne właściwości czujników. 2. Prawa gazów doskonałych i ich zastosowania w pomiarze ciśnienia. 3. Jakie właściwości mikrokontrolerów rodziny

Bardziej szczegółowo

Metody badawcze Marta Więckowska

Metody badawcze Marta Więckowska Metody badawcze Marta Więckowska Badania wizualne pozwalają zrozumieć proces postrzegania oraz obserwować jakie czynniki wpływają na postrzeganie obrazu. Czynniki wpływające na postrzeganie obrazu to:

Bardziej szczegółowo

Układy stochastyczne

Układy stochastyczne Instytut Informatyki Uniwersytetu Śląskiego 21 stycznia 2009 Definicja Definicja Proces stochastyczny to funkcja losowa, czyli funkcja matematyczna, której wartości leżą w przestrzeni zdarzeń losowych.

Bardziej szczegółowo

WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI

WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI Stefan WÓJTOWICZ, Katarzyna BIERNAT ZAKŁAD METROLOGII I BADAŃ NIENISZCZĄCYCH INSTYTUT ELEKTROTECHNIKI ul. Pożaryskiego 8, 04-703 Warszawa tel. (0)

Bardziej szczegółowo

Symulacje akustyczne

Symulacje akustyczne Symulacje akustyczne Hala Sportowa w Suwałkach SYSTEM DSO Maj 2017 Opracował: mgr inż. Jarosław Tomasz Adamczyk SPIS TREŚCI 1. Wprowadzenie... 3 2. Dane wejściowe do symulacji... 3 3. Wyniki symulacji...

Bardziej szczegółowo

POMIARY WYBRANYCH PARAMETRÓW TORU FONICZNEGO W PROCESORACH AUDIO

POMIARY WYBRANYCH PARAMETRÓW TORU FONICZNEGO W PROCESORACH AUDIO Politechnika Rzeszowska Katedra Metrologii i Systemów Diagnostycznych Laboratorium Elektroniczne przyrządy i techniki pomiarowe POMIARY WYBRANYCH PARAMETRÓW TORU FONICZNEGO W PROCESORACH AUDIO Grupa Nr

Bardziej szczegółowo

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU obraz dr inż. Jacek Naruniec Analiza Składowych Niezależnych (ICA) Independent Component Analysis Dąży do wyznaczenia zmiennych niezależnych z obserwacji Problem opiera

Bardziej szczegółowo