ZASTOSOWANIE TESTÓW STATYSTYCZNYCH DO DETEKCJI ZAKŁÓCEŃ IMPULSOWYCH W SYGNAŁACH FONICZNYCH

Podobne dokumenty
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Statystyka matematyczna dla leśników

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

166 Wstęp do statystyki matematycznej

Wykład 3 Hipotezy statystyczne

Prawdopodobieństwo i rozkład normalny cd.

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Politechnika Świętokrzyska. Laboratorium. Cyfrowe przetwarzanie sygnałów. Ćwiczenie 8. Filtracja uśredniająca i statystyczna.

Podstawy Przetwarzania Sygnałów

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Sposoby opisu i modelowania zakłóceń kanałowych

Testowanie hipotez statystycznych.

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Statystyka Matematyczna Anna Janicka

Testowanie hipotez statystycznych

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Analiza regresji - weryfikacja założeń

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

STATYKA Z UWZGLĘDNIENIEM DUŻYCH SIŁ OSIOWYCH

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

WNIOSKOWANIE STATYSTYCZNE

Testy nieparametryczne

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Weryfikacja hipotez statystycznych

Rozdział 8. Regresja. Definiowanie modelu

Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy

W celu obliczenia charakterystyki częstotliwościowej zastosujemy wzór 1. charakterystyka amplitudowa 0,

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Podstawy Automatyki. Wykład 5 - stabilność liniowych układów dynamicznych. dr inż. Jakub Możaryn. Warszawa, Instytut Automatyki i Robotyki

Analiza obrazów - sprawozdanie nr 2

Symulacja sygnału czujnika z wyjściem częstotliwościowym w stanach dynamicznych

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Rekonstrukcja obrazu (Image restoration)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Metody statystyczne kontroli jakości i niezawodności Lekcja II: Karty kontrolne.

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Wprowadzenie do analizy korelacji i regresji

Inteligentna analiza danych

Analiza autokorelacji

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Hipotezy statystyczne

Hipotezy statystyczne

7. Identyfikacja defektów badanego obiektu

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

CYFROWE PRZETWARZANIE SYGNAŁÓW

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

PDF created with FinePrint pdffactory Pro trial version

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Spośród licznych filtrów nieliniowych najlepszymi właściwościami odznacza się filtr medianowy prosty i skuteczny.

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

Podstawy Automatyki. Wykład 5 - stabilność liniowych układów dynamicznych. dr inż. Jakub Możaryn. Warszawa, Instytut Automatyki i Robotyki

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Testowanie hipotez statystycznych. Wprowadzenie

Testowanie hipotez statystycznych.

PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO czȩść II

1. Eliminuje się ze zbioru potencjalnych zmiennych te zmienne dla których korelacja ze zmienną objaśnianą jest mniejsza od krytycznej:

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Analiza korespondencji

Transformata Laplace a to przekształcenie całkowe funkcji f(t) opisane następującym wzorem:

Teoria przetwarzania A/C i C/A.

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

2. STRUKTURA RADIOFONICZNYCH SYGNAŁÓW CYFROWYCH

Elementy modelowania matematycznego

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

STATYSTYKA MATEMATYCZNA

Rozwiązanie n1=n2=n=8 F=(4,50) 2 /(2,11) 2 =4,55 Fkr (0,05; 7; 7)=3,79

Badanie widma fali akustycznej

Pobieranie prób i rozkład z próby

Kolokwium ze statystyki matematycznej

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Transkrypt:

Krzysztof Cisowski Politechnika Gdańska, Wydział ETiI Katedra Systemów Automatyki, ul. G. Narutowicza 11/12, 8-952 Gdańsk, e-mail: krci@eti.pg.gda.pl 24 Poznańskie Warsztaty Telekomunikacyjne Poznań 9-1 grudnia 24 ZASTOSOWANIE TESTÓW STATYSTYCZNYCH DO DETEKCJI ZAKŁÓCEŃ IMPULSOWYCH W SYGNAŁACH FONICZNYCH Streszczenie: Artykuł poświęcony jest omówieniu opartej o testy statystyczne metody detekcji zakłóceń impulsowych występujących w sygnałach fonicznych. We wstępie scharakteryzowano ogólnie zasadę działania parametrycznych detektorów zniekształceń. Następnie omówiono podstawowe rodzaje zakłóceń impulsowych typowych dla archiwalnych i współczesnych sygnałów fonicznych. Szczegółowo przedstawiono podstawy teoretyczne parametrycznych detektorów cyfrowych. Omówiono ideę wykorzystania testów statystycznych do detekcji zakłóceń impulsowych. Na koniec przedstawiono wyniki doświadczalne, w których dokonano porównania własności zaproponowanego algorytmu z metodą opartą o analizę wariancji sygnałów. 1. WSTĘP W artykule omówiono nową parametryczną metodę detekcji zakłóceń impulsowych sygnałów fonicznych wykorzystującą własności statystyczne analizowanych sygnałów. Metoda pozwala na wykrywanie zakłóceń powstających w analogowych torach fonicznych, w których zniekształcenia mają charakter pojedynczych impulsów, grup impulsów lub zakłóceń o złożonym charakterze. W proponowanym algorytmie zakłada się, że sygnał foniczny {} jest lokalnie stacjonarnym procesem autoregresyjnym (AR) rzędu p. Sygnał {} poddawany jest wstępnej filtracji za pomocą filtru analizującego (wybielającego) o współczynnikach równych parametrom modelu AR. Otrzymany sygnał błędów resztowych {e(t)} ma w porównaniu z {} zmniejszoną wartość stosunku sygnał/szum, dzięki czemu nieciągłości wprowadzane do sygnału przez zakłócenia impulsowe są bardziej wyeksponowane łatwiejsze do wykrycia. Proces detekcji zniekształceń w {e(t)} polega na porównaniu amplitudy chwilowej sygnału z pewną wartością progową, ustalaną w sposób zależny od zastosowanego algorytmu detekcji. Sygnał błędów resztowych uzyskany w procesie dekorelacji (wybielania) {} ma charakter szumu białego o nieznanym rozkładzie prawdopodobieństwa. Stosując dodatkowe założenie o gaussowskim charakterze szumu wejściowego {n(t)} formującego {} można przyjąć, że {e(t)} ma rozkład zbliżony do rozkładu normalnego. W dotychczasowych pracach autora (patrz [5], [2]) zakładano, że {n(t)} a tym samym {e(t)} mają rozkład gaussowski oraz poziom odniesienia detektora ustalany był jako wartość chwilowa oszacowania średniego odchylenia standardowego σ 2 n (t) sygnału {n(t)} ( σ 2 n(t) wariancja {n(t)}). W proponowanym rozwiązaniu brak jest założeń o gaussowskim charakterze {n(t)} (i {e(t)}). Nieznany rozkład prawdopodobieństwa sygnału błędów resztowych jest estymowany za pomocą histogramu. W oparciu o oszacowanie rozkładu prawdopodobieństwa ustalane są dwa progi detekcji: dolny i górny. Progi te odpowiadają wartościom krytycznym z d oraz z g testu statystycznego, w którym dla danego poziomu istotności α weryfikowane są dwie hipotezy dotyczące przynależności (lub jej braku) poszczególnych próbek {e(t)} do zbioru próbek nadmiarowych. Hipoteza zerowa H o mówi, że w chwili t i dana próbka sygnału e(t i ) nie jest nadmiariowa (z d e(t i ) z g z prawdopodobieństwem równym 1 α) a hipoteza alternatywna H 1 zakłada, że e(t i ) jest nadmiarowa - zawiera zakłócenie impulsowe (e(t i ) > z g lub e(t i ) < z d z prawdopodobieństwem równym α). W trakcie weryfikacji hipotez można popełniać dwa błędy: błąd I rodzaju gdy niezakłócona impulsowo próbka sygnału (próbka dobra ) zostanie uznana za zakłóconą lub błędy II rodzaju - gdy próbka zakłócona impulsowo zostanie potraktowana jako próbka dobra. Ponieważ zakłada się dodatkowo, że sygnał {} a tym samym {e(t)} jest lokalnie stacjonarnym procesem losowym, estymacja rozkładu prawdopodobieństwa oraz wyznaczanie wartości krytycznych z d oraz z g przeprowadza się dla poszczególnych przedziałów stacjonarności. W proponowanym rozwiązaniu stosowane jest blokowe przetwarzanie danych, w którym dla ustalonego rozmiaru segmentu (odpowiadającego długości przedziału stacjonarności) sygnał {} dzielony jest na jednakowe bloki, w których wyznaczane są: parametry modelu AR, sygnał błędów resztowych oraz histogram {e(t)}. Dla przyjętego poziomu istotności obliczane są wartości z d oraz z g. Wszystkie próbki {e(t)} należące do danego bloku danych są porównywane z wartościami progowymi. Wyniki porównania zapisywane są w specjalnym pliku, w którym jedynymi niezerowymi danymi są te, których indeksy odpowiadają próbkom nadmiarowym. Próbki zakwestionowane przez detektor w chwili t i zapisywane są PWT 24, Poznań 9-1 grudnia 24 1

w postaci e(t i ) z d gdy e(t i ) < z d lub e(t i ) z g gdy e(t i ) > z g. Lokalny histogram sygnału obliczany jest w oparciu o stosunkowo niewielką liczbę danych. Uzyskiwane przybliżenia rozkładu prawdopodobieństwa mają zatem niedoszacowane tzw. ogony, czyli fragmenty rozkładu odpowiadające bardzo mało prawdopodobnym wartościom e(t) (wartościom sygnału dużo mniejszym od z d oraz dużo większym od z g ). Wartości krytyczne wyznaczane na podstawie histogramu są zbyt pesymistyczne (z d powinno być nieco mniejsza a z g powinno byś nieco większe). Na skutek powyższej własności część próbek sygnału {e(t)} o lokalnie największych poziomach lokuje się w obszarze odrzuceń hipotezy H o i jest traktowana jako zakłócenie impulsowe. Algorytm detekcji próbek nadmiarowych musi zatem zawierać drugi etap, w którym analizowany jest plik z wynikami detekcji uzyskanymi w pierwszym etapie: wartości bliskie zeru traktowane są jako błędy pierwszego rodzaju i wskazania tych danych są usuwane z pliku detektora. Ostatecznie tworzony jest drugi plik detektora zawierający zero-jedynkową informację o próbkach nadmiarowych 1 zakłócenie, brak zakłócenia. 2. TYPY ZAKŁÓCEŃ IMPULSOWYCH Zakłócenia impulsowe występujące w sygnałach fonicznych można klasyfikować na wiele sposobów (odpowiednie przykłady można znaleźć w pracach [2] oraz [6]). Jednym z kryteriów podziału może być rodzaj toru akustycznego, w którym sygnał foniczny jest transmitowany bądź przetwarzany. 2.1. Zakłócenia impulsowe powstające w analogowych torach fonicznych Najbardziej charakterystycznymi zakłóceniami występującymi w analogowych torach fonicznych są zniekształcenia pojawiające się przy odczycie gramofonowych nagrań fonicznych. Mechaniczne urządzenie odczytujące (igła gramofonowa) napotkawszy uszkodzenie rowka płyty, wytwarza w przetworniku mechaniczno-elektrycznym impuls elektryczny. Wielkość oraz kształt impulsu uzależnione są od stopnia uszkodzenia rowka (rozmiaru nieciągłości nośnika). Zakłócenia tego typu można podzielić na pojedyncze impulsy (lub grupy pojedynczych impulsów) oraz impulsy złożone (przejściowe). 8 6 4 2 2 4 62 64 66 68 7 72 74 76 78 8 82 t [num. próbek] Rys. 1: Przebieg czasowy przykładowo wybranego fragmentu nagrania muzycznego zarejestrowanego na płycie gramofonowej zawierającego kilka pojedynczych zakłóceń impulsowych. Pojedyncze impulsy o czasie trwania do 1 ns (wg. [4]) lub grupy pojedynczych impulsów o łącznym czasie trwania od kilkuset ns do 3 ms (wg. [6]) stanowią podstawowy rodzaj zakłóceń impulsowych pojawiających się w sygnałach otrzymanych przy odczycie gramofonowych nagrań fonicznych. Pojedyncze impulsy składają się z kilku do kilkunastu próbek i mają najczęściej kształt taki jak na Rys. 1. Zakłócenia tego typu można traktować jako odpowiedź impulsową analogowego kanału transmisyjnego, przez który przesłano zakłócenia w postaci zmodulowanej amplitudowo delty Kroneckera ( δ(t)= { 1 dla t = dla t 25-25 ). 4 8 12 t Rys. 2: Przykład zakłócenia impulsowego przejściowego wg. [6] (Oś t numery próbek). Impulsy złożone (przejściowe) różnią się od pojedynczych impulsów dłuższymi czasami trwania, większą energią, innym rozkładem energii w widmie (składowe niskoczęstotliwościowe dominują) oraz rzadszym występowaniem. Budowa impulsu złożonego to najczęściej krótki, o stromych zboczach impuls początkowy oraz następujące po nim zanikające niskoczęstotliwościowe oscylacje. Dobrym przykładem impulsu złożonego jest sygnał uzyskany w wyniku odtwarzania na gramofonie płyty analogowej posiadającej głęboką rysę. Fizyczna nieciągłość nośnika powoduje, że igła systemu odczytującego po chwilowej utracie kontaktu z powierzchnią nośnika uderza z dużą siłą w przeciwległy brzeg rysy i kontynuuje odtwarzanie przerwanego rowka płyty. Kształt impulsu wynika z własności elektro mechanicznych układu odczytującego. W pierwszej fazie jest to odpowiedź układu na nieciągłość nośnika, a w drugiej wynik występowania rezonansów własnych (zanikające oscylacje nałożone w sposób addytywny na sygnał). Czas trwania fazy pierwszej wynosi 1 5 ms a fazy drugiej jest dłuższy i wynosi do 5 ms [6]. Przykład zakłócenia impulsowego przejściowego zamieszczono na Rys. 2. 2.2. Zakłócenia impulsowe powstające w cyfrowych torach fonicznych Zakłócenia impulsowe generowane przez cyfrowe tory foniczne związane są z błędami numerycznymi powstającymi w wyniku przesyłania, przetwarzania, bądź przechowywania zakodowanych cyfrowo sygnałów fonicznych. 2 2 x 1 4 a) b) c) t 52 53 54 55 56 57 58 59 6 Rys. 3: Przykłady kilku rodzajów cyfrowych zakłóceń impulsowych. (Oś t numery próbek). PWT 24, Poznań 9-1 grudnia 24 2

Przykładami źródeł zakłóceń cyfrowych mogą być: obcinanie próbek sygnału w przetworniku analogowo-cyfrowym po przekroczeniu dozwolonego poziomu amplitudy (Rys. 3a), błędy numeryczne algorytmów przetwarzania sygnałów (Rys. 3b), utrata bloków próbek w trakcie transmisji danych (brakujące próbki zastępowane są najczęściej zerami - Rys. 3c) itp. Cechą charakterystyczną jest to, że na raz powstałe zakłócenia w żaden sposób nie oddziaływują dalsze elementy cyfrowego toru fonicznego. 3. CYFROWY PARAMETRYCZNY DETEKTOR ZAKŁÓCEŃ IMPULSOWYCH Detektory parametryczne wykorzystują w procesie detekcji modelowanie sygnałów zakłócenia impulsowe poszukiwane są nie w samym sygnale {}, lecz w sygnale błędów modelowania {e(t)}. Wykorzystywane jest przy tym spostrzeżenie, że proces rózniczkowania sygnału fonicznego (na ogół silnie wewnętrznie skorelowanego) powoduje znaczne uwypuklenie nieciągłości wprowadzanych do sygnału przez zakłócenia impulsowe. Operacja różniczkowania odpowiada dekorelacji lub widmowemu wybielaniu sygnału, stąd zastosowanie metod dekorelacji opartych o modelowanie daje poprawę wykrywalności zakłóceń. W dotychczas stosowanych przez autora rozwiązaniach opisanych w [1], [2], [3] oraz [5] wykorzystywane były modele AR. Przyjmijmy, że zakłócony impulsowo sygnał foniczny {} opisany jest zależnościami: s(t) = a j s(t j) + n(t), = s(t) + z(t), (1) gdzie a j, j = 1,..., p, oznaczają wartości współczynników AR, {s(t)} jest niezakłóconym sygnałem fonicznym, {n(t)} to szum wejściowy (o wartści oczekiwanej m n = i wariancji σn 2 < ) formujący sygnał {s(t)}, a z(t) = A δ(t t ) jest sygnałem zawierającym zakłócenie impulsowe o amplitudzie A pojawiające się w chwili t. Poddając sygnał {} filtracji odwrotnej za pomocą filtru analizującego o skończonej odpowiedzi impulsowej (FIR), którego współczynnikami są parametry a j, j = 1,..., p, otrzymuje się sygnał błędów resztowych {e(t)} o wartści oczekiwanej m e = i wariancji σe 2 < wyrażony równaniem: e(t) = a j y(t j) (2) = s(t)+z(t) a j (s(t j)+ z(t j)). Korzystając z zależności n(t) = s(t) p a js(t j) równanie (2) można zapisać w postaci: e(t) = n(t) + z(t) a j z(t j) (3) = n(t) + z(t) + z (t), gdzie z (t) = A h(t t 1), przy czym h(t) = p a jδ(t j) jest odpowiedzią impulsową filtru analizującego. Składnik z (t) jest więc sygnałem zawierającym rozmyty przez filtr wybielający pojedynczy impuls zakłócenia. Pojawia się on tuż za impulsem pierwotnym wydłużając czas trwania zakłócenia o p okresów próbkowania. W chwili t sygnały y(t ) oraz e(t ), są równe odpowiednio ( z (t ) = ): e(t ) = n(t ) + A, y(t ) = s(t ) + A, (4) przy czym n(t ) s(t ). Jeśli w próbce sygnału y(t ) poziom zakłócenia A jest porównywalny z poziomem s(t ) (detekcja takiego zakłócenia byłaby trudna lub wręcz niemożliwa), w e(t ) dominującym składnikiem jest zakłócenie, gdyż n(t ) A. Jak widać w chwili t zakłócenie w sygnale {e(t)} ma znacznie wyższy względny poziom niż w sygnale {}, stąd detekcja zakłócenia w {e(t)} jest łatwiejsza. Przez p chwil czasu następujących po chwili t = t zależność (3) przyjmuje postać e(t) = n(t) A a t t, t = t +1,..., t +p, podczas gdy (1) wyraża się równaniem = s(t), t = t + 1,..., t + p. Sygnał {e(t)} zawiera zatem składniki, których odpowiedniki nie występują w sygnale {}. Powstałe zaburzenie może powodować fałszywe alarmy detektora, a w szczególności wydłużanie czasu wskazań obecności zakłócenia. Powyższe wnioski bardzo łatwo można przenieść na przypadek, gdy impuls zakłócenia składa się z M próbek występujących się w sygnale {z(t)} od chwili t = t, tj. z(t) = M 1 i= A i δ(t (t i)). Impuls taki po przejściu przez filtr analizujący o odpowiedzi impulsowej h(t) ulegnie rozmyciu. W sygnale {e(t)} jego przetransformowane składniki będą występowały przez p + M chwil czasu w przedziale t=t,..., t + p +M 1. Niezniekształcona będzie jedynie pierwsza próbka zakłócenia o amplitudzie A występująca w chwili t = t (patrz pierwsze z dwóch równań (4)). Poprawa wykrywalności pierwszej próbki zakłócenia złożonego z wielu impulsów jest taka sama, jak zakłócenia składającego się z impulsu pojedynczego (porównaj (4)). Pewne zniekształcenie kolejnych M 1 próbek zakłócenia nieco ten stan pogarsza, jednak nadal zakłócenie takie łatwiej jest wykryć w sygnale {e(t)} niż {}. Pewien problem mogą stanowić dodatkowe próbki z przedziału t = t +M 1,..., t +p+m 1, których odpowiedniki nie występują w sygnale {}. Często powodują one niepotrzebne wydłużanie czasu wskazań obecności zakłócenia. Detekcja zakłóceń impulsowych w sygnale błędów resztowych {e(t)} oparta jest na założeniu, że PWT 24, Poznań 9-1 grudnia 24 3

szum wejściowy {n(t)} jest gaussowskim procesem losowym.próbki {e(t)} są segregowane do dwóch wzajemnie rozłącznych zbiorów: danych niezakłóconych oraz zakłóconych próbek nadmiarowych. Klasyfikacja sygnału przeprowadzana jest w oparciu o znaną ze statystyki regułę 3σ, w myśl której w danej chwili czasu t i sygnał e(t i ) reprezentuje zakłócenie impulsowe, gdy spełniony jest warunek: e(t i ) > 3 σ n (t i ). (5) gdzie σ n (t i ) = σ n(t 2 i ), σ n(t 2 i ) jest oszacowaniem wariancji szumu wejściowego w chwili t i. Warunek ten oznacza, że próbka e(t i ) traktowana jest jako zakłócona impulsowo, gdy przekracza poziom osiągany przez {n(t)} z bardzo małym prawdopodobieństwem, mniejszym od,3 [5]. Warunek powyższy można również opisać na gruncie teorii weryfikacji hipotez statystycznych. W związku z tym formułujemy hipotezę zerową H mówiącą, ze poziom próbki e(t i ) jest niewielki, tylko nieznacznie różni się od zera (wariancja szumu wejściowego jest niewielka ) oraz hipotezę alternatywną H 1 zakładającą, że wartość e(t i ) jest nadmiarowa dużo większa od zera. W procesie detekcji zakłóceń dokonujemy weryfikacji powyższych hipotez starając się, dla przyjętego poziomu istotności α =,3, odrzucić hipotezę zerową H na rzecz hipotezy alternatywnej. Obszar odrzuceń H wyznaczają wartości krytyczne z d oraz z g, będące odpowiednio dolnym i górnym progiem detekcji. W przypadku rozkładu normalnego dla α =,3 progi przyjmują wartości z d = 3 σ n (t i ) oraz z g = 3 σ n (t i ). Jak można zauważyć symetria rozkładu gaussowskiego sprawia, że moduły wartości krytycznych są sobie równe. W ogólnym przypadku można wybrać inną wartość poziomu istotności α ( < α < 1), odpowiednie progi detekcji można wówczas wyznaczyć w oparciu o tablice rozkładu normalnego. W tym celu dla wielkości α/2 (rozkład gaussowski jest symetryczny) odczytujemy wartość krytyczną z kr. Odpowiednie progi detekcji wyznaczamy zgodnie z zależnościami: z d = z kr σ n (t i ), z g = z kr σ n (t i ). Jak wiadomo w trakcie detekcji zakłóceń impulsowych pojawiają się błędne wskazania detektora. Jeśli niezakłócona próbka sygnału zostanie mimo wszystko uznana za zakłóconą, tzn. gdy w sposób nieuprawniony odrzucimy H na rzecz H 1, popełnimy błąd I rodzaju. Z kolei przyjmując H, gdy dana jest fałszywa, tzn. traktując próbkę zakłóconą impulsowo jako dobrą, popełnimy błąd II rodzaju. Liczba niewłaściwych wskazań detektora zależy od stopnia separacji w sygnale błędów predykcji próbek dobrych i zakłóconych. Separacja ta zależy głownie od własności korelacyjnych oraz stacjonarności samego sygnału {} a następnie od stopnia wybielenia {e(t)} jak również intensywności zakłóceń. Pierwszy z warunków jest od nas niezależny i sprawia, że jeśli sygnał jest słabo skorelowany wewnętrznie, ma cechy sygnału szumopodobnego, proces wybielania nie uwypukli dodatkowo zakłóceń. Szansę bezbłędnego wykrycia będą miały jedynie zniekształcenia wyraźnie górujące nad sygnałem. Trzeci z warunków ma znaczenie, gdy sygnał jest silnie wewnętrznie skorelowany, np. ma widmo prążkowe (wieloton harmoniczny + szum) a filtr wybielający ma błędnie wyznaczone parametry lub zbyt niski rząd, mniejszy od rzędu autoregresji procesu losowego. Wówczas filtracja odwrotna tylko nieznacznie lub wcale nie uwypukla zakłóceń. Efektywność detekcji jest wówczas podobna, jak w przypadku sygnału szumopodobnego. Duży problem dla prawidłowej detekcji zakłóceń stanowią sygnały niestacjonarne, których charakterystyki szybko zmieniają się w czasie, np. wibrowany dźwięk skrzypiec. Flitr analizujący o uśrednionych współczynnikach będzie dawał taki sam skutek jak filtr o błędnie wyznaczonych parametrach. Problem ten można rozwiązać stosując adaptacyjne algorytmy identyfikacji (patrz [5], [2]). Intensywność zakłóceń impulsowych również może wpływać na liczbę błędnych decyzji detektora. Jeśli w silnie wewnętrznie skorelowanym sygnale pojawią się grupy blisko następujących po sobie zakłóceń, charakter sygnału może ulec lokalnemu zaburzeniu. Składnik szumowy może zdominować pozostałe składowe sygnału. Lokalne oceny parametrów ulegną znaczącym zmianom, co będzie miało wpływ na pracę detektora tuż po ustaniu zakłócenia. Lokalne oceny wariancji wzrosną uniemożliwiając wykrycie wielu rzeczywistych zakłóceń. Do wyznaczenia oszacowania wariancji szumu wejściowego σ 2 n(t) należy wykorzystać sygnał e(t). W pracy [1] zaproponowano dwa typy estymatorów rekurencyjnych. Pierwszy z nich jest oparty na prostym modelu ważenia wykładniczego a drugi na modelu średniej ruchomej. Obydwie metody zostały zmodyfikowane w ten sposób, aby estymacja wariancji odbywała się z pominięciem próbek nadmiarowych. Kolejne wartości {e(t)} są wykorzystywane do uaktualnienia σ 2 n(t) tylko wtedy, gdy przejdą pomyślnie weryfikację za pomocą detektora zakłóceń impulsowych (tzn. jeśli w stosunku do nich nie zostanie odrzucona hipoteza H na rzecz H 1 ). W niniejszej pracy omawiany jest algorytm detekcji zakłóceń impulsowych w wersji blokowej. Zaproponowano zatem blokowy algorytm estymacji σ 2 n(t) posiadający wyżej wspomnianą zaletę algorytmów rekurencyjnych. Dane dzielone są na bloki o długościach M próbek, gdzie M T (T okres próbkowania) jest czasem trwania przedziału lokalnej stacjonarności sygnału. Przyjmując określoną wartość poziomu istotności α, któremu odpowiada odczytana z tablic rozkładu normalnego wartość krytyczna z kr, oszacowanie wariancji szumu wejściowego dla i-tego bloku danych oblicza się zgodnie z procedurą: Ustaw wartość początkową indeksu pomocniczego I p =. Zmieniaj indeks j w przedziale < 1, M > i wykonuj operacje: PWT 24, Poznań 9-1 grudnia 24 4

Na rys. 4 porównano efekty działania proponowanego algorytmu detekcji z metodą opartą o analizę wariancji sygnału (wykorzystującą założenie o gaussowskim charakterze sygnału). Rys. 4 a) zawiera wykres sygnału {} posiadającego kilka zakłóceń w postaci impulsów prostych. Jest to zapisany cyfrowo fragment nagrania pochodzącego z płyty analogowej kwartet smyczkowy. Sygnał przetwarzany był blokowo, rozmiar bloku M = 256 próbek. Na rys. 4 b) pokazano efekty uzyskane po zastosowaniu filtracji odwrotnej, filtrem o współczynnikach równych parametrom modelu AR rzędu p = 1 (do identyfikacji modelu zastosowano metodę Burga). Jak można zauważyć zakłócenia uległy uwypukleniu stosunek sygnał/szum uległ zmniejszeniu. Na wykresie zaznaczono również progi detekcji wyznaczone poprzez analizę wariancji poziome linie schodkowe. Do estymacji wariancji zastosowano opisaną wcześniej metodę blokową z poziomem istotności α w =,5 (z krw = 2,81). Progi detekcji ustalono dla poziomu istotności α d =,2 (z krd = 3,71). Rys. 4 c) zawiera zero-jedynkowy sygnał wyjściowy detektora wariancyjnego {d w (t)}. Na rys. 4 d) znajduje się sy jeżeli e(j) z kr σ n (i 1) lub j = 1 I p = I p + 1, Oblicz wariancję w i-tym bloku: c(i p ) = e(j). Ip ( σ n(i) 2 = c2 Ip (j) c(j) ) 2, I p I p gdzie wielkość c = [c 1 (t),..., c M (t)] T jest pomocniczym wektorem o długości M służącym do przechowywania wartości e(t). Jak można zauważyć, kolejne wartości sygnału {e(t)} są uwzględniane w obliczeniach tylko wtedy, gdy ich poziom nie przekracza przyjętej wielokrotności oszacowania wariancji obliczonego dla poprzedniego bloku danych i 1. 4. DETEKCJA ZAKŁÓCEŃ IMPULSO- WYCH Z WYKORZYSTANIEM TESTÓW STATYSTYCZNYCH W dotychczasowych rozważaniach zakładano, że sygnał {e(t)} (a tym samym {}) jest procesem gaussowskim. Praktyka pokazuje, że założenie takie jest błędne. W wielu wypadkach najprostszy test polegający na obserwacji wzrokowej przebiegu czasowego {e(t)} pozwala zauważyć asymetrię rozkładu prawdopodobieństwa sygnału (np. wartości dodatnie pojawiają się częściej niż ujemne), świadczącą o niezerowych nieparzystych momentach procesu losowego. W takich sytuacjach należy domniemywać, że sygnał {e(t)} nie jest procesem gaussowskim, gdyż jak wiadomo dla rozkładu normalnego wartości nieparzystych momentów są równe zeru. W ogólnym przypadku proces wyznaczania progów detekcji (wartości krytycznych z d oraz z g ) powinien być oparty o rzeczywisty, lecz nieznany rozkład prawdopodobieństwa sygnału. W proponowanym rozwiązaniu lokalne oszacowanie rozkładu prawdopodobieństwa wyznaczane jest przy wykorzystaniu histogramu obliczanego dla przedziału lokalnej stacjonarności sygnału. Progiem dolnym z d jest największa wartość sygnału {e(t)}, dla której całka histogramu liczona w przedziale całkowania < e min, z d > jest mniejsza od połowy przyjętego poziomu istotności α/2, gdzie e min jest najmniejszą wartością osiąganą przez sygnał w analizowanym bloku danych. Progiem górnym z g jest natomiast najmniejsza wartość {e(t)}, dla której całka histogramu liczona w przedziale całkowania < z g, e max > jest mniejsza od połowy przyjętego poziomu istotności α/2, gdzie e max jest największą wartością osiąganą przez sygnał w analizowanym bloku danych. Histogram jest tylko dosyć zgrubnym oszacowaniem nieznanego rozkładu prawdopodobieństwa sygnału, w szczególności nie zawiera tzw. ogonów rozkładu (w kierunku oraz ) informujących o prawdopodobieństwach występowania bardzo wielkich i bardzo małych wartości {e(t)}. Jak można się domyślać, skrajne wartości sygnału praktycznie nie występują w stosunkowo mało liczebnym bloku danych. Progi detekcji wyznaczone wyżej opisaną metodą są przeszacowane - z d lub niedoszacowane - z g. Konsekwencją tego zjawiska jest generowanie przez detektor dużej liczby błędów pierwszego rodzaju część próbek dobrych o lokalnie dużych amplitudach uznawana jest za zakłócenie. Konieczne jest zatem wprowadzenie drugiego etapu detekcji służacego do wyeliminowania jak największej liczby błędnych wskazań detektora. W proponowanej metodzie tworzony jest pomocniczy plik danych {d(t)}, zawierający informacje o momentach występowania zakłóceń t i, zakodowaną zgodnie z regułą: d(t) = gdy z d e(t i ) z g e(t i ) z d gdy e(t i ) < z d e(t i ) z g gdy e(t i ) > z g Jak można zauważyć sygnał {d(t)} jest niezerowy tylko w momentach wykrycia zakłóceń. Próbki d(t i ) są równe wartościom e(t i ) pomniejszonym o odpowiednie progi detekcji z d lub z g. Z zasady tworzenia histogramu oraz zastosowanego sposobu obliczania wartości krytycznych wynika, że większość danych {d(t)} o relatywnie małych amplitudach będzie odpowiadała fałszywym wykryciom detektora. Analizując sygnał {d(t)} z odpowiednio dobranymi progami detekcji z sd oraz z sg, można odrzucić błędne wskazania detektora. Dobór wartości z sd i z sg najlepiej jest przeprowadzić dla danego sygnału {e(t)} metodą doświadczalną. Liczne eksperymenty wykazały jednak, że w wielu przypadkach dobre rezultaty selekcji danych można uzyskać stosując następujące podstawienia: z sd = zd oraz z sg = zg Z zależności tej wynika, że stosując detekcję jednoetapową należałoby dodatkowo zwiększyć moduły progów z d i z g o około 1%. 5. WYNIKI DOŚWIADCZALNE PWT 24, Poznań 9-1 grudnia 24 5

gnał {e(t)} wraz z zaznaczonymi progami detekcji wyznaczonymi dla poszczególnych bloków danych w oparciu o histogramy obliczone z poziomem istotności α h =,5. Jak widać progi te położone są asymetrycznie względem zera, co świadczy o niegaussowskim charakterze sygnału {e(t)}. Rys. 4 e) to sygnał zero-jedynkowy {d h1 (t)} uzyskiwany po pierwszym etapie detekcji. Widać w nim bardzo wiele wykryć zakłóceń - większość z nich jest błędna. Rys. 4 f) zawiera sygnał {d(t)}, w którym można zauważyć dużą liczbę próbek o małych poziomach. Są to najczęściej dobre próbki sygnału mylnie zakwestionwane przez detektor jako zakłócenia. Zastoswanie drugiego etapu detekcji powoduje odrzucenie większości z nich (zastosowano progi detekcji: z sd =,9z d oraz z sg =,9z g ). Porównanie ostatecznych wyników detekcji (sygnał {d h2 (t)} z rys. 4 g) ) z efektami uzyskanymi metodą opartą o analizę wariancji (sygnał {d w (t)}) pokazuje, że dla rozpatrywanego sygnału obydwie metody dają podobne rezultaty najbardziej istotne zakłócenia zostały wykryte. 6. WNIOSKI KOŃCOWE W pracy omówiono nową metodę wykrywania zakłóceń impulsowych powstających w trakcie transmisji, zapisu i przechowywania analogowych sygnałów fonicznych. Algorytm jest odmianą parametrycznego detektora zakłóceń wykorzystującego model autoregresyjny sygnału. Oparty jest o analizę rozkładów prawdopodobieństw błędów resztowych otrzymywanych na wyjściu filtru analizującego o współczynnikach równych parametrom modelu AR. W algorytmie tym, w odróżnieniu od wcześniej opracowanych przez autora rozwiązań detektorów parametrycznych, brak jest założeń odnośnie gaussowskiego charakteru analizowanych sygnałów fonicznych. Zaproponowany sposób wyznaczania wartości progowych detektora w oparciu o histogram sygnału sprawia, że konieczne jest zastosowanie dwuetapowej metody detekcji. W pracy podano heurystyczną zależność pozwalającą w znacznym stopniu usunąć błędne wskazania detektora pojawiające się w znacznej liczbie po pierwszym etapie detekcji. W dalszych pracach należałoby się skupić na eliminacji drugiej fazy detekcji przez np. zaproponowanie metody estymacji tzw. ogonów funkcji rozkładu prawdopodobieństwa. Opracowany detektor ma dobre własności wykrywania zakłóceń impulsowych w sygnałach fonicznych w szczególności, gdy analizowany sygnał nie jest procesem gaussowskim. SPIS LITERATURY [1] Cisowski K.: Efficiency of impulsive noise detection in audio recordings using the adaptive filtering method. 94th AES Convention, preprint No 3464 (B1-4), Berlin, Germany, 1993. [2] Cisowski K.: Adaptacyjna filtracja i rekonstrukcja sygnałów fonicznych. Rozprawa doktorska, Politechnika Gdańska, Gdańsk, 2. [3] Cisowski K.: Detekcja zakłóceń impulsowych w sygnałach fonicznych. VI KKNT Diagnostyka procesów Przemysłowych, DPP 3, Władysławowo, 15-17 września, 23, str. 157-162. [4] Królewski M.: An electronic circuit for removing impulse noise from analog program. 84th AES Convention, preprint No 2571 (B-5), Paris, 1988. [5] Niedźwiecki M., Cisowski K.: Adaptive scheme for elimination of broadband noise and impulsive disturbances from AR and ARMA signals. IEEE Trans. on Signal Processing., vol. 44, no. 3, 1996, str. 528-537. [6] Vaseghi S.V.: Advanced signal processing and digital noise reduction. John Wiley & Sons Ltd. and B. G. Teubner, 1996. a) e(t) b) d w (t) c) e(t) d) d h1 (t) e) d(t) f) d h2 (t) g) 4 2 2 4 1 62 64 66 68 7 72 74 76 78 8 82 3 2 1 62 64 66 68 7 72 74 76 78 8 82 1.5 1.5 1 62 64 66 68 7 72 74 76 78 8 82 3 2 1 62 64 66 68 7 72 74 76 78 8 82 1.5 1.5 62 64 66 68 7 72 74 76 78 8 82 3 2 1 1 62 64 66 68 7 72 74 76 78 8 82 1.5 1.5 62 64 66 68 7 72 74 76 78 8 82 Rys. 4: Przykład detekcji zakłóceń impulsowych w sygnale fonicznym. Szczegółowy opis wykresów zamieszczono w tekście. Oś pionowa amplituda sygnału, oś pozioma numery próbek. PWT 24, Poznań 9-1 grudnia 24 6