TESTY LOSOWOŚCI. Badanie losowości próby - test serii.

Podobne dokumenty
1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o

ANALIZA DANYCH DYSKRETNYCH

Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste

L.Kowalski zadania ze statystyki matematycznej-zestaw 3 ZADANIA - ZESTAW 3

Statystyka i Opracowanie Danych. W7. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

Ćwiczenie 2 ESTYMACJA STATYSTYCZNA

Prawdopodobieństwo i statystyka r.

KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1

Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

Estymacja przedziałowa

Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)

Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

STATYSTYKA I ANALIZA DANYCH

PRZEDZIAŁY UFNOŚCI. Niech θ - nieznany parametr rozkładu cechy X. Niech α będzie liczbą z przedziału (0, 1).

Lista 6. Estymacja punktowa

Parametryczne Testy Istotności

STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr inż Krzysztof Bryś

Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).

1 Testy statystyczne. 2 Rodzaje testów

Statystyka matematyczna dla leśników

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Wokół testu Studenta 1. Wprowadzenie Rozkłady prawdopodobieństwa występujące w testowaniu hipotez dotyczących rozkładów normalnych

Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w

PODSTAWY BIOSTATYSTYKI ĆWICZENIA

Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2

STATYSTYKA MATEMATYCZNA

Testowanie hipotez. H 1 : µ 15 lub H 1 : µ < 15 lub H 1 : µ > 15

Prawdopodobieństwo i statystyka r.

Wykład 3 Hipotezy statystyczne

STATYSTYKA OPISOWA WYKŁAD 1 i 2

SIGMA KWADRAT LUBELSKI KONKURS STATYSTYCZNO- DEMOGRAFICZNY

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.

Testowanie hipotez statystycznych.

X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA

TESTY NORMALNOŚCI. ( Cecha X populacji ma rozkład normalny). Hipoteza alternatywna H1( Cecha X populacji nie ma rozkładu normalnego).

Estymacja przedziałowa:

Statystyka. Katarzyna Chudy Laskowska

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

(X i X) 2. n 1. X m S

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Wykład 11 ( ). Przedziały ufności dla średniej

MACIERZE STOCHASTYCZNE

Testowanie hipotez statystycznych.

Metoda łączona. Wykład 7 Dwie niezależne próby. Standardowy błąd dla różnicy dwóch średnich. Metoda zwykła (niełączona) n2 2

Estymacja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 7

ZSTA LMO Zadania na ćwiczenia

d wymiarowy wektor losowy Niech (Ω, S, P) przestrzeń probabilistyczna Definicja Odwzorowanie X: Ω R nazywamy 1-wymiarowym wektorem

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Prawdopodobieństwo i statystyka r.

STATYSTYKA MATEMATYCZNA

θx θ 1, dla 0 < x < 1, 0, poza tym,

Lista 5. Odp. 1. xf(x)dx = xdx = 1 2 E [X] = 1. Pr(X > 3/4) E [X] 3/4 = 2 3. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Twierdzenia graniczne:

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

µ = Test jest następujący: jeŝeli X > 0.01 to odrzucamy H. 0

POLITECHNIKA OPOLSKA

Estymacja parametrów populacji

Wykład 10 Testy jednorodności rozkładów

Wykład 11. a, b G a b = b a,

ZMIENNA LOSOWA I JEJ PARAMETRY -powtórzenie

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Testowanie hipotez statystycznych

STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH

Testowanie hipotez statystycznych

Prognozowanie na podstawie modelu ekonometrycznego

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Plan wykładu. Analiza danych Wykład 1: Statystyka opisowa. Literatura. Podstawowe pojęcia

Elementy modelowania matematycznego

( ) WŁASNOŚCI MACIERZY

Ćwiczenia rachunkowe TEST ZGODNOŚCI χ 2 PEARSONA ROZKŁAD GAUSSA

Wykład 11 Testowanie jednorodności

Wydział Matematyki. Testy zgodności. Wykład 03

Statystyka matematyczna. Wykład II. Estymacja punktowa

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Statystyka matematyczna. Wykład VI. Zesty zgodności

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Ekonometria. Weryfikacja modelu. Paweł Cibis 12 maja 2007

3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej

Podstawowe pojęcia. Próba losowa. Badanie próby losowej

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

O liczbach naturalnych, których suma równa się iloczynowi

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

Zadanie 1 Odp. Zadanie 2 Odp. Zadanie 3 Odp. Zadanie 4 Odp. Zadanie 5 Odp.

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Przykład 1 ceny mieszkań

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

16 Przedziały ufności

Prawdopodobieństwo i statystyka

Transkrypt:

TESTY LOSOWOŚCI Badaie losowości próby - test serii. W wielu zagadieiach wioskowaia statystyczego istotym założeiem jest losowość próby. Prostym testem do weryfikacji tej własości jest test serii. 1

Dla rozpatrywaego ciągu daych statystyczych obliczamy mediaę m e (wartość środkowa). Jeśli x 1 x... x dae uporządkowae to m e x1 1 x x dlaieparzystych dlaparzystych

Przykład. Dla daych (po uporządkowaiu),, 3, 3, 4, 5, 5, 5, 5 mediaą jest 4. Dla daych (po uporządkowaiu),,, 3, 3, 4, 5, 5, 5, 5 mediaą jest 3,5. 3

Elemetom próby przypisujemy symbol a lub b: a - gdy x i > m e, b - gdy x i < m e (elemetów x i = m e ie rozpatrujemy). Serie to podciągi złożoe z jedakowych symboli. 4

Rozpatrujemy hipotezy H 0 (elemety próby mają charakter losowy), H 1 (elemety próby ie mają charakteru losowego), Stosujemy statystykę: U = liczba serii 5

Zbiór krytyczy: K = (-; k 1 > < k ; ) gdzie k 1 odczytujemy z tablicy dla poziomu istotości / i liczb 1 oraz, gdzie k odczytujemy z tablicy dla poziomu istotości 1 - / i liczb 1 oraz, gdzie 1 - liczba symboli a, - liczba symboli b, Decyzje: Jeśli U K to H 0 odrzucamy, Jeśli U K to ie ma podstaw do odrzuceia H 0. 6

7 Uwaga. Gdy 1 lub jest większe od 0, to liczba serii ma w przybliżeiu rozkład 1) ( 1; 1 1 1 N Dla rozkładu rówomierego i bardzo dużych moża stosować rozkład ; N

Tablica rozkładu serii Tablica dla = 0,05: (tablica jest symetrycza) 1 3 4 5 6 7 8 9 10 11 1 13 14 15 16 17 18 19 0 5 6 3 3 7 3 3 3 8 3 3 3 4 4 9 3 3 4 4 5 5 10 3 3 4 5 5 5 6 11 3 4 4 5 5 6 6 7 1 3 4 4 5 6 6 7 7 7 13 3 4 5 5 6 6 7 7 8 8 14 3 4 5 5 6 7 7 8 8 9 9 15 3 3 4 5 6 6 7 7 8 8 9 9 10 16 3 4 4 5 6 6 7 8 8 9 9 10 10 11 17 3 4 4 5 6 7 7 8 9 9 10 10 11 11 11 18 3 4 5 5 6 7 8 8 9 9 10 10 11 11 1 1 19 3 4 5 6 6 7 8 8 9 10 10 11 11 1 1 13 13 0 3 4 5 6 6 7 8 9 9 10 10 1 1 13 13 13 13 14 8

1 4 Tablica rozkładu serii Tablica dla = 0,975: (tablica jest symetrycza) 3 4 5 6 7 8 9 10 11 1 13 14 15 16 17 18 19 0 3 5 6 4 5 7 8 5 5 7 8 9 6 5 7 8 9 10 7 5 7 9 10 11 1 8 5 7 9 10 11 1 13 9 5 7 9 11 1 13 13 14 10 5 7 9 11 1 13 14 15 15 11 5 7 9 11 1 13 14 15 16 16 1 5 7 9 11 1 13 15 15 16 17 18 13 5 7 9 11 13 14 15 16 17 18 18 19 14 5 7 9 11 13 14 15 16 17 18 19 19 0 15 5 7 9 11 13 14 15 17 17 18 19 0 1 1 16 5 7 9 11 13 15 16 17 18 19 0 0 1 17 5 7 9 11 13 15 16 17 18 19 0 1 3 4 18 5 7 9 11 13 15 16 17 18 19 0 1 3 4 4 5 19 5 7 9 11 13 15 16 17 19 0 1 3 4 5 5 6 0 5 7 9 11 13 15 16 17 19 0 1 3 4 4 5 6 6 7 9

Przykład W celu zbadaia rozkładu wydajości pracy zarejestrowao czas wykoaia detalu przez 15 wylosowaych pracowików i otrzymao wyiki (mi): 16, 0, 5, 34,, 33, 47, 30, 8, 19,, 40, 36, 31, 38. Sprawdzimy a poziomie istotości 0,05 hipotezę, że wybór próby był losowy. 10

Rozwiązaie. Wyzaczamy mediaę ( po uporządkowaiu daych iemalejąco) i otrzymujemy m e = 30. Kolejym daym przyporządkowujemy symbole a i b: 16 0 5 34 33 47 30 b b b a b a a - 8 19 40 36 31 38 b b b a a a a Liczba serii wyosi u = 6 Z tablic rozkładu serii odczytujemy K = (-; 3> < 1 ; ) Poieważ u K to ie ma podstaw do odrzuceia hipotezy H 0, zatem możemy sądzić, że próba ma charakter losowy. 11

Badaie losowości próby - ogóly test serii. Rozpatrzmy rodzię testów serii do badaia losowości. Ustalamy liczbę 0 < p < 1. Dla rozpatrywaego ciągu daych statystyczych obliczamy kwatyl x p (wartość dzieląca uporządkowae dae a części p% i (1 - p)%). Liczbę p azywamy rzędem kwatyla. Elemetom próby przypisujemy symbol a lub b: a - gdy x i > x p, b - gdy x i < x p (elemetów x i = x p ie rozpatrujemy). Serie to podciągi złożoe z jedakowych symboli. 1

Rozpatrujemy hipotezy H 0 (elemety próby mają charakter losowy), H 1 (elemety próby ie mają charakteru losowego), Stosujemy statystykę: R = liczba serii 13

Statystyka ta ma parametry: ER p1 p p 1 p, D R 4p1 p1 3p1 p p1 p3 10 p1 p, gdzie to długość badaego ciągu, a p to rząd kwatyla. Dla dużych statystyka R ER U D R jest zmieą losową o asymptotyczym rozkładzie ormalym N(0, 1). 14

Zbiór krytyczy: K = (-; -k> < k ; ) gdzie k odczytujemy z tablicy N(0, 1) dla poziomu istotości 1- /. Decyzje: Jeśli U K to H 0 odrzucamy, Jeśli U K to ie ma podstaw do odrzuceia H 0. 15

Uwaga Zgodość uzyskaej liczby serii poszczególych długości z rozkładem teoretyczym moża zbadać wykorzystując test zgodości chi-kwadrat. Po wyzaczeiu liczby wystąpień każdej z długości serii symboli a lub b w badaym ciągu obliczamy statystykę testową: U N k E k Ek k gdzie N k uzyskaa liczba serii długości k, k k E k k 3 p 1 p p 1 p wartość teoretycza liczby serii długości k w ciągu o długości, kwatyla rzędu p. Statystyka U ma w przybliżeiu rozkład o r 1 stopiach swobody, gdzie r jest liczbą długości serii, które zaobserwowao., 16

Hipoteza zerowa H 0 ( Ciąg ma charakter losowy). Hipoteza alteratywa H1( losowego). Poziom istotości. Ciąg ie ma charakteru Obliczamy wartość u statystyki U. Wyzaczamy zbiór krytyczy K k ; ), gdzie k wyzaczamy z tablicy rozkładu z r - 1 stopiami swobody. Y k P r 1, Podejmujemy decyzję: odrzucamy hipotezę H 0, gdy przyjmujemy hipotezę H 0, gdy u K u K 17

Test losowości Testowaie losowości geeratora ciągu biarego. Hipoteza zerowa H 0 ( Ciąg ma charakter losowy). Hipoteza alteratywa H1( losowego). Ciąg ie ma charakteru poziom istotości. Weryfikacja powyższych hipotez za pomocą testu przebiega astępująco: 1. Geerujemy długi biary ciąg losowy. Dzielimy go a bloki p. 4-bitowe. liczba bloków, > 80, k liczba możliwych wartości w bloku, (dla bloków -bitowych k = 4 liczb dwubitowych, dla bloków 4-bitowych k = 16 liczb czterobitowych) 18

1. Przyjmujemy, że p i k. 3. Wyzaczamy liczbę i wystąpień i tej wartości we wszystkich blokach, i = 1,,, k. k i i1 4. Obliczamy u k i1 ( i p p i i ) 1 k i1 p i i 5. Wyzaczamy zbiór krytyczy obustroy K 0 ; k1 k ; ) gdzie k 1,k wyzaczamy z tablicy rozkładu z k - 1 stopiami swobody., PY k k 1, Y k 1 1 P k 1 19

Podejmujemy decyzję: odrzucamy hipotezę H 0, gdy przyjmujemy hipotezę H 0, gdy u K u K Test pokerowy 4 bitowy. Hipoteza zerowa H 0 ( Ciąg ma charakter losowy). poziom istotości. Geerujemy długi biary ciąg losowy. Dzielimy go a bloki 4-bitowe. liczba bloków, > 80, k liczba możliwych wartości w bloku, dla bloków 4-bitowych k = 16 liczb czterobitowych) 1 Przyjmujemy, że p i 16. Wyzaczamy liczbę i wystąpień i tej wartości we wszystkich blokach, i = 1,,, 16. 16 i i1 0

Obliczamy u 16 16 i i1 6. Wyzaczamy zbiór krytyczy obustroy K 0 ; k1 k ; ) gdzie k 1,k wyzaczamy z tablicy rozkładu z k - 1 stopiami swobody. PY k 1 k1 1, P Y k 1 k, Podejmujemy decyzję: Nie ma podstaw do odrzuceia ciągu gdy k 1 u k 1

Wyzaczaie liczby jedyek w ciągu biarym Przykład. (test moobitowy) Wyzaczaie liczby jedyek w rówomierym ciągu biarym. Niech = 10000, poziom istotości = 0,01. H ( p 0,5), H ( p 0,5) 0 1 K ( ; k k ; ), ( k) 1 W 0,5 U 0,5(1 0,5) gdzie W średia liczba jedyek w ciągu. Wtedy k =,58, K ( ; k k ; ) = = ( ;,58,58 ; )

Aby test był pozytywy dla geeratora liczba jedyek k powia być w graicach k 0,5,58 10000 10000,58 0,5(1 0,5) Czyli od 487 do 518 Zadaie: wykoać powyższy przykład dla poziomu istotości = 0,001. Test etropii (Maurera) Geerujemy długi biary ciąg losowy. Dzielimy go a bloki L-bitowe (zwykle L = 8,..., 16). Q sekwecja iicjująca, K sekwecja testowa, Długość próbki N = (Q + K)L. Uwaga, L Q 5, K Q 8 zatem dla p. L = 8 Q 5 180 3

Statystyka testowa U L.Kowalski - Test losowości 1 K QK 1 Q log A A odległość -tego bloku od jego ostatiego wystąpieia (lub gdy blok występuje pierwszy raz), Stawiamy hipotezę: H 0 (etropia istota), Pożądaa jest istota etropia. Zbiór krytyczy K r 0 ; k1 k ; ) = Wyzaczaie k1 k : k1 E k, k E k ( k) 1 gdzie, dla poziomu istotości. V K K - długość sekwecji testowej Zestawieie wartości E, V dla przykładowych L. 4

L E V 8 7,1836655 3,38 9 8,1764476 3,311 10 9,173431 3,356 11 10,170033 3,384 1 11,1687649 3,401 13 1,1680703 3,410 14 13,167696 3,416 15 14,1674884 3,419 16 15,1673788 3,41 Nie ma podstaw do odrzuceia ciągu gdy k u 1 k 5

Testy losowości - testy kombiatorycze. Test permutacji. Hipoteza zerowa H 0 ( Ciąg ma charakter losowy). poziom istotości. Geerujemy ciąg losowy. Dzielimy go a bloki m- elemetowe. Przyporządkowujemy każdemu blokowi permutację m elemetową wg kolejości liczb w bloku (wg kolejości rosącej), Wyzaczamy prawdopodobieństwo teoretycze 1 permutacji ( p i m! ) przy założeiu H 0, 6

Badamy testem chi kwadrat zgodość zaobserwowaej liczby wystąpień poszczególych permutacji z rozkładem teoretyczym (rozkład jedostajy) Wyzaczamy zbiór krytyczy K k ; ), gdzie k wyzaczamy z tablicy rozkładu z m! - 1 stopiami swobody. Y k P m! 1, Podejmujemy decyzję: odrzucamy hipotezę H 0, gdy przyjmujemy hipotezę H 0, gdy u K u K 7

Dae: 69, 49, 19, 73, 68, 71, 97,,04, 4, 40, 73, 8, 36, 96, 10, 63, 9, 41, 37, 3, 1, 95, 16, 33, 40, 50, 3, 9, 31, 56, 59, 9, 13, 15, 60, 63, 67, 18, 10, 83, 67, 18, 08, 57, 1, 8, 54, 01, 37, 9, 81, 33, 4, 34, 8, 67, 70, 0, 85, 90, 35, 99, 71, 50, 94, 73, 64, 76, 19, 84, 54, 01, 7,, 40, 30, 53, 14, 41, 70 8