Statystyczne testy nieparametryczne



Podobne dokumenty
Statystyka Inżynierska

t - kwantyl rozkładu t-studenta rzędu p o f stopniach swobody

Ćwiczenie 3. H 1 : p p 0 H 3 : p > p 0. b) dla małej próby statystykę testową oblicza się za pomocą wzoru:

Matematyka ubezpieczeń majątkowych r. Zadanie 1. Rozważamy proces nadwyżki ubezpieczyciela z czasem dyskretnym postaci: n

X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

MIANO ROZTWORU TITRANTA. Analiza statystyczna wyników oznaczeń

Statystyka opisowa. () Statystyka opisowa 24 maja / 8

Matematyka ubezpieczeń majątkowych r. ma złożony rozkład Poissona. W tabeli poniżej podano rozkład prawdopodobieństwa ( )

KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1

Stanisław Cichocki Natalia Nehrebecka. Wykład 4

ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA

Porównanie dwu populacji

Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste

D:\materialy\Matematyka na GISIP I rok DOC\07 Pochodne\8A.DOC 2004-wrz-15, 17: Obliczanie granic funkcji w punkcie przy pomocy wzoru Taylora.

Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

PRZEDZIAŁY UFNOŚCI. Niech θ - nieznany parametr rozkładu cechy X. Niech α będzie liczbą z przedziału (0, 1).

DEA podstawowe modele

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

Estymacja przedziałowa

TESTY LOSOWOŚCI. Badanie losowości próby - test serii.

Stanisław Cichocki Natalia Nehrebecka. Wykład 3

Prawdopodobieństwo i statystyka r.

1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o

EKONOMETRIA. Liniowy model ekonometryczny (regresji) z jedną zmienną objaśniającą

21. CAŁKA KRZYWOLINIOWA NIESKIEROWANA. x = x(t), y = y(t), a < t < b,

Konspekty wykładów z ekonometrii

EKONOMETRIA wykład 2. Prof. dr hab. Eugeniusz Gatnar.

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.

STATYSTYKA I ANALIZA DANYCH

Testowanie hipotez. H 1 : µ 15 lub H 1 : µ < 15 lub H 1 : µ > 15

Sygnały pojęcie i klasyfikacja, metody opisu.

Statystyczny opis danych - parametry

Stanisław Cichocki Natalia Nehrebecka. Wykład 3

Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.

TRANZYSTORY POLOWE JFET I MOSFET

16 Przedziały ufności

Niepewności pomiarowe

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Statystyka i Opracowanie Danych. W7. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

H brak zgodności rozkładu z zakładanym

Funkcja generująca rozkład (p-two)

DYNAMICZNE MODELE EKONOMETRYCZNE

3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej

Alicja Ganczarek Akademia Ekonomiczna w Katowicach. Analiza niezależności przekroczeń VaR na wybranym segmencie rynku energii

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

STATYSTYKA OPISOWA PODSTAWOWE WZORY

MODELE MATEMATYCZNE W UBEZPIECZENIACH. 1. Renty

Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja

Miary rozproszenia. Miary położenia. Wariancja. Średnia. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.

Model Lesliego. Oznaczmy: 0 m i liczba potomstwa pojawiającego się co jednostkę czasu u osobnika z i-tej grupy wiekowej, i = 1,...

Wykład 11 ( ). Przedziały ufności dla średniej

ESTYMACJA PARAMETRÓW FUNKCJI REGRESJI METODĄ KLASYCZNĄ ORAZ METODAMI BOOTSTRAPOWYMI**

PODSTAWY BIOSTATYSTYKI ĆWICZENIA

Miary położenia. Miary rozproszenia. Średnia. Wariancja. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.

Metrologia: miary dokładności. dr inż. Paweł Zalewski Akademia Morska w Szczecinie

L.Kowalski zadania ze statystyki matematycznej-zestaw 3 ZADANIA - ZESTAW 3

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

ψ przedstawia zależność

Prawdopodobieństwo i statystyka r.

Wykład 6. Badanie dynamiki zjawisk

, gdzie b 4c 0 oraz n, m ( 2). 2 2 b b b b b c b x bx c x x c x x

1. Element nienaprawialny, badania niezawodności. Model matematyczny elementu - dodatnia zmienna losowa T, określająca czas życia elementu

Wytrzymałość śruby wysokość nakrętki

Ćwiczenia nr 5. TEMATYKA: Regresja liniowa dla prostej i płaszczyzny

Parametryczne Testy Istotności

Lista 6. Estymacja punktowa

Estymacja: Punktowa (ocena, błędy szacunku) Przedziałowa (przedział ufności)

Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)

ANALIZA PRZYCZYNOWOŚCI W ZAKRESIE ZALEŻNOŚCI NIELINIOWYCH. IMPLIKACJE FINANSOWE

1. Szereg niesezonowy 1.1. Opis szeregu

STATYSTYKA OPISOWA WYKŁAD 1 i 2

specyfikacji i estymacji modelu regresji progowej (ang. threshold regression).

Pobieranie próby. Rozkład χ 2

Wybrane litery alfabetu greckiego

STATYSTYKA OPISOWA PODSTAWOWE WZORY

θx θ 1, dla 0 < x < 1, 0, poza tym,

Metoda łączona. Wykład 7 Dwie niezależne próby. Standardowy błąd dla różnicy dwóch średnich. Metoda zwykła (niełączona) n2 2

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

Wykład 11 Testowanie jednorodności

C d u. Po podstawieniu prądu z pierwszego równania do równania drugiego i uporządkowaniu składników lewej strony uzyskuje się:

WYBRANE TESTY NIEOBCIĄŻONOŚCI MIAR RYZYKA NA PRZYKŁADZIE VALUE AT RISK

Statystyka Matematyczna Anna Janicka

Podprzestrzenie macierzowe

Statystyka matematyczna dla leśników


Klasyfikacja modeli. Metoda najmniejszych kwadratów

Estymacja przedziałowa - przedziały ufności

Wokół testu Studenta 1. Wprowadzenie Rozkłady prawdopodobieństwa występujące w testowaniu hipotez dotyczących rozkładów normalnych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).

(X i X) 2. n 1. X m S

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Projekt ze statystyki

Statystyka. Katarzyna Chudy Laskowska

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Statystyka Wzory I. Analiza struktury

Integracja zmiennych Zmienna y

Podprzestrzenie macierzowe

Transkrypt:

Saysycze esy ieparamerycze Tesami ieparameryczymi azywamy esy służące do weryfikaci hipoez ieparameryczych, hipoez iedoyczących warości iezaych paramerów populaci (choć czasem poęcie o ozacza hipoezy ie zakładaące rozkładu Normalego dla populaci). Ze względu a różorodość hipoez ieparameryczych, klasę esów ieparameryczych moża podzielić a asępuące podklasy: esy zgodości (z pewym rozkładem eoreyczym), w ym esy ormalości, esy edorodości, czyli zgodości dwóch (lub więce) rozkładów, esy iezależości, ie esy, w ym p. esy weryfikuące hipoezę, ze próba ma charaker losowy. W7-1 PDF creaed wih FiePri pdffacory Pro rial versio hp://www.fiepri.com

Badaie iezależości rozkładu dwu cech Cecha (X, Y) ma dwuwymiarowy, iezay rozkład Tes Chi-Kwadra iezależości Cecha (X, Y) ma dwuwymiarowy rozkład ciągły Współczyik korelaci ragowe Spearmaa Współczyik korelaci ragowe Kedalla Czy koleość obserwaci w próbie es losowa? es serii W7 - PDF creaed wih FiePri pdffacory Pro rial versio hp://www.fiepri.com

ZALEŻNOŚĆ MIĘDZY CECHAMI JAKOŚCIOWYMI /SKATEGORYZOWANYMI/ X, Y cechy obserwowae Próba: (X 1, Y 1 ),...(X k, Y m ) klasy cechy X klasy cechy Y 1... m 1 11 1... 1m 1... m k k1 k... km H 0 : Cechy X i Y są iezależe H 1 : Cechy X i Y są zależe W7-3 PDF creaed wih FiePri pdffacory Pro rial versio hp://www.fiepri.com

Tes Chi-kwadra (c ) iezależości k m ( i i ) emp i 1 1 i i liczba obserwaci realizuących i ą warość cechy X i -ą warość Y i eoreycza liczba obserwaci realizuących i ą warość cechy X i -ą warość Y (wg. rozkładów brzegowych dla każde z ych dwu cech) Jeśli i i i m 1 N i,, N k i 1 1 k i 1 emp> kry., o hipoezę H 0 odrzucamy. kry. α, v, gdzie v (k 1) (m 1) m i i, W7-4 PDF creaed wih FiePri pdffacory Pro rial versio hp://www.fiepri.com

Przykład: Badao dwie właściwości wędliy: związaie (słabo związaa, związaa, dobrze związaa) oraz smakowiość (dosaecza, dobra, bardzo dobra). Aalizę przeprowadzoo dla 60 baoów wędliy. Wyiki były asępuące: X- smakowiość Y 1 -słabo związaa Y - związaa Y 3 - dobrze związaa i. X 1 - dosaecza 9 5 3 17 X -dobra 4 1 6 X 3 -b. dobra 1 6 14 1. 14 3 3 60 Hipoeza badawcza i saysycza brzmi: H 0 : Smakowiość wędliy (X) ie zależy od sopia związaia (Y). cechy e są iezależe W7-5 PDF creaed wih FiePri pdffacory Pro rial versio hp://www.fiepri.com

Kosruuemy fukcę esową oparą a rozkładzie chi-kwadra. Dae (liczebości) eoreycze N i (eśli cechy są iezależe czyli P(A B)P(A)*P(B), o rozkłady brzegowe P(A) i P(B) wyzaczaą prawdopodobieńswo podklas P(A B)): X- smakowiość Y 1 -słabo związaa Y - związaa Y 3 - dobrze związaa i. X 1 - dosaecza 4 6,5 6,5 17 X -dobra 5 8,5 8,5 X 3 -b. dobra 5 8 8 1. 14 3 3 60 17 14 17 3 11 3.97, 1 6.5,..., 60 60 W7-6 PDF creaed wih FiePri pdffacory Pro rial versio hp://www.fiepri.com

1 3 60 33 8.05 (9 3.97) emp 3.97 19. (5 6.5) + 6.5 kry. α, v 0.05, 4 (14 8.05) +... + 8.05 9.49 Poieważ emp> kry., o hipoezę H 0 odrzucamy. Wyiki pozwalaą swierdzić, że smakowiość badae wędliy zależy od związaia e składików. Dla podiesieia walorów sesoryczych e wędliy ależy ak prowadzić proces echologiczy, aby uzyskać możliwie awiększe e związaie Moża wyzaczyć akże współczyik koygeci P, kóry przymue warość zero, gdy wysępue całkowia iezależość cech. W7-7 PDF creaed wih FiePri pdffacory Pro rial versio hp://www.fiepri.com

P N+ Dla aszego przykładu P N + 19. 60 + 19. 0.49 co świadczy o duże sile związku między rozważaymi cechami. W7-8 PDF creaed wih FiePri pdffacory Pro rial versio hp://www.fiepri.com

TESTY ZGODNOŚCI Hipoezy ego ypu doyczą zgodości rozkładu empiryczego z rozkładem określoym przez hipoezę lub zgodości (edorodości) rozkładów pewe cechy w kilku populacach bez określaia, o aki rozkład chodzi. Z ego eż powodu esy służące do weryfikaci akich hipoez azywamy esami zgodości (edorodości). Do aczęście sosowaych esów zgodości ależą: (chi-kwadra) Pearsoa λ (lambda) Kołmogorowa-Smirowa w Shapiro-Wilka W7-9 PDF creaed wih FiePri pdffacory Pro rial versio hp://www.fiepri.com

Niech hipoezą zerową będzie przypuszczeie, że cecha X ma w populaci rozkład określoy dysrybuaą F 0 (x): H 0 : F( x) F0 ( x) Saysyka k ( ) 1 wobec H1 : F( x) F0 ( x) przy prawdziwości H 0 ma asympoyczy rozkład z liczbą sopi swobody vk u 1. Wielkość p es eoreyczą (o zaczy, obliczoą przy założeiu prawdziwości esowae hipoezy H 0 ) liczebością w ym przedziale, k es liczbą przedziałów klasowych, a u liczbą paramerów populacyych, szacowaych z próby. W7-10 PDF creaed wih FiePri pdffacory Pro rial versio hp://www.fiepri.com

Warość empiryczą saysyki ( ) emp porówuemy z warością kryyczą oczyaą z ablic saysyczych α, v k u 1 wioskuąc aalogiczie ak w pozosałych hipoezach. Elemeem kluczowym przy wykorzysaiu saysyki Chi-kwadra es wielkość p P( x ( x ; x 1 )) kóra es eoreyczym (o zaczy, obserwowaym przy założeiu prawdziwości esowae hipoezy H 0 ) prawdopodobieńswem wysąpieia obserwaci w ym przedziale. W7-11 PDF creaed wih FiePri pdffacory Pro rial versio hp://www.fiepri.com

Przykład: Pracodawca przypuszcza, że liczba pracowików ieobecych w róże di ygodia ie es aka sama. W celu sprawdzeia swoego przypuszczeia obserwował, przez pewie okres, liczby pracowików ieobecych w koleych diach ygodia. Wyiki obserwaci zawiera abela: dzień ygodia liczba ieobecych poiedziałek 00 worek 160 środa 140 czwarek 140 piąek 100 Badaą cechą X es dzień, w kórym pracowik był ieobecy w pracy. Jes o cecha akościowa o warościach: poiedziałek, worek,, piąek. Hipoeza badawcza, że abseca pracowika es zależa od dia ygodia pracy, może być zapisaa przez egacę, o zaczy sugeruemy brak prefereci w opuszczaiu di. W7-1 PDF creaed wih FiePri pdffacory Pro rial versio hp://www.fiepri.com

Zapis saysyczy ego przypuszczeia pracodawcy ma posać hipoezy: H : cecha X ma rozkład: Po. Wk. Śro. Czw. Pk. 1/5 1/5 1/5 1/5 1/5 Do weryfikaci badae hipoezy sosuemy es chi kwadra zgodości, przymuąc α 0.05. Pomocicze obliczeia fukci esowe zawiera abela: i i eore. Po 00 148 Wk 160 148 Śro 140 148 Czw 140 148 Pk 100 148 suma 740 740 W7-13 PDF creaed wih FiePri pdffacory Pro rial versio hp://www.fiepri.com

Warość saysyki es wyzaczoa według formuły: emp ( (00 148) 148 ) +... + (100 148) 148 Poieważ warość kryycza 9. 49 α, v k u 1 0.05,5 0 1 0.05,4 35,68 zachodzi relaca emp > 0.05,4, czyli hipoezę o zgodości z określoym rozkładem odrzucamy. Ozacza o, że przypuszczeie pracodawcy o ierówomierym rozkładzie abseci w zakładzie pracy moża uzać za uzasadioe. W7-14 PDF creaed wih FiePri pdffacory Pro rial versio hp://www.fiepri.com

Tes c zgodości (edorodości) kilku rozkładów Obserwuemy ę samą cechę w kilku populacach. Ieresue as odpowiedź a pyaie, czy rozkłady e są akie same (co pociąga za sobą rówość wszyskich paramerów). Jeżeli dysrybuaę dae cechy w i e populaci ozaczymy ako F i, o hipoeza zerowa ma posać: H F F... 0 : 1 F k W7-15 PDF creaed wih FiePri pdffacory Pro rial versio hp://www.fiepri.com

Zasosowaie esu wymaga zesawieia próby w posaci abeli dwukierukowe. W edym kieruku umieszczamy poziomy dae cechy, w drugim populace. umer populaci klasy cechy X X 1 X... X r 1 11 1... 1r 1... r k k1 k... kr Saysyka esowa ma posać: emp k r i 1 1 ( ) i i i gdzie i i W7-16 PDF creaed wih FiePri pdffacory Pro rial versio hp://www.fiepri.com

i ozacza liczbę obserwaci reprezeuących i ą populacę i ą klasę cechy X. Z ideksem górym, es o odpowiedia liczebość eoreycza. Przy prawdziwości H 0 saysyka a ma rozkład Pearsoa z liczbą sopi swobody v(k 1)(r 1). Wioskowaie przebiega aalogiczie ak przy iych hipoezach. W7-17 PDF creaed wih FiePri pdffacory Pro rial versio hp://www.fiepri.com

przykład: We wszyskich 10 sklepach pewe sieci sklepów es akie samo zaporzebowaie a mleko o róże zawarości łuszczu. sklep 0,5%,0% 3,% 1 34 36 8 48 4 46 3 15 18 10 4 61 45 51 5 37 9 46 6 18 16 5 7 39 8 35 8 4 18 31 9 41 38 9 10 19 6 16 Warość saysyki emp wyosi 3,8. Powodue o, iż kryyczy poziom isoości (P-value) wyosi 16%. Nie ma podsaw, aby a poziomie isoości 5% odrzucić hipoezę o akim samym rozkładzie prefereci odośie zawarości łuszczu we wszyskich 10 sklepach W7-18 PDF creaed wih FiePri pdffacory Pro rial versio hp://www.fiepri.com