Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Podobne dokumenty
Weryfikacja hipotez statystycznych za pomocą testów statystycznych

1 Estymacja przedziałowa

Statystyka matematyczna dla leśników

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Wykład 3 Hipotezy statystyczne

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

Testowanie hipotez statystycznych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Testowanie hipotez statystycznych cd.

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

Wydział Matematyki. Testy zgodności. Wykład 03

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Testowanie hipotez statystycznych

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Statystyka matematyczna

Estymacja punktowa i przedziałowa

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Estymacja parametrów rozkładu cechy

Metody Statystyczne. Metody Statystyczne

Hipotezy statystyczne

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Zadania ze statystyki, cz.6

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Zawartość. Zawartość

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Hipotezy statystyczne

Rozkłady statystyk z próby. Statystyka

Statystyka matematyczna. Wykład VI. Zesty zgodności

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Testowanie hipotez statystycznych.

Wnioskowanie statystyczne. Statystyka w 5

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

Matematyka i statystyka matematyczna dla rolników w SGGW

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Weryfikacja hipotez statystycznych

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

WNIOSKOWANIE STATYSTYCZNE

Porównanie dwóch rozkładów normalnych

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Testowanie hipotez statystycznych.

Prawdopodobieństwo i rozkład normalny cd.

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

1 Podstawy rachunku prawdopodobieństwa

Elementy statystyki STA - Wykład 5

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

Statystyka matematyczna i ekonometria

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Spis treści 3 SPIS TREŚCI

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Porównanie wielu rozkładów normalnych

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Rozkłady statystyk z próby

Testy post-hoc. Wrocław, 6 czerwca 2016

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Prawdopodobieństwo i statystyka

Katedra Biotechnologii i Genetyki Zwierząt, Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Statystyczna analiza danych

Transkrypt:

Porównanie modeli statystycznych Monika Wawrzyniak Katarzyna Kociałkowska

Jaka jest miara podobieństwa? Aby porównywać rozkłady prawdopodobieństwa dwóch modeli statystycznych możemy użyć: metryki dywergencji testów

Kiedy dwa modele są różne, a kiedy podobne? Dwa modele są jednakowe wtedy i tylko wtedy, gdy metryka i dywergencja są równe zero. Dwa modele są podobne jeżeli wartość metryki oraz wartość dywergencji mieszczą się w ściśle zadanych przedziałach Dwa modele różnią się od siebie jeżeli wartość metryki oraz wartość dywergencji nie mieszczą się w zadanych przedziałach 3

METRYKI 4

Metryka Euklidesowa (odległość) Porównanie numeryczne n d A, B = y ia y i=1 ib 0.5 0.4 0.3 0. 0.1 4 6 8 5

Odległość Hellinger`a H P, Q = 1 f x g(x) dx = = 1 f x g x dx 6

DYWERGENCJE 7

Kullback - Leiber p x ln p(x) q(x) dx Jeffrey`s (p x q x )(ln p x ln q(x))dx Kagan`s 1 p x q(x) dx p(x) Ekspotencjalna p(x) ln p x ln q(x) dx Przykładowe dywergencje 8

NO TO MOŻE JAKIŚ PRZYKŁAD 9

N μ, σ = 1 σ π e x μ σ 0.30 0.5 0.0 0.15 0.10 N (.75, 1.3) N (.5, 1.6) 0.05 4 6 8 Kullback - Leiber p(x) ln p(x) dx 0,049 q(x) Jeffrey`s (p(x) q(x))(ln p(x) ln q(x))dx 0,116 Kagan`s 1 (p(x) q(x)) dx 0,58 p(x) Ekspotencjalna p(x)(ln p(x) ln q(x)) dx 0,076 10

Porównywanie do danych wzorcowych, czyli TESTY STATYSTYCZNE 11

TESTY PARAMETRYCZNE 1

Test istotności średniej Czy średnia wartość cechy w populacji (μ) wynosi tyle, co pewna dana z góry wartość (μ₀)? H₀ : μ = μ₀ H 1 : μ μ 0 lub H 1 : μ > μ 0 lub H 1 : μ < μ 0 Nieznane odchylenie, mała próba (n<30) t = m μ 0 μ n 1 gdzie: m - średnia z próby, μ - odchylenie standardowe z próby liczba stopni swobody ν = n-1 porównujemy z wartością krytyczną testu t α 13

Test istotności średniej- PRZYKŁAD Czy można powiedzieć że długość nazwiska w naszej grupie wynosi 7 liter (średnia długość w Polsce)? Stawiamy hipotezę zerową: H0: μ =7 wobec hipotezy alternatywnej: H1: μ 7 t obl = 7, 7,675818 19=0,3 Przyjmując α = 0.05 znajdujemy w tablicach dla 19 stopni swobody wartość krytyczną t=.093. Ponieważ t obl < t 0.05 stwierdzamy brak podstaw do odrzucenia hipotezy zerowej. 14

Test istotności dla dwóch średnich Czy średnia wartość cechy w populacji (m 1 ) wynosi tyle, co średnia wartość cechy innej w populacji (m )? H₀ : m 1 = m H 1 : m 1 m lub H 1 : m 1, > m lub H 1 : m 1 < m gdzie: m 1,m - średnie podanych populacji dla nieznanych odchyleń standardowych: u = m 1 m σ 1 n 1 + σ gdzie: n 1, n -liczebności prób. liczba stopni swobody ν = n 1 +n - porównujemy z wartością krytyczną testu t α n 15

Test istotności dla dwóch średnich- PRZYKŁAD Czy można powiedzieć że średnie dla obu prób są sobie równe? C1={,1,4,4} C={3,5,1,1,1} Stawiamy hipotezę zerową: H0: m 1 = m wobec hipotezy alternatywnej: H1: m 1 m u=0,34146 Przyjmując α = 0.05 znajdujemy w tablicach dla 8 stopni swobody wartość krytyczną t=,306. Ponieważ u < t 0.05 stwierdzamy brak podstaw do odrzucenia hipotezy zerowej. 16

Test istotności wariancji Czy wariancja cechy w populacji (σ ) wynosi tyle, co pewna dana z góry wartość (σ ₀)? H₀ : σ = σ ₀ H 1 : σ σ ₀ (1) lub H 1 : σ > σ ₀ () lub H 1 : σ < σ ₀ (3) mała próba (n<30) Χ = n σ σ o gdzie: σ -jest wariancją z próby, n- jest liczebnością próby. liczba stopni swobody ν = n-1 17

Test istotności wariancji Wartość krytyczną X kryt odczytujemy z tablic rozkładu chi-kwadrat Dla (1) dla poziomu istotności α Dla () dla poziomu istotności 1-α Dla (3) X kryt1dla poziomu istotności 1- α / oraz X krytdla poziomu istotności α / Obszar krytyczny: Dla (1) X > X kryt Dla () X <X kryt Dla (3) X kryt1<x <X kryt 18

Test istotności wariancji- PRZYKŁAD Czy można powiedzieć że wariancja długości nazwiska w naszej grupie wynosi 6 liter? Stawiamy hipotezę zerową: H0: σ =6 wobec hipotezy alternatywnej: H1: σ 6 Χ = 0 7,16 6 = 3,86667 Przyjmując α = 0.05 znajdujemy w tablicach dla 19 stopni swobody obszar krytyczny: 8.9065 <X < 3.853 Ponieważ 8.9065 <3,86667< 3.853 stwierdzamy brak podstaw do odrzucenia hipotezy zerowej. 19

Test dla dwóch wariancji Czy wariancja cechy w populacji (σ 1) wynosi tyle, co wariancja cech innej populacji (σ )? H₀ : σ 1 = σ 1 H 1 : σ 1 σ (1) lub H 1 : σ 1 > σ () lub H 1 : σ 1 < σ (3) mała próba (n<30), Test Fishera: F = n 1(n 1)σ 1 n (n 1 1)σ statystyka ta ma rozkład F Snedecora, liczba stopni swobody v 1 =n 1-1 i v =n -1 Dla testu jednostronnego F kryt1 =F(α,v1,v) Dla testu obustronnego F kryt1 =F(α/,v1,v) Druga wartość graniczna F kryt =1/F kryt1 0

Test dla dwóch wariancji-przykład Czy można powiedzieć, że wariancja dla pierwszej próby jest większa niż wariancja dla próby drugiej? C1={,1,4,4} C={3,5,1,1,1} Stawiamy hipotezę zerową: H0: σ 1 > σ wobec hipotezy alternatywnej: H1: σ 1 <= σ F=0,75806 Przyjmując α = 0.05 znajdujemy w tablicach dla v 1 =3 i v =5 stopni swobody: F kryt1 =5,409451 i F kryt =0,18486, stąd obszar krytyczny: 0,18486< F <5,409451 Ponieważ 0,18486<0,75806 <5,409451 stwierdzamy brak podstaw do odrzucenia hipotezy zerowej. 1

TESTY NIEPARAMETRYCZNE

Test jednorodności Weryfikują hipotezę o zgodności dwóch rozkładów empirycznych ze sobą (oba rozkłady pochodzą z tej samej populacji) Test k i i i i n n n n n n n n n n 1 1 1 1 1 1 1 1 ) ( 3

Test jednorodności - PRZYKŁAD Liczba wystąpienia samogłosek w danym tekście 0,019 Samogłoski tekst I tekst II I 7 1 Y 11 17 U 8 9 E 8 6 A 4 37 O 4 1 Razem 1 131 Czy dane pochodzą z tego samego rozkładu? ( 0,05; v k 1 6 1 5) 4,35 4

Dziękujemy 5