Regresja Analiza wariancji Regresja logistyczna. Regresja, Anova. Stanisław Jaworski. UM Zakład Profilaktyki...

Wielkość: px
Rozpocząć pokaz od strony:

Download "Regresja Analiza wariancji Regresja logistyczna. Regresja, Anova. Stanisław Jaworski. UM Zakład Profilaktyki..."

Transkrypt

1 UM Zakład Profilaktyki...

2 Model regresji prostoliniowej Model regresji wielokrotnej Przykład W pewnej klinice badano związek między aktywnością enzymów aminotransferazy a stężeniem amoniaku we krwi u chorych z ostrą niewydolnością wątroby. Pobrano losową próbę 10 pacjentów i otrzymano następujące wyniki: aktywność stężenie Pytania 1. Czy stężenie amoniaku we krwi można rozpoznać po poziomie aktywności enzymów? 2. Czy w przypadku istnienia takiej zależności, można ją przedstawić w zwartej formie, za pomocą funkcji?

3 Model regresji prostoliniowej Model regresji wielokrotnej danych > aktywność< c(430,470,520,570,630,690,740,770,800,780) > stężenie< c(31,33,36,39,42,47,51,54,55,57) Utworzenie wykresu > plot(aktywność,stężenie,pch=19,col= red ) Punkty na wykresie są wypełnione: pch=19. Punkty są koloru czerwonego: col= red.

4 Model regresji prostoliniowej Model regresji wielokrotnej Ocena wykresu daje pewne podstawy do przyjęcia następującej zależności: y i = β 0 + β 1 x i + e i, i = 1, 2,..., n, gdzie y i stężenie amoniaku we krwi i tego pacjenta x i aktywność enzymu w organiźmie i tego pacjenta e i błąd dopasowania

5 Model regresji prostoliniowej Model regresji wielokrotnej Metoda najmniejszych kwadratów Parametry β 0 oraz β 1 dobieramy tak, aby średniokwadratowy błąd dopasowania, mianowicie i e2 i = i (y i β 0 β 1 x i ) 2, był minimalny. W ten sposób dobrane parametry oznaczamy przez ˆβ 0 oraz ˆβ 1. Wyrażają się one wzorami i ˆβ 1 = (x i x)(y i ȳ) i (x i x i ) 2, ˆβ0 = ȳ ˆβ 1 x Wówczas gdzie (y i ˆβ 0 ˆβ 1 x i ) 2 = (1 r 2 ) i i r = i (x i x)(y i ȳ) i (y i ȳ i ) 2 i (x i x) 2 (y i ȳ) 2,

6 Model regresji prostoliniowej Model regresji wielokrotnej Współczynnik r jest miernikiem zależności liniowej.

7 Model regresji prostoliniowej Model regresji wielokrotnej Pytania 1. Czy stężenie amoniaku we krwi można rozpoznawać po aktywności enzymów? 2. W jaki sposób wyznaczyć ewentualną zależność liniową między stężeniem amoniaku a aktywnością enzymów? W jaki sposób sprawdzić wiarygodność tej zależności? Aby odpowiedzieć na postawione pytania, musimy przyjąć model statystyczny, który pozwoli nam na uogólnienie wniosków z próby 10 pacjentów na całą populację pacjentów.

8 Model Regresja Model regresji prostoliniowej Model regresji wielokrotnej Przyjmujemy następujący model: Y i = β 0 + β 1 x i + ε i, i = 1, 2,..., n, gdzie ε i, i = 1, 2,..., n, są niezależnymi zmiennymi losowymi o tym samym rozkładzie N(0, σ 2 ). Uwagi Y 1, Y 2,..., Y n, są zmiennymi losowymi, a y 1, y 2,..., y n są ich realizacjami. Model dotyczy rozkładu warunkowego Y X = x.

9 Model Regresja Model regresji prostoliniowej Model regresji wielokrotnej Przyjmujemy następujący model: Y i = β 0 + β 1 x i + ε i, i = 1, 2,..., n, gdzie ε i, i = 1, 2,..., n, są niezależnymi zmiennymi losowymi o tym samym rozkładzie N(0, σ 2 ). Uwagi Y 1, Y 2,..., Y n, są zmiennymi losowymi, a y 1, y 2,..., y n są ich realizacjami. Model dotyczy rozkładu warunkowego Y X = x.

10 Model regresji prostoliniowej Model regresji wielokrotnej Cztery hipotetyczne realizacje doświadczenia według modelu. Takich realizacji jest nieskończenie wiele. Wśród nich znajduje się rzeczywiste doświadczenie.

11 Estymacja Regresja Model regresji prostoliniowej Model regresji wielokrotnej ˆβ 0, ˆβ 1 są oszacowaniami punktowymi parametrów β 0 oraz β 1. Oszacowania przedziałowe dla β 0 oraz β 1 są postaci β 1 ( ˆβ 1 t(α; n 2)S β1, ˆβ 1 + t(α; n 2)S β1 ) β 0 ( ˆβ 0 t(α; n 2)S β0, ˆβ 0 + t(α; n 2)S β0 ) gdzie S 2 β 1 = S 2 varx, S 2 β 0 = S 2 varx ( varx n + x 2) S 2 = vary ˆβ 1 cov(x, y) n 2 = vary(1 r 2 ) n 2

12 Estymacja Regresja Model regresji prostoliniowej Model regresji wielokrotnej ˆβ 0, ˆβ 1 są oszacowaniami punktowymi parametrów β 0 oraz β 1. Oszacowania przedziałowe dla β 0 oraz β 1 są postaci β 1 ( ˆβ 1 t(α; n 2)S β1, ˆβ 1 + t(α; n 2)S β1 ) β 0 ( ˆβ 0 t(α; n 2)S β0, ˆβ 0 + t(α; n 2)S β0 ) gdzie S 2 β 1 = S 2 varx, S 2 β 0 = S 2 varx ( varx n + x 2) S 2 = vary ˆβ 1 cov(x, y) n 2 = vary(1 r 2 ) n 2

13 Weryfikacja hipotez Regresja Model regresji prostoliniowej Model regresji wielokrotnej H 0 : β 1 = 0 H 1 : β 1 0 Statystyka testowa F emp = ˆβ 1 2 Sβ 2 = ˆβ 1 cov(x, y) 1 S 2 Hipotezę odrzucamy, jeżeli F emp > F (α; 1, n 2). F (α; 1, n 2) jest wartością krytyczną rozkładu F.

14 Weryfikacja hipotez Regresja Model regresji prostoliniowej Model regresji wielokrotnej H 0 : β 1 = a H 1 : β 1 a Statystyka testowa t emp = ˆβ 1 a S β1 Hipotezę odrzucamy, jeżeli t emp > t(α; n 2). t(α; n 2) jest wartością krytyczną rozkładu t Studenta.

15 Model regresji prostoliniowej Model regresji wielokrotnej Obliczenia w R dla podanego przykładu

16 Model regresji prostoliniowej Model regresji wielokrotnej Obliczenia w R dla podanego przykładu Zgodnie z oznaczeniami oraz obliczeniami w R mamy: r 2 = , F emp = 452.5, t emp = (przy a = 0) Przedział ufności dla β 1 (na poziomie ufności 0.95): ( , ) Przedział ufności dla β 0 (na poziomie ufności 0.95): ( , )

17 Model regresji prostoliniowej Model regresji wielokrotnej Obszar ufności dla prostej regresji. Obszar predykcji

18 Obszar ufności dla prostej regresji Model regresji prostoliniowej Model regresji wielokrotnej Obszar ufności dla prostej regresji umożliwia nam wnioskowanie o wartościach średnich zmiennej Y jednocześnie dla wielu wybranych wartości zmiennej X. gdzie f (x) (ˆf (x) t(α; n 2)S Y ; ˆf (x) + t(α; n 2)S Y ) ˆf (x) = ˆβ 0 + ˆβ 1 x S 2 Y = S 2 ( 1 n + (x x)2 varx )

19 Obszar predykcji Regresja Model regresji prostoliniowej Model regresji wielokrotnej Obszar predykcji umożliwia nam wnioskowanie o wartościach zmiennej Y jednocześnie dla wielu wybranych wartości zmiennej X. Y (x) (ˆf (x) t(α; n 2)S Y (x) ; ˆf (x) + t(α; n 2)S Y (x) ) gdzie Y (x) oznacza wartość zmiennej Y dla wybranej wartości x zmiennej X oraz ( SY 2 (x) = S ) (x x)2 + n varx

20 Model regresji prostoliniowej Model regresji wielokrotnej Obliczenia w R dla podanego przykładu Zgodnie z oznaczeniami oraz obliczeniami w R mamy (na poziomie ufności 0.95): Przedział ufności dla f (635): ( , ) Przedział ufności dla Y (635): ( , )

21 Model Regresja Model regresji prostoliniowej Model regresji wielokrotnej Przyjmujemy następujący model: Y i = β 0 + β 1 x 1i β p x pi + ε i, i = 1, 2,..., n, gdzie ε i, i = 1, 2,..., n, są niezależnymi zmiennymi losowymi o tym samym rozkładzie N(0, σ 2 ). Uwagi Y 1, Y 2,..., Y n, są zmiennymi losowymi, a y 1, y 2,..., y n są ich realizacjami. Model dotyczy rozkładu warunkowego Y X = x.

22 Model Regresja Model regresji prostoliniowej Model regresji wielokrotnej Przyjmujemy następujący model: Y i = β 0 + β 1 x 1i β p x pi + ε i, i = 1, 2,..., n, gdzie ε i, i = 1, 2,..., n, są niezależnymi zmiennymi losowymi o tym samym rozkładzie N(0, σ 2 ). Uwagi Y 1, Y 2,..., Y n, są zmiennymi losowymi, a y 1, y 2,..., y n są ich realizacjami. Model dotyczy rozkładu warunkowego Y X = x.

23 Przykład Regresja Model regresji prostoliniowej Model regresji wielokrotnej Y (Poziom) liczba urodzin w przeliczeniu na 1000 osób X 1 (Status) status socjoekonomiczny (wypadkowa poziomu wykształcenia, oczekiwań życiowych, śmiertelności niemowląt, frakcji kobiet w wieku zatrudnionych poza rolnictwem, produktu krajowego brutto, frakcji populacji żyjącej w miastach) par X 2 (Planowanie) indeks planowania rodziny (odzwierciedla poziom zaangażowania państwa w planowanie struktury rodziny)

24 Model regresji prostoliniowej Model regresji wielokrotnej Kraj Status Planowanie Poziom Boliwia Brazylia Chile Kolumbia Kostaryka Kuba Dominikana Ekwador Salwador Gwatemala Haiti Honduras Jamajka Meksyk Nikaragua Panama Paragwaj Peru Trynidad i Tobago Wenezuela 91 7 Regresja, 11Anova

25 Model regresji prostoliniowej Model regresji wielokrotnej Przypuśćmy, że mamy dane wprowdzone do R pod zmienną dane: Chcemy za pomocą metody najmniejszych kwadratów oszacować współczynniki funkcji regresji. Przyjmujemy model regresji: gdzie i = 1,..., 20. Poziom i = β 0 + β 1 Status i + β 2 Planowanie i + ε i

26 Model regresji prostoliniowej Model regresji wielokrotnej Obliczenia w R dla podanego przykładu

27 Model regresji prostoliniowej Model regresji wielokrotnej Oszacowane współczynniki: ˆβ 0 = , ˆβ1 = , ˆβ2 = Zanim przejdziemy do zinterpretowania tych współczynników, należy sprawdzić, czy różnią się istotnie od zera. W pierwszej kolejności należy zweryfikować hipotezę H 0 : β 1 = β 2 = 0 Oznacza ona, że Status oraz Planowanie nie wyjaśniają różnic w Poziomie urodzeń w poszczególnych krajach. Do weryfikacji tej hipotezy stosujemy test F. Wartość tej statystyki wynosi F emp = Hipotezę odrzucamy (na poziomie istotności α), jeżeli F emp > F (α, p, n p 1). F (0.05, 2, 17) =

28 Model regresji prostoliniowej Model regresji wielokrotnej Ponieważ F emp = > F (0.05, 2, 17) (równoważnie p value = 1.132e 05 = < α = 0.05 ), hipotezę odrzucamy. Wniosek jest taki, że przynajmniej jedna cecha objaśniająca (Status, Planowanie) wyjaśnia poziom urodzeń w poszczególnych krajach. Następnym krokiem jest weryfikacja hipotez cząstkowych. Postać i tej hipotezy cząskowej jest następująca: H 0 : β i = 0 Na poziomie istotności α = 0.05 weryfikujemy tę hipotezę za pomocą testu t-studenta. Statystyka testowa ma postać: t emp = ˆβ i /S βi Jeżeli t emp > t(α, n p 1), to hipotezę odrzucamy.

29 Model regresji prostoliniowej Model regresji wielokrotnej W podanym przykładzie możemy na przykład zweryfikować hipotezę H 0 : β 1 = 0 mówiącą, że poziom urodzeń nie zależy od statusu socjoekonomicznego. Statystyka testowa dla tej hipotezy wynosi t emp = / = 2.507, a wartość krytyczna t(0.05, 17) = Hipotezę zatem odrzucamy na poziomie istotności 0.05.

30 Model regresji prostoliniowej Model regresji wielokrotnej Podobnie odrzucamy hipotezę H 0 : β 2 = 0 Wniosek końcowy jest taki, że za pomocą cech Status oraz Planowanie możemy lepiej wyjaśnić zmienność liczby urodzeń w badanych krajach, niż byśmy mogli to zrobić bez tych cech. Pewnym miernikiem dopasowania modelu do danych jest współczynik korelacji wielokrotnej R, który jest liczbą z przedziału (0, 1). W naszym przykładzie R 2 = Możemy teraz zinterpretować współczynniki funkcji regresji. Oszacowanie tej funkcji ma postać: Poziom = ˆβ 0 + ˆβ 1 Status + ˆβ 2 Planowanie

31 Model regresji prostoliniowej Model regresji wielokrotnej Poziom = Status Planowanie

32 Model regresji prostoliniowej Model regresji wielokrotnej Weryfikacja modelu za pomocą analizy reszt qqnorm(model$res,xlab= Kwantyle teoretyczne,ylab= Kwantyle empiryczne,main= Normalny wykres prawdopodobieństwa ) qqline(model$res)

33 Model regresji prostoliniowej Model regresji wielokrotnej plot(model$fitted.values,model$res,xlab= Wartości funkcji regresji,ylab= Reszty,col= red,pch=19) abline(h=0) qqline(model$res)

34 Model regresji prostoliniowej Model regresji wielokrotnej

35 Jednoczynnikowa analiza wariancji Testy analizy wariancji są podstawowym narzędziem statystyki eksperymentalnej. Służą do sprawdzenia, czy czynniki, których poziomy możemy z góry ustalić przed wykonaniem eksperymentu, wywierają istotny wpływ na kształtowanie średniej wartości badanej cechy mierzalnej. Czynniki te nazywamy esperymentalnymi. Badanym obietom (jednostkom eksperymentalnym) poziomy tych czynników przydzielane są losowo. Są czynniki, których poziomów nie możemy przydzielić losowo do obiektów, ponieważ stanowią ich integralną charakterystykę. Nazywamy je czynnikami klasyfikującymi. Poziomy każdego czynnika mogą być ustalone. Mówimy wtedy stałych czynnikach lub efektach. Poziomy czynnika mogą też być wylosowane z populacjii wszystkich możliwych poziomów. Wtedy są to czynniki losowe

36 Jednoczynnikowa analiza wariancji Testy analizy wariancji są podstawowym narzędziem statystyki eksperymentalnej. Służą do sprawdzenia, czy czynniki, których poziomy możemy z góry ustalić przed wykonaniem eksperymentu, wywierają istotny wpływ na kształtowanie średniej wartości badanej cechy mierzalnej. Czynniki te nazywamy esperymentalnymi. Badanym obietom (jednostkom eksperymentalnym) poziomy tych czynników przydzielane są losowo. Są czynniki, których poziomów nie możemy przydzielić losowo do obiektów, ponieważ stanowią ich integralną charakterystykę. Nazywamy je czynnikami klasyfikującymi. Poziomy każdego czynnika mogą być ustalone. Mówimy wtedy stałych czynnikach lub efektach. Poziomy czynnika mogą też być wylosowane z populacjii wszystkich możliwych poziomów. Wtedy są to czynniki losowe

37 Jednoczynnikowa analiza wariancji Testy analizy wariancji są podstawowym narzędziem statystyki eksperymentalnej. Służą do sprawdzenia, czy czynniki, których poziomy możemy z góry ustalić przed wykonaniem eksperymentu, wywierają istotny wpływ na kształtowanie średniej wartości badanej cechy mierzalnej. Czynniki te nazywamy esperymentalnymi. Badanym obietom (jednostkom eksperymentalnym) poziomy tych czynników przydzielane są losowo. Są czynniki, których poziomów nie możemy przydzielić losowo do obiektów, ponieważ stanowią ich integralną charakterystykę. Nazywamy je czynnikami klasyfikującymi. Poziomy każdego czynnika mogą być ustalone. Mówimy wtedy stałych czynnikach lub efektach. Poziomy czynnika mogą też być wylosowane z populacjii wszystkich możliwych poziomów. Wtedy są to czynniki losowe

38 Jednoczynnikowa analiza wariancji Testy analizy wariancji są podstawowym narzędziem statystyki eksperymentalnej. Służą do sprawdzenia, czy czynniki, których poziomy możemy z góry ustalić przed wykonaniem eksperymentu, wywierają istotny wpływ na kształtowanie średniej wartości badanej cechy mierzalnej. Czynniki te nazywamy esperymentalnymi. Badanym obietom (jednostkom eksperymentalnym) poziomy tych czynników przydzielane są losowo. Są czynniki, których poziomów nie możemy przydzielić losowo do obiektów, ponieważ stanowią ich integralną charakterystykę. Nazywamy je czynnikami klasyfikującymi. Poziomy każdego czynnika mogą być ustalone. Mówimy wtedy stałych czynnikach lub efektach. Poziomy czynnika mogą też być wylosowane z populacjii wszystkich możliwych poziomów. Wtedy są to czynniki losowe

39 Jednoczynnikowa analiza wariancji Testy analizy wariancji są podstawowym narzędziem statystyki eksperymentalnej. Służą do sprawdzenia, czy czynniki, których poziomy możemy z góry ustalić przed wykonaniem eksperymentu, wywierają istotny wpływ na kształtowanie średniej wartości badanej cechy mierzalnej. Czynniki te nazywamy esperymentalnymi. Badanym obietom (jednostkom eksperymentalnym) poziomy tych czynników przydzielane są losowo. Są czynniki, których poziomów nie możemy przydzielić losowo do obiektów, ponieważ stanowią ich integralną charakterystykę. Nazywamy je czynnikami klasyfikującymi. Poziomy każdego czynnika mogą być ustalone. Mówimy wtedy stałych czynnikach lub efektach. Poziomy czynnika mogą też być wylosowane z populacjii wszystkich możliwych poziomów. Wtedy są to czynniki losowe

40 Przykład Regresja Jednoczynnikowa analiza wariancji Mamy trzy ośrodki szkolenia. W każdym ośrodku przeprowadzamy dwa rodzaje szkolenia. Rodzaj szkolenia przydzielany jest losowo do każdego uczestnika programu (eksperymentu). Mamy zatem dwa czynniki: rodzaj szkolenia oraz ośrodek szkolenia. Jeżeli ten sam rodzaj szkolenia jest lepszy w każdym ośrodku, wniosek nasuwa się sam, ponieważ rodzaj szkolenia przydzielony został losowo do każdego uczestnika. W przypadku wykrycia różnic między ośrodkami, wniosek nie jest już tak oczywisty. Nie wiemy, czy uczestnicy programu są lepiej szkoleni w danym ośrodku, ponieważ jest on lepiej wyposażony, posiada lepszych wykładowców, uczestnicy są lepiej przygotowani, (czynnik edukacji możnaby wyeliminować poprzez rozlosowanie uczestników do ośrodków) Rodzaj szkolenia jest czynnikiem eksperymentalnym, a ośrodek szkolenia klasyfikującym.

41 Przykład Regresja Jednoczynnikowa analiza wariancji Mamy trzy ośrodki szkolenia. W każdym ośrodku przeprowadzamy dwa rodzaje szkolenia. Rodzaj szkolenia przydzielany jest losowo do każdego uczestnika programu (eksperymentu). Mamy zatem dwa czynniki: rodzaj szkolenia oraz ośrodek szkolenia. Jeżeli ten sam rodzaj szkolenia jest lepszy w każdym ośrodku, wniosek nasuwa się sam, ponieważ rodzaj szkolenia przydzielony został losowo do każdego uczestnika. W przypadku wykrycia różnic między ośrodkami, wniosek nie jest już tak oczywisty. Nie wiemy, czy uczestnicy programu są lepiej szkoleni w danym ośrodku, ponieważ jest on lepiej wyposażony, posiada lepszych wykładowców, uczestnicy są lepiej przygotowani, (czynnik edukacji możnaby wyeliminować poprzez rozlosowanie uczestników do ośrodków) Rodzaj szkolenia jest czynnikiem eksperymentalnym, a ośrodek szkolenia klasyfikującym.

42 Przykład Regresja Jednoczynnikowa analiza wariancji Mamy trzy ośrodki szkolenia. W każdym ośrodku przeprowadzamy dwa rodzaje szkolenia. Rodzaj szkolenia przydzielany jest losowo do każdego uczestnika programu (eksperymentu). Mamy zatem dwa czynniki: rodzaj szkolenia oraz ośrodek szkolenia. Jeżeli ten sam rodzaj szkolenia jest lepszy w każdym ośrodku, wniosek nasuwa się sam, ponieważ rodzaj szkolenia przydzielony został losowo do każdego uczestnika. W przypadku wykrycia różnic między ośrodkami, wniosek nie jest już tak oczywisty. Nie wiemy, czy uczestnicy programu są lepiej szkoleni w danym ośrodku, ponieważ jest on lepiej wyposażony, posiada lepszych wykładowców, uczestnicy są lepiej przygotowani, (czynnik edukacji możnaby wyeliminować poprzez rozlosowanie uczestników do ośrodków) Rodzaj szkolenia jest czynnikiem eksperymentalnym, a ośrodek szkolenia klasyfikującym.

43 Przykład Regresja Jednoczynnikowa analiza wariancji Mamy trzy ośrodki szkolenia. W każdym ośrodku przeprowadzamy dwa rodzaje szkolenia. Rodzaj szkolenia przydzielany jest losowo do każdego uczestnika programu (eksperymentu). Mamy zatem dwa czynniki: rodzaj szkolenia oraz ośrodek szkolenia. Jeżeli ten sam rodzaj szkolenia jest lepszy w każdym ośrodku, wniosek nasuwa się sam, ponieważ rodzaj szkolenia przydzielony został losowo do każdego uczestnika. W przypadku wykrycia różnic między ośrodkami, wniosek nie jest już tak oczywisty. Nie wiemy, czy uczestnicy programu są lepiej szkoleni w danym ośrodku, ponieważ jest on lepiej wyposażony, posiada lepszych wykładowców, uczestnicy są lepiej przygotowani, (czynnik edukacji możnaby wyeliminować poprzez rozlosowanie uczestników do ośrodków) Rodzaj szkolenia jest czynnikiem eksperymentalnym, a ośrodek szkolenia klasyfikującym.

44 Przykład Regresja Jednoczynnikowa analiza wariancji Mamy trzy ośrodki szkolenia. W każdym ośrodku przeprowadzamy dwa rodzaje szkolenia. Rodzaj szkolenia przydzielany jest losowo do każdego uczestnika programu (eksperymentu). Mamy zatem dwa czynniki: rodzaj szkolenia oraz ośrodek szkolenia. Jeżeli ten sam rodzaj szkolenia jest lepszy w każdym ośrodku, wniosek nasuwa się sam, ponieważ rodzaj szkolenia przydzielony został losowo do każdego uczestnika. W przypadku wykrycia różnic między ośrodkami, wniosek nie jest już tak oczywisty. Nie wiemy, czy uczestnicy programu są lepiej szkoleni w danym ośrodku, ponieważ jest on lepiej wyposażony, posiada lepszych wykładowców, uczestnicy są lepiej przygotowani, (czynnik edukacji możnaby wyeliminować poprzez rozlosowanie uczestników do ośrodków) Rodzaj szkolenia jest czynnikiem eksperymentalnym, a ośrodek szkolenia klasyfikującym.

45 Przykład Regresja Jednoczynnikowa analiza wariancji Mamy trzy ośrodki szkolenia. W każdym ośrodku przeprowadzamy dwa rodzaje szkolenia. Rodzaj szkolenia przydzielany jest losowo do każdego uczestnika programu (eksperymentu). Mamy zatem dwa czynniki: rodzaj szkolenia oraz ośrodek szkolenia. Jeżeli ten sam rodzaj szkolenia jest lepszy w każdym ośrodku, wniosek nasuwa się sam, ponieważ rodzaj szkolenia przydzielony został losowo do każdego uczestnika. W przypadku wykrycia różnic między ośrodkami, wniosek nie jest już tak oczywisty. Nie wiemy, czy uczestnicy programu są lepiej szkoleni w danym ośrodku, ponieważ jest on lepiej wyposażony, posiada lepszych wykładowców, uczestnicy są lepiej przygotowani, (czynnik edukacji możnaby wyeliminować poprzez rozlosowanie uczestników do ośrodków) Rodzaj szkolenia jest czynnikiem eksperymentalnym, a ośrodek szkolenia klasyfikującym.

46 Przykład Regresja Jednoczynnikowa analiza wariancji Mamy trzy ośrodki szkolenia. W każdym ośrodku przeprowadzamy dwa rodzaje szkolenia. Rodzaj szkolenia przydzielany jest losowo do każdego uczestnika programu (eksperymentu). Mamy zatem dwa czynniki: rodzaj szkolenia oraz ośrodek szkolenia. Jeżeli ten sam rodzaj szkolenia jest lepszy w każdym ośrodku, wniosek nasuwa się sam, ponieważ rodzaj szkolenia przydzielony został losowo do każdego uczestnika. W przypadku wykrycia różnic między ośrodkami, wniosek nie jest już tak oczywisty. Nie wiemy, czy uczestnicy programu są lepiej szkoleni w danym ośrodku, ponieważ jest on lepiej wyposażony, posiada lepszych wykładowców, uczestnicy są lepiej przygotowani, (czynnik edukacji możnaby wyeliminować poprzez rozlosowanie uczestników do ośrodków) Rodzaj szkolenia jest czynnikiem eksperymentalnym, a ośrodek szkolenia klasyfikującym.

47 Jednoczynnikowa analiza wariancji Jednoczynnikowa analiza wariancji Założenia 1. Na każdym poziomie czynnika rozkład prawdopodobieństwa badanej cechy mierzalnej a) jest normalny b) ma tę samą wariancję 2. Obserwacje są niezależne Cel 1. Zweryfikować, czy średnia wartość badanej cechy zależy od czynnika 2. Jeżeli średnia zależy od czynnika, zbadać w jaki sposób i jakie są tego konsekwencje

48 Jednoczynnikowa analiza wariancji Jednoczynnikowa analiza wariancji Założenia 1. Na każdym poziomie czynnika rozkład prawdopodobieństwa badanej cechy mierzalnej a) jest normalny b) ma tę samą wariancję 2. Obserwacje są niezależne Cel 1. Zweryfikować, czy średnia wartość badanej cechy zależy od czynnika 2. Jeżeli średnia zależy od czynnika, zbadać w jaki sposób i jakie są tego konsekwencje

49 Jednoczynnikowa analiza wariancji Jednoczynnikowa analiza wariancji Model Y ij = µ i + ε ij gdzie i jest indeksem określający poziom czynnika (i = 1,..., k; k liczba poziomów czynnika) j jest indeksem określającym numer powtórzenia obserwacji przy ustalonym poziomie czynnika (j = 1,..., n i; n i-liczba powtórzeń przy i tym poziomie czynnika) Y ij jest zmienną losową; przy i-tym poziomie czynnika oznacza j-tą wartość obserwowanej cechy µ i jest wartością oczekiwaną zmiennej Y ij; oznacza średnią wartość obserwowanej cechy przy i-tym poziomie czynnika ε ij jest zmienną losową o rozkładzie N(0, σ 2 ). O zmiennych losowych ε ij, i = 1,..., k, j = 1,..., n i, zakładamy, że są niezależne

50 Jednoczynnikowa analiza wariancji Jednoczynnikowa analiza wariancji Model Y ij = µ i + ε ij gdzie i jest indeksem określający poziom czynnika (i = 1,..., k; k liczba poziomów czynnika) j jest indeksem określającym numer powtórzenia obserwacji przy ustalonym poziomie czynnika (j = 1,..., n i; n i-liczba powtórzeń przy i tym poziomie czynnika) Y ij jest zmienną losową; przy i-tym poziomie czynnika oznacza j-tą wartość obserwowanej cechy µ i jest wartością oczekiwaną zmiennej Y ij; oznacza średnią wartość obserwowanej cechy przy i-tym poziomie czynnika ε ij jest zmienną losową o rozkładzie N(0, σ 2 ). O zmiennych losowych ε ij, i = 1,..., k, j = 1,..., n i, zakładamy, że są niezależne

51 Jednoczynnikowa analiza wariancji Jednoczynnikowa analiza wariancji Model Y ij = µ i + ε ij gdzie i jest indeksem określający poziom czynnika (i = 1,..., k; k liczba poziomów czynnika) j jest indeksem określającym numer powtórzenia obserwacji przy ustalonym poziomie czynnika (j = 1,..., n i; n i-liczba powtórzeń przy i tym poziomie czynnika) Y ij jest zmienną losową; przy i-tym poziomie czynnika oznacza j-tą wartość obserwowanej cechy µ i jest wartością oczekiwaną zmiennej Y ij; oznacza średnią wartość obserwowanej cechy przy i-tym poziomie czynnika ε ij jest zmienną losową o rozkładzie N(0, σ 2 ). O zmiennych losowych ε ij, i = 1,..., k, j = 1,..., n i, zakładamy, że są niezależne

52 Jednoczynnikowa analiza wariancji Jednoczynnikowa analiza wariancji Model Y ij = µ i + ε ij gdzie i jest indeksem określający poziom czynnika (i = 1,..., k; k liczba poziomów czynnika) j jest indeksem określającym numer powtórzenia obserwacji przy ustalonym poziomie czynnika (j = 1,..., n i; n i-liczba powtórzeń przy i tym poziomie czynnika) Y ij jest zmienną losową; przy i-tym poziomie czynnika oznacza j-tą wartość obserwowanej cechy µ i jest wartością oczekiwaną zmiennej Y ij; oznacza średnią wartość obserwowanej cechy przy i-tym poziomie czynnika ε ij jest zmienną losową o rozkładzie N(0, σ 2 ). O zmiennych losowych ε ij, i = 1,..., k, j = 1,..., n i, zakładamy, że są niezależne

53 Jednoczynnikowa analiza wariancji Jednoczynnikowa analiza wariancji Model Y ij = µ i + ε ij gdzie i jest indeksem określający poziom czynnika (i = 1,..., k; k liczba poziomów czynnika) j jest indeksem określającym numer powtórzenia obserwacji przy ustalonym poziomie czynnika (j = 1,..., n i; n i-liczba powtórzeń przy i tym poziomie czynnika) Y ij jest zmienną losową; przy i-tym poziomie czynnika oznacza j-tą wartość obserwowanej cechy µ i jest wartością oczekiwaną zmiennej Y ij; oznacza średnią wartość obserwowanej cechy przy i-tym poziomie czynnika ε ij jest zmienną losową o rozkładzie N(0, σ 2 ). O zmiennych losowych ε ij, i = 1,..., k, j = 1,..., n i, zakładamy, że są niezależne

54 Jednoczynnikowa analiza wariancji Jednoczynnikowa analiza wariancji Model Y ij = µ i + ε ij gdzie i jest indeksem określający poziom czynnika (i = 1,..., k; k liczba poziomów czynnika) j jest indeksem określającym numer powtórzenia obserwacji przy ustalonym poziomie czynnika (j = 1,..., n i; n i-liczba powtórzeń przy i tym poziomie czynnika) Y ij jest zmienną losową; przy i-tym poziomie czynnika oznacza j-tą wartość obserwowanej cechy µ i jest wartością oczekiwaną zmiennej Y ij; oznacza średnią wartość obserwowanej cechy przy i-tym poziomie czynnika ε ij jest zmienną losową o rozkładzie N(0, σ 2 ). O zmiennych losowych ε ij, i = 1,..., k, j = 1,..., n i, zakładamy, że są niezależne

55 Jednoczynnikowa analiza wariancji Zatem Y ij N(µ i, σ 2 ), i = 1,..., k, j = 1,..., n i, są niezależnymi zmiennymi losowymi Porównanie wartości średnich Test F (poziom istotności α) Statystyka testowa H 0 : µ 1 =... = µ k F emp = S 2 a S 2 e Jeżeli F emp > F (α; k 1, N k), to hipotezę H 0 : µ 1 = = µ k odrzucamy. Wniosek praktyczny: przynajmniej jedna ze średnich µ 1,..., µ k jest inna od pozostałych

56 Jednoczynnikowa analiza wariancji Podział całkowitej sumy kwadratów Y ij Ȳ.. }{{} zmienność całkowita = Ȳi. }{{ Ȳ.. + Y } ij }{{ Ȳi. } zmienność zmienność średnich wokół średniej (Y ij Ȳ.. ) 2 = n i (Ȳ i. Ȳ.. ) 2 i j i }{{}}{{} SST SSTR SST całkowita suma kwadratów SSTR suma kwadratów dla czynnika SSE suma kwadratów reszt + i S 2 a = SSTR/(k 1), S 2 e = SSE/(N k), N = i n i (Y ij Ȳ i. ) 2 j } {{ } SSE

57 Jednoczynnikowa analiza wariancji Grupy jednorodne podzbiory średnich, które można uznać za takie same Procedury porównań wielokrotnych postępowanie statystyczne zmierzające do podzielenia zbioru średnich na grupy jednorodne Procedury: Tukeya, Scheffégo, Bonfferroniego, Duncana, Newmana Kuelsa i inne. Ogólna idea procedur porównań wielokrotnych (n 1 = = n k ) NIR najmniejsza istotna różnica Jeżeli Ȳ i Ȳ j < NIR, to uznajemy, że µ i = µ j. Jeżeli Ȳi Ȳj < NIR Ȳ i Ȳ l < NIR Ȳ l Ȳ j < NIR, to uznajemy, że µ i = µ j = µ l. Badając w ten sposób wszystkie pary średnich próbkowych otrzymujemy podział zbioru średnich na grupy jednorodne.

58 Jednoczynnikowa analiza wariancji Procedura Tukeya Założenie: n 1 = = n k = n NIR = t(α; k, N k)s e 1 n t(α; k, N k) wartość krytyczna studentyzowanego rozstępu Przypadek nierównolicznych prób Jedna z modyfikacji procedury Tukeya ( 1 1 NIR ij = t(α; k, N k)s e + 1 ) 2 n i n j

59 Regresja Przykład: badania prospektywne Przykład: badania retrospektywne Rozważmy dwuwartościową zmienną: 1 choroba wystąpiła, 0 choroba nie wystąpiła. Oznaczmy ją przez D (na przykład: choroba wieńcowa). Przedmiotem zainteresowania jest dwuwartościowa zmienna, któr określa grupę ryzyka: 1 jest w grupie ryzyka, 0 nie ma w grupie ryzyka. Oznaczmy ją przez E (na przykład: palenie papierosów). Zauważmy, że aby zbadać związek grupy ryzyka (palaczy) z chorobą (chorobą wieńcową), często musimy brać pod uwagę dodatkowe charakterystyki takie, jak wiek C 1, rasa C 2 czy płeć C 3. Te charakterystyki nie interesują nas w sposób bezpośredni. Są to tak zwane zmienne kontrolne. Zmienną E (ekspozycja) razem ze zmiennymi kontrolnymi C 1, C 2, C 3 nazywamy zmiennymi NIEZALEŻNYMI, a zmienną D nazywamy zmienną ZALEŻNĄ. (E, C 1, C 2, C 3 ) D }{{} niezależne

60 Regresja Przykład: badania prospektywne Przykład: badania retrospektywne Rozważmy dwuwartościową zmienną: 1 choroba wystąpiła, 0 choroba nie wystąpiła. Oznaczmy ją przez D (na przykład: choroba wieńcowa). Przedmiotem zainteresowania jest dwuwartościowa zmienna, któr określa grupę ryzyka: 1 jest w grupie ryzyka, 0 nie ma w grupie ryzyka. Oznaczmy ją przez E (na przykład: palenie papierosów). Zauważmy, że aby zbadać związek grupy ryzyka (palaczy) z chorobą (chorobą wieńcową), często musimy brać pod uwagę dodatkowe charakterystyki takie, jak wiek C 1, rasa C 2 czy płeć C 3. Te charakterystyki nie interesują nas w sposób bezpośredni. Są to tak zwane zmienne kontrolne. Zmienną E (ekspozycja) razem ze zmiennymi kontrolnymi C 1, C 2, C 3 nazywamy zmiennymi NIEZALEŻNYMI, a zmienną D nazywamy zmienną ZALEŻNĄ. (E, C 1, C 2, C 3 ) D }{{} niezależne

61 Regresja Przykład: badania prospektywne Przykład: badania retrospektywne Rozważmy dwuwartościową zmienną: 1 choroba wystąpiła, 0 choroba nie wystąpiła. Oznaczmy ją przez D (na przykład: choroba wieńcowa). Przedmiotem zainteresowania jest dwuwartościowa zmienna, któr określa grupę ryzyka: 1 jest w grupie ryzyka, 0 nie ma w grupie ryzyka. Oznaczmy ją przez E (na przykład: palenie papierosów). Zauważmy, że aby zbadać związek grupy ryzyka (palaczy) z chorobą (chorobą wieńcową), często musimy brać pod uwagę dodatkowe charakterystyki takie, jak wiek C 1, rasa C 2 czy płeć C 3. Te charakterystyki nie interesują nas w sposób bezpośredni. Są to tak zwane zmienne kontrolne. Zmienną E (ekspozycja) razem ze zmiennymi kontrolnymi C 1, C 2, C 3 nazywamy zmiennymi NIEZALEŻNYMI, a zmienną D nazywamy zmienną ZALEŻNĄ. (E, C 1, C 2, C 3 ) D }{{} niezależne

62 Regresja Przykład: badania prospektywne Przykład: badania retrospektywne Rozważmy dwuwartościową zmienną: 1 choroba wystąpiła, 0 choroba nie wystąpiła. Oznaczmy ją przez D (na przykład: choroba wieńcowa). Przedmiotem zainteresowania jest dwuwartościowa zmienna, któr określa grupę ryzyka: 1 jest w grupie ryzyka, 0 nie ma w grupie ryzyka. Oznaczmy ją przez E (na przykład: palenie papierosów). Zauważmy, że aby zbadać związek grupy ryzyka (palaczy) z chorobą (chorobą wieńcową), często musimy brać pod uwagę dodatkowe charakterystyki takie, jak wiek C 1, rasa C 2 czy płeć C 3. Te charakterystyki nie interesują nas w sposób bezpośredni. Są to tak zwane zmienne kontrolne. Zmienną E (ekspozycja) razem ze zmiennymi kontrolnymi C 1, C 2, C 3 nazywamy zmiennymi NIEZALEŻNYMI, a zmienną D nazywamy zmienną ZALEŻNĄ. (E, C 1, C 2, C 3 ) D }{{} niezależne

63 Funkcja logistyczna f (z) = 1 1+e z Przykład: badania prospektywne Przykład: badania retrospektywne Ryzyko wystąpienia choroby chcemy wyrazić za pomocą prawdopodobieństwa. Prawdopodobieństwo jest wartością z przedziału (0,1). W naszym przypadku chcemy uzależnić je od zmiennych niezależnych. Argument z reprezentuje mi zmienne niezależne, a f (z) ryzyko wystąpienia choroby.

64 Model Regresja Przykład: badania prospektywne Przykład: badania retrospektywne Podstawiamy Otrzymujemy z = β 0 + β 1 C 1 + β 2 C 2 + β 3 C 3 + β 4 E P(D = 1 C 1, C 2, C 3, E) = e (β0+β1c1+β2c2+β3c3+β4e)

65 Przykład 1 Regresja Przykład: badania prospektywne Przykład: badania retrospektywne D = wystąpienie choroby wieńcowej (0 lub 1) E = poziom katecholamin (0 - niski, 1 - wysoki) C 1 = wiek (ciągła) C 2 = wynik elektrokardiogramu (0 - w normie, 1 - poza normą) n = 609 liczba badanych kobiet Czas obserwacji = 9 lat (E, C 1, C 2 ) D Czas: T 0 T 1 Wynik estymacji (z = β 0 + β 1 C 1 + β 2 C 2 + β 3 E): ˆβ 0 = 3.911, ˆβ1 = 0.029, ˆβ2 = 0.342, ˆβ3 = 0.652

66 Przykład, cd Regresja Przykład: badania prospektywne Przykład: badania retrospektywne Chcemy wykorzystać wyniki estymacji w celu oszacowania ryzyka wystąpienia choroby wieńcowej u osób: a) o wysokim poziomie katecholamin w wieku 40 lat, których elektrokardiogram nie wykazał odstępstw od normy E = 1, C 1 = 40, C 2 = 0 b) o niskim poziomie katecholamin w wieku 40 lat, których elektrokardiogram nie wykazał odstępstw od normy E = 0, C 1 = 40, C 2 = 0

67 Przykład, cd Regresja Przykład: badania prospektywne Przykład: badania retrospektywne ad a) 1 ˆP(D = 1 C 1 = 40, C 2 = 0, E = 1) = 1 + e ( (40) (0) (1)) = ad b) 1 ˆP(D = 1 C 1 = 40, C 2 = 0, E = 0) = 1 + e ( (40) (0) (0)) = RR = ˆP(D = 1 C 1 = 40, C 2 = 0, E = 1) ˆP(D = 1 C 1 = 40, C 2 = 0, E = 0) = 1.82

68 Przykład 2 Regresja Przykład: badania prospektywne Przykład: badania retrospektywne W badaniach retrospektywnych nad przypuszczalnym znaczeniem grupy krwi w chorobie wrzodowej układu pokarmowego zebrano dane: Choroba wrzodowa Grupa kontrolna Grupa O Grupa A Grupa O Grupa A Londyn Manchester Newcastle Celem badań jest sprawdzenie, czy ryzyko choroby wrzodowej zależy od grupy krwi. Zatem za zmienną zależną powinniśmy przyjąć występowanie choroby wrzodowej, a za niezależną grupę krwi. Oznacza to, że zbierając dane, powinniśmy wylosować osoby z każdą grupą krwi, a następnie po ustalonym czasie zliczyć osoby z chorobą i bez choroby wrzodowej: ( ) Miasto, Grupa krwi Choroba Czas: T 0 T 1

69 Przykład, cd. Regresja Przykład: badania prospektywne Przykład: badania retrospektywne Poręczniej jest zebrać dane odwrotnie: ( ) Choroba Miasto, Grupa krwi najpierw wybieramy osoby spośród chorych oraz zdrowych, a następnie zliczamy osoby z grupą krwi O oraz A. Jeżeli nie kontrolujemy, miejsca zamieszkania osoby, zmienna Miasto ma charakter losowy i mamy powyższy schemat. Przy wyborze osób z konkretnych miast mamy schemat: Miasto, Choroba Grupa krwi (!) Nie możemy oszacować w sposób bezpośredni ryzyka choroby wrzodowej, ponieważ liczba chorych w stosunku do zdrowych jest z góry ustalona i nie odzwierciedla rozkładu liczby chorych osób w populacji osób chorych i zdrowych. Zatem nie możemy bezpośrednio oszacowć prawdopodobieństwa. P(Choroba Grupa krwi, Miasto)

70 Przykład, cd. Regresja Przykład: badania prospektywne Przykład: badania retrospektywne Możemy za to oszacować P(Grupa krwi Choroba, Miasto), Przyjmijmy Nazwa cechy Grupa krwi Choroba Miasto Przyjmowane wartości A, O Tak, Nie Londyn, Manchester, Newcastle Przykłady zapisu: P(A Tak, Londyn), P(O Tak, Londyn), P(A Nie, Newcastle)

71 Przykład: badania prospektywne Przykład: badania retrospektywne Przyjmujemy model P(A Choroba, Miasto) = e z z = β 0 + β 1 L(Choroba = Tak) + β 2 L(Miasto = Manchester) + + β 3 L(Miasto = Newcastle) Przykłady L(PRAWDA) = 1 = 1 L(FAŁSZ) 1 P(A Tak, Londyn) = 1 + e (β0+β1) 1 P(A Nie, Manchester) = 1 + e (β0+β2) P(O Tak, Londyn) = 1 P(A Tak, Londyn) = e (β0+β1)

72 Przykład: badania prospektywne Przykład: badania retrospektywne Obliczenia w R:

73 Przykład: badania prospektywne Przykład: badania retrospektywne Obliczenia w R: ˆβ 0 = , ˆβ1 = , ˆβ2 = , ˆβ3 =

74 Przykład: badania prospektywne Przykład: badania retrospektywne Znaczenie oszacowanych parametrów. Można pokazać, że (dla każdego Miasta) ( / ) P(A Tak, Miasto) P(A Nie, Miasto) ln P(O Tak, Miasto) P(O Nie, Miasto) = β 1 Zatem mamy następujący iloraz szans: / P(A Tak, Miasto) P(A Nie, Miasto) OR = P(O Tak, Miasto) P(O Nie, Miasto) = eβ1

75 Przykład: badania prospektywne Przykład: badania retrospektywne Można pokazać: OR = = = / P(A Tak, Miasto) P(A Nie, Miasto) P(O Tak, Miasto) P(O Nie, Miasto) = / P(Tak A, Miasto) P(Nie A, Miasto) P(Tak O, Miasto) P(Nie O, Miasto) = / P(Tak A, Miasto) P(Tak O, Miasto) P(Nie A, Miasto) P(Nie O, Miasto) Oznacza to, że iloraz szans w badaniu retrospektywnym jest identyczny z ilorazem szans w badaniu prospektywnym. Przyjmując RR = P(Tak A, Miasto) P(Tak O, Miasto) oraz P(Nie A, Miasto) P(Nie O, Miasto) 1 otrzymujemy RR OR

76 Przykład: badania prospektywne Przykład: badania retrospektywne Otrzymane przybliżenia jest realne, jeżeli procentowo jest bardzo mało ludzi chorych na wrzody układu pokarmowego. Obliczenia: e ˆβ 1 = e Wnioski: 1. Ryzyko choroby wrzodowej jest większe u osób z grupą krwi O. 2. Ryzyko choroby wrzodowej u osoby z grupą A jest o ok. 30% mniejsze niż u osoby z grupą O.

Porównanie wielu rozkładów normalnych

Porównanie wielu rozkładów normalnych Porównanie wielu rozkładów normalnych Założenia:. X i N(µ i, σi 2 ), i =,..., k 2. X,..., X k są niezależne Czy µ = = µ k? Czy σ 2 = = σ 2 k? Próby: X i,..., X ini, i =,..., k X i, varx i, s 2 i = varx

Bardziej szczegółowo

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,

Bardziej szczegółowo

Estymacja parametrów rozkładu cechy

Estymacja parametrów rozkładu cechy Estymacja parametrów rozkładu cechy Estymujemy parametr θ rozkładu cechy X Próba: X 1, X 2,..., X n Estymator punktowy jest funkcją próby ˆθ = ˆθX 1, X 2,..., X n przybliżającą wartość parametru θ Przedział

Bardziej szczegółowo

Porównanie dwóch rozkładów normalnych

Porównanie dwóch rozkładów normalnych Porównanie dwóch rozkładów normalnych Założenia: 1. X 1 N(µ 1, σ 2 1), X 2 N(µ 2, σ 2 2) 2. X 1, X 2 są niezależne Ocena µ 1 µ 2 oraz σ 2 1/σ 2 2. Próby: X 11,..., X 1n1 ; X 21,..., X 2n2 X 1, varx 1,

Bardziej szczegółowo

hipotez statystycznych

hipotez statystycznych Weryfikacja hipotez statystycznych Przykład. Producent pewnych detali twierdzi, że wadliwość jego produkcji nie przekracza 2%. Odbiorca pewnej partii tego produktu chce sprawdzić, czy może wierzyć producentowi.

Bardziej szczegółowo

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...

Bardziej szczegółowo

Elementy statystyki STA - Wykład 5

Elementy statystyki STA - Wykład 5 STA - Wykład 5 Wydział Matematyki i Informatyki Uniwersytet im. Adama Mickiewicza 1 ANOVA 2 Model jednoczynnikowej analizy wariancji Na model jednoczynnikowej analizy wariancji możemy traktować jako uogólnienie

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Analiza wariancji. dr Janusz Górczyński

Analiza wariancji. dr Janusz Górczyński Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik

Bardziej szczegółowo

Stosowana Analiza Regresji

Stosowana Analiza Regresji prostej Stosowana Wykład I 5 Października 2011 1 / 29 prostej Przykład Dane trees - wyniki pomiarów objętości (Volume), średnicy (Girth) i wysokości (Height) pni drzew. Interesuje nas zależność (o ile

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie

Bardziej szczegółowo

Szkice rozwiązań z R:

Szkice rozwiązań z R: Szkice rozwiązań z R: Zadanie 1. Założono doświadczenie farmakologiczne. Obserwowano przyrost wagi ciała (przyrost [gram]) przy zadanych dawkach trzech preparatów (dawka.a, dawka.b, dawka.c). Obiektami

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Bioinformatyka Wykład 4 Wrocław, 17 października 2011 Temat. Weryfikacja hipotez statystycznych dotyczących wartości oczekiwanej w dwóch populacjach o rozkładach normalnych. Model 3. Porównanie średnich

Bardziej szczegółowo

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ Dana jest populacja generalna, w której dwuwymiarowa cecha (zmienna losowa) (X, Y ) ma pewien dwuwymiarowy rozk lad. Miara korelacji liniowej dla zmiennych (X, Y

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Przykład. Producent pewnych detali twierdzi, że wadliwość jego produkcji nie przekracza 2%. Odbiorca pewnej partii tego produktu chce sprawdzić, czy może wierzyć producentowi.

Bardziej szczegółowo

1 Weryfikacja hipotez statystycznych

1 Weryfikacja hipotez statystycznych Spis treści Spis treści 1 Weryfikacja hipotez statystycznych 1 1.1 Pojęcia................................ 1 2 Porównania z normami 3 2.1 Wstęp................................ 3 2.2 Porównanie z normami:

Bardziej szczegółowo

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Spis treści Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Romuald Kotowski Katedra Informatyki Stosowanej PJWSTK 2009 Spis treści Spis treści 1 Wstęp Bardzo często interesujący

Bardziej szczegółowo

Rozdział 8. Regresja. Definiowanie modelu

Rozdział 8. Regresja. Definiowanie modelu Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność

Bardziej szczegółowo

JEDNOCZYNNIKOWA ANALIZA WARIANCJI, ANOVA

JEDNOCZYNNIKOWA ANALIZA WARIANCJI, ANOVA JEDNOCZYNNIKOWA ANALIZA WARIANCJI, ANOVA 1 Obserwowana (badana) cecha Y Czynnik wpływający na Y (badany) A A i i ty poziom czynnika A a liczba poziomów (j=1..a), n i liczba powtórzeń w i tej populacji

Bardziej szczegółowo

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Analiza zależności cech ilościowych regresja liniowa (Wykład 13) Analiza zależności cech ilościowych regresja liniowa (Wykład 13) dr Mariusz Grządziel semestr letni 2012 Przykład wprowadzajacy W zbiorze danych homedata (z pakietu R-owskiego UsingR) można znaleźć ceny

Bardziej szczegółowo

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym Badanie zgodności z określonym rozkładem H 0 : Cecha X ma rozkład F F jest dowolnym rozkładem prawdopodobieństwa Test chi kwadrat zgodności F jest rozkładem ciągłym Test Kołmogorowa F jest rozkładem normalnym

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności: Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności

Bardziej szczegółowo

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny

Bardziej szczegółowo

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić). Egzamin ze Statystyki Matematycznej, WNE UW, wrzesień 016, zestaw B Odpowiedzi i szkice rozwiązań 1. Zbadano koszt 7 noclegów dla 4-osobowej rodziny (kwatery) nad morzem w sezonie letnim 014 i 015. Wylosowano

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę

Bardziej szczegółowo

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji

Bardziej szczegółowo

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE Było: Przykład. W doświadczeniu polowym załoŝonym w układzie całkowicie losowym w czterech powtórzeniach porównano

Bardziej szczegółowo

1.1 Wstęp Literatura... 1

1.1 Wstęp Literatura... 1 Spis treści Spis treści 1 Wstęp 1 1.1 Wstęp................................ 1 1.2 Literatura.............................. 1 2 Elementy rachunku prawdopodobieństwa 2 2.1 Podstawy..............................

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona Badanie zależności między cechami Obserwujemy dwie cechy: X oraz Y Obiekt (X, Y ) H 0 : Cechy X oraz Y są niezależne Próba: (X 1, Y 1 ),..., (X n, Y n ) Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności

Bardziej szczegółowo

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe Zjazd 7. SGGW, dn. 28.11.10 r. Matematyka i statystyka matematyczna Tematy 1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe nna Rajfura 1 Zagadnienia Przykład porównania wielu obiektów w

Bardziej szczegółowo

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn Wykład 10 Estymacja przedziałowa - przedziały ufności dla średniej Wrocław, 21 grudnia 2016r Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja 10.1 Przedziałem

Bardziej szczegółowo

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1 Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie

Bardziej szczegółowo

ESTYMACJA PRZEDZIAŁOWA WYBRANYCH PARAMETRÓW

ESTYMACJA PRZEDZIAŁOWA WYBRANYCH PARAMETRÓW ESTYMACJA PRZEDZIAŁOWA WYBRANYCH PARAMETRÓW POPULACJI Szkic wykładu Wprowadzenie 1 Wprowadzenie 2 3 4 Przypomnienie dotychczasowych rozważań Przedziałem ufności nazywamy przedział losowy, o którym przypuszczamy

Bardziej szczegółowo

Przykład 1. (A. Łomnicki)

Przykład 1. (A. Łomnicki) Plan wykładu: 1. Wariancje wewnątrz grup i między grupami do czego prowadzi ich ocena 2. Rozkład F 3. Analiza wariancji jako metoda badań założenia, etapy postępowania 4. Dwie klasyfikacje a dwa modele

Bardziej szczegółowo

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.

Bardziej szczegółowo

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y). Statystyka i opracowanie danych Ćwiczenia 12 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA WIELORAKA Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych

Bardziej szczegółowo

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD listopada 2009

STATYSTYKA MATEMATYCZNA WYKŁAD listopada 2009 STATYSTYKA MATEMATYCZNA WYKŁAD 7 23 listopada 2009 Wykład 6 (16.XI.2009) zakończył się zdefiniowaniem współczynnika korelacji: E X µ x σ x Y µ y σ y = T WSPÓŁCZYNNIK KORELACJI ρ X,Y = ρ Y,X (!) WSPÓŁCZYNNIK

Bardziej szczegółowo

Testy post-hoc. Wrocław, 6 czerwca 2016

Testy post-hoc. Wrocław, 6 czerwca 2016 Testy post-hoc Wrocław, 6 czerwca 2016 Testy post-hoc 1 metoda LSD 2 metoda Duncana 3 metoda Dunneta 4 metoda kontrastów 5 matoda Newman-Keuls 6 metoda Tukeya Metoda LSD Metoda Least Significant Difference

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8 Regresja wielokrotna Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X 1, X 2, X 3,...) na zmienną zależną (Y).

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA Powtórka Powtórki Kowiariancja cov xy lub c xy - kierunek zależności Współczynnik korelacji liniowej Pearsona r siła liniowej zależności Istotność

Bardziej szczegółowo

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie

Bardziej szczegółowo

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014 Estymacja przedziałowa - przedziały ufności dla średnich Wrocław, 5 grudnia 2014 Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja Przedziałem ufności dla paramertu

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM

Bardziej szczegółowo

Stosowana Analiza Regresji

Stosowana Analiza Regresji Model jako : Stosowana Analiza Regresji Wykład XI 21 Grudnia 2011 1 / 11 Analiza kowariancji Model jako : Oprócz czynnika o wartościach nominalnych chcemy uwzględnić wpływ predyktora o wartościach ilościowych

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno WERYFIKACJA MODELI MODELE LINIOWE Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno ANALIZA KORELACJI LINIOWEJ to NIE JEST badanie związku przyczynowo-skutkowego, Badanie współwystępowania cech (czy istnieje

Bardziej szczegółowo

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej

Bardziej szczegółowo

Analiza wariancji i kowariancji

Analiza wariancji i kowariancji Analiza wariancji i kowariancji Historia Analiza wariancji jest metodą zaproponowaną przez Ronalda A. Fishera. Po zakończeniu pierwszej wojny światowej był on pracownikiem laboratorium statystycznego w

Bardziej szczegółowo

Statystyczna analiza danych (molekularnych) analiza wariancji ANOVA

Statystyczna analiza danych (molekularnych) analiza wariancji ANOVA Statystyczna analiza danych (molekularnych) analiza wariancji ANOVA Anna Gambin 19 maja 2013 Spis treści 1 Przykład: Model liniowy dla ekspresji genów 1 2 Jednoczynnikowa analiza wariancji 3 2.1 Testy

Bardziej szczegółowo

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Było: Estymacja parametrów rozkładu teoretycznego punktowa przedziałowa Przykład. Cecha X masa owocu pewnej odmiany. ZałoŜenie: cecha X ma w populacji rozkład

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.

Bardziej szczegółowo

MODELE LINIOWE. Dr Wioleta Drobik

MODELE LINIOWE. Dr Wioleta Drobik MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

Własności statystyczne regresji liniowej. Wykład 4

Własności statystyczne regresji liniowej. Wykład 4 Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych 9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Temat Testowanie hipotez statystycznych Kody znaków: Ŝółte wyróŝnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Idea i pojęcia teorii testowania hipotez

Bardziej szczegółowo

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

NIEZALEŻNOŚĆ i ZALEŻNOŚĆ między cechami Test chi-kwadrat, OR, RR

NIEZALEŻNOŚĆ i ZALEŻNOŚĆ między cechami Test chi-kwadrat, OR, RR NIEZALEŻNOŚĆ i ZALEŻNOŚĆ między cechami Test chi-kwadrat, OR, RR M Zalewska Zakład Profilaktyki ZagrożeńŚrodowiskowych i Alergologii Analiza niezależności zmiennych jakościowych (test niezależności Chi-kwadrat)

Bardziej szczegółowo

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012

Bardziej szczegółowo

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss

Bardziej szczegółowo

Estymacja punktowa i przedziałowa

Estymacja punktowa i przedziałowa Temat: Estymacja punktowa i przedziałowa Kody znaków: żółte wyróżnienie nowe pojęcie czerwony uwaga kursywa komentarz 1 Zagadnienia 1. Statystyczny opis próby. Idea estymacji punktowej pojęcie estymatora

Bardziej szczegółowo

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz. LABORATORIUM 4 1. Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz. I) WNIOSKOWANIE STATYSTYCZNE (STATISTICAL INFERENCE) Populacja

Bardziej szczegółowo

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0 Testowanie hipotez Każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy nazywamy hipotezą statystyczną. Hipoteza określająca jedynie wartości nieznanych parametrów liczbowych badanej cechy

Bardziej szczegółowo

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15 VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów

Bardziej szczegółowo

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe

Bardziej szczegółowo

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde

Bardziej szczegółowo

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska Anna Stankiewicz Izabela Słomska Wstęp- statystyka w politologii Rzadkie stosowanie narzędzi statystycznych Pisma Karla Poppera

Bardziej szczegółowo

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na

Bardziej szczegółowo

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech TATYTYKA wykład 8 Wnioskowanie Weryfikacja hipotez Wanda Olech Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z

Bardziej szczegółowo

Testowanie hipotez statystycznych cd.

Testowanie hipotez statystycznych cd. Temat Testowanie hipotez statystycznych cd. Kody znaków: żółte wyróżnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Przykłady testowania hipotez dotyczących:

Bardziej szczegółowo

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane

Bardziej szczegółowo

Metody Statystyczne. Metody Statystyczne. #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji

Metody Statystyczne. Metody Statystyczne. #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji gkrol@mail.wz.uw.edu.pl #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji 1 Ryzyko błędu - powtórzenie Statystyka niczego nie dowodzi, czyni tylko wszystko mniej lub bardziej prawdopodobnym

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

a. opisać badaną cechę; cechą X jest pomiar średnicy kulki

a. opisać badaną cechę; cechą X jest pomiar średnicy kulki Maszyna ustawiona jest tak, by produkowała kulki łożyskowe o średnicy 1 cm. Pomiar dziesięciu wylosowanych z produkcji kulek dał x = 1.1 oraz s 2 = 0.009. Czy można uznać, że maszyna nie rozregulowała

Bardziej szczegółowo

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 3 1 / 8 ZADANIE z rachunku

Bardziej szczegółowo

STATYSTYKA

STATYSTYKA Wykład 1 20.02.2008r. 1. ROZKŁADY PRAWDOPODOBIEŃSTWA 1.1 Rozkład dwumianowy Rozkład dwumianowy, 0 1 Uwaga: 1, rozkład zero jedynkowy. 1 ; 1,2,, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym

Bardziej szczegółowo

Wykład 9 Wnioskowanie o średnich

Wykład 9 Wnioskowanie o średnich Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i

Bardziej szczegółowo

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 7 i 8 1 / 9 EFEKTYWNOŚĆ ESTYMATORÓW, próba

Bardziej szczegółowo

Wykład 5 Teoria eksperymentu

Wykład 5 Teoria eksperymentu Wykład 5 Teoria eksperymentu Wrocław, 22.03.2017r Co to jest teoria eksperymentu? eksperyment - badanie jakiegoś zjawiska polegające na celowym wywołaniu tego zjawiska lub jego zmian oraz obserwacji i

Bardziej szczegółowo

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

Statystyka w przykładach

Statystyka w przykładach w przykładach Tomasz Mostowski Zajęcia 10.04.2008 Plan Estymatory 1 Estymatory 2 Plan Estymatory 1 Estymatory 2 Własności estymatorów Zazwyczaj w badaniach potrzebujemy oszacować pewne parametry na podstawie

Bardziej szczegółowo

Hipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym.

Hipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym. Hipotezy proste Zadanie 1. Niech X ma funkcję gęstości f a (x) = (1 + a)x a, dla 0 < x < 1, Testujemy H 0 : a = 1 przeciwko H 1 : a = 2. Dysponujemy pojedynczą obserwacją X. Wyznaczyć obszar krytyczny

Bardziej szczegółowo

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, 诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów

Bardziej szczegółowo