Krzywe przeżycia - testowanie różnic

Wielkość: px
Rozpocząć pokaz od strony:

Download "Krzywe przeżycia - testowanie różnic"

Transkrypt

1 5 listopada 2008

2 Podstawowe pojęcia Przypomnienie Cel testowania Badamy np.: przeżywalność pacjentów po operacji; długość trwania małżeństwa. T zmienna losowa oznaczająca czas do interesującego nas zdarzenia (survival time). Funkcja przeżycia: S(t) = P(T >= t) = 1 F (t ) S(t) oznacza prawdopodobieństwo, że obiekt przeżyje do czasu t.

3 Krzywe przeżycia Wprowadzenie Przypomnienie Cel testowania Krzywe przeŝycia z podziałem ze względu na płeć biorcy S(t) kobiety-biorcy męŝczy?ni-biorcy Czas obserwacji

4 Przypomnienie Cel testowania Po co testujemy różnice krzywych przeżycia? Szukamy odpowiedzi na pytania: Czy dłużej żyją pacjenci poddani jednej terapii, czy drugiej? Czy długość trwania małżeństwa zależy od statusu majątkowego małżonków? Czy procesy, w których adwokat jest wynajęty trwają dłużej niż te, w których adwokat jest przydzielony? Itd. Szukamy czynników, które wpływają na przeżycie.

5 Testy dla danych niecenzorowanych Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych Brak obserwacji cenzorowanych używamy standardowych nieparametrycznych testów do porównania 2 funkcji przeżycia dla 2 grup. GRUPY: Niezależne: np. test serii, Wilcoxon-Mann-Whitney Test U; Zależne: np. test znaków (Sign Test).

6 Test serii Wprowadzenie Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych X 1,..., X n próba prosta z rozkładu o nieznanej dystrybuancie F 1; Y 1,..., Y m próba prosta z rozkładu o nieznanej dystrybuancie F 2; Testujemy hipotezę H 0: F 1 = F 2 przeciw hipotezie alternatywnej H 1: F 1 F 2. Kolejne kroki: ustawiamy obserwacje z obu grup w 1 niemalejący ciąg; obserwacje z pierwszej grupy oznaczamy zerami, z drugiej jedynkami; (n+m)! n!m! liczba różnych ciągów składających się z n zer oraz m jedynek (wszystkie równie prawdopodobne, bo zakładamy, że X 1,..., Xn, Y 1,..., Y m są nzal, o tym samym rozkładzie) statystyka testowa: L = liczba serii w ciągu (L 2), Np. dla ciągu L=5; mała liczba serii = zdarzenie przemawiające przeciw hipotezie H 0. Zbiór krytyczny W = [2, l(alfa, n, m)]. l(alfa, n, m) tak dobrane, aby P(L W ) alfa (istnieją tablice tych wartości).

7 Wilcoxon-Mann-Whitney Test U Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych ustawiamy obserwacje z obu grup w 1 niemalejący ciąg; sumujemy pozycje w ciągu (rank) dla obserwacji z obu grup (oddzielnie). Mniejsza z otrzymanych liczb jest wartością statystyki testowej jeśli jest odpowiednio duża, hipotezę o równości dystrybuant odrzucamy. Test nie powinien być stosowany, gdy rozkłady w 2 grupach różnią się bardzo może wtedy wygenerować błędny wynik.

8 Sign Test Wprowadzenie Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych p = P(X > Y ), H 0 : p = 1 2 mamy pary obserwacji (x i, y i ), i 1,..., n; pary (x i, y i ), t.że x i = y i odrzucamy. Zostaje m par; w := #{(x i, y i ) : y i x i > 0}; H 0 jest prawdą W b(m; 0, 5).

9 Wprowadzenie Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych Niektóre ważne testy: Log-rank test (najbardziej popularny test); Breslow s test; Cox s F test.

10 Log-rank Wprowadzenie Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych Analiza oparta jest na momentach, w których obserwujemy zdarzenia. Dla każdej takiej chwili liczymy zaobserwowaną oraz oczekiwaną liczbę zdarzeń w każdej grupie. Niech j = 1,..., J momenty, w których obserwujemy zdarzenia (w dowolnej grupie), N 1j, N 2j - liczby obserwowanych obiektów zagrożonych w j-tym momencie w 1. i 2. grupie odpowiednio. N j := N 1j + N 2j O 1j, O 2j liczby zaobserwowanych zdarzeń w chwili j w obu grupach O j := O 1j + O 2j

11 Log-rank Wprowadzenie Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych Znając wartość O j (łączna liczba zdarzeń w chwili j) i zakładając prawdziwość hipotezy, O j1 ma hipergeometryczny rozkład z parametrami N j, N 1j, O j : expected value: E j = O j N 1j N 1 variance: V j = O N 1j j (1 N 1j )(N N 1 N j O j ) 1 N j 1 statystyka testowa: Z = J j=1 (O 1j E j ) J j=1 V j H prawdziwa Z N(0, 1).

12 Log-rank Wprowadzenie Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych Inna statystyka testowa: O t1, O t2 są sumami obserwowanych zdarzeń we wszystkich momentach w grupie 1. i 2. odpowiednio; E t1, E t2 są sumami oczekiwanych zdarzeń we wszystkich momentach w grupie 1. i 2. odpowiednio; Statystyka testowa: S = (O t1 E t1 ) 2 E t1 + (O t2 E t2 ) 2 E t2 S χ 2 z (liczba grup 1) stopniami swobody.

13 Log-rank przykład Wprowadzenie Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych Porównujemy krzywe przeżycia dla pacjentów z powracającymi guzami (recurrent malignant gliomas) różnego typu. 51 dorosłych pacjentów; 20 z guzami typu A = astrocytoma, 31 z guzami typu G = glioblastoma;

14 Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych A G * * * * * * * 35...

15 Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych 1 Moment: j=1 w 6. Tygodniu N 1 = 51, O 1 = 1 prawd.smierci= 1 51 W grupie 1. N 1,1 = 20, więc oczekiwana liczba śmierci E 1,1 = 20 1 W grupie 2. N 2,1 = 31, więc oczekiwana liczba śmierci E 2,1 = Moment: j=2 w 10. Tygodniu N 2 = 50, O 2 = 2 prawd.śmierci= 2 50 W grupie 1. N 1,2 = 19, więc oczekiwana liczba śmierci E 1,2 = 19 1 W grupie 2. N 2,2 = 31, więc oczekiwana liczba śmierci E 2,2 = Itd Po zsumowaniu: O t1 = 14, O t2 = 28 E t1 = 22.48, E t2 = S = ( ) ( ) = W tablicy rozkładu χ 2 odnajdujemy P < 0.01, okazuje się więc, że różnica między grupami jest statystycznie znacząca.

16 log-rank Breslow test Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych Breslow test: V = wi (Oi Ei) i w i waga Log-rank test: waga wszędzie jest jednakowa Breslow test: w i = N i (czyli wcześniejsze zdarzenia mają większą wagę) Log-rank test lepszy, gdy: Śmiertelność w obu grupach jest proporcjonalna krzywe przeżycia nie przecinają się (funkcje hazardu są paralelne) Breslow test jest lepszy, gdy: Śmiertelność w obu grupach nie jest proporcjonalna krzywe przeżycia przecinają się. Moc tego testu zmniejsza się, kiedy zwiększa się liczba cenzorowanych obserwacji.

17 log-rank Breslow test Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych {t j : j = 1, 2,..., r} zbiór wszystkich momentów wystąpienia zdarzenia (np. śmierci obiektu); O j liczba wystąpień zdarzenia w chwili t j; N j liczba obserwowanych obiektów zagrożonych w chwili t j; C j liczba ocenzorowanych obserwacji w okresie [t j, t j+1); w j waga; r (Cj + Oj) = Ni; j=i O ja, N ja, C ja analogicznie jak O j, N j, C j tylko dla podgrupy a; Statystyka Coxa-Mantela dla próbki a: V a = r i=0 wi(oia O i N ia N i )

18 Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych V a = r i=0 wi(oia O i N ia N i = r i=0 wioia r i=0 (Cia + Oia) i j=0 wj O j N j ) = r i=0 wioia r i=0 wi O i r (Cja N i + Oja) j=i = r i=0 (wi i j=0 wj O j N j )O ia r i=0 ( i j=0 wj O j N j )C ia V a = N a Vja, gdzie: { j=0 w i i k=0 V ja = w k O k N k gdy wystąpiła obrerwacja X ja = t i; i w k=0 k O k N k gdy X ja jest ocenzorowaną wartością; log-rank { rho = 0, w i = 1 1 i O k k=0 N V ja = k gdy wystąpiła obrerwacja X ja = t i; i gdy X k=0 ja jest ocenzorowaną wartością; O k N k Jeśli brak cenzorowania i remisów to: O k = 1, N k = N k + 1. i O k k=0 N k = 1 ik=0 = N 1 log( N ) N k+1 k=n i+1 k N i+1

19 Funkcja survdiff Wprowadzenie Funkcja survdiff Współczynnik rho RandomSurvivalForest Funkcja survdiff przeprowadza test na różnice między dwoma lub większą liczbą krzywych przeżycia używając rodziny G rho testów lub wykazuje różnice krzywą doświadczalną a teoretyczną. Funkcja survdiff implementuje rodzinę testów sparametryzowaną współczynnikiem rho. Każda śmierć w próbce testowej jest przemnożona przez S(t) rho, gdzie S(t) jest funkcją przeżycia. Wartości szczególne rho: rho = 0 log-rank lub Mantel-Haenszel test; rho = 1 Peto & Peto test (modyfikacja testu Gehana-Wilcoxona);

20 Składnia Wprowadzenie Funkcja survdiff Współczynnik rho RandomSurvivalForest Składnia: > survdiff (formula, data, subset, na.action, rho = 0) gdzie formula obiekt postaci Surv(time, status) predictors, gdzie predictors jest cechą lub zbiorem cech dzielącym nam obserwacje na podgrupy; data zbiór danych; subset wyrażenie określające które wiersze z danych testowych mają zostać użyte w teście; na.action filtr brakujących danych; rho wartość określająca typ testu;

21 survdiff - przykład1 Wprowadzenie Funkcja survdiff Współczynnik rho RandomSurvivalForest >survdiff(surv(dane$czas, dane$status) plec.biorcy, dane) Call: survdiff(formula = Surv(dane$czas, dane$status) plec.biorcy, dane) E V N Observed Expected plec.biorcy=k plec.biorcy=m Chisq= 0.6 on 1 degrees of freedom, p= Zmienne w tabeli oznaczają: N liczba osobników w grupie; obs liczba obserwacji w grupie (czasem z wagą różną od 1); exp oczekiwana wartość obserwacji (z wagą); Chisq statystyka Chi-kwadrat; p p-value;

22 Funkcja survdiff Współczynnik rho RandomSurvivalForest Krzywe przeŝycia z podziałem ze względu na płeć biorcy S(t) kobiety-biorcy męŝczy?ni-biorcy Czas obserwacji Call: survdiff(formula = Surv(dane$czas, dane$status) plec.biorcy, dane, rho=1) E V N Observed Expected plec.biorcy=k plec.biorcy=m Chisq= 1.2 on 1 degrees of freedom, p= 0.283

23 Funkcja survdiff Współczynnik rho RandomSurvivalForest Krzywe przeŝycia z podziałem ze względu na wiek dawcy S(t) wiek dawcy < < wiek dawcy < 60 wiek dawcy > Czas obserwacji >dane$myvalue=round(dane$wiek.dawcy/20)*20 >survdiff(surv(dane$czas, dane$status) myvalue, dane) E V N Observed Expected myvalue= myvalue= myvalue= Chisq= 8.7 on 2 degrees of freedom, p=

24 Funkcja survdiff Współczynnik rho RandomSurvivalForest Krzywe przeŝycia z podziałem ze względu na plec dawcy i biorcy S(t) plec.dawcy=k, plec.biorcy=k plec.dawcy=k, plec.biorcy=m plec.dawcy=m, plec.biorcy=k plec.dawcy=m, plec.biorcy=m Czas obserwacji >survdiff(surv(dane$czas, dane$status) plec.dawcy+plec.biorcy, dane) E V N Observed Expected plec.dawcy=k, plec.biorcy=k plec.dawcy=k, plec.biorcy=m plec.dawcy=m, plec.biorcy=k plec.dawcy=m, plec.biorcy=m Chisq= 3.3 on 3 degrees of freedom, p= 0.345

25 Funkcja survdiff Współczynnik rho RandomSurvivalForest >survdiff(surv(dane$czas, dane$status) plec.biorcy, dane, rho = 0) E V N Observed Expected plec.biorcy=k plec.biorcy=m Chisq= 0.6 on 1 degrees of freedom, p= >survdiff(surv(dane$czas, dane$status) plec.biorcy, dane, rho = 0.5) E V N Observed Expected plec.biorcy=k plec.biorcy=m Chisq= 0.9 on 1 degrees of freedom, p= >survdiff(surv(dane$czas, dane$status) plec.biorcy, dane, rho = 1) E V N Observed Expected plec.biorcy=k plec.biorcy=m Chisq= 1.2 on 1 degrees of freedom, p= 0.283

26 Zależność p-value od rho Funkcja survdiff Współczynnik rho RandomSurvivalForest ZaleŜność p-value od rho dla podziału względem plec.dawcy p-value rho

27 RandomSurvivalForest importance Funkcja survdiff Współczynnik rho RandomSurvivalForest >plot(rsf(survrsf(czas.obserwacji, status)., data = dane[,-6])) wiek.dawcy Error Rate MDRD36m plec.biorcy MDRD60m wagastart niezgodnosci.ab plec.dawcy wiek.biorcy MDRD12m niezgodnosci.dr MDRDend MDRD30 wagaend MDRD24m MDRD6m MDRD Number of Trees Importance

28 Funkcja survdiff Współczynnik rho RandomSurvivalForest left daughter right daughter split var split point status prediction MDRD MDRD36m MDRD36m wiek.dawcy MDRDend wiek.biorcy wiek.biorcy MDRD36m MDRD12m wiek.dawcy plec.dawcy

29 Funkcja survdiff Współczynnik rho RandomSurvivalForest Krzywe przeŝycia z podziałem ze względu na wiek.dawcy S(t) wiek.dawcy < 43.5 wiek.dawcy >= Czas obserwacji >dane$myvalue=dane$wiek.dawcy>= 43.5 >survdiff(surv(dane$czas.obserwacji, dane$status) myvalue, data = dane) E V N Observed Expected myvalue=false myvalue=true Chisq= 11.9 on 1 degrees of freedom, p=

30 Funkcja survdiff Współczynnik rho RandomSurvivalForest Krzywe przeŝycia z podziałem ze względu na MDRD36m S(t) MDRD36m <= 40 MDRD36m > Czas obserwacji >dane$myvalue=round(dane$mdrd36m/40)*40 >survdiff(surv(dane$czas.obserwacji, dane$status) myvalue, data = dane) E V N Observed Expected myvalue= myvalue= Chisq= 5.2 on 1 degrees of freedom, p=

31 Funkcja survdiff Współczynnik rho RandomSurvivalForest Krzywe przeŝycia z podziałem ze względu na MDRD7 S(t) MDRD7 <= median MDRD7 > median Czas obserwacji >dane$myvalue=dane$mdrd7<=median(dane$mdrd7) >survdiff(surv(dane$czas.obserwacji, dane$status) myvalue, data = dane) E V N Observed Expected myvalue=false myvalue=true Chisq= 0.2 on 1 degrees of freedom, p= 0.696

32 Bibliografia Stevenson, M., 2007, An Introduction to Survival Analysis. IVABS, s Therneau, T.M., Foundation, M., 1999, A package for Survival Analysis in S. s Jones, M.P, Crowley, J., 1989, A General Class of Nonparametric Tests for Survival Analysis. Biometrics, Vol. 45, No. 1, s Harrington, D.P., Fleming, T.R., 1982, A Class of Rank Test Procedures for Censored Survival Data. Biometrika, Vol. 69, No. 3, s

33 ! Wprowadzenie Dziękujemy za uwagę!

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Bioinformatyka Wykład 4 Wrocław, 17 października 2011 Temat. Weryfikacja hipotez statystycznych dotyczących wartości oczekiwanej w dwóch populacjach o rozkładach normalnych. Model 3. Porównanie średnich

Bardziej szczegółowo

Podstawy statystycznego modelowania danych Analiza prze»ycia

Podstawy statystycznego modelowania danych Analiza prze»ycia Podstawy statystycznego modelowania danych Analiza prze»ycia Tomasz Suchocki Uniwersytet Przyrodniczy we Wrocªawiu Katedra Genetyki i Ogólnej Hodowli Zwierz t Plan wykªadu 1. Wprowadzenie 2. Hazard rate

Bardziej szczegółowo

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4. Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ

Bardziej szczegółowo

Analiza przeżycia. Wprowadzenie

Analiza przeżycia. Wprowadzenie Wprowadzenie Przedmiotem badania analizy przeżycia jest czas jaki upływa od początku obserwacji do wystąpienia określonego zdarzenia, które jednoznacznie kończy obserwację na danej jednostce. Analiza przeżycia

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Mgr inż. Kasietczuk Magdalena. Wydział Geodezji Górniczej i Inżynierii Środowiska Katedra Kształtowania i Ochrony Środowiska

Mgr inż. Kasietczuk Magdalena. Wydział Geodezji Górniczej i Inżynierii Środowiska Katedra Kształtowania i Ochrony Środowiska Akademia Górniczo Hutnicza im. S. Staszica w Krakowie Pakiet SURVIVAL w R Mgr inż. Kasietczuk Magdalena Wydział Geodezji Górniczej i Inżynierii Środowiska Katedra Kształtowania i Ochrony Środowiska Kraków,

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

Rozkłady statystyk z próby

Rozkłady statystyk z próby Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez statystycznych

Bardziej szczegółowo

Analiza przeżycia Survival Analysis

Analiza przeżycia Survival Analysis Analiza przeżycia Survival Analysis 2013 Analiza przeżycia Doświadczenie dynamiczne - zwierzęta znikają lub pojawiają się w czasie doświadczenia Obserwowane zdarzenia: zachorowanie, wyzdrowienie, zejście,

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;

Bardziej szczegółowo

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne.

Bardziej szczegółowo

W tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji.

W tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji. 5 Collocations Związek frazeologiczny (kolokacja), to często używane zestawienie słów. Przykłady: strong tea, weapons of mass destruction, make up. Znaczenie całości wyrażenia, nie zawsze wynika ze znaczeń

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych

Bardziej szczegółowo

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona Badanie zależności między cechami Obserwujemy dwie cechy: X oraz Y Obiekt (X, Y ) H 0 : Cechy X oraz Y są niezależne Próba: (X 1, Y 1 ),..., (X n, Y n ) Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności

Bardziej szczegółowo

Statystyka matematyczna Test χ 2. Wrocław, 18.03.2016r

Statystyka matematyczna Test χ 2. Wrocław, 18.03.2016r Statystyka matematyczna Test χ 2 Wrocław, 18.03.2016r Zakres stosowalności Testowanie zgodności Testowanie niezależności Test McNemara Test ilorazu szans Copyright 2014, Joanna Szyda ZAKRES STOSOWALNOŚCI

Bardziej szczegółowo

Pytanie: Kiedy do testowania hipotezy stosujemy rozkład normalny?

Pytanie: Kiedy do testowania hipotezy stosujemy rozkład normalny? Pytanie: Kiedy do testowania hipotezy stosujemy rozkład normalny? Gdy: badana cecha jest mierzalna (tzn. posiada rozkład ciągły); badana cecha posiada rozkład normalny; dysponujemy pojedynczym wynikiem;

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH Co to są hipotezy statystyczne? Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej. Dzielimy je

Bardziej szczegółowo

Analiza przeżycia Survival Analysis

Analiza przeżycia Survival Analysis Analiza przeżycia Survival Analysis 2016 Analiza przeżycia Analiza takich zdarzeń jak zachorowanie, wyzdrowienie, zejście, ciąża, Ważne jest nie tylko wystąpienie zdarzenia, ale również czas do momentu

Bardziej szczegółowo

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności. TEST STATYSTYCZNY Testem statystycznym nazywamy regułę postępowania rozstrzygająca, przy jakich wynikach z próby hipotezę sprawdzaną H 0 należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia.

Bardziej szczegółowo

Regresja liniowa wprowadzenie

Regresja liniowa wprowadzenie Regresja liniowa wprowadzenie a) Model regresji liniowej ma postać: gdzie jest zmienną objaśnianą (zależną); są zmiennymi objaśniającymi (niezależnymi); natomiast są parametrami modelu. jest składnikiem

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Analiza przeżycia. Czym zajmuje się analiza przeżycia?

Analiza przeżycia. Czym zajmuje się analiza przeżycia? ANALIZA PRZEŻYCIA Analiza przeżycia Czym zajmuje się analiza przeżycia? http://www.analyticsvidhya.com/blog/2014/04/survival-analysis-model-you/ Analiza przeżycia Jest to inaczej analiza czasu trwania

Bardziej szczegółowo

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY Weryfikacja hipotez statystycznych Statystyka i demografia PROJEKT DOFINANSOWANY ZE ŚRODKÓW NARODOWEGO BANKU POLSKIEGO URZĄD STATYSTYCZNY

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

Spis treści 3 SPIS TREŚCI

Spis treści 3 SPIS TREŚCI Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe

Bardziej szczegółowo

Własności estymatora parametru lambda transformacji potęgowej. Janusz Górczyński, Andrzej Zieliński, Wojciech Zieliński

Własności estymatora parametru lambda transformacji potęgowej. Janusz Górczyński, Andrzej Zieliński, Wojciech Zieliński Własności estymatora parametru lambda transformacji potęgowej Janusz Górczyński, Andrzej Zieliński, Wojciech Zieliński 1. Wstęp Najczęstszym powodem transformowania zmiennej losowej jest jej normalizacja,

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Przykład. Producent pewnych detali twierdzi, że wadliwość jego produkcji nie przekracza 2%. Odbiorca pewnej partii tego produktu chce sprawdzić, czy może wierzyć producentowi.

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne Czyli jak bardzo jesteśmy pewni że parametr oceniony na podstawie próbki jest

Bardziej szczegółowo

Analiza wariancji. dr Janusz Górczyński

Analiza wariancji. dr Janusz Górczyński Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik

Bardziej szczegółowo

S t a t y s t y k a, część 3. Michał Żmihorski

S t a t y s t y k a, część 3. Michał Żmihorski S t a t y s t y k a, część 3 Michał Żmihorski Porównanie średnich -test T Założenia: Zmienne ciągłe (masa, temperatura) Dwie grupy (populacje) Rozkład normalny* Równe wariancje (homoscedasticity) w grupach

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta

Bardziej szczegółowo

Uwaga! Test studenta dla pojedynczej próby, niekierunkowy. Wykład 9: Testy Studenta. Test Studenta dla jednej próby, kierunkowy

Uwaga! Test studenta dla pojedynczej próby, niekierunkowy. Wykład 9: Testy Studenta. Test Studenta dla jednej próby, kierunkowy Wykład 9: Testy Studenta Jest kilka typów testów Studenta. Mają podobną strukturę, ale służą do testowania różnych hipotez i różnią się nieco postacią statystyki testowej. Trzy podstawowe typy testów Studenta

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

Wykład 10 (12.05.08). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

Wykład 10 (12.05.08). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego Wykład 10 (12.05.08). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego Przykład Cena metra kwadratowego (w tys. zł) z dla 14 losowo wybranych mieszkań w

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA Zadanie 0.1 Zmienna losowa X ma rozkład określony funkcją prawdopodobieństwa: x k 0 4 p k 1/3 1/6 1/ obliczyć EX, D X. (odp. 4/3;

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde

Bardziej szczegółowo

Rozkłady dwuwymiarowe. Tablice dwudzielcze. Przykład (wstępny):

Rozkłady dwuwymiarowe. Tablice dwudzielcze. Przykład (wstępny): Rozkłady dwuwymiarowe Rozkłady brzegowe Rozkłady warunkowe Niezależność Kowariancja Współczynnik korelacji (Przykłady na tablicy) Tablice dwudzielcze Najprostsze tablice 2x2 : dwa rzędy i dwie kolumny

Bardziej szczegółowo

Rozkłady zmiennych losowych

Rozkłady zmiennych losowych Rozkłady zmiennych losowych Wprowadzenie Badamy pewną zbiorowość czyli populację pod względem występowania jakiejś cechy. Pobieramy próbę i na podstawie tej próby wyznaczamy pewne charakterystyki. Jeśli

Bardziej szczegółowo

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2 STATYSTYKA Rafał Kucharski Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2 Karl Popper... no matter how many instances of white swans we may have observed, this does not

Bardziej szczegółowo

Metody statystyki medycznej stosowane w badaniach klinicznych

Metody statystyki medycznej stosowane w badaniach klinicznych Metody statystyki medycznej stosowane w badaniach klinicznych Statistics for clinical research & post-marketing surveillance część III Program szkolenia część III Model regresji liniowej Współczynnik korelacji

Bardziej szczegółowo

Dokładne i graniczne rozkłady statystyk z próby

Dokładne i graniczne rozkłady statystyk z próby Dokładne i graniczne rozkłady statystyk z próby Przypomnijmy Populacja Próba Wielkość N n Średnia Wariancja Odchylenie standardowe 4.2 Rozkład statystyki Mówimy, że rozkład statystyki (1) jest dokładny,

Bardziej szczegółowo

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej 7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach

Bardziej szczegółowo

Z poprzedniego wykładu

Z poprzedniego wykładu PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne

Bardziej szczegółowo

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas: ROZWIĄZANIA I ODPOWIEDZI Zadanie A1. Można założyć, że przy losowaniu trzech kul jednocześnie kolejność ich wylosowania nie jest istotna. A więc: Ω = 20 3. a) Niech: - wśród trzech wylosowanych opakowań

Bardziej szczegółowo

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych 1 Laboratorium III: Testy statystyczne Spis treści Laboratorium III: Testy statystyczne... 1 Wiadomości ogólne... 2 1. Krótkie przypomnienie wiadomości na temat testów statystycznych... 2 1.1. Weryfikacja

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 3. Zmienne losowe 4. Populacje i próby danych 5. Testowanie hipotez i estymacja parametrów 6. Test t 7. Test

Bardziej szczegółowo

Testowanie hipotez cz. I

Testowanie hipotez cz. I Wykład 11 Testowanie hipotez cz. I TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipoteza statystyczna jest to przypuszczenie dotyczące nieznanej własności rozkładu prawdopodobieństwa badanej cechy populacji. W zadaniach

Bardziej szczegółowo

Problem dwóch prób: porównywanie średnich i wariancji z populacji o rozkładach normalnych. Wrocław, 23 marca 2015

Problem dwóch prób: porównywanie średnich i wariancji z populacji o rozkładach normalnych. Wrocław, 23 marca 2015 Problem dwóch prób: porównywanie średnich i wariancji z populacji o rozkładach normalnych. Wrocław, 23 marca 2015 Problem dwóch prób X = (X 1, X 2,..., X n ) - próba z rozkładu normalnego N (µ, σ 2 X ),

Bardziej szczegółowo

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Zmienne muszą być zmiennymi ilościowym (liczymy i porównujemy średnie!) Są to testy parametryczne Nazwa

Bardziej szczegółowo

( x ) jest dystrybuantą cechy x dla i-tej grupy.

( x ) jest dystrybuantą cechy x dla i-tej grupy. Testy nieparametryczne porównujące więcej niż dwie grupy Nie wspominaliśmy do tej pory o możliwości porównywania więcej niż dwóch grup w ramach testów parametrycznych. Możliwość taka istnieje (realizowana

Bardziej szczegółowo

ZALICZENIA. W celu uzyskania zaliczenia należy wybrać jeden z trzech poniższych wariantów I, II lub III

ZALICZENIA. W celu uzyskania zaliczenia należy wybrać jeden z trzech poniższych wariantów I, II lub III ZALICZENIA W celu uzyskania zaliczenia należy wybrać jeden z trzech poniższych wariantów I, II lub III 1 Wariant I. PROBLEM WŁASNY Sformułować własne zadanie statystyczne związane z własną pracą badawczą

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8 Regresja wielokrotna Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X 1, X 2, X 3,...) na zmienną zależną (Y).

Bardziej szczegółowo

WNIOSKOWANIE STATYSTYCZNE

WNIOSKOWANIE STATYSTYCZNE STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących

Bardziej szczegółowo

Ćwiczenie: Weryfikacja hipotez statystycznych dla jednej i dwóch średnich.

Ćwiczenie: Weryfikacja hipotez statystycznych dla jednej i dwóch średnich. Ćwiczenie: Weryfikacja hipotez statystycznych dla jednej i dwóch średnich. EXCEL Do weryfikacji różnic między dwiema grupami jednostek doświadczalnych w Excelu wykorzystujemy funkcję o nazwie T.TEST. Zastosowana

Bardziej szczegółowo

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, 诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4 Inne układy doświadczalne 1) Układ losowanych bloków Stosujemy, gdy podejrzewamy, że może występować systematyczna zmienność między powtórzeniami np. - zmienność

Bardziej szczegółowo

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd. WYKŁAD 9 TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd. Było: Przykład 1. Badano krąŝek o wymiarach zbliŝonych do monety jednozłotowej ze stronami oznaczonymi: A, B. NaleŜy ustalić, czy krąŝek jest symetryczny?

Bardziej szczegółowo

Badanie zależności zmiennych kolumnowej i wierszowej:

Badanie zależności zmiennych kolumnowej i wierszowej: Wykład : Tablice wielodzielcze Zródło:http://pl.wikipedia.org/wiki/Plik:Drosophila_melanogaster.jpg Drosophila melanogaster Krzyżówka wsteczna (CcNn i ccnn) Kolor oczu czerwone fioletowe Rozmiar skrzydła

Bardziej szczegółowo

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo

Bardziej szczegółowo

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem

Bardziej szczegółowo

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej

Bardziej szczegółowo

Analizy wariancji ANOVA (analysis of variance)

Analizy wariancji ANOVA (analysis of variance) ANOVA Analizy wariancji ANOVA (analysis of variance) jest to metoda równoczesnego badania istotności różnic między wieloma średnimi z prób pochodzących z wielu populacji (grup). Model jednoczynnikowy analiza

Bardziej szczegółowo

Badanie zależności pomiędzy zmiennymi

Badanie zależności pomiędzy zmiennymi Badanie zależności pomiędzy zmiennymi Czy istnieje związek, a jeśli tak, to jak silny jest pomiędzy np. wykształceniem personelu a jakością świadczonych usług? Ogólnie szukamy miary zależności (współzależności),

Bardziej szczegółowo

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Zadanie Zbadano satysfakcję z życia w skali 1 do 10 w dwóch grupach rodziców: a) Rodzice dzieci zdrowych oraz b) Rodzice dzieci z niepełnosprawnością

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne 1 Wybrane testy nieparametryczne 1. Test chi-kwadrat zgodności z rozkładem oczekiwanym 2. Test chi-kwadrat niezależności dwóch zmiennych kategoryzujących 3. Test U Manna-Whitney

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Testowanie hipotez statystycznych Hipotezą statystyczną jest dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia

Bardziej szczegółowo

Statystyka w analizie i planowaniu eksperymentu

Statystyka w analizie i planowaniu eksperymentu 19 kwietnia 2011 Testy dla dwóch grup 1 Analiza danych dla dwóch grup: test t-studenta dla dwóch grup sparowanych; test t-studenta dla dwóch grup niezależnych (jednakowe wariancje) test Z dla dwóch grup

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

STATYSTYKA wykład 5-6

STATYSTYKA wykład 5-6 TATYTYKA wykład 5-6 Twierdzenia graniczne Rozkłady statystyk z próby Wanda Olech Twierdzenia graniczne Jeżeli rozpatrujemy ciąg zmiennych losowych {X ; X ;...; X n }, to zdarza się, że ich rozkłady przy

Bardziej szczegółowo

Wykład 14 Test chi-kwadrat zgodności

Wykład 14 Test chi-kwadrat zgodności Wykład 14 Test chi-kwadrat zgodności Obserwacje klasyfikujemy do jakościowych klas Zliczamy liczbę obserwacji w każdej klasie Jeżeli są tylko dwie klasy, to liczba obserwacji w pierszej klasie ma rozkład

Bardziej szczegółowo

Matematyka ubezpieczeń majątkowych 1.10.2012 r.

Matematyka ubezpieczeń majątkowych 1.10.2012 r. Zadanie. W pewnej populacji każde ryzyko charakteryzuje się trzema parametrami q, b oraz v, o następującym znaczeniu: parametr q to prawdopodobieństwo, że do szkody dojdzie (może zajść co najwyżej jedna

Bardziej szczegółowo

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski Narzędzia statystyczne i ekonometryczne Wykład 1 dr Paweł Baranowski Informacje organizacyjne Wydział Ek-Soc, pok. B-109 pawel@baranowski.edu.pl Strona: baranowski.edu.pl (w tym materiały) Konsultacje:

Bardziej szczegółowo

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego Ze względu na jakość uzyskiwanych ocen parametrów strukturalnych modelu oraz weryfikację modelu, metoda najmniejszych

Bardziej szczegółowo

Test lewostronny dla hipotezy zerowej:

Test lewostronny dla hipotezy zerowej: Poznajemy testowanie hipotez statystycznych w środowisku R Zajęcia z dnia 11 maja 2011 roku Najpierw teoria TESTY ISTOTNOŚCI WARTOŚCI ŚREDNIEJ W POPULACJI GENERALNEJ gdy znana jest wariancja!!! Test prawostronny

Bardziej szczegółowo

Testowanie hipotez statystycznych etc

Testowanie hipotez statystycznych etc Testowanie hipotez statystycznych etc Definicje Testy średniej Test Pearsona Test Kołmogorowa-Smirnowa Test znaków Teoria testów Analiza wariancji Krzywe regresji Definicje Parametryczny (test, hipoteza,

Bardziej szczegółowo

Zastosowanie Excela w matematyce

Zastosowanie Excela w matematyce Zastosowanie Excela w matematyce Komputer w dzisiejszych czasach zajmuje bardzo znamienne miejsce. Trudno sobie wyobrazić jakąkolwiek firmę czy instytucję działającą bez tego urządzenia. W szkołach pierwsze

Bardziej szczegółowo

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU Zał. nr 4 do ZW WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU Nazwa w języku polskim STATYSTYCZNA ANALIZA DANYCH Nazwa w języku angielskim STATISTICAL DATA ANALYSIS Kierunek studiów (jeśli dotyczy):

Bardziej szczegółowo

STATYSTYKA OD PODSTAW Z SYSTEMEM SAS. wersja 9.2 i 9.3. Szkoła Główna Handlowa w Warszawie

STATYSTYKA OD PODSTAW Z SYSTEMEM SAS. wersja 9.2 i 9.3. Szkoła Główna Handlowa w Warszawie STATYSTYKA OD PODSTAW Z SYSTEMEM SAS wersja 9.2 i 9.3 Szkoła Główna Handlowa w Warszawie Spis treści Wprowadzenie... 6 1. Podstawowe informacje o systemie SAS... 9 1.1. Informacje ogólne... 9 1.2. Analityka...

Bardziej szczegółowo

Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym

Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym Wiesława MALSKA Politechnika Rzeszowska, Polska Anna KOZIOROWSKA Uniwersytet Rzeszowski, Polska Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym Wstęp Wnioskowanie statystyczne

Bardziej szczegółowo

Matematyka 2. dr inż. Rajmund Stasiewicz

Matematyka 2. dr inż. Rajmund Stasiewicz Matematyka 2 dr inż. Rajmund Stasiewicz Skala ocen Punkty Ocena 0 50 2,0 51 60 3,0 61 70 3,5 71 80 4,0 81 90 4,5 91-5,0 Zwolnienie z egzaminu Ocena z egzaminu liczba punktów z ćwiczeń - 5 Warunki zaliczenia

Bardziej szczegółowo

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA Wykład 4: Wnioskowanie statystyczne Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA Idea wnioskowania statystycznego Celem analizy statystycznej nie jest zwykle tylko

Bardziej szczegółowo

Badania eksperymentalne

Badania eksperymentalne Badania eksperymentalne Pomiar na skali porządkowej mgr Agnieszka Zięba Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa Najpopularniejsze sposoby oceny wyników eksperymentu

Bardziej szczegółowo

Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś.

Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś. Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś. Województwo Urodzenia według płci noworodka i województwa. ; Rok 2008; POLSKA Ogółem Miasta Wieś Pozamałżeńskie- Miasta Pozamałżeńskie-

Bardziej szczegółowo

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego

Bardziej szczegółowo

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Redakcja i korekta Bogdan Baran Projekt graficzny okładki Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2011 ISBN

Bardziej szczegółowo

Sterowanie wielkością zamówienia w Excelu - cz. 3

Sterowanie wielkością zamówienia w Excelu - cz. 3 Sterowanie wielkością zamówienia w Excelu - cz. 3 21.06.2005 r. 4. Planowanie eksperymentów symulacyjnych Podczas tego etapu ważne jest określenie typu rozkładu badanej charakterystyki. Dzięki tej informacji

Bardziej szczegółowo

WYKŁAD 8 ANALIZA REGRESJI

WYKŁAD 8 ANALIZA REGRESJI WYKŁAD 8 ANALIZA REGRESJI Regresja 1. Metoda najmniejszych kwadratów-regresja prostoliniowa 2. Regresja krzywoliniowa 3. Estymacja liniowej funkcji regresji 4. Testy istotności współczynnika regresji liniowej

Bardziej szczegółowo

ANALIZA WARIANCJI - KLASYFIKACJA JEDNOCZYNNIKOWA

ANALIZA WARIANCJI - KLASYFIKACJA JEDNOCZYNNIKOWA ANALIZA WARIANCJI - KLASYFIKACJA JEDNOCZYNNIKOWA Na poprzednich zajęciach omawialiśmy testy dla weryfikacji hipotez, że dwie populacje o rozkładach normalnych mają jednakowe wartości średnie. Co jednak

Bardziej szczegółowo

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015 Zmienne losowe, statystyki próbkowe Wrocław, 2 marca 2015 Zasady zaliczenia 2 kolokwia (każde po 20 punktów) projekt (20 punktów) aktywność Zasady zaliczenia 2 kolokwia (każde po 20 punktów) projekt (20

Bardziej szczegółowo

1. Przyszła długość życia x-latka

1. Przyszła długość życia x-latka Przyszła długość życia x-latka Rozważmy osobę mającą x lat; oznaczenie: (x) Jej przyszłą długość życia oznaczymy T (x), lub krótko T Zatem x+t oznacza całkowitą długość życia T jest zmienną losową, której

Bardziej szczegółowo

zbieranie porządkowanie i prezentacja (tabele, wykresy) analiza interpretacja (wnioskowanie statystyczne)

zbieranie porządkowanie i prezentacja (tabele, wykresy) analiza interpretacja (wnioskowanie statystyczne) STATYSTYKA zbieranie porządkowanie i prezentacja (tabele, wykresy) analiza interpretacja (wnioskowanie statystyczne) DANYCH STATYSTYKA MATEMATYCZNA analiza i interpretacja danych przy wykorzystaniu metod

Bardziej szczegółowo

Analiza korespondencji

Analiza korespondencji Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy

Bardziej szczegółowo