Spis treści. Zadania i biostatystyki. Zbieranie danych

Wielkość: px
Rozpocząć pokaz od strony:

Download "Spis treści. Zadania i biostatystyki. Zbieranie danych"

Transkrypt

1 Zadania i biostatystyki Jarosław Piskorski 1 Zadania i biostatystyki 2 Zbieranie danych 3 Interpretacja wyników badań IF UZ Jarosław Piskorski (IF UZ) 1 / 122 Jarosław Piskorski (IF UZ) Zadania i biostatystyki 2 / 122 Zadania i biostatystyki Po co nam biostatystyka? Rodzice dziecka z defektem genetycznych zastanawiają się nad tym, czy starać się o drugie dziecko. Podobne przyczyny nie zawsze mają takie same skutki we wszystkich powyższych przykładach podstawowym elementem decyzji jest niepewność. Lekarz, wybierający terapię musi zastanowić się nad prognozą dla pacjenta w zależności od wybranej terapii. W eksperymencie badającym kancerogenność składnika pożywienia FDA testuje ten składnik w (przynajmniej) dwóch grupach ze składnikiem i bez. Nowotwory pojawią się w obu grupach Czy palenie powoduje raka? Skąd wątpliwości? Zadaniem (bio)statystyki jest radzenie sobie ze zmiennością i niepewnością. Podczas budowy nowego centrum ochrony zdrowia (szpitala, przychodni specjalistycznej itp.) trzeba wziąć pod uwagę zarówno obecny stan zdrowia populacji jak i szacowane zmiany w przyszłości oraz dostępność nowych terapii. Jarosław Piskorski (IF UZ) 3 / 122 Jarosław Piskorski (IF UZ) Zadania i biostatystyki 4 / 122 Zadania i biostatystyki Na jakie pytania odpowiada (bio)statystyka? Aby odpowiedzieć na pytanie należy zaprojektować badanie JAK? CZY? Jarosław Piskorski (IF UZ) 5 / 122 Jarosław Piskorski (IF UZ) Zadania i biostatystyki 6 / 122 Zadania i biostatystyki Definicje podstawowych typów badań Badanie obserwacyjne Eksperyment Badanie obserwacyjne Sparowane badanie case-control Badanie case-control z dopasowaniem charakterystyki próby Laboratoryjny Porównawczy Skrzyżowany Badanie podłużne Badanie kliniczne Badanie prospektywne Badanie przekrojowe Badanie obserwacyjne zbiera dane na temat istniejącej sytuacji. W założeniu zbieranie danych nie powinno wpływać na obserwowany system i jego działanie. ALE... Badanie retrospektywne Badanie typu case-control Jarosław Piskorski (IF UZ) 7 / 122 Jarosław Piskorski (IF UZ) 8 / 122

2 Zbieranie danych Zbieranie danych Zbieranie danych 1 Zadania i biostatystyki 2 Zbieranie danych 3 Interpretacja wyników badań badania laboratoryjne, badania kliniczne, badania ankietowe itd. notatki prowadzone przez badaczy zbieranie zbyt dużej lub zbyt małej ilości danych testowanie procedury zbierania danych decyzja dotycząca metod statystycznych powinna być podjęta przed rozpoczęciem badania i powinna być pomocna przy wybieraniu typu danych zbieranych w badaniu (częściowa) replikacja innych badań Jarosław Piskorski (IF UZ) 9 / 122 Jarosław Piskorski (IF UZ) 10 / 122 Zbieranie danych Edycja i weryfikacja danych Interpretacja wyników badań Sprawdzenie spójności i poprawności Brakujące dane Logistyka obsługi danych Koszty obsługi i analizy danych 1 Zadania i biostatystyki 2 Zbieranie danych 15% 3 Interpretacja wyników badań Jarosław Piskorski (IF UZ) 11 / 122 Jarosław Piskorski (IF UZ) 12 / 122 Wnioski z badania Interpretacja wyników badań Obciążenie Podobieństwo w badaniach porównawczych Randomizacja Rozszerzenie interpretacji do większej populacji Precyzja i prawdziwość pomiarów projekt (np. układ bloków losowanych) 4 Statystyki oparte o momenty zmiennej losowej 5 Populacja i próba Jarosław Piskorski (IF UZ) 13 / 122 Jarosław Piskorski (IF UZ) 14 / 122 Statystyka to numeryczna charakterystyka próby. Jednym z podstawowych zadań statystyki jest opisanie próby przy pomocy tak niewielkiej liczby parametrów jak to tylko możliwe. Percentyl ma intuicyjne i jasne znaczenie na przykład 25-ty percentyl to taka wartość, że 25% obserwacji znajduje się poniżej tej wartości a 75% powyżej. Przy stosowaniu tej defnincji do faktycznej, istniejącej próby napotykamy na następujące problemy małe grupy równe wartości (ties) niejednoznaczność percentyli Jarosław Piskorski (IF UZ) 15 / 122 Jarosław Piskorski (IF UZ) 16 / 122

3 Problemy z percentylami percentyla (bez problemów) Mając do dyspozycji próbę 22, 22, 24, 27 jak można zdefniniować 25-ty percentyl? W zbiorze nie ma takiej liczby! Która (jaka?) liczba jest 75-tym percentylem? Jest ich nieskończona liczba! np. 24.5, 25, P-ty percentyl P-ty percentyl z próby liczącej n obserwacji to wartość o randze P (1 + n) 100 Jeżeli ta ranga nie jest całkowita, to zaokrąglić ją należy do najbliższej rangi połówkowej. Ranga połówkowa to wartość w połowie pomiędzy dwiema liczbami (średnia). Jarosław Piskorski (IF UZ) 17 / 122 Jarosław Piskorski (IF UZ) 18 / 122 Percentyle aflatoksyna w orzeszkach ziemnych Wyróżnione percentyle Około 560g zmielonych orzeszków zostało podzielonych na 16 próbek, które odwirowano i przeanalizowano. Jedna próbka uległa zniszczeniu. Wyniki dla pozostałych 15 to: 30, 26, 26, 36, 48, 50, 16, 31, 22, 27, 23, 35, 52, 28, 37 Znaleźć 50-ty percentyl. szeregujemy 16, 22, 23, 26, 26, 27, 28, 30, 31, 35, 36, 37, 48, 50, 52 Znaleźć 90-ty percentyl. 50/100)(1 + 15) = 8 (90/100)(1 + 15) = 14.4 co zaokrąglamy do 14.5 i obliczamy 1/2( ) = 51. Percentyl Nazwa 50 mediana (m) 25 dolny kwartyl (Q1) 75 górny kwartyl (Q3) IQR Odstęp międzykwartylowy (interquartile range - IQR) to różnica pomiędzy górnym i dolnym kwartylem. Zadanie: wyliczyć IQR dla przykładu z aflatoksynami. Jarosław Piskorski (IF UZ) 19 / 122 Jarosław Piskorski (IF UZ) 20 / 122 Pudełko z wąsami (wykres pudełkowy lub skrzynkowy) Podstawowe momenty Statystyki oparte o momenty zmiennej losowej Średnia arytmetyczna ȳ = yi n, ȳ = py i Odchylenie standardowe s = (ȳ yi) 2 n 1 Jarosław Piskorski (IF UZ) 21 / 122 Jarosław Piskorski (IF UZ) 22 / 122 Statystyki oparte o momenty zmiennej losowej Statystyki oparte o momenty zmiennej losowej Kilka własności odchylenia standardowego Stopnie swobody 1 Odchylenie standardowe jest wyrażone w takich samych jednostkach co zmienna 2 Wartość odchylenia standardowego nie zmienia się po dodaniu tej samej stałej do wszystkich wartości. 3 Jeżeli wszystkie wartości pomnożymy przez tę samą stałą, to odchylenie standardowe też zostanie przez nią pomnożone. 4 Kwadrat odchylenia standardowego nazywa się wariancją. 5 W wielu przypadkach zachodzi s IQR W wielu przypadkach około 68% przypadków skupionych jest w odległości jednego odchylenia standardowego od średniej, 95% skupionych jest w odległości 2 odchyleń standardowych od średniej. Jarosław Piskorski (IF UZ) 23 / 122 Przykład: zliczamy dzieci w rodzinie X to chłopcy, Y to dziewczęta. W tej sytuacji mamy 2 stopnie swobody. Jeżeli zliczamy chłopców i dziewczęta w rodzinach, które mają 8 dzieci, to jest tu tylko jeden stopień swobody. M liczba więzów liniowych. df = N M Jarosław Piskorski (IF UZ) 24 / 122

4 Populacja i próba Populacja i próba Populacja i próba 4 Statystyki oparte o momenty zmiennej losowej 5 Populacja i próba Populacja: pełny zbiór obiektów, którego dotyczy procedura statystyczna (nawet jeżeli zbiór ten nie istnieje). Próba: skończony podzbiór populacji. Parametr: numeryczna charakterystyka populacji. Statystyka: numeryczna charakterystyka próby. Jarosław Piskorski (IF UZ) 25 / 122 Jarosław Piskorski (IF UZ) 26 / 122 Populacja i próba Populacja i próba Populacja i próba Dobór próby i wnioskowanie Przykład 1: ciśnienie skurczowe u 2232 mężczyzn żyjących w Japonii reprezentuje wszystkich mężczyzn w Japonii. Przykład 2: PKU powoduje opóźnienie umysłowe. Wprowadzamy dietę i badamy IQ u czterolatków, a następnie porównujemy (w odpowiedni sposób) ze zdrowymi dziećmi. Co jest tutaj populacją? populacja Tutaj populacja nie istnieje! Jest nią zbiór wszystkich dzieci które mogłyby być leczone dietą dobór próby wnioskowanie Wyniki badania próby rozszerzamy na (nieistniejącą) populację próba Jarosław Piskorski (IF UZ) 27 / 122 Jarosław Piskorski (IF UZ) 28 / 122 Zadanie doboru próby Populacja i próba Populacja i próba Praktyczne zagadnienia związane z doborem próby Zadanie doboru próby to sytuacja mająca następujące elementy: zdefiniowana jest populacja wykonany jest pomiar obliczana jest (w odpowiedni sposób) statystyka czy populacja jest zdefiniowana jednoznacznie? czy mierzona zmienna jest obserwowalna? czy procedura doboru próby jest odpowiednia? czy próba jest wystarczająco duża? Jarosław Piskorski (IF UZ) 29 / 122 Jarosław Piskorski (IF UZ) 30 / 122 Estymacja i testowanie hipotez Estymacja i testowanie hipotez Estymacja i testowanie hipotez 6 Estymacja i testowanie hipotez 7 8 Estymacja: to szacowanie wartości parametrów populacji (np. średnie ciśnienie skurczowe). : procedura przyjmowania hipotez (domysłów) na temat parametrów populacji i testowanie czy zaobserwowane dane są zgodne z tymi hipotezami. W przypadku PKU hipotezą jest: IQ dzieci na diecie jest takie samo jak dzieci zdrowych. Rozróżnienie pomiędzy estymacją a testowaniem hipotez jest zwykle kwestą rozłożenia akcentów. Jarosław Piskorski (IF UZ) 31 / 122 Jarosław Piskorski (IF UZ) 32 / 122

5 Populacja i próba powrót do definicji 6 Estymacja i testowanie hipotez 7 8 Populacja to zbiór wszystkich możliwych wartości zmiennej losowej. Losowy dobór elementów do próby zapewnia, że zmienna jest zmienną losową. Populacja jest opisana w sposób pełny (zamodelowana), jeżeli znana jest funkcja rozkładu prawdopodobieństwa lub funkcja gęstości rozkładu prawdopodobieństwa Jarosław Piskorski (IF UZ) 33 / 122 Jarosław Piskorski (IF UZ) 34 / 122 Rozkład Gaussa : przykład [Golubjatnikov et. al. (1978)] modeluje szeroką grupę zbiorów danych w sposób satysfakcjonujący. Centralne Twierdzenie Graniczne mówi, że z przyczyn matematycznych rozkład ten ma bardziej uniwersalne zastosowanie niż inne rozkłady. Jarosław Piskorski (IF UZ) 35 / 122 Jarosław Piskorski (IF UZ) 36 / 122 : przykład [Kato et. al. (1973)] f(x) = 1 σ (x µ) 2 2π e 2σ 2 Jarosław Piskorski (IF UZ) 37 / 122 Jarosław Piskorski (IF UZ) 38 / 122 Parametry rozkładu normalnego Parametr położenia f(x) = Parametr kształtu (x µ ) 2 1 σ 2π e 2 σ 2 gęstość prawdopodobieństwa Jarosław Piskorski (IF UZ) 39 / 122 x Jarosław Piskorski (IF UZ) 40 / 122

6 Parametry rozkładu normalnego Parametry rozkładu normalnego gęstość prawdopodobieństwa µ =0, σ =1 µ = 12, σ =0.8 gęstość prawdopodobieństwa µ =0, σ =1 µ = 12, σ =0.8 µ =2, σ = x Jarosław Piskorski (IF UZ) 41 / 122 x Jarosław Piskorski (IF UZ) 42 / 122 Parametry rozkładu normalnego Parametry rozkładu normalnego gęstość prawdopodobieństwa µ =0, σ =1 µ = 12, σ =0.8 µ =2, σ =5 µ = 8, σ =7 gęstość prawdopodobieństwa µ =0, σ =1 µ = 12, σ =0.8 µ =2, σ =5 µ = 8, σ =7 µ =4, σ = x Jarosław Piskorski (IF UZ) 43 / 122 x Jarosław Piskorski (IF UZ) 44 / 122 T-shirts Dla zmiennej losowej X o średniej µ i wariancji σ 2 zmienna Z (Z-score) zdefiniowana jest jako X µ σ. f(x) = 1 σ 2π e 1 2 ( ) 2 x µ σ Jarosław Piskorski (IF UZ) 45 / 122 Jarosław Piskorski (IF UZ) 46 / 122 Standardowy rozkład normalny Po normalizacji X µ σ rozkład prawdopodobieństwa dla każdego przypadku jest identyczny. Pomiar prawdopodobieństwa Standardowy rozkład normalny gęstość prawdopodobieństwa Standardowy rozkład normalny P= % 4 2 σ 0 σ 2 4 Jarosław Piskorski (IF UZ) 47 / 122 Jarosław Piskorski (IF UZ) 48 / 122

7 Standardowy rozkład normalny Standardowy rozkład normalny 4 σ 0 σ 4 Pomiar prawdopodobieństwa Pomiar prawdopodobieństwa Standardowy rozkład normalny Standardowy ozkład normalny % % 4 σ 0 σ 4 4 σ 0 σ 4 Jarosław Piskorski (IF UZ) 49 / 122 Jarosław Piskorski (IF UZ) 50 / 122 Pomiar prawdopodobieństwa Pomiar prawdopodobieństwa przykład Standardowy rozkład normalny 5 % 4 σ 0 σ 4 Załóżmy, że iloraz inteligencji (IQ) jest rozłożony normalnie ze średnią µ = 100 i odchyleniem standardowym σ = 15. IQ > 115 oznacza wysoki iloraz inteligencji. Jaka część populacji ma wysoki iloraz inteligencji? Z = = 1 P [Z > 1] = 1 P [Z 1] = = (15.87%) % 16 % Jarosław Piskorski (IF UZ) 51 / 122 Jarosław Piskorski (IF UZ) 52 / 122 Pomiar prawdopodobieństwa przykład 2 Wróćmy do przykładu poziomu cholesterolu u dzieci z Wisconsin. Załóżmy µ = 175mg/(100mL) i σ = 30mg/(100mL). Załóżmy, że normalny cholesterol jest w odległości 2σ od średniej (pomiędzy 115 a 235). Z 1 = = Z 2 = = 2 30 P [Z 1 Z Z 2] = 1 2P [Z > 2] P [Z > 2] = 1 P [Z 2] 6 Estymacja i testowanie hipotez 7 8 Jarosław Piskorski (IF UZ) 53 / 122 Jarosław Piskorski (IF UZ) 54 / 122 Rozkład statystyki Wszystkie poprzednie przykłady dotyczyły obliczeń na podstawie parametrów populacji. Rozważmy przykład wielkośrodowego badania nad przeżyciem chorych na nowotwór. Średni czas przeżycia (lub wzrost tego czasu względem terapii standardowej) będzie różnił się pomiędzy ośrodkami. STATYSTYKI ZMIENIAJĄ SIĘ Z PRÓBY NA PRÓBĘ Funkcja (gęstości) rozkładu prawdopodobieństwa statystyki nazywa się rozkładem próby statystyki. Twierdzenie Jeżeli zmienna losowa ma średnią w populacji µ i wariancję σ 2, to rozkład próby średniej z próby ma średnią µ i wariancję σ2 n. Powyższe twierdzenie nie zakłada normalności rozkładu populacji, z której pochodzi próba! σ Odchylenie standardowe rozkładu próby ( 2 n ) nazywa się błędem standardowym. Jarosław Piskorski (IF UZ) 55 / 122 Jarosław Piskorski (IF UZ) 56 / 122

8 Przykład - IQ Błąd standardowy µ = 100, σ = 15. populacja średnia wariancja odchylenie standardowe pojedyncza obserwacja, Y = =σ średnia z 25 obserwacji, Ȳ /25 = 9 3 = σ/ n σ n aby k-krotnie zmniejszyć błąd, próbę musimy zwiększyć k 2 krotnie (np. 2 vs 4). σ/ σ/ 110 = = czyli 10% wzrost liczebności próby prowadzi do 5% wzrostu precyzji Jarosław Piskorski (IF UZ) 57 / 122 Jarosław Piskorski (IF UZ) 58 / 122 Centralne twierdzenie graniczne Przykład IQ Twierdzenie Jeżeli Y ma rozkład normalny o średniej µ i wariancji σ 2, to Ȳ, oparta o próbę losową n obserwacji rozkład normalny o średniej µ i wariancji σ 2 /n. Jakie jest prawdopodobieństwo, że średnia IQ grupy 25 osobowej przekroczy 106? µ = 100, σ/sqrtn = 15/ 25 = 3 [ ] P [Ȳ > 106] = P Z > 3 = P [Z > 2] = = Jakie jest prawdopodobieństwo, że IQ pojedynczej osoby przekroczy 106? P [Y > 106] = P [Z > 6 ] = P [Z > 0.4] = Jarosław Piskorski (IF UZ) 59 / 122 Jarosław Piskorski (IF UZ) 60 / 122 Centralne twierdzenie graniczne 2 Estymacja punktowa i przedziałowa Twierdzenie Jeżeli zmienna losowa Y ma zmienną populacyjną µ i wariancję populacyjną σ 2, to średnia (statystyka) Ȳ oparta na próbie n obserwacji ma rozkład w przybliżeniu normalny ze średnią µ i wariancją σ 2 /n, dla wystarczająco dużego n. 9 Estymacja punktowa i przedziałowa 10 Jarosław Piskorski (IF UZ) 61 / 122 Jarosław Piskorski (IF UZ) 62 / 122 Uwagi wstępne Estymacja punktowa i przedziałowa Estymacja punktowa i przedziałowa Jak oszacować precyzję oszacowania? UWAGA: w poniższych przykładach wnioskować będziemy o średniej, zakładając, że wariancja jest znana. Czyli: Dla zmiennej losowej Y o nieznanej średniej populacyjnej µ i znanej wariancji σ 2 wybieramy próbę o liczebności n i chcemy na tej podstawie wyciągnąć wniosek o µ. Naturalnym oszacowaniem µ jest Ȳ. Jak np. odróżnić próbę n = 25 od próby n = 100? obie dają to samo oszacowanie µ? Jedna z możliwości to podanie zarówno Ȳ jak i błąd standardowy. Takie podejście jest dobre przy porównywaniu dwóch prób, jednak nie jest zbyt przydatne w opisywaniu pojedynczej próby Ȳ jest estymatą punktową µ. Jarosław Piskorski (IF UZ) 63 / 122 Jarosław Piskorski (IF UZ) 64 / 122

9 Estymacja punktowa i przedziałowa Estymacja przedziałowa Przedział ufności Estymacja punktowa i przedziałowa Rozważmy wielkość µ ± 1.96σ n. 95% średnich z prób n elementowych zawartych będzie w przedziale [µ 1.96σ/ n, µ σ/ n] gdy n rośnie, przedział staje się węższy. Zastąpmy µ przez Ȳ [Ȳ 1.96σ/ n, Ȳ σ/ n]. Tutaj nie możemy już mówić o wpadaniu w przedział, bo Ȳ zmienia się z próby na próbę. Interpretacja: mamy 95% prawdopodobieństwa (0.95), że ten przedział zawiera w sobie µ. Przedział [Ȳ 1.96σ/ n, Ȳ σ/ n] nazywa się 95% przedziałem ufności. (100 α)% przedziałem ufności dla średniej µ populacji o rozkładzie normalnym i znanej wariancji σ 2, opartym na próbie wielkości n nazywamy α Ȳ ± z 1 α/2 n gdzie z 1 α/2 jest wartością normalnej zmiennej standardowej, dla której 100(1 α)% powierzchni pod krzywą normalną zawiera się pomiędzy ±z 1 α/2. Ściśle rzecz biorąc, powinniśmy napisać ( ) σ Ȳ + z α/2 n, Ȳ + z σ 1 α/2 n ale z α/2 = z 1 α Jarosław Piskorski (IF UZ) 65 / 122 Jarosław Piskorski (IF UZ) 66 / 122 Estymacja punktowa i przedziałowa Przedział ufności przykład Estymacja punktowa i przedziałowa Przedział ufności przykład Wróćmy do przykładu z danymi o nagłej śmierci łóżeczkowej. 78 przypadków SIDS w King County, Washington, Y masa urodzeniowa w gramach. Dla tych 78 przypadków (dla tej próby) Ȳ = g 2994g. Z zestawienia wszystkich urodzeń w tym okresie obliczono σ 800g. 95% przedział ufności dla średniej masy urodzeniowej w przypadku SIDS ( ) ± (1.96) lub 2994 ± (1.96)(90.6) lub 2994 ± dolna granica 2816g, górna granica 3172 g. Na podstawie tej próby mamy 95% pewności, że przedział (2816, 3172) zawiera w sobie prawdziwą średnią populacyjną µ dla populacji SIDS. Obliczając w ten sam sposób, ale stosując 99% przedział ufności otrzymamy (2760, 3228) Ten przedział jest szerszy jest to cena za większą pewność. Jak zmniejszyć tę cenę? NIE DA SIĘ! Zawsze trzeba zapłacić Jarosław Piskorski (IF UZ) 67 / 122 Jarosław Piskorski (IF UZ) 68 / 122 Interpretacja CI Estymacja punktowa i przedziałowa Demonstracja Przedziału Ufności (CI) CI: [ x z 1 α 2σ n, x + z1 α 2σ n ] coverage rate (pokrycie): Estymacja punktowa i przedziałowa Próby Jarosław Piskorski (IF UZ) 69 / 122 Jarosław Piskorski (IF UZ) 70 / 122 przykład SIDS W estymacji przedziałowej tworzyliśmy CI, który z pewnym prawdopodobieństwem zawierał szacowany parametr (np. średnią) populacji. W testowaniu hipotez zajmujemy się odległością statystyki od założonej wielkości parametru. Odległość tę mierzymy w σ. odległość Wracamy do przykładu 78 przypadków SIDS w Wisconsin. Ȳ = 2994g, σ = 800g, σ/ n = 800/ 78 = 90.6g. Pytanie: czy przypadki SIDS mają niższą masę urodzeniową niż w ogólnej populacji, µ = 3300g. odległość = 306 g, czyli 306/90.6 = 3.38 błędu standardowego wartość hipotetyczna wartość zaobserwowana 2994 g 3300 g Jarosław Piskorski (IF UZ) 71 / 122 Jarosław Piskorski (IF UZ) 72 / 122

10 2 błędy standardowe zgodne z wartością hipotetyczną 2 błędy standardowe Ȳ Zamiast podawać odległości przy pomocy liczby odchyleń standardowych, możemy podawać prawdopodobieństwa w ogonach rozkładu normalnego. Wielkość tę nazywamy wartością p (p-value). Dla 2σ będzie to około (Ściśle dla 1.96σ mamy 0.05.) niezgodne z wartością hipotetyczną Ȳ wartość hipotetyczna niezgodne z wartością hipotetyczną W ten sposób moglibyśmy przed dokonaniem pomiaru postawić hipotezę i stwierdzić, że przyjmiemy hipotezę, jeżeli wartość p będzie mniejsza niż nasza ustalona wielkość graniczna (np. 0.05). Jarosław Piskorski (IF UZ) 73 / 122 Jarosław Piskorski (IF UZ) 74 / 122 kilka definicji kilka definicji Hipoteza zerowa H 0 podaje zakładaną wartość parametru(ów). Obszar krytyczny (obszar odrzucenia) zawiera wartości statystyk dla których hipoteza zerowa jest odrzucana. Wartości na krańcach tego obszaru nazywają się wartościami krytycznymi. Błąd I rodzaju następuje wtedy, gdy odrzucamy hipotezę zerową, podczas gdy w rzeczywistości jest ona prawdziwa. Poziom istotności to prawdopodobieństwo błędu typu I przy założeniu, że H 0 jest prawdziwa. Hipoteza alternatywna podaje prawdziwą wartość (wartości) parametru (ów), która będzie przyjęta gdy odrzucona zostanie H 0. Jarosław Piskorski (IF UZ) 75 / 122 Jarosław Piskorski (IF UZ) 76 / 122 kilka definicji przykład SIDS Błąd typu II występuje, gdy hipoteza zerowa nie zostanie odrzucona, podczas gdy w rzeczywistości jest ona prawdziwa. Moc testu to prawdopodobieństwo odrzucenia H 0 gdy jest ona fałszywa. Prawdopodobieństwo błędu typu I oznacza się przez α, prawdopodobieństwo błędu typu II przez β. Prawda o masie urodzeniowej Decyzja o masie urodzeniowej równa różna równa poprawna (1 α) błąd typu II (β) różna błąd typu I (α) poprawna (1 β) moc testu = 1 β Jarosław Piskorski (IF UZ) 77 / 122 Jarosław Piskorski (IF UZ) 78 / 122 przykład SIDS przykład SIDS H 0 : µ = 3300g, H A : µ 3300g, (µ 2σ/ n) = 3119g, (µ + 2σ/ n) = 3481g Ȳ = 2994g odrzucamy H 0 nie odrzucamy H 0 odrzucamy H 0 (µ 2σ/ 3119g n) = 3119g H 0 : µ = 3300g (µ + 2σ/ n) = 3481g zaobserwowana wartość 2994g Prawdopodobieństwo popełnienia błędu typu I to prawdopodobieństwo, że średnia próby 78 osobowej z populacji o średniej 3300g jest mniejsza niż 3481 g. [ ] P [3119 Ȳ 3481] = P Z = P [ 2 Z 2] z tabel P [Z 2] = P [ 2 Z 2] = (2)(0.0228) = czyli w naszym podejściu prawdopodobieństwo popełnienia błędu typu I wynosi Jarosław Piskorski (IF UZ) 79 / 122 Jarosław Piskorski (IF UZ) 80 / 122

11 Błąd typu II Błąd typu II Prawdopodobieństwo błędu typu II obliczyć można wyłącznie gdy podana jest wartość parametru dla H A. Załóżmy H A : µ = 3000g wartość ta wynika z wcześniejszych badań. Jarosław Piskorski (IF UZ) 81 / 122 Jarosław Piskorski (IF UZ) 82 / 122 Błąd typu II Testy dwustronne i jednostronne Prawdopodobieństwo błędu typu II obliczyć można wyłącznie gdy podana jest wartość parametru dla H A. Załóżmy H A : µ = 3000g wartość ta wynika z wcześniejszych badań. Zastosowanie testu dwustronnego lub jednostronnego zależy od hipotezy alternatywnej (H A ). Do tej pory mieliśmy H 0 : µ = 3300; H A : µ 3300 P [B.t.II] = P [3119 Ȳ 3481] [ = P Z 90.6 = P [1.31 Z 5.31] = z czego wynika, β = i moc testu 1 β = 0, 905. Czym różni się α od β? ] α 2 α 2 Jarosław Piskorski (IF UZ) 83 / 122 Jarosław Piskorski (IF UZ) 84 / 122 Testy dwustronne i jednostronne Test jednostronny przykład Jeżeli z doświadczenia wiemy, że masa urodzeniowa nie może być większa może być jedynie taka sama lub mniejsza, po przyjmiemy. H 0 : µ = 3300; H A : µ < 3300 Przyjmując α = 0.05 tak jak poprzednio, z tablic odczytujemy Z = 1.64, co daje dolną granicę przedziału: 3300 (1.63) = = 3151 Poprzednio mieliśmy (3122, 3478). α Jarosław Piskorski (IF UZ) 85 / 122 Jarosław Piskorski (IF UZ) 86 / 122 Test jednostronny przykład Porównanie estymacji i testowania hipotez α Wybierz poziom ufności (1 α). Odczytaj z 1 α/2 z tabeli. Wylicz Ȳ ± z 1 α/2. Wybierz hipotezę zerową (H 0 : µ = µ 0). Określ α, czyli prawdopodobieństwo błędu typu I. Odczytaj z 1 α/2 z tabeli. Oblicz Ȳ ; odrzuć lub przyjmij H Jarosław Piskorski (IF UZ) 87 / 122 Jarosław Piskorski (IF UZ) 88 / 122

12 Przedział ufności vs. test hipotezy Porównanie estymacji i testowania hipotez Przedział ufności Test hipotezy µ 0 ( Ȳ z 1 α/2σ0 n Ȳ ) Ȳ + z 1 α/2σ0 n Czy zawsze te przedziały się przecinają? [ P z 1 α/2 Ȳ µ ] σ/ n z 1 α/2 = 1 α ] P [ µ z 1 α/2σ Ȳ µ + z 1 α/2σ n n = 1 α ( µ 0 z 1 α/2σ0 n µ 0 ) µ 0 + z 1 α/2σ0 n Ȳ [ P Ȳ z 1 α/2σ µ Ȳ + z ] 1 α/2σ = 1 α n n Jarosław Piskorski (IF UZ) 89 / 122 Jarosław Piskorski (IF UZ) 90 / 122 Porównanie estymacji i testowania hipotez Wnioskowanie o wariancji Estymacja przedziałowa kładzie nacisk na precyzję oszacowania. kładzie nacisk na sprawdzenie zgodności zebranych danych z postawioną hipotezą. Daje możliwość wyliczenia prawdopodobieństwa otrzymania takiego lub bardziej skrajnego wyniku. Dodatkow pozwala liczyć niezbędną wielkość próby do przeprowadzenia testu oraz moc testu. Do tej pory wszystkie wnioski dotyczyły średniej, a wariancję uznawaliśmy za znaną. Zmienna Ȳ µ σ/ n ma rozkład normalny. Zmienna ma rozkład χ 2 (n 1)s 2 σ 2 Wybranie podejścia zależy od charakterystyki problemu i obszaru w którym się poruszamy. Jarosław Piskorski (IF UZ) 91 / 122 Jarosław Piskorski (IF UZ) 92 / 122 Rozkład χ 2 Rozkład χ 2 Jeżeli zmienna losowa Y ma rozkład normalny o średniej µ i wariancji σ 2, to dla n-elementowej próby losowej wielkość (n 1)s 2 σ 2 ma rozkład χ 2 z n 1 stopniami swobody. [ ] (n 1)s 2 E σ 2 = n 1 [ ] (n 1)s 2 var σ 2 = 2(n 1) Przy wielokrotnym losowaniu próby wariancja będzie się zmieniała z próby na próbę, a rozkład χ 2 będzie opisywał tę zmienność w zależności od prawdziwej wariancji i liczebności próby. Jarosław Piskorski (IF UZ) 93 / 122 Jarosław Piskorski (IF UZ) 94 / 122 Rozkład χ 2 Wnioskowanie o wariancji w populacji gęstość prawdopodobieństwa df=1 df=2 df=4 df=10 Załóżmy, że mamy próbę wielkości n z populacji o rozkładzie normalnym. Wariancja z próby wynosi s 2. Chcemy dowiedzieć się, czy wynik ten jest zgodny z hipotetyczną wartością σ 0. χ 2 = (n 1)s2 σ 2 Ta wielkość jest bliska 1 gdy s 2 jest podobne do σ 2 i bliskie 0 lub bardzo duże w przeciwnym wypadku x Jarosław Piskorski (IF UZ) 95 / 122 Jarosław Piskorski (IF UZ) 96 / 122

13 Wnioskowanie o wariancji przykład SIDS Wnioskowanie o wariancji przykład SIDS Zakładaliśmy, że σ 2 = (800g) 2. Dla pierwszych 11 przypadków s 2 = ( g) 2. χ 2 = z ν = 10 stopni swobody. (11 1)( g)2 (800) 2 = 5.15 gęstość prawdopodobieństwa P(χ 2 10 <3.25)=0.025 P(χ 2 10 >20.48)= Jarosław Piskorski (IF UZ) 97 / χ 10 Jarosław Piskorski (IF UZ) 98 / % przedział ufności dla wariancji przykład SIDS 95% przedział ufności dla wariancji przykład SIDS gdzie ν = (n 1) P [χ 2 α/2 χ2 χ 2 1 α/2 = 1 α [ ] P χ 2 (n 1)s2 α/2 σ 2 χ 2 1 α/2 = 1 α [ (n 1)s 2 P χ 2 σ 2 1 α/2 ] (n 1)s2 χ 2 = 1 α α/2 χ = 3.25, χ = P [3.25 χ ] = 0.95 (10)( ) σ 2 (10)( ) σ g σ 1007g Jarosław Piskorski (IF UZ) 99 / 122 Jarosław Piskorski (IF UZ) 100 / , początki współczesnej statystyki Różnica zdań , początki współczesnej statystyki , początki współczesnej statystyki 12 Podejście Fishera 13 Podejście Neymana-Pearsona 14 Jarosław Piskorski (IF UZ) 101 / 122 Jarosław Piskorski (IF UZ) 102 / , Wembley , początki współczesnej statystyki , początki współczesnej statystyki Czym NIE są wyniki procedur statystycznych prawdopodobieństwo, że hipoteza zerowa jest prawdziwa prawdopodobieństwo, że prawdziwa jest hipoteza alternatywna prawdopodobieństwo, że w kolejnych badaniach otrzymany wynik będzie potwierdzony informacja o tym, czy wynik jest istotny (w sensie ważny) informacja o tym, czy otrzymany wynik można generalizować Jarosław Piskorski (IF UZ) 103 / 122 Jarosław Piskorski (IF UZ) 104 / 122

14 Podejście Fishera Podejście Fishera Wartość p podejście Fishera , początki współczesnej statystyki 12 Podejście Fishera 13 Podejście Neymana-Pearsona 14 wnioskowanie indukcyjne hipoteza zerowa, H 0 P (x H) vs. P (H x) test istotności: prawdopodobieństwo otrzymania wyniku oraz wyników bardziej skrajnych, pod warunkiem, że hipoteza zerowa jest prawdziwa Jarosław Piskorski (IF UZ) 105 / 122 Jarosław Piskorski (IF UZ) 106 / 122 Podejście Fishera Wartość p podejście Fishera Podejście Fishera Wartość p podejście Fishera badacz zakłada H 0: próba pochodzi z hipotetycznej, nieskończonej populacji o znanym rozkładzie próbkowania mówimy, że hipoteza zostaje obalona (wsp. odrzucona) [ disproved, cont. rejected], jeżeli oszacowanie z próby różni się od średniej rozkładu w ten sposób, że wartość p jest mniejsza niż pewna liczba (kryterium), zwana poziomem istotności Fisher stwierdza, że tym kryterium najczęściej jest p 0.05, ale nie przywiązuje do tej liczby nadmiernej wagi Każdy eksperyment to szansa dana rzeczywistości na obalenie hipotezy zerowej, Fisher, 1966 fakt naukowy powinien być uznany za udowodniony doświadczalnie, jeżeli prawidłowo zaplanowany eksperyment rzadko nie wygeneruje wystarczająco wysokiej wartości p jeżeli jeden na dwadzieścia nie wydaje się wystarczająco małą liczbą, to możemy, jeżeli tylko chcemy, narysować linię na poziomie jeden na pięćdziesiąt lub jeden na sto Fisher, 1926 Jarosław Piskorski (IF UZ) 107 / 122 Jarosław Piskorski (IF UZ) 108 / 122 Podejście Fishera Przesłanki indukcyjne inductive evidence Podejście Neymana-Pearsona Fisher uznawał wartości p za przesłanki indukcyjne przeciwko hipotezie zerowej: im mniejsza wartość p, tym większy ciężar dowodu. Albo wydarzył się wyjątkowo rzadki przypadek, albo teoria jest nieprawdziwa, Fisher, , początki współczesnej statystyki 12 Podejście Fishera 13 Podejście Neymana-Pearsona 14 Jarosław Piskorski (IF UZ) 109 / 122 Jarosław Piskorski (IF UZ) 110 / 122 Podejście Neymana-Pearsona Podejście Neymana-Pearsona zakładana jest hipoteza alternatywna (H 1) badacz wybiera (najczęściej) punktową hipotezę zerową i testuje względem hipotezy alternatywnej wprowadza się dwa rodzaje błędu: nieprawidłowe odrzucenie (Typ I) i nieprawidłowa akceptacja (Typ II), których wielkość oparta jest na kryterium decyzyjnym, wielkości próby i wielkości efektu Jarosław Piskorski (IF UZ) 111 / 122 Podejście Neymana-Pearsona Podejście Neymana-Pearsona rezultaty w podejściu Neymana-Pearsona oparte są na wielokrotnym wybieraniu próby ze zdefiniowanej populacji podejście to najbardziej odpowiada sytuacji powtarzanego próbkowania, jak np. w kontroli jakości: wtedy α to częstość (prawdopodobieństwo) błędu typu I, a β jest tym samym dla błędu typu II moc testu: (1 β): prawdopodobieństwo odrzucenia fałszywej hipotezy zerowej Jarosław Piskorski (IF UZ) 112 / 122

15 W podejściu Fishera nie było hipotezy alternatywnej oraz błędu typu II , początki współczesnej statystyki 12 Podejście Fishera 13 Podejście Neymana-Pearsona 14 W rzeczy samej [... ] błędy drugiego rodzaju popełniane są jedynie przez osoby, które nie rozumieją Rozważanie mocy (testu) jest czasem niejawnie obecne w tekstach Fishera. Wolałby, żeby pojęcie to wprowadził otwarcie Fisher, 1935 Neyman, 1967 Neymanowskie pojęcie mocy i Fisherowskie pojęcie czułości są bardzo bliskie. Jarosław Piskorski (IF UZ) 113 / 122 Jarosław Piskorski (IF UZ) 114 / 122 Neyman i Fisher odrzucali całkowicie Fisherowskie pojęcie przesłanek indukcyjnych, wprowadzając w zamian indukcyjne zachowanie Akceptacja hipotezy H oznacza jedynie decyzję o podjęciu czynności A a nie czynności B. To wcale nie znaczy, że wierzymy, iż hipoteza H jest prawdziwa [... ] podczas gdy odrzucenie hipotezy H oznacza decyzję o podjęciu czynności B i nie implikuje wiary, że H jest fałszywa Neyman, 1950 Wprowadzono różne nazwy dla teorii statystycznej zawierającej odniesienie do zachowania, np. statystyka behawioralna. Ja wolę mówić o indukcyjnym zachowaniu, a nie o indukcyjnym rozumowaniu poziom istotności Decyzja o tym czy przyjąć, czy odrzucić hipotezę w podejściu Neymana-Pearsona zależy od ceny, którą trzeba zapłacić za popełnienie błędu typu I i błędu typu II. Cena ta nie ma związku z teorią statystyczną. W późniejszych pracach Neyman stwierdził, że unikanie błędu typu I jest ważniejsze niż unikanie błędu typu II. Neyman nazwał prawdopodobieństwo popełnienia błędu typu I (α) poziomem istotności testu Neyman, 1971 Jarosław Piskorski (IF UZ) 115 / 122 Jarosław Piskorski (IF UZ) 116 / 122 α i p Powtarzanie eksperymentu kontrola jakości α jest ustalane przed rozpoczęciem zbierania danych, więc procedura Neymana-Pearsona nazywana jest procedurą o ustalonym α lub o ustalonej wielkości powyższe jest w jawnej sprzeczności z Fisherowskim pojęciem wartości p, która jest zmienną losową o rozkładzie jednorodnym (pod H 0) α i β ustalają przedziały odrzucenia i akceptacji na tej podstawie odrzuca się H 0 i przyjmuje H A bądź nie odrzuca się H 0 Fisherowskie podejście stosowalne jest do pojedynczych eksperymentów podejście Neymana-Pearsona (testowanie hipotez) na to nie pozwala badacz może podjąć decyzję o hipotezie jeżeli test poddany był wielokrotnym i identycznym replikacjom warunek ten nie zachodzi w normalnych badaniach naukowych, Fisher, 1956 Nie krytykuję procedur akceptacji w kontroli jakości i jestem wdzięczny, ilekroć podróżuję samolotem, za wysoką precyzję i wiarygodność, która może być uzyskana jedynie w ten sposób Fisher, 1955 Jarosław Piskorski (IF UZ) 117 / 122 Jarosław Piskorski (IF UZ) 118 / 122 Fisher, czy Neyman? testowanie statystyczne zwykle formalnie używa narzędzi Neymana-Pearsona, jednak przyjmuje filozofię Fishera, Johnstone, 1986 Fisherowska filozofia obalania hipotezy zerowej jest prawie zawsze wykładana równocześnie z podejściem Neymana-Pearsona, odnoszącym się do hipotez zerowych, błędów I i II rodzaju oraz mocy testu statystycznego. Wartość p jest podawana (i często interpretowana) w odniesieniu do α, czyli prawdopodobieństwa błędu typu I, czyli z wielkością niewspółmierną (niekompatybilną). Ostatnio wyjaśnienia testu istotności podawane przez J. Neymana, autora, który nie był związany z powstaniem tych testów, może sprowadzić czytelników o przygotowaniu matematycznym na manowce, poprzez aksjomatyczny zapis czegoś, co nie jest ani ogólnie przyjęte, ani prawdziwe, a mianowicie, że poziom istotności musi być równy częstości z którą hipoteza jest odrzucana w powtarzanym eksperymencie przeprowadzonym w ustalonej populacji dozwolonej przez hipotezę. Ten natrętny aksjomat, który obcy jest rozumowaniu na którym testy istotności zostały oparte wydaje się być poważną przeszkodą w dalszym postępie. Fisher, 1945 Jarosław Piskorski (IF UZ) 119 / 122 Jarosław Piskorski (IF UZ) 120 / 122

16 Nieprawidłowe interpretacje wartości p i α Jeden z powodów zamieszania p to prawdopodobieństwo I rodzaju p to maksymalne tolerowalne prawdopodobieństwo błędu typu pierwszego miara możliwości wystąpienia błędu I rodzaju α to ustalone przed eksperymentem prawdopodobieństwo błędu typu I używane do kontrolowania prawdopodobieństwa odrzucenia H 0 rozszerzenie klasycznej (frequentist) interpretacji przedziału ufności na wartość p używanie p < α jako miary dowodów przeciwko H 0 Karl Pearson zabronił Fisherowi reprodukcji table z Biometriki, więc Fisher stworzył swoją, uboższą wersję. Jarosław Piskorski (IF UZ) 121 / 122 Jarosław Piskorski (IF UZ) 122 / 122

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( ) Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału

Bardziej szczegółowo

Zmienna bazowa. 100(1 α)% przedział ufności dla µ: 100(α)% test hipotezy dla µ = µ 0; odrzucić, jeżeli Ȳ nie jest w przedziale

Zmienna bazowa. 100(1 α)% przedział ufności dla µ: 100(α)% test hipotezy dla µ = µ 0; odrzucić, jeżeli Ȳ nie jest w przedziale Wprowadzenie Wprowadzenie Wnioskowanie podsumowanie Zdefiniuj populację, która będzie przedmiotem badań Zbierz parametry, które będą przedmiotem wnioskowania Wybierz losową próbę z populacji Przeprowadź

Bardziej szczegółowo

Prawdopodobieństwo i rozkład normalny cd.

Prawdopodobieństwo i rozkład normalny cd. # # Prawdopodobieństwo i rozkład normalny cd. Michał Daszykowski, Ivana Stanimirova Instytut Chemii Uniwersytet Śląski w Katowicach Ul. Szkolna 9 40-006 Katowice E-mail: www: mdaszyk@us.edu.pl istanimi@us.edu.pl

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria Wykład 5 dr inż. Anna Skowrońska-Szmer zima 2017/2018 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją

Bardziej szczegółowo

Wnioskowanie statystyczne. Statystyka w 5

Wnioskowanie statystyczne. Statystyka w 5 Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15 VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady

Bardziej szczegółowo

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012

Bardziej szczegółowo

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1 Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Było: Estymacja parametrów rozkładu teoretycznego punktowa przedziałowa Przykład. Cecha X masa owocu pewnej odmiany. ZałoŜenie: cecha X ma w populacji rozkład

Bardziej szczegółowo

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie

Bardziej szczegółowo

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria Wykład 5 Anna Skowrońska-Szmer lato 2016/2017 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją jako prawdziwą

Bardziej szczegółowo

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde

Bardziej szczegółowo

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę

Bardziej szczegółowo

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4. Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ

Bardziej szczegółowo

Hipotezy statystyczne

Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej próbki losowej. Hipotezy

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów

Bardziej szczegółowo

Hipotezy statystyczne

Hipotezy statystyczne Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta

Bardziej szczegółowo

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.

Bardziej szczegółowo

Testowanie hipotez statystycznych cd.

Testowanie hipotez statystycznych cd. Temat Testowanie hipotez statystycznych cd. Kody znaków: żółte wyróżnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Przykłady testowania hipotez dotyczących:

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz. LABORATORIUM 4 1. Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz. I) WNIOSKOWANIE STATYSTYCZNE (STATISTICAL INFERENCE) Populacja

Bardziej szczegółowo

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28 Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn Wykład 10 Estymacja przedziałowa - przedziały ufności dla średniej Wrocław, 21 grudnia 2016r Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja 10.1 Przedziałem

Bardziej szczegółowo

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów Wstęp do probabilistyki i statystyki Wykład 4. Statystyki i estymacja parametrów dr hab.inż. Katarzyna Zakrzewska, prof.agh, Katedra Elektroniki, WIET AGH Wstęp do probabilistyki i statystyki. Wykład 4

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych 9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

Rozkłady statystyk z próby. Statystyka

Rozkłady statystyk z próby. Statystyka Rozkłady statystyk z próby tatystyka Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających ten

Bardziej szczegółowo

Rozkład Gaussa i test χ2

Rozkład Gaussa i test χ2 Rozkład Gaussa jest scharakteryzowany dwoma parametramiwartością oczekiwaną rozkładu μ oraz dyspersją σ: METODA 2 (dokładna) polega na zmianie zmiennych i na obliczeniu pk jako różnicy całek ze standaryzowanego

Bardziej szczegółowo

Wykład 3 Hipotezy statystyczne

Wykład 3 Hipotezy statystyczne Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Temat Testowanie hipotez statystycznych Kody znaków: Ŝółte wyróŝnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Idea i pojęcia teorii testowania hipotez

Bardziej szczegółowo

Rozkłady statystyk z próby

Rozkłady statystyk z próby Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny

Bardziej szczegółowo

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15 VII WYKŁAD STATYSTYKA 30/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 7 (c.d) WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności,

Bardziej szczegółowo

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej, Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (punktowa, przedziałowa) Weryfikacja

Bardziej szczegółowo

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej

Bardziej szczegółowo

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska Porównanie modeli statystycznych Monika Wawrzyniak Katarzyna Kociałkowska Jaka jest miara podobieństwa? Aby porównywać rozkłady prawdopodobieństwa dwóch modeli statystycznych możemy użyć: metryki dywergencji

Bardziej szczegółowo

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotności, p-wartość i moc testu Wrocław, 01.03.2017r Przykład 2.1 Właściciel firmy produkującej telefony komórkowe twierdzi, że wśród jego produktów

Bardziej szczegółowo

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności: Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności

Bardziej szczegółowo

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. dr hab. Jerzy Nakielski Katedra Biofizyki i Morfogenezy Roślin Plan wykładu: 1. Etapy wnioskowania statystycznego 2. Hipotezy statystyczne,

Bardziej szczegółowo

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)

Bardziej szczegółowo

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014 Estymacja przedziałowa - przedziały ufności dla średnich Wrocław, 5 grudnia 2014 Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja Przedziałem ufności dla paramertu

Bardziej szczegółowo

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie Wyznaczanie przedziału 95%CI oznaczającego, że dla 95% prób losowych następujące nierówności są prawdziwe: X t s 0.025 n < μ < X + t s

Bardziej szczegółowo

Estymacja punktowa i przedziałowa

Estymacja punktowa i przedziałowa Temat: Estymacja punktowa i przedziałowa Kody znaków: żółte wyróżnienie nowe pojęcie czerwony uwaga kursywa komentarz 1 Zagadnienia 1. Statystyczny opis próby. Idea estymacji punktowej pojęcie estymatora

Bardziej szczegółowo

Oszacowanie i rozkład t

Oszacowanie i rozkład t Oszacowanie i rozkład t Marcin Zajenkowski Marcin Zajenkowski () Oszacowanie i rozkład t 1 / 31 Oszacowanie 1 Na podstawie danych z próby szacuje się wiele wartości w populacji, np.: jakie jest poparcie

Bardziej szczegółowo

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

TESTOWANIE HIPOTEZ STATYSTYCZNYCH TETOWANIE HIPOTEZ TATYTYCZNYCH HIPOTEZA TATYTYCZNA przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia jest oceniana na

Bardziej szczegółowo

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych

Bardziej szczegółowo

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego

Bardziej szczegółowo

Zadania ze statystyki, cz.6

Zadania ze statystyki, cz.6 Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych

Bardziej szczegółowo

Wykład 9 Wnioskowanie o średnich

Wykład 9 Wnioskowanie o średnich Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i

Bardziej szczegółowo

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1. Opracowała: Joanna Kisielińska ZMIENNE LOSOWE Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R tzn. X: R. Realizacją zmiennej losowej

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

Metody Statystyczne. Metody Statystyczne.

Metody Statystyczne. Metody Statystyczne. gkrol@wz.uw.edu.pl #4 1 Sprawdzian! 5 listopada (ok. 45-60 minut): - Skale pomiarowe - Zmienne ciągłe i dyskretne - Rozkład teoretyczny i empiryczny - Miary tendencji centralnej i rozproszenia - Standaryzacja

Bardziej szczegółowo

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;

Bardziej szczegółowo

Pobieranie prób i rozkład z próby

Pobieranie prób i rozkład z próby Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wprowadzenie

Testowanie hipotez statystycznych. Wprowadzenie Wrocław University of Technology Testowanie hipotez statystycznych. Wprowadzenie Jakub Tomczak Politechnika Wrocławska jakub.tomczak@pwr.edu.pl 10.04.2014 Pojęcia wstępne Populacja (statystyczna) zbiór,

Bardziej szczegółowo

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności. TEST STATYSTYCZNY Testem statystycznym nazywamy regułę postępowania rozstrzygająca, przy jakich wynikach z próby hipotezę sprawdzaną H 0 należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia.

Bardziej szczegółowo

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW Założenia do analizy wariancji dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW anna_rajfura@sggw.pl Zagadnienia 1. Normalność rozkładu cechy Testy: chi-kwadrat zgodności, Shapiro-Wilka, Kołmogorowa-Smirnowa

Bardziej szczegółowo

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...

Bardziej szczegółowo

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu, z którego pochodzi próbka. Hipotezy dzielimy na parametryczne i nieparametryczne. Parametrycznymi

Bardziej szczegółowo

WNIOSKOWANIE STATYSTYCZNE

WNIOSKOWANIE STATYSTYCZNE STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących

Bardziej szczegółowo

Analiza niepewności pomiarów

Analiza niepewności pomiarów Teoria pomiarów Analiza niepewności pomiarów Zagadnienia statystyki matematycznej Dr hab. inż. Paweł Majda www.pmajda.zut.edu.pl Podstawy statystyki matematycznej Histogram oraz wielobok liczebności zmiennej

Bardziej szczegółowo

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407 Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Weryfikacja hipotez dotyczących postaci nieznanego rozkładu -Testy zgodności.

Bardziej szczegółowo

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1. Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w

Bardziej szczegółowo

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

dr hab. Dariusz Piwczyński, prof. nadzw. UTP dr hab. Dariusz Piwczyński, prof. nadzw. UTP NIEZBĘDNE DO ZROZUMIENIA WYKŁADU POJĘCIA Doświadczenie jednogrupowe (jednopróbkowe), dwugrupowe (dwupróbkowe) Doświadczenie niezależne i wiązane (zależne, sparowane)

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl

Bardziej szczegółowo

WYKŁAD 5 TEORIA ESTYMACJI II

WYKŁAD 5 TEORIA ESTYMACJI II WYKŁAD 5 TEORIA ESTYMACJI II Teoria estymacji (wyznaczanie przedziałów ufności, błąd badania statystycznego, poziom ufności, minimalna liczba pomiarów). PRÓBA Próba powinna być reprezentacyjna tj. jak

Bardziej szczegółowo

Zadania ze statystyki cz.8. Zadanie 1.

Zadania ze statystyki cz.8. Zadanie 1. Zadania ze statystyki cz.8. Zadanie 1. Wykonano pewien eksperyment skuteczności działania pewnej reklamy na zmianę postawy. Wylosowano 10 osobową próbę studentów, których poproszono o ocenę pewnego produktu,

Bardziej szczegółowo

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej, Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (estymacja punktowa, przedziałowa)

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Bioinformatyka Wykład 4 Wrocław, 17 października 2011 Temat. Weryfikacja hipotez statystycznych dotyczących wartości oczekiwanej w dwóch populacjach o rozkładach normalnych. Model 3. Porównanie średnich

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Przykład (wstępny). Producent twierdzi, że wadliwość produkcji wynosi 5%. My podejrzewamy, że rzeczywista wadliwość produkcji wynosi 15%. Pobieramy próbę stuelementową

Bardziej szczegółowo

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z

Bardziej szczegółowo

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N = HISTOGRAM W pewnych przypadkach interesuje nas nie tylko określenie prawdziwej wartości mierzonej wielkości, ale także zbadanie całego rozkład prawdopodobieństwa wyników pomiarów. W takim przypadku wyniki

Bardziej szczegółowo

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW ODRZUCANIE WYNIKÓW OJEDYNCZYCH OMIARÓW W praktyce pomiarowej zdarzają się sytuacje gdy jeden z pomiarów odstaje od pozostałych. Jeżeli wykorzystamy fakt, że wyniki pomiarów są zmienną losową opisywaną

Bardziej szczegółowo

Estymacja przedziałowa. Przedział ufności

Estymacja przedziałowa. Przedział ufności Estymacja przedziałowa Przedział ufności Estymacja przedziałowa jest to szacowanie wartości danego parametru populacji, ρ za pomocą tak zwanego przedziału ufności. Przedziałem ufności nazywamy taki przedział

Bardziej szczegółowo

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd. WYKŁAD 9 TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd. Było: Przykład 1. Badano krąŝek o wymiarach zbliŝonych do monety jednozłotowej ze stronami oznaczonymi: A, B. NaleŜy ustalić, czy krąŝek jest symetryczny?

Bardziej szczegółowo

IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15

IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15 IV WYKŁAD STATYSTYKA 26/03/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 4 Populacja generalna, próba, losowanie próby, estymatory Statystyka (populacja generalna, populacja próbna, próbka mała, próbka duża, reprezentatywność,

Bardziej szczegółowo

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0 Testowanie hipotez Każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy nazywamy hipotezą statystyczną. Hipoteza określająca jedynie wartości nieznanych parametrów liczbowych badanej cechy

Bardziej szczegółowo

Na podstawie dokonanych obserwacji:

Na podstawie dokonanych obserwacji: PODSTAWOWE PROBLEMY STATYSTYKI MATEMATYCZNEJ Niech mamy próbkę X 1,..., X n oraz przestrzeń prób X n, i niech {X i } to niezależne zmienne losowe o tym samym rozkładzie P θ P. Na podstawie obserwacji chcemy

Bardziej szczegółowo

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH Co to są hipotezy statystyczne? Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej. Dzielimy je

Bardziej szczegółowo

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy

Bardziej szczegółowo