Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Podobne dokumenty
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Jeśli powyższy opis nie jest zrozumiały należy powtórzyć zagadnienie standaryzacji zanim przejdzie się dalej!

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Pobieranie prób i rozkład z próby

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Estymacja punktowa i przedziałowa

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Wnioskowanie statystyczne. Statystyka w 5

Metody Statystyczne. Metody Statystyczne.

Oszacowanie i rozkład t

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

STATYSTYKA MATEMATYCZNA

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Grupowanie materiału statystycznego

Statystyka matematyczna dla leśników

Testowanie hipotez statystycznych

IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15

Zadania ze statystyki, cz.6

METODY STATYSTYCZNE W BIOLOGII

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Testowanie hipotez statystycznych

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Prawdopodobieństwo i rozkład normalny cd.

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO czȩść I

STATYSTYKA INDUKCYJNA. O sondażach i nie tylko

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Spis treści 3 SPIS TREŚCI

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Weryfikacja hipotez statystycznych

KURS STATYSTYKA. Lekcja 2 Przedziały ufności i estymacja przedziałowa ZADANIE DOMOWE. Strona 1

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Estymacja parametro w 1

Rozkłady statystyk z próby

Estymacja parametrów rozkładu cechy

ESTYMACJA. Przedział ufności dla średniej

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Kolokwium ze statystyki matematycznej

166 Wstęp do statystyki matematycznej

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Teoria Estymacji. Do Powyżej

a. opisać badaną cechę; cechą X jest pomiar średnicy kulki

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Monte Carlo, bootstrap, jacknife

Rozkłady statystyk z próby. Statystyka

Kontekstowe wskaźniki efektywności nauczania - warsztaty

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

STATYSTYKA INDUKCYJNA. O sondaŝach ach i nie tylko

5. WNIOSKOWANIE PSYCHOMETRYCZNE

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010

Metody probabilistyczne

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0

WYKŁAD 5 TEORIA ESTYMACJI II

1. szereg wyliczający (szczegółowy) - wyniki są uporządkowane wyłącznie według wartości badanej cechy, np. od najmniejszej do największej

Statystyka Matematyczna Anna Janicka

WNIOSKOWANIE STATYSTYCZNE

Statystyka matematyczna i ekonometria

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

1 Podstawy rachunku prawdopodobieństwa

Statystyka i Analiza Danych

KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański

Zadanie Punkty Ocena

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Testowanie hipotez statystycznych. Wprowadzenie

ESTYMACJA PARAMETRYCZNA I WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH

Może faktycznie ceny na Opolszczyźnie są wyższe niż w Polsce. Ceny na Opolszczyźnie są podobne, a akurat trafiliśmy na próbę droższych piekarni.

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

1 Estymacja przedziałowa

Hipotezy statystyczne

Transkrypt:

Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru na podstawie estymatora Statystyka indukcyjna: estymacja parametrów szacowanie wartości parametrów na podstawie wartości estymatora. Statystyka indukcyjna pozwala obliczyć błąd jakim obciążone są te szacunki! - punktowa - przedziałowa testowanie hipotez ESTYMATOR STATYSTYKA W PRÓBIE PARAMETR STATYSTYKA W POPULACJI Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Jeśli chcemy coś powiedzieć o średniej w populacji to informujemy o średniej w próbie. Jest to tak zwana ESTYMACJA PUNKTOWA Co z tego wynika: dalej nie wiemy ile wynosi średnia w populacji, ale zgadzamy się, że obliczona średnia jest pewnym przybliżeniem średniej w populacji. 1

Możemy również wyznaczyć zróżnicowanie w nieskończonej liczbie pomiarów czyli błąd standardowy. Jeśli wylosowalibyśmy nieskończenie wiele prób i dla każdej z prób obliczylibyśmy np. średnią, to otrzymamy nieskończenie wiele średnich. Tak otrzymany rozkład średnich jest tzw. rozkładem średnich z próby. Jest to rozkład teoretyczny! Jeśli obliczymy zróżnicowanie - czyli odchylenie standardowe - rozkładu tych średnich to otrzymamy wielkość błędu standardowego Rozkład średnich z próby jest rozkładem normalnym o średniej i odchyleniu standardowym równemu błędowi standardowemu Błąd standardowy średniej możemy wyznaczyć na podstawie wzoru - poszukiwana średnia w populacji (parametr) - odchylenie standardowe w populacji M i średnie z kolejnych prób s odchylenie standardowe w próbie N- liczebność próby 2

Im mniejszy błąd tym lepiej - większa dokładność szacowania Im mniejsze zróżnicowanie z próby czyli mniejszy błąd standardowy z tym większą dokładnością możemy określić wielkość statystyki w populacji Możemy estymować nie tylko średnią w populacji, ale inne statystyki: odchylenie standardowe, wariancję, medianę, proporcję, itd. Estymowany parametr przewidujemy za pomocą przedziału liczbowego, w którym z określonym stopniem pewności znajduje parametr w populacji. Przewidując, np. średnią liczbę dni urlopu w sierpniu możemy stwierdzić, że średnia liczba dni urlopu w sierpniu zawiera się w przedziale <1-31> i mamy wtedy 100% pewność, że tak jest. Ale choć jest to wiedza pewna, to żadnym stopniu nas ta informacja nie satysfakcjonuje. Jeśli skrócimy przedział w którym jak przypuszczamy zawierała się będzie średnia to stracimy tę 100% pewność. Informacja, że średnia zawiera się w przedziale <10-15> jest mniej pewna (obarczona błędem), bo może się zdarzyć, ze podany przez nas przedział nie zawiera prawdziwej średniej dni urlopu w sierpniu. Estymator przedziałowy parametru jest nazywany przedziałem ufności. Poziom ufności (1-alfa) jest miarą wiarygodności estymatora Nie wiemy ile dokładnie wynosi parametr w populacji (np. średnia), ale szacujemy ją podając pewien przedział, który jak przypuszczamy tę średnią zawiera. 3

Interpretując przedział ufności otrzymany dla danych z konkretnego badania należy pamiętać, że jest to jeden z wielu przedziałów, który możemy wyznaczyć dla przewidywanego parametru. Gdyby wylosowała się inna próba otrzymalibyśmy inny przedział ufności. Parametr jest stały, zmienia się - w zależności od próby - przedział ufności Przewidując parametr (a dokładnie, przedział, który będzie zawierał parametr) przyjmujemy pewne ryzyko popełnienia błędu czyli dopuszczamy że wyznaczony przedział nie zawiera parametru. Ryzyko, że pomylimy się w 5 przewidywaniach na 100, oznacza, że parametr przewidujemy z 95% poziomem ufności. Jeśli będziemy pobierać nieskończenie wiele prób i na ich podstawie wyznaczać przedziały ufności to 95% z nich zawiera prawdziwy (stały) parametr. Szansa, że przedział ufności zawiera prawdziwą średnią wynosi 95 na100 (wynika to z własności rozkładu normalnego). Konkretny (np. uzyskany w naszych badaniach) przedział, zawiera albo nie zawiera średnią z populacji. Ale tego nie wiemy. Ufamy jednak (?), że jest to jeden z tych 95% wszystkich przedziałów, które zawierają parametr populacji (np. średnią). Ilustracja graficzna przedziałów ufności otrzymanych w nieskończenie wielu próbach. Przy 95% poziomie ufności (z=1,96) 95% z nich zawiera średnią w populacji, 5 % nie Na rysunku znaczono przedziały ufności wyznaczone w przykładowych 7 próbach, spośród których jeden nie zawiera średniej. Teoretycznie takich przedziałów uzyskać możemy nieskończenie wiele. 4

2017-11-13 95% przedział ufności 95% p. ufn 9 9,2 9,4 9,6 9,8 10 10,2 10,4 10,6 10,8 11 99% p. ufn 99% przedział ufności Howell (1997) proponuje myślenie o parametrze jak o słupku, a o przedziałach ufności jako o krążkach, które badacze rzucają na słupek Na podstawie danych z próby badacze tworzą krążki o odpowiedniej średnicy. Posługując się np. 95% przedziałem ufności krążki trafiają na słupek w 95% razach, w 5% rzutów nie trafiają. Twierdzenie dotyczące przedziałów ufności mówią o prawdopodobieństwie z jakim krążek (przedział ufności) znajdzie się na słupku (będzie zawierał prawdziwą wartość parametru), a nie dotyczy prawdopodobieństwa z jakim słupek (parametr) znajdzie się w krążku (w przedziale ufności) Shaughnessy J. J., Zechmeister E. B. - Metody badawcze w psychologii, s. 449, za Howell D.C. Statistical methods for psychology. 5

Długość przedziału ufności zależy od przyjętego poziomu istotności (alfa) /poziomu ufności (1-alfa). Im większy poziom ufności tym dłuższy przedział, tym mniejsza precyzja szacowania. Jeśli jest duże zróżnicowanie cechy w populacji to nie można oczekiwać krótkich przedziałów ufności. 95% poziom ufności dla średniej oznacza, że gdybyśmy wyznaczyli przedziały ufności z (nieskończenie) wielu prób, to 95% tych przedziałów będzie zawierało prawdziwą wartość poszukiwanego parametru. Nie wiadomo dokładnie, który z przedziałów zawiera tę wartość. Wiadomo jedynie, ile z nich będzie w błędzie, a ile będzie zawierało prawdziwą wartość parametru. W praktyce nie przeprowadzamy losowania wielu prób. Losujemy JEDNĄ próbę i na jej podstawie przewidujemy to co dzieje się w populacji. Ufamy, że wyznaczony w naszej jednej próbie przedział ufności tą średnią zawiera. Mamy na to 95% szansę 95% przedział ufności oznacza 95% prawdopodobieństwo, że prawdziwa wartość parametru leży w podanych widełkach 95% przedział ufności oznacza, że możemy być w 95% pewni, że prawdziwy parametr leży w podanym przedziale. Przedział ufności to przedział wiarygodnych wartości dla średniej 95% przedział ufności oznacza, że interesujący nas parametr ma 95% prawdopodobieństwo znalezienia się w tym przedziale 6

Można sprawdzić, że końce przedziałów to 50,932 0,188 * 1,96 Opis wyników: Średnia indeksu męskości wynosi M=50,9, błąd standardowy średniej wynosi S M =0,188. Przedział ufności wyznaczony dla 95% poziomu ufności wynosi (50,563, 51,301). Istnieje 95% prawdopodobieństwo, że uzyskany przedział ufności (50,563, 51,301) zawiera prawdziwą średnią w populacji. Jak należy rozumieć, zinterpretować powyższe raportowanie wyników czyli co czytamy między wierszami. Przyjmujemy, że średnia w populacji wynosi 50,9. Ale ten wynik różni się od prawdziwego. Błąd standardowy S M =0,188 to wielkość zróżnicowania rozkładu średnich, które byśmy otrzymali pobierając nieskończenie wiele prób. Stwierdzamy, z 95% prawdopodobieństwem, że przedział (50,563, 51,301) jest przedziałem, który zawiera prawdziwą średnia w populacji. Szansa, że wyznaczony przedział ufności zawiera prawdziwą średnią wynosi 95 na 100. Czyli, że jest to jeden z tych 95% przedziałów, które zawierają prawdziwą średnią, a które byśmy wyznaczyli wyznaczając przedziały ufności pobierając nieskończenie wiele prób. 99% przedział ufności (50,44, 51,41) 95% p. ufności (50,56, 51,30) 50 50,4 50,8 51,2 51,6 52 Im szerszy przedział tym większa pewność, że zawiera parametr, niestety większa pewność powoduje, że spada precyzja szacowania 7

to w istocie połowa długości przedziału ufności Co raportujemy w wynikach (np. badan sondażowych)? Średnia wysokość kwoty przeznaczanej na wakacje wynosi 2000zł, a błąd statystyczny wynosi 150zł, poziom ufności 0,95. Co z tego wynika? Że wyznaczono przedział ufności dla średniej wakacyjnych wydatków (1850zł, 2150zł). Błąd standardowy średniej wydatków wynosi 76,53zł (=150zł/1,96) Zróżnicowanie nieskończenie wielu pomiarów (zmienność) wakacyjnych wydatków jest na poziomie 76,53zł. Odchylenie standardowe z próby wynosi 76,53zł Wysokość wydatków uzyskana w próbie (200zł) z nie różni się od rzeczywistej wielkości wydatków o więcej niż błąd statystyczny (+/- 150zł ) z prawdopodobieństwem 95% to w istocie połowa długości przedziału ufności Co raportujemy w wynikach (np. badan sondażowych)? Poparcie dla poglądu, że statystyka jest fajna wynosi 85%, a błąd statystyczny (błąd pomiaru) wynosi 3%, przyjęty w badaniach poziom ufności wynosi 0,95. Co z tego wynika? Że przedział ufności dla frakcji uważających, że statystyka jest fajna wynosi (82%, 88%). Błąd standardowy frakcji wynosi natomiast 1,53% (=3%/1,96) Zróżnicowanie nieskończenie wielu pomiarów (zmienność) frakcji jest na poziomie 1,53% Odsetek z próby (85%) nie różni się od prawdziwego odsetka w populacji o więcej niż jeden błąd statystyczny 3% (z prawdopodobieństwem 95%) 8

- Od wielkości populacji (wielkość dużych populacji nie wpływa znacząco na wielkość próby wielkość próby rośnie dla coraz większych populacji, ale tylko do pewnego momentu, potem rozmiar populacji nie wpływa na wielkość próby dzielimy przez bardzo duże N, jak bardzo nie ma znaczenia bo i tak otrzymam wartość bliska zera) - Od błędu standardowego (zwykle zakładamy jego maksymalną dopuszczalną wartość = błąd dopuszczalny/maksymalny) - od poziomu ufności, określanego za pomocą poziomu istotności alfa Alfa = 1 poziom ufności 9

Bardziej wnikliwe omówienie idei estymacji przedziałowej znajduje się w materiałach dodatkowych 10