Ustalanie mocy testu i optymalnej wielkości próby

Wielkość: px
Rozpocząć pokaz od strony:

Download "Ustalanie mocy testu i optymalnej wielkości próby"

Transkrypt

1 Warsztaty szkoleniowe z zakresu oceny oddziaływania instrumentów aktywnej polityki rynku pracy Ustalanie mocy testu i optymalnej wielkości próby Piotr Ćwiakowski, Kraków, 7 czerwca 2017 r.

2 Plan wykładu Dlaczego próbkowanie jest potrzebne? (powtórzenie) Jakie znaczenie ma wielkość próby? (nowość) Jaka próba jest dostatecznie duża? (nowość) Jak zwiększyć moc testu? (nowość)

3 DLACZEGO PRÓBKOWANIE JEST KONIECZNE?

4 Próbkowanie pozwala wnioskować o charakterystykach populacji 1. Populacja docelowa 2. Próba badawcza Takie same charakterystyki (trafność zewnętrzna)

5 Typowe dylematy badacza (o wielkości próby) Powinienem wylosować 200, czy raczej 500 obserwacji do mojej próby? Jaka jest praktyczna różnica między próbą 200 a 500? Czy da się to skwantyfikować? Czy są jakieś reguły pozwalające ustalić optymalną wielkość próby? Jak duża próba jest już wystarczająco duża?

6 JAKIE ZNACZENIE MA WIELKOŚĆ PRÓBY?

7 Przykład badanie wzrostu Polaków Załóżmy, że wybraliśmy (losowo) 10 osób z populacji Polski, mierząc ich wzrost i następnie opierając się o prostą średnią wzrostu w próbie, twierdzimy: średni wzrost Polaka wynosi 170 cm Dajecie wiarę temu wnioskowi? Dlaczego? Dlaczego nie?

8 Przykład badanie wzrostu Polaków Załóżmy teraz, że wybraliśmy (losowo) 1000 osób z populacji Polski, mierząc ich wzrost i następnie opierając się o prostą średnią wzrostu w próbie, twierdzimy: średni wzrost Polaka to 170 cm Czy wierzycie teraz mniej lub bardziej we wnioski z badania? Dlaczego?

9 Znaczenie wielkości próby Duża próba losowa zwiększa wiarygodność badania, ponieważ: Mamy większą pewność że próba ma takie same charakterystyki jak populacja. Jest mniejsza szansa, że ewentualne obserwacje odstające spowodują obciążenie wyników. Jest większa szansa, że otrzymany wynik będzie bliższy prawdziwemu i że błąd wynikający z przypadkowości losowania będzie mniejszy. Intuicyjnie: Im większa jest próba, tym mniejsza niepewność związana z wynikiem.

10 Case study - opis Pewien PUP postanowił zbadać średni wzrost osób bezrobotnych w swoim okręgu. Całkowita liczba bezrobotnych w powiecie wynosi Jakie mamy możliwości?

11 Case study - opis Pewien PUP postanowił zbadać średni wzrost osób bezrobotnych w swoim okręgu. Całkowita liczba bezrobotnych w powiecie wynosi Jakie mamy możliwości? 1) Zmierzyć wzrost wszystkich osób w populacji docelowej i podać wynik (średnia). 2) Skonstruować próbę losową, policzyć średnią, przeprowadzić prosty test statystyczny i wyciągnąć wnioski nt. wzrostu w populacji. Ponieważ było wystarczające finansowanie projektu, analitycy PUP-u zmierzyli wzrost wszystkich osób bezrobotnych w powiecie. Zatem bez wykorzystania testów statystycznych, mogli stwierdzić że prawdziwy średni wzrost wśród bezrobotnych (na terenie ich powiatu) wynosi 165,1 cm. Dodatkowo, pewien dociekliwy analityk postanowił sprawdzić co by było, gdyby zamiast obranej strategii zdecydowano się oprzeć badanie na próbie losowej i estymować oczekiwany wzrost bezrobotnego, za pomocą średniej z próby. Badacz przeprowadził w tym celu następujący eksperyment. Z tej samej populacji wylosował 30 podprób 10 po 5 os., 10 po 10 os. wreszcie 10 po 20 os.

12 Case study - analiza wyników Średnie w podpróbach n = 5 n = 10 n = , , ,5 168,4 167, ,8 166,16 166,2 165,7 165,70 165,95 164,0 164,51 164,65 163, ,6 162, , ,9 161 Średnie z średnich 166,0 165,5 165,4 Błąd standardowy oszacowań 2,72 1,78 1,51 Źródło: Kopczyński M. (2005). Podstawy statystyki. Podręcznik dla humanistów. Warszawa: Oficyna Wydawnicza Mówią wieki.

13 Case study - analiza wyników Ta liczba oznacza, że w pierwszej podpróbie składającej się z 5 obs. średni wzrost wyniósł 170,1 cm Średnie w podpróbach n = 5 n = 10 n = , , ,5 168,4 167, ,8 166,16 166,2 165,7 165,70 165,95 164,0 164,51 164,65 163, ,6 162, , ,9 161 Średnie z średnich 166,0 165,5 165,4 Błąd standardowy oszacowań Ta liczba oznacza, że w drugiej podpróbie składającej się z 10 obs. średni wzrost wyniósł 169 cm. 2,72 1,78 1,51 Ta liczba oznacza, że w trzeciej podpróbie składającej się z 20 obs. średni wzrost wyniósł 168,4 cm.

14 Case study - wnioski Średnie w podpróbach n = 5 n = 10 n = , , ,5 168,4 167, ,8 166,16 166,2 165,7 165,70 165,95 164,0 164,51 164,65 163, ,6 162, , ,9 161 Średnie z średnich 166,0 165,5 165,4 Błąd standardowy oszacowań 2,72 1,78 1,51 Przeciętny rezultat eksperymentu jest bliższy prawdzie w próbie liczniejszej.

15 Case study - wnioski Średnie w podpróbach n = 5 n = 10 n = , , ,5 168,4 167, ,8 166,16 166,2 165,7 165,70 165,95 164,0 164,51 164,65 163, ,6 162, , ,9 161 Średnie z średnich 166,0 165,5 165,4 Błąd standardowy oszacowań 2,72 1,78 1,51 Niepewność wyniku (mierzona bł. std.) jest mniejsza dla prób liczniejszych

16 Case study - podsumowanie - W liczniejszej próbie jest większa szansa na to aby wynik był dokładniejszy. - Liczniejsze próby mają mniejszy błąd wyniku związany z losowaniem (błąd czysto losowy). - Liczniejsze próby mają bardziej stabilny wynik w ramach eksperymentu (mniejszy błąd standardowy).

17 Skąd wiemy, że wnioski z badań nie są przypadkowe? Przedziały ufności są statystyczną miarą naszej ufności w wyniki. Przez ufność rozumiemy pewność, że zaobserwowany wynik nie jest przypadkowy (tzn. że nie wynika z błędu czysto losowego). Zwyczajowo przyjmuje się 95% poziom ufności.

18 Testowanie przedziałem ufności Poziom bezrobocia Statystycznie nieistotny wynik 45% 40% 95% poziom ufności Wielkość próby = % Grupa eksperymentalna Grupa kontrolna

19 Przykład Rząd chciałby przetestować nowy model aktywizacji bezrobotnych i zdecydował się na przeprowadzenie programu pilotażowego w jednym z powiatów. Połowa losowo wyselekcjonowanych bezrobotnych została wybrana do nowego programu, a wobec pozostałych stosowano politykę sprzed reformy. Do badania ewaluacyjnego wylosowano po 200 osób do grupy kontrolnej i eksperymentalnej. Załóżmy teraz, że stopa zatrudnienia po roku działania wśród osób obserwowanych w badaniu ewaluacyjnym, objętych nowym programem wynosiła 65%, a w grupie kontrolnej 55%. Pojawia się kluczowe pytanie: Czy różnica między grupami jest statystycznie istotna? Spróbujmy rozważyć kilka analiz statystycznych z różnymi zestawami parametrów badawczych.

20 Testowanie przedziałem ufności Poziom bezrobocia Statystycznie nieistotny wynik 45% 30% 95% poziom ufności Wielkość próby = % Grupa eksperymentalna Grupa kontrolna

21 Przykład (2) ufność w wyniki Co by się stało, gdyby wskaźniki 55% i 65% były prawdziwe, a my byśmy wyselekcjonowali do badania 1000 osób ( ) zamiast 400 ( ).

22 Poziom bezrobocia 45% 40% Liczniejsza próba oznacza pewność Statystycznie istotny wynik wyniku 95% poziom ufności Wielkość próby = % Grupa eksperymentalna Grupa kontrolna

23 Intuicja: szerokość przedziału ufności (błąd) a wielkość próby błąd = ½ * szerokość przedziału ufności/efektu programu

24 Duża próba v. mała próba wnioski Liczniejsza próba zwęża przedziały ufności, co odzwierciedla wzrost pewności wyników. Z licznością próby rośnie prawdopodobieństwo zaobserwowania statystycznie istotnego wyniku.

25 Przykład (2) Wielkość efektu (effect size) Załóżmy, że w wyniku działania tego samego programu spodziewany jest większy efekt (20 punktów procentowych różnicy zamiast wyjściowych 10 pp.). Projektując ewaluację, powinno się zwiększyć czy zmniejszyć próbę badawczą?

26 CLICKER QUESTION Program A: oczekujemy dużej różnicy w stopie zatrudnienia pomiędzy grupą eksperymentalną a kontrolną (20 pp.) Program B: oczekujemy małej różnicy w stopie zatrudnienia pomiędzy grupą eksperymentalną a kontrolną (10 pp.) Aby oba badania miały tę samą moc, który scenariusz badawczy powinien zakładać większą próbę? A. Program A B. Program B C. Taka sama próba dla scenariuszy A and B 0% 0% 0% A. B. C.

27 Wielkość efektu v. wielkość próby N = 200 N = 500

28 Wielkość efektu wnioski Im większy rezultat naszej polityki, tym mniejszej próby potrzebujemy aby go udowodnić.

29 Podsumowanie Zakładając, że estymowany efekt jest prawdziwy, zwiększamy prawdopodobieństwo jego udowodnienia jeśli nasza próba będzie dostatecznie duża. Więc jeśli zwiększanie próby może tylko poprawić jakość badania, czemu nie badać za każdym razem całej populacji?

30 Podsumowanie Zakładając, że estymowany efekt jest prawdziwy, zwiększamy prawdopodobieństwo jego udowodnienia jeśli nasza próba będzie dostatecznie duża. Więc jeśli zwiększanie próby może tylko poprawić jakość badania, czemu nie badać za każdym razem całej populacji? ograniczone fundusze, malejąca korzyść z dodatkowej jednostki w próbie (np. malejący wzrost wiarygodności wyników z 1 dodatkowej osoby w dużej próbie). Potrzebne jest zatem narzędzie, które pozwoli na policzenie optymalnej wielkości próby. Optymalnej, czyli minimalnej próby potrzebnej do udowodnienia na danym poziomie ufności założonego a priori efektu.

31 POWER CALCULATIONS JAKA PRÓBA JEST DOSTATECZNIE DUŻA?

32 Moc Prawdopodobieństwo wykrycia efektu, pod warunkiem że hipoteza o istnieniu efektu jest prawdziwa. Standardowo przyjmuje się poziom mocy testu 80%. Oznacza to akceptację 20% prawdopodobieństwa nie wykrycia efektu nawet jeśli jest prawdziwy. Potrzebna jest większa próba, aby moc była większa!

33 Liczenie wielkości próby Mając: ustalony poziom ufności (zwykle 95%), założony poziom mocy testu (zwykle 80%), założoną wielkość efektu (zależy od charakteru programu, ale za istotny uznaje się efekt co najmniej na poziomie 20% odchylenia standardowego w próbie), możemy wyznaczyć minimalną wielkość próby potrzebną do otrzymania statystycznie istotnego wyniku.

34 Liczenie wielkości próby - przykład

35 Minimalny wykrywalny efekt Mając: ustalony poziom ufności (zwykle 95%), założony poziom mocy testu (zwykle 80%), założoną wielkość próby, możemy policzyć minimalny efekt, jaki musimy osiągnąć, aby udowodnić pozytywne skutki ewaluowanej polityki.

36 JAK ZWIĘKSZYĆ MOC?

37 Moc testu zależy od wielu czynników 1. Zmienności w populacji 2. Wielkości efektu 3. Reprezentatywności próby Czy potrzebujemy stratyfikacji w schemacie losowania? 4. Sposobu randomizacji (jednostki v. grupy): Czy losujemy pojedynczych respondentów, czy raczej klastry? (szkoły, powiaty, etc.)

38 1. Jak podobne/różne są osoby w populacji? Populacja jednorodna Populacja zróżnicowan a

39 Test: Jak reagują na zmiany? Podobnie W różny sposób

40 Jeśli populacja jest jednorodna, jest mniejsza szansa na uzyskanie przypadkowego wyniku 140 cm 130 cm 130 cm Bez dodatkowego dożywiania wzrost dzieci wynosi 130 cm. Jeśli w grupie eksperymentalnej dzieci są wyższe (140 cm) to jest to wynik działania programu. W eksperymencie kontrolowanym przeprowadzonym na grupie heterogenicznej wnioskowanie nie jest takie proste przypadkowość wyniku jest większa.

41 2. Jak poprawnie założyć wielkość efektu? Jeśli oczekiwany jest duży efekt, zostanie wykryty nawet w małej próbie badawczej. Dlaczego? Ponieważ przy zaobserwowaniu dużej różnicy w punkcie końcowym prawdopodobieństwo, że taki wynik jest przypadkowy, jest niewielkie. Odwrotnie, jeśli oczekujemy małych efektów (ale mających praktyczne znaczenie), należy zwiększyć próbę aby zwiększyć szansę udowodnienia go w analizie statystycznej. UWAGA: NIE NALEŻY ROBIĆ NIEREALISTYCZNYCH ZAŁOŻEŃ ODNOŚNIE WIELKOŚCI EFEKTU!!

42 Kto jest wyższy?

43 Kto jest wyższy?

44 3. Stratyfikacja próby losowej Czasami próba losowa nie jest wystarczająco duża, abyśmy ex ante mieli zapewnioną reprezentatywność badania (trafność zewnętrzna) więc może okazać, że nie możemy rozciągnąć wniosków z badania na populację. Dlatego, musimy w schemacie losowania dokonać stratyfikacji (warstwowania) aby upewnić się, że kluczowe charakterystyki będą miały taki sam rozkład w próbie i populacji.

45 4. Losowanie grupowe Czasami zależy nam na posiadaniu w próbie osób należących do różnych jednostek szkół, miejscowości, powiatów, etc. Co wtedy?

46 TEST Rząd zamierza dokonać ewaluacji nowego programu edukacyjnego w szkołach podstawowych. Badanie ewaluacyjne jest randomizowane na poziomie powiatu. Aby zwiększyć moc testu i wiarygodność badania analityk ma do wyboru jedną z dwóch strategii. Którą powinien zastosować? A. Zwiększyć liczbę osób badanych na poziomie wybranego powiatu B. Zwiększyć liczbę powiatów wyselekcjonowanych do badania Zwiększyć liczbę osób b... 0% Zwiększyć liczbę powiat.. 0%

47 Przykład: losowanie grupowe v. indywidualne

48 Przykład: losowanie grupowe v. indywidualne

49 Przykład: losowanie grupowe v. indywidualne

50 4. Losowanie grupowe Czasami zależy nam na posiadaniu w próbie osób należących do różnych jednostek szkół, miejscowości, powiatów, etc. Co wtedy? Jeśli losujemy na poziomie klastrów (np. powiatów), aby utrzymać moc testu musimy zwiększyć ich liczbę. Zwiększenie liczby osób wewnątrz klastrów nic nie da do próby będą trafiały osoby z tych samych klastrów, wnosząc relatywnie niewiele nowej informacji ich zachowanie jest silnie powiązane z przynależnością do konkretnego klastra.

51 Przykład: wyniki uczniów w ramach szkoły Szkoła A Szkoła B

52 Intuicyjnie: obciążenie wyników przy małej liczbie klastrów A A B B

53 Zwiększenie liczby uczniów w klastrze nie zwiększa wiarygodności badania. Uczniowie w ramach szkoły będą podobni (profil ucznia w ramach szkoły jest w miarę jednolity). Nowy uczeń z tej samej szkoły w badaniu nie niesie zbyt wielu nowych informacji i nie zwiększa znacząco reprezentatywności badania. Aby zwiększyć moc badania trzeba zwiększyć liczbę szkół (czyli klastrów).

54 Współczynnik korelacji wewnątrzgrupowej (ρ) Stopień w jakim są podobni (homogeniczni) respondenci w ramach klastra. Jeśli ρ=1 Wszystkie osoby w ramach klastra są takie same. Zwiększenie liczby osób w ramach klastra w ogóle nie poprawia jakości badania Efektywna wielkość próby jest równa liczbie klastrów Jeśli ρ=0 Sytuacja taka sama, jak gdybyśmy mieli do czynienia z randomizacją na poziomie osób (z pominięciem klastrów).

55 Przykład - klastry Poniższe badania mają dokładnie taką samą moc:* 80 klastrów, 20 osób w klastrze 40 klastrów, osób w klastrze Porównajmy koszty: osób v ! *Założony współczynnik korelacji wewnątrzgrupowej 5%

56 Przykład klastry vs losowanie indywidualne Oba poniższe badania mają taką samą moc*: Poziom indywidualny: po 393 w grupie kontrolnej i eksperymentalnej [N=786] Losowanie grupowe: 80 klastrów, 20 osób na klaster [N=1600] Jeśli losujemy z klastrów, potrzebna jest większa próba. *Założony współczynnik korelacji wewnątrzgrupowej 5%

57 CLICKER QUESTION Zakładając, że rząd ma fundusze na 2000 wywiadów, którą opcję powinniśmy wybrać aby zmaksymalizować moc badania? (Wnioski z analizy mają dotyczyć populacji bezrobotnych w całej Polsce) A. Przeprowadzenie 20 ankiet na powiat w 100 powiatach. B. Przeprowadzenie 50 ankiet na powiat w 40 powiatach. C. Przeprowadzenie 500 ankiet na powiat w 4 powiatach. D. Nie ma znaczenia, moc testu i tak będzie wystarczająca. 0% 0% 0% 0% A. B. C. D.

58 Inne sposoby zwiększania mocy przy tej samej wielkości próby Stratyfikacja Kontrolowanie wszystkich istotnych zmiennych (e.g. płeć, wiek, zawód) Solidne, rzetelne zbieranie danych Adekwatna metoda statystyczna

59 REGUŁY KCIUKA wskazówki dla analityków

60 Reguły kciuka Losowanie indywidualne: 100 osoba próba losowa rzadko jest wystarczająca osobowa próba losowa (i równy podział między grupę kontrolną i eksperymentalną) zwykle wystarcza. Dobór grupowy: 10 klastrów w grupie eksperymentalnej i 10 w kontrolnej rzadko jest wystarczające. 50 klastrów w grupie eksperymentalnej i 50 w kontrolnej, z co najmniej 15 osobami w klastrze, zwykle wystarcza. ZASTRZEŻENIE: ostateczna optymalna wielkość próby zależy od takich czynników jak: zmienność zjawiska, korelacja wewnątrzgrupowa, oczekiwana wielkość efektu, korelacja między wartościami punktów końcowych przed i po badaniu, itd.

61 Kluczowe wnioski z wykładu Aby badanie było wiarygodne należy mieć odpowiednią wielkość próby Zwiększenie próby powoduje zwiększenie mocy badania Randomizacja na poziomie osób poprzez wzrost liczby osób Randomizacja na poziomie klastrów poprzez wzrost liczby klastrów (a nie osób w klastrach) Wykrycie mniejszego efektu wymaga użycia większej próby

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności: Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności

Bardziej szczegółowo

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

Projektowanie eksperymentu część 2

Projektowanie eksperymentu część 2 Warsztaty szkoleniowe z zakresu ewaluacji wpływu instrumentów Aktywnych Polityk Rynku Pracy Projektowanie eksperymentu część 2 Lucilla Bruni, Kraków, 5 czerwca 2017 r. Idealne badanie eksperymentalne klony

Bardziej szczegółowo

Pomiar wpływu I: Jak mierzyć wpływ? Wstęp do projektowania ewaluacji

Pomiar wpływu I: Jak mierzyć wpływ? Wstęp do projektowania ewaluacji Warsztaty szkoleniowe z zakresu oceny oddziaływania instrumentów aktywnej polityki rynku pracy Pomiar wpływu I: Jak mierzyć wpływ? Wstęp do projektowania ewaluacji Maciej Jakubowski, Gdańsk, 21 lutego

Bardziej szczegółowo

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej, Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (punktowa, przedziałowa) Weryfikacja

Bardziej szczegółowo

Rozstęp Pozycyjne Odchylenie ćwiartkowe Współczynnik zmienności

Rozstęp Pozycyjne Odchylenie ćwiartkowe Współczynnik zmienności Miary zmienności: Miary zmienności Klasyczne Wariancja Odchylenie standardowe Odchylenie przeciętne Współczynnik zmienności Rozstęp Pozycyjne Odchylenie ćwiartkowe Współczynnik zmienności 2 Spróbujmy zastanowić

Bardziej szczegółowo

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1. Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w

Bardziej szczegółowo

Pobieranie prób i rozkład z próby

Pobieranie prób i rozkład z próby Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012

Bardziej szczegółowo

Wykład 9 Wnioskowanie o średnich

Wykład 9 Wnioskowanie o średnich Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i

Bardziej szczegółowo

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA Wykład 4: Wnioskowanie statystyczne Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA Idea wnioskowania statystycznego Celem analizy statystycznej nie jest zwykle tylko

Bardziej szczegółowo

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( ) Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału

Bardziej szczegółowo

Wnioskowanie statystyczne. Statystyka w 5

Wnioskowanie statystyczne. Statystyka w 5 Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów

Bardziej szczegółowo

Jeśli powyższy opis nie jest zrozumiały należy powtórzyć zagadnienie standaryzacji zanim przejdzie się dalej!

Jeśli powyższy opis nie jest zrozumiały należy powtórzyć zagadnienie standaryzacji zanim przejdzie się dalej! CO POWINNIŚMY WIEDZIEĆ (I ROZUMIEĆ) ZABIERAJĄC SIĘ DO CZYTANIA 1. Jeśli mamy wynik (np. z kolokwium) podany w wartościach standaryzowanych (np.: z=0,8) to wiemy, że aby ustalić jaki był wynik przed standaryzacją

Bardziej szczegółowo

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu

Bardziej szczegółowo

Metody doboru próby do badań. Dr Kalina Grzesiuk

Metody doboru próby do badań. Dr Kalina Grzesiuk Metody doboru próby do badań Dr Kalina Grzesiuk Proces doboru próby 1. Ustalenie populacji badanej 2. Ustalenie wykazu populacji badanej 3. Ustalenie liczebności próby 4. Wybór metody doboru próby do badań

Bardziej szczegółowo

Wykład 2: Tworzenie danych

Wykład 2: Tworzenie danych Wykład 2: Tworzenie danych Plan: Statystyka opisowa a wnioskowanie statystyczne Badania obserwacyjne a eksperyment Planowanie eksperymentu, randomizacja Próbkowanie z populacji Rozkłady próbkowe Wstępna/opisowa

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne Czyli jak bardzo jesteśmy pewni że parametr oceniony na podstawie próbki jest

Bardziej szczegółowo

Warsztat: Randomizacja w programie Excel

Warsztat: Randomizacja w programie Excel Warsztaty szkoleniowe z zakresu ewaluacji wpływu instrumentów Aktywnych Polityk Rynku Pracy Warsztat: Randomizacja w programie Excel Piotr Ćwiakowski Tomasz Gajderowicz, Kraków, 5 czerwca 2017 r. Przydział

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

Zadania ze statystyki cz.8. Zadanie 1.

Zadania ze statystyki cz.8. Zadanie 1. Zadania ze statystyki cz.8. Zadanie 1. Wykonano pewien eksperyment skuteczności działania pewnej reklamy na zmianę postawy. Wylosowano 10 osobową próbę studentów, których poproszono o ocenę pewnego produktu,

Bardziej szczegółowo

Pomiar wpływu I: Jak mierzyć wpływ? Wstęp do projektowania ewaluacji

Pomiar wpływu I: Jak mierzyć wpływ? Wstęp do projektowania ewaluacji Warsztaty szkoleniowe z zakresu oceny oddziaływania instrumentów aktywnej polityki rynku pracy Pomiar wpływu I: Jak mierzyć wpływ? Wstęp do projektowania ewaluacji Maciej Jakubowski, Kraków, 6 czerwca

Bardziej szczegółowo

Metody probabilistyczne

Metody probabilistyczne Metody probabilistyczne 13. Elementy statystki matematycznej I Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 17.01.2019 1 / 30 Zagadnienia statystki Przeprowadzamy

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

Badania marketingowe

Badania marketingowe Wiesz już co chcesz osiągnąć w badaniu marketingowym i jak to (idealnie) zorganizować. Ale jakimi metodami? Skąd pewność, że będą efektywne? Ćwiczenie: jaką metodą zbadasz co koledzy/koleżanki na sali

Bardziej szczegółowo

Wykład 10 Zrandomizowany plan blokowy

Wykład 10 Zrandomizowany plan blokowy Wykład 10 Zrandomizowany plan blokowy Staramy się kontrolować efekty zróżnicowania badanych jednostek eksperymentalnych poprzez zapewnienie ich ``jednorodności wewnątrz każdej grupy zabiegowej. Dzielimy

Bardziej szczegółowo

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28 Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych

Bardziej szczegółowo

ZALICZENIA. W celu uzyskania zaliczenia należy wybrać jeden z trzech poniższych wariantów I, II lub III

ZALICZENIA. W celu uzyskania zaliczenia należy wybrać jeden z trzech poniższych wariantów I, II lub III ZALICZENIA W celu uzyskania zaliczenia należy wybrać jeden z trzech poniższych wariantów I, II lub III 1 Wariant I. PROBLEM WŁASNY Sformułować własne zadanie statystyczne związane z własną pracą badawczą

Bardziej szczegółowo

Próbkowanie. Wykład 4 Próbkowanie i rozkłady próbkowe. Populacja a próba. Błędy w póbkowaniu, cd, Przykład 1 (Ochotnicy)

Próbkowanie. Wykład 4 Próbkowanie i rozkłady próbkowe. Populacja a próba. Błędy w póbkowaniu, cd, Przykład 1 (Ochotnicy) Wykład 4 Próbkowanie i rozkłady próbkowe µ = średnia w populacji, µ=ey, wartość oczekiwana zmiennej Y σ= odchylenie standardowe w populacji, σ =(Var Y) 1/2, pierwiastek kwadratowy wariancji zmiennej Y,

Bardziej szczegółowo

Badania sondażowe. Schematy losowania. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa

Badania sondażowe. Schematy losowania. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa Badania sondażowe Schematy losowania Agnieszka Zięba Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa 1 Próba jako miniatura populacji CELOWA subiektywny dobór jednostek

Bardziej szczegółowo

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

Prawdopodobieństwo i rozkład normalny cd.

Prawdopodobieństwo i rozkład normalny cd. # # Prawdopodobieństwo i rozkład normalny cd. Michał Daszykowski, Ivana Stanimirova Instytut Chemii Uniwersytet Śląski w Katowicach Ul. Szkolna 9 40-006 Katowice E-mail: www: mdaszyk@us.edu.pl istanimi@us.edu.pl

Bardziej szczegółowo

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne Wykład 4 Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym 2. Rozkłady próbkowe 3. Centralne twierdzenie graniczne Przybliżenie rozkładu dwumianowego rozkładem normalnym Niech Y ma rozkład

Bardziej szczegółowo

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom

Bardziej szczegółowo

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę

Bardziej szczegółowo

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane

Bardziej szczegółowo

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.

Bardziej szczegółowo

Praktyczne aspekty doboru próby. Dariusz Przybysz Warszawa, 2 czerwca 2015

Praktyczne aspekty doboru próby. Dariusz Przybysz Warszawa, 2 czerwca 2015 Praktyczne aspekty doboru próby Dariusz Przybysz Warszawa, 2 czerwca 2015 Określenie populacji Przed przystąpieniem do badania, wybraniem sposobu doboru próby konieczne jest precyzyjne określenie populacji,

Bardziej szczegółowo

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)

Bardziej szczegółowo

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15 VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych 9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :

Bardziej szczegółowo

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1 Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie

Bardziej szczegółowo

Rozkłady statystyk z próby. Statystyka

Rozkłady statystyk z próby. Statystyka Rozkłady statystyk z próby tatystyka Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających ten

Bardziej szczegółowo

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego

Bardziej szczegółowo

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria Wykład 5 dr inż. Anna Skowrońska-Szmer zima 2017/2018 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

WNIOSKOWANIE STATYSTYCZNE

WNIOSKOWANIE STATYSTYCZNE STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących

Bardziej szczegółowo

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny

Bardziej szczegółowo

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński Mikroekonometria 5 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.medexp3.dta przygotuj model regresji kwantylowej 1. Przygotuj model regresji kwantylowej w którym logarytm wydatków

Bardziej szczegółowo

Propensity Score Matching

Propensity Score Matching Zajęcia 2 Plan dzisiejszych zajęć 1 Doświadczenia Idealne doświadczenie Nie-idealne doświadczenia 2 Idealne doświadczenie Nie-idealne doświadczenia Plan idealnego doświadczenia (eksperymentu) Plan doświadczenia

Bardziej szczegółowo

Oszacowanie i rozkład t

Oszacowanie i rozkład t Oszacowanie i rozkład t Marcin Zajenkowski Marcin Zajenkowski () Oszacowanie i rozkład t 1 / 31 Oszacowanie 1 Na podstawie danych z próby szacuje się wiele wartości w populacji, np.: jakie jest poparcie

Bardziej szczegółowo

Zadanie Punkty Ocena

Zadanie Punkty Ocena Statystyka matematyczna Test przykładowy na zaliczenie laboratorium / ćwiczeń PROSZĘ NIE ODWRACAĆ KARTKI PRZED ROZPOCZĘCIEM TESTU! Wskazówki: 1. Wybierz zadania, za które w sumie możesz otrzymać 30 punktów

Bardziej szczegółowo

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej, Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (estymacja punktowa, przedziałowa)

Bardziej szczegółowo

Psychometria. Psychologia potoczna. Psychometria (z gr. psyche dusza, metria miara) Plan wykładów. Plan wykładów. Wprowadzenie w problematykę zajęć

Psychometria. Psychologia potoczna. Psychometria (z gr. psyche dusza, metria miara) Plan wykładów. Plan wykładów. Wprowadzenie w problematykę zajęć Psychometria Wprowadzenie w problematykę zajęć W 1 Psychologia potoczna potoczne przekonanie dotyczące natury ludzkiego zachowania wyrażające się w zdroworozsądkowych, intuicyjnych twierdzeniach. dr Łukasz

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wprowadzenie

Testowanie hipotez statystycznych. Wprowadzenie Wrocław University of Technology Testowanie hipotez statystycznych. Wprowadzenie Jakub Tomczak Politechnika Wrocławska jakub.tomczak@pwr.edu.pl 10.04.2014 Pojęcia wstępne Populacja (statystyczna) zbiór,

Bardziej szczegółowo

Zadania ze statystyki, cz.6

Zadania ze statystyki, cz.6 Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z

Bardziej szczegółowo

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl

Bardziej szczegółowo

ESTYMACJA. Przedział ufności dla średniej

ESTYMACJA. Przedział ufności dla średniej ESTYMACJA Przedział ufności dla średniej W grupie 900 losowo wybranych pracowników przedsiębiorstwa średnia liczba dni nieobecności w pracy wynosiła 30, a odchylenie standardowe 3 dni. a) Przyjmując współczynnik

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Stanisław Cichocki Natalia Nehrebecka. Wykład 7 Stanisław Cichocki Natalia Nehrebecka Wykład 7 1 1. Metoda Największej Wiarygodności MNW 2. Założenia MNW 3. Własności estymatorów MNW 4. Testowanie hipotez w MNW 2 1. Metoda Największej Wiarygodności

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria Wykład 5 Anna Skowrońska-Szmer lato 2016/2017 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją jako prawdziwą

Bardziej szczegółowo

Wykład 8: Testy istotności

Wykład 8: Testy istotności Wykład 8: Testy istotności Hipotezy Statystyki testowe P-wartości Istotność statystyczna Test dla średniej w populacji Dwustronny test a przedział ufności Używanie i nadużywanie testów Testy istotności

Bardziej szczegółowo

Może faktycznie ceny na Opolszczyźnie są wyższe niż w Polsce. Ceny na Opolszczyźnie są podobne, a akurat trafiliśmy na próbę droższych piekarni.

Może faktycznie ceny na Opolszczyźnie są wyższe niż w Polsce. Ceny na Opolszczyźnie są podobne, a akurat trafiliśmy na próbę droższych piekarni. Statystyczne testowanie hipotez: procedura, która pozwala ocenić hipotezę na temat parametru populacji w oparciu o statystykę próby. Zauważyliśmy, że ceny pieczywa w Opolu są wyższe niż gdzie indziej w

Bardziej szczegółowo

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn Wykład 10 Estymacja przedziałowa - przedziały ufności dla średniej Wrocław, 21 grudnia 2016r Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja 10.1 Przedziałem

Bardziej szczegółowo

Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński Mikroekonometria 6 Mikołaj Czajkowski Wiktor Budziński Metody symulacyjne Monte Carlo Metoda Monte-Carlo Wykorzystanie mocy obliczeniowej komputerów, aby poznać charakterystyki zmiennych losowych poprzez

Bardziej szczegółowo

Analiza wariancji. dr Janusz Górczyński

Analiza wariancji. dr Janusz Górczyński Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Przykład 1. (A. Łomnicki)

Przykład 1. (A. Łomnicki) Plan wykładu: 1. Wariancje wewnątrz grup i między grupami do czego prowadzi ich ocena 2. Rozkład F 3. Analiza wariancji jako metoda badań założenia, etapy postępowania 4. Dwie klasyfikacje a dwa modele

Bardziej szczegółowo

Model EWD dla II etapu edukacyjnego.

Model EWD dla II etapu edukacyjnego. Model EWD dla II etapu edukacyjnego. Na podstawie materiałów Pracowni EWD Instytut Badań Edukacyjnych Warszawa, 28-29.11.2014 r. Plan zajęć /moduł 9. i 10./ 1. Idea EWD 2. Model EWD dla II etapu 3. Prezentacja

Bardziej szczegółowo

Grupowanie materiału statystycznego

Grupowanie materiału statystycznego Grupowanie materiału statystycznego Materiał liczbowy, otrzymany w wyniku przeprowadzonej obserwacji statystycznej lub pomiaru, należy odpowiednio usystematyzować i pogrupować. Doskonale nadają się do

Bardziej szczegółowo

Porównywanie populacji

Porównywanie populacji 3 Porównywanie populacji 2 Porównywanie populacji Tendencja centralna Jednostki (w grupie) według pewnej zmiennej porównuje się w ten sposób, że dokonuje się komparacji ich wartości, osiągniętych w tej

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

Kontekstowe wskaźniki efektywności nauczania - warsztaty

Kontekstowe wskaźniki efektywności nauczania - warsztaty Kontekstowe wskaźniki efektywności nauczania - warsztaty Przygotowała: Aleksandra Jasińska (a.jasinska@ibe.edu.pl) wykorzystując materiały Zespołu EWD Czy dobrze uczymy? Metody oceny efektywności nauczania

Bardziej szczegółowo

Metody Statystyczne. Metody Statystyczne.

Metody Statystyczne. Metody Statystyczne. gkrol@wz.uw.edu.pl #4 1 Sprawdzian! 5 listopada (ok. 45-60 minut): - Skale pomiarowe - Zmienne ciągłe i dyskretne - Rozkład teoretyczny i empiryczny - Miary tendencji centralnej i rozproszenia - Standaryzacja

Bardziej szczegółowo

R-PEARSONA Zależność liniowa

R-PEARSONA Zależność liniowa R-PEARSONA Zależność liniowa Interpretacja wyników: wraz ze wzrostem wartości jednej zmiennej (np. zarobków) liniowo rosną wartości drugiej zmiennej (np. kwoty przeznaczanej na wakacje) czyli np. im wyższe

Bardziej szczegółowo

I jest narzędziem służącym do porównywania rozproszenia dwóch zmiennych. Używamy go tylko, gdy pomiędzy zmiennymi istnieje logiczny związek

I jest narzędziem służącym do porównywania rozproszenia dwóch zmiennych. Używamy go tylko, gdy pomiędzy zmiennymi istnieje logiczny związek ZADANIA statystyka opisowa i CTG 1. Dokonano pomiaru stężenia jonów azotanowych w wodzie μg/ml 1 0.51 0.51 0.51 0.50 0.51 0.49 0.52 0.53 0.50 0.47 0.51 0.52 0.53 0.48 0.59 0.50 0.52 0.49 0.49 0.50 0.49

Bardziej szczegółowo

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe? 2 Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia czy pomiędzy zmiennymi istnieje związek/zależność. Stosujemy go w sytuacji, kiedy zmienna zależna mierzona jest na skali

Bardziej szczegółowo

Analiza wariancji - ANOVA

Analiza wariancji - ANOVA Analiza wariancji - ANOVA Analiza wariancji jest metodą pozwalającą na podział zmienności zaobserwowanej wśród wyników eksperymentalnych na oddzielne części. Każdą z tych części możemy przypisać oddzielnemu

Bardziej szczegółowo

5. WNIOSKOWANIE PSYCHOMETRYCZNE

5. WNIOSKOWANIE PSYCHOMETRYCZNE 5. WNIOSKOWANIE PSYCHOMETRYCZNE Model klasyczny Gulliksena Wynik otrzymany i prawdziwy Błąd pomiaru Rzetelność pomiaru testem Standardowy błąd pomiaru Błąd estymacji wyniku prawdziwego Teoria Odpowiadania

Bardziej szczegółowo

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie Wyznaczanie przedziału 95%CI oznaczającego, że dla 95% prób losowych następujące nierówności są prawdziwe: X t s 0.025 n < μ < X + t s

Bardziej szczegółowo

Z poprzedniego wykładu

Z poprzedniego wykładu PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne

Bardziej szczegółowo

Modele quasi-eksperymentalne: Model regresji nieciągłej

Modele quasi-eksperymentalne: Model regresji nieciągłej Warsztaty szkoleniowe z zakresu ewaluacji wpływu instrumentów Aktywnych Polityk Rynku Pracy Modele quasi-eksperymentalne: Model regresji nieciągłej Maciej Wilamowski, Kraków, 6 czerwca 2017 r. Metody ewaluacji

Bardziej szczegółowo

Rozkłady statystyk z próby

Rozkłady statystyk z próby Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny

Bardziej szczegółowo

METODOLOGIA BADAŃ HUMANISTYCZNYCH METODYKA NAUCZANIA JĘZYKA OBCEGO CZ.II

METODOLOGIA BADAŃ HUMANISTYCZNYCH METODYKA NAUCZANIA JĘZYKA OBCEGO CZ.II METODOLOGIA BADAŃ HUMANISTYCZNYCH METODYKA NAUCZANIA JĘZYKA OBCEGO CZ.II Podział zmiennych Zmienne zależne zmienne, które są przedmiotem badania, których związki z innymi zmiennymi chcemy określić Zmienne

Bardziej szczegółowo

Szkice rozwiązań z R:

Szkice rozwiązań z R: Szkice rozwiązań z R: Zadanie 1. Założono doświadczenie farmakologiczne. Obserwowano przyrost wagi ciała (przyrost [gram]) przy zadanych dawkach trzech preparatów (dawka.a, dawka.b, dawka.c). Obiektami

Bardziej szczegółowo

Wnioskowanie bayesowskie

Wnioskowanie bayesowskie Wnioskowanie bayesowskie W podejściu klasycznym wnioskowanie statystyczne oparte jest wyłącznie na podstawie pobranej próby losowej. Możemy np. estymować punktowo lub przedziałowo nieznane parametry rozkładów,

Bardziej szczegółowo

Modele quasi-eksperymentalne: Model regresji nieciągłej

Modele quasi-eksperymentalne: Model regresji nieciągłej Warsztaty szkoleniowe z zakresu oceny oddziaływania instrumentów aktywnej polityki rynku pracy Modele quasi-eksperymentalne: Model regresji nieciągłej Maciej Wilamowski, Gdańsk, 22 lutego 2017 r. Metody

Bardziej szczegółowo

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014 Estymacja przedziałowa - przedziały ufności dla średnich Wrocław, 5 grudnia 2014 Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja Przedziałem ufności dla paramertu

Bardziej szczegółowo

STATYSTYKA wykład 5-6

STATYSTYKA wykład 5-6 TATYTYKA wykład 5-6 Twierdzenia graniczne Rozkłady statystyk z próby Wanda Olech Twierdzenia graniczne Jeżeli rozpatrujemy ciąg zmiennych losowych {X ; X ;...; X n }, to zdarza się, że ich rozkłady przy

Bardziej szczegółowo

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde

Bardziej szczegółowo