TESTY I KORELACJE cz.1

Wielkość: px
Rozpocząć pokaz od strony:

Download "TESTY I KORELACJE cz.1"

Transkrypt

1 TESTY I KORELACJE cz.1 TESTY I KORELACJE - WPROWADZENIE Podstawowe narzędzia statystyki indukcyjnej to testy statystyczne i współczynniki korelacji. Różnice między nimi prezentuje poniższa tabela: TEST STATYSTYCZNY Może być wykonany zarówno dla jednej zmiennej, jak i dla pary zmiennych. Dla jednej zmiennej sprawdza sposób rozkładu zmiennej. Dla dwóch zmiennych sprawdza, czy pomiędzy zmiennymi występuje zależność. Ma dwie hipotezy: H 0 i H 1 Hipoteza H 0 (zazwyczaj) mówi o tym, że zmienne od siebie nie zależą. Hipoteza H 1 (zazwyczaj) mówi o tym, że zmienne od siebie zależą. Dla rozstrzygnięcia testu ważny jest poziom istotności statystycznej. Standardowo przyjmuje się wartość p < 0,05 jako tę, która pozwala odrzucić hipotezę H 0 i w efekcie przyjąć założenie o występowaniu zależności między zmiennymi. WSPÓŁCZYNNIK KORELACJI Może być wyliczony tylko dla pary zmiennych. Sprawdza siłę zależności pomiędzy zmiennymi. Korelacja to współwystępowanie a nie zależność przyczynowo-skutkowa! Nie ma hipotez. Wartość korelacji mówi o jej sile: im bliżej 0 -> tym słabsza im bliżej 1 -> tym silniejsza Znaki +/- to kierunek korelacji: + - korelacja wprost proporcjonalna - - korelacja odwrotnie proporcjonalna Wybór odpowiedniego testu statystycznego i współczynnika korelacji podyktowany nie jest taki oczywisty. Trzeba wziąć pod uwagę kilka rzeczy: poziom pomiaru zmiennej/zmiennych, liczbę ich wartości, to czy ich rozkład jest losowy i zbliżony do normalnego, czy mamy do czynienia z równością wariancji. Wybór testu/współczynnika korelacji słabszego niż wymagany nie jest błędem, ale osłabia wartość informacyjną prowadzonych analiz. Zdecydowanie błędem jest zaś wybór testu/współczynnika silniejszego nad tym musi czuwać analityk, bo SPSS w dość dużej liczbie przypadków nie zaprotestuje i wykona bezsensowne i merytorycznie bzdurne obliczenia. 1

2 Liczba wartości zmiennej niezależnej 1 wartość 1 grupa lub 1 parametr 2 wartości 2 grupy lub 2 parametry Więcej niż 2 wartości więcej niż 2 grupy lub więcej niż 2 parametry Poziom pomiaru zmiennej zależnej WYJATEK! Niezależna: Ilościowy WYJATEK! Niezależna: Nominalny Rozkład zmiennej zależnej normalny Wariancje homogeniczne Test statystyczny Tak Nie Test t-studenta dla średniej H 0 : μ = μ 0 H 1 : μ μ 0 H 1 : μ < μ 0 H 1 : μ > μ 0 Nie Nie Test chi-kwadrat dla jednej zmiennej H 0 : rozkład jest losowy H 1 : rozkład nie jest losowy Ilościowy Tak Nie Test t-studenta dla dwóch średnich H 0 : μ 1 = μ 2 H 1 : μ 1 μ 2 H 1 : μ 1 < μ 2 H 1 : μ 1 > μ 2 Porządkowy Nie Nie Test Manna-Whitney a H 0 : F 1 (x) = F 2 (x) H 1 : ~ H 0 Nominalny Nie Nie Test niezależności chi-kwadrat H 0 : nie zachodzi zależność H 1 : ~ H 0 Ilościowy Tak Tak Analiza wariancji ANOVA H 0 : μ 1 = μ 2 = = μ k H 1 : ~ H 0 + testy: post-hoc Porządkowy Nie Nie Test Kruskala-Wallisa H 0 : F 1 (x) = F 2 (x) = = F k (x) H 1 : ~ H 0 Nominalny Nie Nie Test niezależności chi-kwadrat H 0 : nie zachodzi zależność H 1 : ~ H 0 Współczynniki korelacji Poziom pomiaru zmiennej niezależnej Nominalny C kontyngencji (n x n) V Cramera (n x n) Phi φ Yulla (2 x 2) Porządkowy C kontyngencji (n x n) V Cramera (n x n) Phi φ Yulla (2 x 2) Ilościowy C kontyngencji (n x n) V Cramera (n x n) Phi φ Yulla (2 x 2) Poziom pomiaru zmiennej zależnej Nominalny Porządkowy Ilościowy C kontyngencji (n x n) V Cramera (n x n) Phi φ Yulla (2 x 2) Rho Spearmana (r s ) Ewentualnie: C kontyngencji (n x n) V Cramera (n x n) Phi φ Yulla (2 x 2) Eta (η) Eta (η) Ewentualnie: Rho Spearmana (r s ) Rho Spearmana (r s ) R Pearsona (r xy ) Interpretacja 0,0-0,1 nikła 0,1-0,3 słaba 0,3-0,5 przeciętna 0,5-0,7 wysoka 0,7-0,9 bardzo wysoka 0,9-1,0 pełna 2

3 1. TEST NIEZALEŻNOŚCI CHI-KWADRAT I WSPÓLCZYNNIK KONTYNGENCJI C test nieparametryczny najsłabszy przedstawianych, co oznacza z jednej strony, że można go wykonać zawsze, ale z drugiej ma najmniejszą czułość i czasem wykaże istnienie zależności tam, gdzie silniejsze testy by ją wykluczyły Układ hipotez: H 0 : nie zachodzi zależność pomiędzy zmienną niezależną i zależną (zmienna zależna nie różnicuje rozkładu zmiennej zależnej) H 1 : ~ H 0 Ogólna zasada działania: test porównuje ze sobą dwa rozkłady liczebności w tabeli krzyżowej zmienna niezależna x zmienna zależna: obserwowany i oczekiwany rozkład obserwowany uzyskujemy w toku badania, to nasze dane z bazy rozkład oczekiwany to pewien rozkład idealny: tak rozkładałyby się liczebności w tabeli krzyżowej, gdyby między dwiema zmiennymi nie było żadnej zależności jeśli rozkłady obserwowany i oczekiwany są bardzo podobne test orzeka, że nie ma zależności 3

4 jeśli natomiast rozkłady od siebie odbiegają test orzeka, że zależność jest Przykład: filtr: rok badania to 2010 Czy istnieje zależność pomiędzy wiekiem respondenta a samookreśleniem przez niego swojej religijności? Zmienna niezależna: wiek w przedziałach (zdekodowane q9age) Zmienna zależna: re32 Które z następujących stwierdzeń opisuje Pana(-ią) najlepiej (ważne: odpowiedź trudno powiedzieć ma być brakiem danych) ANALIZA -> OPIS STATYSTYCZNY -> TABELE KRZYŻOWE i dalej: STATYSTYKI -> CHI-KWADRAT oraz WSPÓŁCZYNNIK KONTYNGENCJI KOMÓRKI -> PROCENTY W WIERSZU Należy pamiętać, że zgodnie z konwencją tworzenia tabel zmienną niezależną umieszczamy w wierszach, a zmienną zależną w kolumnach Jeśli chcemy zobaczyć rozkład oczekiwany to w KOMÓRKI należy zaznaczyć również LICZEBNOŚCI OCZEKIWANE Syntax: CROSSTABS /TABLES=q9age_rek BY re32 /FORMAT=AVALUE TABLES /STATISTICS=CHISQ CC /CELLS=COUNT ROW /COUNT ROUND CELL. W linii kodu /TABLES zmienna niezależna wymieniana jest jako pierwsza a zmienna zależna jako druga Aby zobaczyć rozkład oczekiwany w linii /CELLS powinno być /CELLS=COUNT EXPECTED ROW 4

5 Jeśli chodzi o współczynniki korelacji, które można zastosować po obliczeniu testu chi-kwadrat, to są trzy najpopularniejsze: Współczynnik kontyngencji C (najbardziej uniwersalny, z korektą na kształt tabeli) V Cramera (dla tabel innych niż 2 x 2) Phi φ Yulla (tylko dla tabel 2 x 2) Zalecam stosowanie tego pierwszego właśnie ze względu na jego uniwersalność. Po wydaniu polecenia otrzymujemy 4 tabele: Informacja o analizowanych danych pokazuje, ile obserwacji zostało wykluczonych: to respondenci, którzy przynajmniej w jednym z analizowanych pytań udzielili odpowiedzi zakwalifikowanej jako brak danych. Tabela krzyżowa Testy chi-kwadrat skąd odczytujemy decyzję podaną przez test i tak naprawdę interesuje nas tylko wiersz Chi-kwadrat Pearsona Miary symetryczne skąd odczytujemy wartość współczynniki kontyngencji C (tylko, gdy istnieje zależność). Tabela testu: Testy Chi-kwadrat Wartość df Istotność asymptotyczna (dwustronna) Chi-kwadrat Pearsona 60,792 a 15,000 Iloraz wiarygodności 63,074 15,000 Test związku liniowego 31,270 1,000 N Ważnych obserwacji 1168 a. 0,0% komórek (0) ma liczebność oczekiwaną mniejszą niż 5. Minimalna liczebność oczekiwana wynosi 12,41. 2 (df, N) = [wartość], [istotność] < 0,05 2 (15, N=1168) = 60,792, p<0,05 [ przy braku zależności opis wyglądałby: 2 (15, N=1168) = 60,792, p>0,05 ] Ponieważ istotność statystyczna jest mniejsza niż 0,05, to możemy odrzucić hipotezę o braku zależności między zmiennymi i przyjąć, że zależność jest. Co oznacza taką oto interpretację: W celu sprawdzenia związku pomiędzy wiekiem a samookreśleniem przez respondenta jego religijności wykonano test niezależności chi-kwadrat. Test 2 (15, N=1168) = 60,792, p<0,05 5

6 wykazał, że istnieje zależność pomiędzy zmiennymi. Analiza rozkładu zmiennych w tabeli krzyżowej ujawniła, że im starszy respondent, tym rzadziej pojawiały się odpowiedzi o niepostępowaniu zgodnie z zasadami religii. Miary symetryczne Wartość Istotność przybliżona Nominalna przez Nominalna Współczynnik kontyngencji,222,000 N Ważnych obserwacji 1168 Wartość współczynnika kontyngencji wynosi C=0,222, co oznacza, że zależność jest słaba. Generalnie do właściwego raportu z badań nie wklejamy SPSS-owych tabel testu i współczynnika, tylko opisujemy ich wyniki. Przy teście chi-kwadrat trzeba pamiętać jeszcze o kilku sprawach. Zobrazuję to na przykładzie. Tym razem przetestujemy parę zmiennych: homepop liczba osób w gospodarstwie domowym re32 samookreślenie religijności Syntax: CROSSTABS /TABLES=hompop BY re32 /FORMAT=AVALUE TABLES /STATISTICS=CHISQ CC /CELLS=COUNT EXPECTED ROW /COUNT ROUND CELL. Wygenerowana tabela krzyżowa ujawnia w swojej końcowej części to, co może być problematyczne (dla zachowania czytelności usunęłam część wierszy, zmieniłam opis w wierszach i pokolorowałam je) 6

7 Tabela krzyżowa Liczba osób w gospodarstwie domowym JEDNA (RESPONDENT) Postępuję zgodnie z zasadami religii i uważam siebie za osobę uduchowioną, zainteresowaną tym, co święte lub nadprzyrodz najlepiej: * Które z następujących stwierdzeń opisuje Pana(-ią) Które z następujących stwierdzeń opisuje Pana(-ią) najlepiej: Postępuję Nie postępuję zgodnie z zgodnie z zasadami zasadami religii, ale nie religii, ale uważam siebie uważam siebie za osobę za osobę uduchowioną, uduchowioną, zainteresowaną zainteresowaną tym, co święte tym, co święte lub nadp lub nadp Nie postępuję zgodnie z zasadami religii i nie uważam siebie za osobę uduchowioną, zainteresowaną tym, co święte lub nad Ogółem Liczebność Liczebność oczekiwana % z Liczba osób w gospodarstwie domowym 43,9 141,9 17,9 23,3 227,0 21,1% 57,7% 8,4% 12,8% 100,0% Liczba osób w gosp. domowym Ogółem SIEDEM OSÓB OSIEM OSÓB DZIEWIĘĆ OSÓB DWANAŚCIE OSÓB Liczebność L.oczekiwana 2,3 7,5,9 1,2 12,0 % 16,7% 75,0% 8,3% 0,0% 100,0% Liczebność L.oczekiwana,6 1,9,2,3 3,0 % 66,7% 33,3% 0,0% 0,0% 100,0% Liczebność L.oczekiwana,2,6,1,1 1,0 % 0,0% 100,0% 0,0% 0,0% 100,0% Liczebność L.oczekiwana,2,6,1,1 1,0 % 0,0% 100,0% 0,0% 0,0% 100,0% Liczebność L.oczekiwana 226,0 730,0 92,0 120,0 1168,0 % 19,3% 62,5% 7,9% 10,3% 100,0% Zmienna liczba osób w gospodarstwie domowym wygenerowała 10 kategorii od gospodarstw jednoosobowych do gospodarstwa dwunastoosobowego. Tyle, że od kategorii siedem osób ta i kolejne są bardzo mało liczne. Co powoduje, że końcówka tabeli obfituje w puste komórki. A test chi-kwadrat tego bardzo nie lubi. Jego czułość i wiarygodność jeszcze bardziej spada. 7

8 Drugi problem jest powiązany z pierwszym i sygnalizuje go sam SPSS. Pod tabelą testu wyświetla się taki oto komunikat: Testy Chi-kwadrat Wartość df Istotność asymptotyczna (dwustronna) Chi-kwadrat Pearsona 24,604 a 27,597 Iloraz wiarygodności 26,444 27,494 Test związku liniowego 4,699 1,030 N Ważnych obserwacji 1168 a. 42,5% komórek (17) ma liczebność oczekiwaną mniejszą niż 5. Minimalna liczebność oczekiwana wynosi,08. Dużego odsetka komórek z małymi liczebnościami oczekiwanymi też chi-kwadrat nie lubi. I to też obniża jego czułość i wiarygodność. Dlatego, gdy mamy do czynienia z taką sytuacją należy zastanowić się nad rekodowaniem problematycznych zmiennych. W tym przypadku można by zrobić coś takiego: liczba osób w gosp dom Częstość Procent Procent ważnych Procent skumulowany JEDNA (RESPONDENT) ,6 19,6 19,6 DWIE OSOBY ,6 26,6 46,2 Ważne TRZY OSOBY ,6 21,6 67,8 CZTERY OSOBY ,2 19,2 87,1 PIĘĆ OSÓB I WIĘCEJ ,9 12,9 100,0 Ogółem ,0 100,0 Test chi-kwadrat co prawda ponownie wskazał na brak zależności (można sprawdzić samemu ), ale przynajmniej wiemy, że nie wynika to z nierównomiernego rozkładu zmiennych. 8

9 2. TEST CHI-KWADRAT DLA 1 ZMIENNEJ Test chi-kwadrat można też wykorzystać, aby sprawdzić, czy rozkład danej zmiennej nominalnej lub porządkowej: albo jest losowy tzn. czy poszczególne kategorie osób wyznaczone przez wartości tej zmiennej wypełniają się w sposób losowy. albo odzwierciedla strukturę populacji (np. 20% niewierzących i 80% wierzących) Układ hipotez: H 0 : nie ma różnic w rozkładzie liczebności pomiędzy kategoriami (rozkład jest losowy / odzwierciedla strukturę populacji) H 1 : ~ H 0 Przykład: filtr: rok badania 2010 testowana zmienna q5 kobiety nie nadają się do polityki zmienną potraktujemy jako dwuwartościową (odpowiedź nie jestem pewien/pewna ma być brakiem danych) przetestujemy losowość rozkładu czy każda z dwóch ważnych odpowiedzi (zgadzam się / nie zgadzam się) to 50% respondentów ANALIZA -> TESTY NIEPARAMETRYCZNE -> TESTY TRADYCYJNE -> CHI-KWADRAT W polu Wartości oczekiwane pozostawić Wszystkie kategorie są równe. Gdybyśmy chcieli testować rozkład populacyjny, który nie byłby tak równy, to należałoby wybrać opcję wartości i wprowadzić ręcznie proporcje kolejnych kategorii w takiej samej kolejności jak idą w wartościach testowanej zmiennej! Syntax NPAR TESTS /CHISQUARE=q5 /EXPECTED=EQUAL /MISSING ANALYSIS. 9

10 Po wykonaniu polecenia otrzymujemy dwie tabele. Pierwsza to rozkład zmiennej: Kobiety nie nadają się do polityki Obserwowane Oczekiwane N Reszty N Zgadzam się ,0 10,0 Nie zgadzam się ,0-10,0 Ogółem 1204 Kolumna Obserwowane informuje nas jak wygląda uzyskany w badaniu rozkład zmiennej. Kolumna Oczekiwane informuje jaki byłby rozkład, gdyby każda z kategorii miała 50%. Kolumna reszty to różnica Obserwowane - Oczekiwane ; reszta większa od zera pokazuje, czego mamy za dużo w rozkładzie faktycznym, a reszta mniejsza od zera: czego za mało. O tym, czy różnica między obserwowanym i oczekiwanym wpływa lub nie wpływa na losowość rozkładu informuje tabela testu. Statystyki testu Kobiety nie nadają się do polityki Chi-kwadrat,332 a df 1 Istotność asymptotyczna,564 a. 0 komórek (0,0%) ma liczebność oczekiwaną mniejszą od 5. Minimalna liczebność oczekiwana w komórce wynosi 602,0. 2 (df, N) = [wartość], [istotność] > 0,05 2 (1, N=1204) = 0,332, p>0,05 [ przy braku zależności opis wyglądałby: 2 (1, N=1204) = 0,332, p>0,05 ] Interpretacja: Dla zbadania losowości rozkładu zmiennej Kobiety nie nadają się do polityki zgadzam się lub nie zgadzam ze stwierdzeniem, wykonano test chi-kwadrat dla jednej zmiennej. Test 2 (1, N=1204) = 0,332, p>0,05 nie jest istotny statystycznie, co nie daje podstaw do odrzucenia hipotezy zerowej: rozkład zmiennej jest losowy. 10

11 3. TEST T-STUDENTA I WSPÓŁCZYNNIK KORELACJI ETA Test parametryczny Porównywanym parametrem jest średnia; Test t-studenta porównuje średnie z dwóch grup. Grupy te można wyznaczyć na trzy różne sposoby: a) Zmienna niezależna jest oryginalnie dwuwartościowa Np. płeć: kobieta / mężczyzna b) Zmienna niezależna jest oryginalnie wielowartościowa, ale dla celów analitycznych sprowadzamy poprzez rekodowanie ją do dwóch wartości, np. Wiek: 1: <= 25 lat 2: lat 3: lat 4: lat 5: lat 6: 66+ lat Wiek: 1: <=45 lat 2: 45+ lat c) Zmienna niezależna jest oryginalnie wielowartościowa, ale dla celów analitycznych wybieramy do porównania tylko dwie z jej wartości, np. Wiek: 1: <= 25 lat 2: lat 3: lat 4: lat 5: lat 6: 66+ lat Wiek: 2: lat 4: lat Układ hipotez: Hipoteza zerowa: nie różnic pomiędzy średnimi w porównywanych grupach; zmienna niezależna nie różnicuje średnich; nie ma związku pomiędzy zmiennymi H 0 : μ 1 = μ 2 Hipoteza alternatywna: jest różnica pomiędzy średnimi w porównywanych grupach; zmienna niezależna różnicuje średnie; jest związek pomiędzy zmiennymi; Trzy możliwe postacie: H 1 : μ 1 μ 2 => średnie różnią się, bez orzekania która jest większa H 1 : μ 1 < μ 2 => średnia w drugiej grupie większa od średniej w pierwszej grupie H 1 : μ 1 > μ 2 => średnia w pierwszej grupie większa od średniej w drugiej grupie 11

12 Test t-studenta ma też swoje wymagania, których niespełnienie obniża jego wiarygodność: W miarę równoliczne porównywane grupy (w praktyce nie musi być co do osoby, ale ważne, by unikać wielkich dysproporcji); Równe wariancje w porównywanych grupach (w praktyce: test ma wbudowaną poprawkę na okoliczność niehomogenicznych wariancji); Rozkład zmiennej zależnej w każdej z porównywanych grup jest normalny (w praktyce: często się to pomija). Niespełnienie jednego, dwóch lub wszystkich powyższych założeń może/powinno być wskazówką do tego, by parametryczny test t-studenta zastąpić jego nieparametrycznym odpowiednikiem: testem Manna- Whitneya. Przykład: Filtr: rok badania 2010 Zmienna niezależna: q8 płeć Zmienna zależna: re6 Mężczyzna zarabiać, kobieta w domu o Potraktujemy ją jako zmienną ilościową ze względu na zastosowaną tam kafeterię likertowską; o By utrzymać poziom ilościowych należy do braków danych dopisać odpowiedź trudno powiedzieć ; o Przypominam: gdyby to była kafeteria czwórelementowa, to można by ją zmienić w likertowską umieszczając trudno powiedzieć jako item środkowy; ANALIZA -> PORÓWNANIE ŚREDNICH -> TEST T DLA PRÓB NIEZALEŻNYCH Zmienna testowana -> zależna Zmienna grupująca -> niezależna o Przy wybraniu punktu podziału, będzie on stanowił dolną granicę drugiego przedziału (będzie np. < 3 oraz >=3) Syntax: T-TEST GROUPS=q8(1 2) /MISSING=ANALYSIS /VARIABLES=re6 /CRITERIA=CI(.95). w linii kodu T-TEST GROUPS=q8(1 2) jest zmienna niezależna w kody dwóch porównywanych grup w linii kodu /VARIABLES=re6 jest zmienna zależna 12

13 Wykonanie polecenia generuje dwie tabele: Statystyki dla grup Test dla prób niezależnych Interpretuje się obie tabele. Tabela statystyki dla grup Statystyki dla grup Mężczyz zarabiać, kobieta w domu Płeć respondenta: 1=M, 2=KOB N Średnia Odchylenie standardowe Błąd standardowy średniej MĘŻCZYZNA 584 2,73 1,169,048 KOBIETA 646 3,04 1,208,048 Interpretujemy podobne dane jak przy prostym porównywaniu średnich: Wartość średniej Wartość odchylenia standardowego Liczebność grup Ta ostatnia informacja o liczebności grup jest dla nas ważna ze względu na wymogi testu (jak pamiętamy: test woli grupy równoliczne). Tu nie ma równoliczności, ale dysproporcja nie jest jakaś bardzo duża. To znaczy, że (na razie) możemy ufać testowi. Interpretacja drugiej tabeli test dla prób niezależnych Test dla prób niezależnych Mężczyz zarabiać, kobieta w domu Założono równość wariancji Nie założono równości wariancji Test Levene'a Test t równości średnich jednorodności wariancji F Istotność t df Istotność (dwustronna) Różnica średnich Błąd standardowy różnicy 95% przedział ufności dla różnicy średnich Dolna granica Górna granica,047,829-4, ,000 -,311,068 -,444 -,177-4, ,760,000 -,311,068 -,444 -,178 13

14 Tabela składa się z wyników dwóch testów: Testu Levene a (zaznaczony na szaro) Testu t-studenta Po co test Levene a? Jednym z warunków testu t-studenta jest homogeniczność wariancji. Test na szczęście nie wymaga tego bezwzględnie i ma wbudowaną poprawkę właśnie na okoliczność braku równości wariancji. Kłopot polega na tym, że SPSS jednocześnie liczy obie wersje testu: tę bez poprawki i tę z poprawką. Byśmy jednak wiedzieli, który wynik jest ten nasz dostajemy podpowiedź w postaci testu Levene a. Test ten sprawdza właśnie homogeniczność wariancji (jego H o zakłada równość wariancji): Gdy istotność testu Levene a jest mniejsza niż 0,05 -> test jest istotny, odrzucamy jego hipotezę zerową -> wariancje nie są homogeniczne i czytamy w tabeli 2 wiersz w części test t równości średnich ; Gdy istotność testu Levene a jest większa niż 0,05 -> test jest nieistotny, przyjmujemy jego hipotezę zerową -> wariancje są homogeniczne i czytamy w tabeli 1 wiersz w części test t równości średnich ; W naszym przypadku istotność testu Levene a jest większa niż 0,05, co oznacza, że wariancje są homogeniczne i dalej będziemy zajmować się pierwszym wierszem tabeli. Test dla prób niezależnych Mężczyz zarabiać, kobieta w domu Założono równość wariancji Nie założono równości wariancji Test Levene'a Test t równości średnich jednorodności wariancji F Istotność t df Istotność (dwustronna) Różnica średnich Błąd standardowy różnicy 95% przedział ufności dla różnicy średnich Dolna granica Górna granica,047,829-4, ,000 -,311,068 -,444 -,177-4, ,760,000 -,311,068 -,444 -,178 t(df) = [wartość]; [istotność] < 0,05 t(1228) = -4,575; p<0,05 [ przy braku zależności opis wyglądałby: t(1228) = -4,575, p>0,05 ] 14

15 Interpretacja: Aby sprawdzić, czy odpowiedzi respondentów na pytanie Mężczyzna powinien zarabiać, a kobieta powinna siedzieć w domu są zróżnicowane ze względu na płeć, wykonano test t-studenta. Test t(1228) = -4,575; p<0,05 wykazał, że płeć różnicuje opinie. Kobiety częściej niż mężczyźni wykazywały tendencję do odrzucania wskazanej w pytaniu tezy. Ponieważ test t-studenta wykazała istnienie zależności można obliczyć współczynnik korelacji, który pokaże siłę zależności. Będzie to Eta, którą stosujemy przy układzie zmiennych: Nominalna x ilościowa Porządkowa x ilościowa Etę można policzyć na dwa sposoby: 1) ANALIZA -> PORÓWNYWANIE ŚREDNICH -> SREDNIE w OPCJE zaznaczyć tabela ANOVA i eta Syntax: MEANS TABLES=re6 BY q8 /CELLS MEAN COUNT STDDEV /STATISTICS ANOVA. Przy okazji policzy się Anova, którą tutaj ignorujemy. Interesuje nas tylko tabela: Miara związku Eta Eta kwadrat Mężczyz zarabiać, kobieta w domu * Płeć respondenta: 1=M, 2=KOB,129,017 2) ANALIZA -> OPIS STATYSTYCZNY -> TABELE KRZYŻOWE w STATYSTYKI zaznaczyć Eta Syntax: CROSSTABS /TABLES=q8 BY re6 /FORMAT=AVALUE TABLES /STATISTICS=ETA /CELLS=COUNT ROW /COUNT ROUND CELL. 15

16 Tabelę krzyżową można zignorować i przejść od razu do tabelki: Miary kierunkowe Wartość Zmienna zależna: Płeć,155 Nominalna przez respondenta: 1=M, 2=KOB Eta Przedziałowa Zmienna zależna: Mężczyz zarabiać, kobieta w domu,130 Przy tej tabeli ważne jest, by odczytać właściwy wiersz ten, gdzie jest wskazana zmienna zależna. Niezależnie od sposobu liczenia współczynnik korelacji Eta ( = 0,129 / = 0,13) informuje, że zależność jest słaba. Do tej pory nie zwracaliśmy uwagi na trzeci warunek testu t-studenta, czyli wymóg rozkładu normalnego zmiennej zależnej w każdej z porównywanych grup. Tak jak pisałam wcześniej, warunek ten najczęściej się ignoruje. Gdybyśmy jednak chcieli sprawdzić, czy i pod tym względem możemy ufać testowi t-studenta, to mamy do dyspozycji odpowiednie testy: Test Kołmogorow-Smirnowa dla grup N>100 Test Shapiro-Wilka dla grup N<100 Ponieważ nasza próba jest zdecydowanie ponad stuosobowa, to zrobimy test Kołmogorow-Smirnowa. ANALIZA -> OPIS STATYSTYCZNY -> EKSPLORACJA w WYKRESY zaznaczyć histogram oraz wykresy normalności z testami ; można odznaczyć łodyga-i-liście ; zmienna niezależna będzie czynnikiem, co oznacza, że normalność rozkładu będziemy testować osobno dla każdej z jej grup: osobno dla mężczyzn i osobno dla kobiet; Syntax: EXAMINE VARIABLES=re6 BY q8 /PLOT BOXPLOT HISTOGRAM NPPLOT /COMPARE GROUPS /STATISTICS DESCRIPTIVES /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL. W linii kodu EXAMINE VARIABLES=re6 BY q8 zmienna niezależna (czynnik) podawana jest jako druga 16

17 W tabeli statystyki opisowe mamy dobrze nam znane miary. Do oceny normalności rozkładu przydadzą nam się szczególnie dwie: kurtoza i błąd standardowy kurtozy skośność i błąd standardowy skośności Wiemy, że kurtoza opisuje dopasowanie rozkładu zmiennej do rozkładu normalnego wzwyż / wszerz, a skośność przesunięcie rozkładu zmiennej w prawo lub w lewo. Ponadto, jeśli podzielimy obie miary przez ich błędy standardowe, to: wynik w granicach -2 do 2 wskazuje na rozkład normalny zmiennej wynik poniżej -2 lub powyżej 2 wskazuje na nienormalność rozkładu Dalej mamy test normalności rozkładu u nas: test Kołmogorow-Smirnowa. Jego hipoteza zerowa zakłada, że rozkład zmiennej zależnej jest normalny. Dlatego p < 0,05 oznacza istotność testu, odrzucenie H 0 i uznanie, że rozkład nie jest normalny p > 0,05 oznacza nieistotność testu, przyjęcie H 0 i uznanie, że rozkład jest normalny Wynik testu Kołmogorowa-Smirnowa jest opisany przez poniższą tabelę. Testy normalności rozkładu Płeć respondenta: 1=M, Kołmogorow-Smirnow a 2=KOB Statystyka df Istotność Mężczyz zarabiać, kobieta w MĘŻCZYZNA, ,000 domu KOBIETA, ,000 a. Z poprawką istotności Lillieforsa W naszym przypadku istotność w obu grupach jest mniejsza niż 0,05. Oznacza to, że mamy podstawy do odrzucenia hipotezy zerowej o normalności rozkładu zmiennej. Gdybyśmy teraz chcieli być bardzo rygorystyczni, to wynik testu Kołmogorowa-Smirnowa powinien nas zniechęcić do wykonania testu t-studenta. Zamiast tego powinniśmy sięgnąć po jego nieparametryczny odpowiednik, czyli test Manna-Whitneya. Przy teście Kołmogorowa-Smirnowa pokazane są również wykresy można spojrzeć na histogramy, które powinny potwierdzić wnioski dot. kształtu rozkładu zmiennej z analizy kurtozy i skośności. Resztę wykresów można pominąć. 17

18 4. TEST MANNA-WHITNEYA Test nieparametryczny Porównuje rozkłady rang dla dwóch grup (wyznaczonych przez zmienną niezależną) Traktowany jako nieparametryczny odpowiednik testu t-studenta Układ hipotez: H 0 : F 1 (x) = F 2 (x) => rozkłady rang są równe, zmienna niezależna nie różnicuje rozkładów rang, nie ma zależności między zmiennymi H 1 : ~ H 0 Zasada działania na przykładzie: Przeprowadzono pomiar czasu nauki do egzaminu w minutach i uzyskano wyniki: Kobiety: 171, 194, 162, 210, 171, 160, 176, 185, 203, 222, 129, 167, 168 Mężczyźni: 152, 114, 151, 174, 149, 161, 153, 163, 156 Pomiary z obu grup są szeregowane od najmniejszego do największego (każda grupa osobno), a potem rangowane (obie grupy razem). Następnie rangi dla każdej z grup są sumowane. K Ranga ,5 14, M Ranga Dalsze obliczenia związane są ze statystyką U i jej rozkładem. Te wszystkie działania SPSS wykonuje w trakcie obliczania testu. Nam udostępnia jedynie wynik końcowy. Przykład: Filtr: rok badania 2010 Zmienna niezależna: q8 płeć Zmienna zależna: re6 Mężczyzna zarabiać, kobieta w domu o Dla jasności interpretacji do braków danych zostaje zaliczona odpowiedź trudno powiedzieć ANALIZA -> TESTY NIEPARAMETRYCZNE -> TESTY TRADYCYJNE -> DWIE PRÓBY NIEZALEŻNE Zmienna grupująca -> niezależna Zmienna testowana -> zależna 18

19 Syntax: NPAR TESTS /M-W= re6 BY q8(1 2) /MISSING ANALYSIS. w linii kodu /M-W= re6 BY q8(1 2) zmienna zależna podawana jest jako pierwsza a zmienna niezależna jako druga (wraz z kodami porównywanych grup) Wykonanie polecenia generuje dwie tabele. Pierwsza z tabel: rangi, informuje nas ile osób było w każdej z porównywanych grup. Do tego, dla każdej z grup podane są średnie rangi. Można te liczby, lekko naginając rzeczywistość, interpretować tak jak zwykłą średnią: im wyższa wartość, tym częściej padały odpowiedzi wysoko kodowane w kafeterii (u nas: wskazujące na niezgodę z prezentowanym twierdzeniem). Rangi Mężczyz zarabiać, kobieta w domu Płeć respondenta: 1=M, 2=KOB N Średnia ranga Suma rang MĘŻCZYZNA , ,50 KOBIETA , ,50 Ogółem 1287 Druga tabela jest tabelą właściwą testu: Statystyki testu a Mężczyz zarabiać, kobieta w domu U Manna-Whitneya ,500 W Wilcoxona ,500 Z -5,326 Istotność asymptotyczna,000 (dwustronna) a. Zmienna grupująca: Płeć respondenta: 1=M, 2=KOB U=[wartość]; [istotność] < 0,05 U=171352,5; p<0,05 [ przy braku zależności opis wyglądałby: U=171352,5, p>0,05 ] Interpretacja: Aby sprawdzić, czy odpowiedzi respondentów na pytanie Mężczyzna powinien zarabiać, a kobieta powinna siedzieć w domu są zróżnicowane ze względu na płeć, wykonano test Manna-Whitenya. Test U=171352,5; p<0,05 wykazał, że płeć różnicuje opinie. Kobiety częściej niż mężczyźni wykazywały tendencję do odrzucania wskazanej w pytaniu tezy. 19

20 5. TEST KRUSKALA-WALLISA Test nieparametryczny Porównuje rozkłady rang dla więcej niż dwóch grup (wyznaczonych przez zmienną niezależną) Traktowany jako nieparametryczny odpowiednik jednoczynnikowej analizy wariancji ANOVA Układ hipotez: H 0 : F 1 (x) = F 2 (x) = = F k (x) => rozkłady rang są równe, zmienna niezależna nie różnicuje rozkładów rang, nie ma zależności między zmiennymi H 1 : ~ H 0 Zasada działania testu jest taka sama jak w przypadku testu Manna-Whitneya, z tą różnicą, że test Kruskala- Wallisa oparty jest na statystyce chi-kwadrat. Przykład: Filtr: rok badania 2010 Zmienna niezależna: rekodowany do przedziałów wiek Zmienna zależna: re6 Mężczyzna zarabiać, kobieta w domu o Dla jasności interpretacji do braków danych zostaje zaliczona odpowiedź trudno powiedzieć ANALIZA -> TESTY NIEPARAMETRYCZNE -> TESTY TRADYCYJNE -> K PRÓB NIEZALEŻNYCH Zmienna grupująca -> niezależna Zmienna testowana -> zależna Syntax: NPAR TESTS /K-W=re6 BY q9age_rek(1 6) /MISSING ANALYSIS. w linii kodu K-W=re6 BY q9age_rek(1 6) zmienna zależna podawana jest jako pierwsza a zmienna niezależna jako druga (wraz z kodami porównywanych grup pierwszym i ostatnim kodem z listy wszystkich wartości zmiennej bez braków danych) 20

21 Wykonanie polecenia generuje dwie tabele. Pierwsza z tabel: rangi, informuje nas ile osób było w każdej z porównywanych grup. Do tego, dla każdej z grup podane są średnie rangi. Można te liczby, lekko naginając rzeczywistość, interpretować tak jak zwykłą średnią: im wyższa wartość, tym częściej padały odpowiedzi wysoko kodowane w kafeterii (u nas: wskazujące na niezgodę z prezentowanym twierdzeniem). Rangi Mężczyz zarabiać, kobieta w domu Wiek respondenta (Podzielone) N Średnia ranga <= , , , , , ,70 Ogółem 1287 Druga tabela jest tabelą właściwą testu: Statystyki testu a,b Mężczyz zarabiać, kobieta w domu Chi-kwadrat 77,985 df 5 Istotność asymptotyczna,000 a. Test Kruskala-Wallisa b. Zmienna grupująca: Wiek respondenta (Podzielone) H=[wartość]; [istotność] < 0,05 H=77,985; p<0,05 [ przy braku zależności opis wyglądałby: H=77,985, p>0,05 ] Interpretacja: Aby sprawdzić, czy odpowiedzi respondentów na pytanie Mężczyzna powinien zarabiać, a kobieta powinna siedzieć w domu są zróżnicowane ze względu na wiek, wykonano test Kruskala-Wallisa. Test H=77,985; p<0,05 wykazał, że wiek różnicuje opinie. Osoby młodsze częściej niż starsi respondenci wykazywały tendencję do odrzucania wskazanej w pytaniu tezy. 21

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

TESTY I KORELACJE cz.2

TESTY I KORELACJE cz.2 TESTY I KORELACJE cz.2 1. JEDNOCZYNNIKOWA ANALIZA WARIANCJI ANOVA W SCHEMACIE MIĘDZYGRUPOWYM Analizę wariancji można podzielić na dwa typy: a) Ze względu na liczbę czynników: Jednoczynnikowa gdy po stronie

Bardziej szczegółowo

Badanie zależności skala nominalna

Badanie zależności skala nominalna Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność

Bardziej szczegółowo

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe? 2 Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia czy pomiędzy zmiennymi istnieje związek/zależność. Stosujemy go w sytuacji, kiedy zmienna zależna mierzona jest na skali

Bardziej szczegółowo

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Jak sprawdzić normalność rozkładu w teście dla prób zależnych? Jak sprawdzić normalność rozkładu w teście dla prób zależnych? W pliku zalezne_10.sta znajdują się dwie zmienne: czasu biegu przed rozpoczęciem cyklu treningowego (zmienna 1) oraz czasu biegu po zakończeniu

Bardziej szczegółowo

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi) Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi) Czy miejsce zamieszkania różnicuje uprawianie sportu? Mieszkańcy

Bardziej szczegółowo

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Zmienne muszą być zmiennymi ilościowym (liczymy i porównujemy średnie!) Są to testy parametryczne Nazwa

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 Metody sprawdzania założeń w analizie wariancji: -Sprawdzanie równości (jednorodności) wariancji testy: - Cochrana - Hartleya - Bartletta -Sprawdzanie zgodności

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

Test U Manna-Whitneya : Test H Kruskala-Wallisa Test Wilcoxona

Test U Manna-Whitneya : Test H Kruskala-Wallisa Test Wilcoxona Nieparametryczne odpowiedniki testów T-Studenta stosujemy gdy zmienne mierzone są na skalach porządkowych (nie można liczyć średniej) lub kiedy mierzone są na skalach ilościowych, a nie są spełnione wymagania

Bardziej szczegółowo

Jednoczynnikowa analiza wariancji

Jednoczynnikowa analiza wariancji Jednoczynnikowa analiza wariancji Zmienna zależna ilościowa, numeryczna Zmienna niezależna grupująca (dzieli próbę na więcej niż dwie grupy), nominalna zmienną wyrażoną tekstem należy w SPSS przerekodować

Bardziej szczegółowo

ANALIZY WIELOZMIENNOWE

ANALIZY WIELOZMIENNOWE ANALIZY WIELOZMIENNOWE ANALIZA REGRESJI Charakterystyka: Rozszerzenie analizy korelacji o badanie zależności pomiędzy wieloma zmiennymi jednocześnie; Podstawowe zastosowanie (ale przez nas w tym momencie

Bardziej szczegółowo

GRUPY NIEZALEŻNE Chi kwadrat Pearsona GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara Q Cochrana

GRUPY NIEZALEŻNE Chi kwadrat Pearsona GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara Q Cochrana GRUPY NIEZALEŻNE Chi kwadrat Pearsona Testy stosujemy w sytuacji, kiedy zmienna zależna mierzona jest na skali nominalnej Liczba porównywanych grup (czyli liczba kategorii zmiennej niezależnej) nie ma

Bardziej szczegółowo

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Zadanie Zbadano satysfakcję z życia w skali 1 do 10 w dwóch grupach rodziców: a) Rodzice dzieci zdrowych oraz b) Rodzice dzieci z niepełnosprawnością

Bardziej szczegółowo

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe

Bardziej szczegółowo

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych 1 Laboratorium III: Testy statystyczne Spis treści Laboratorium III: Testy statystyczne... 1 Wiadomości ogólne... 2 1. Krótkie przypomnienie wiadomości na temat testów statystycznych... 2 1.1. Weryfikacja

Bardziej szczegółowo

Analizy wariancji ANOVA (analysis of variance)

Analizy wariancji ANOVA (analysis of variance) ANOVA Analizy wariancji ANOVA (analysis of variance) jest to metoda równoczesnego badania istotności różnic między wieloma średnimi z prób pochodzących z wielu populacji (grup). Model jednoczynnikowy analiza

Bardziej szczegółowo

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4 Inne układy doświadczalne 1) Układ losowanych bloków Stosujemy, gdy podejrzewamy, że może występować systematyczna zmienność między powtórzeniami np. - zmienność

Bardziej szczegółowo

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;

Bardziej szczegółowo

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

Efekt główny Efekt interakcyjny efekt jednego czynnika zależy od poziomu drugiego czynnika Efekt prosty

Efekt główny Efekt interakcyjny efekt jednego czynnika zależy od poziomu drugiego czynnika Efekt prosty ANOVA DWUCZYNNIKOWA testuje różnice między średnimi w grupach wyznaczonych przez dwa czynniki i ich kombinacje. Analiza pozwala ustalić wpływ dwóch czynników na wartości zmiennej zależnej (ilościowej!)

Bardziej szczegółowo

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1. Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Dwuczynnikowa analiza wariancji (2-way

Bardziej szczegółowo

Żródło:

Żródło: Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Zmienne muszą być zmiennymi ilościowym (liczymy i porównujemy średnie!) Są to testy parametryczne Test

Bardziej szczegółowo

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Przykład 2 Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Sondaż sieciowy analiza wyników badania sondażowego dotyczącego motywacji w drodze do sukcesu Cel badania: uzyskanie

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Zadanie 1. Analiza Analiza rozkładu

Zadanie 1. Analiza Analiza rozkładu Zadanie 1 data lab.zad 1; input czas; datalines; 85 3060 631 819 805 835 955 595 690 73 815 914 ; run; Analiza Analiza rozkładu Ponieważ jesteśmy zainteresowani wyznaczeniem przedziału ufności oraz weryfikacja

Bardziej szczegółowo

S t a t y s t y k a, część 3. Michał Żmihorski

S t a t y s t y k a, część 3. Michał Żmihorski S t a t y s t y k a, część 3 Michał Żmihorski Porównanie średnich -test T Założenia: Zmienne ciągłe (masa, temperatura) Dwie grupy (populacje) Rozkład normalny* Równe wariancje (homoscedasticity) w grupach

Bardziej szczegółowo

Doświadczalnictwo leśne. Wydział Leśny SGGW Studia II stopnia

Doświadczalnictwo leśne. Wydział Leśny SGGW Studia II stopnia Doświadczalnictwo leśne Wydział Leśny SGGW Studia II stopnia Metody nieparametryczne Do tej pory omawialiśmy metody odpowiednie do opracowywania danych ilościowych, mierzalnych W kaŝdym przypadku zakładaliśmy

Bardziej szczegółowo

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii SPIS TREŚCI Przedmowa... 11 Wykaz symboli... 15 Litery alfabetu greckiego wykorzystywane w podręczniku... 15 Symbole wykorzystywane w zagadnieniach teorii mnogości (rachunku zbiorów)... 16 Symbole stosowane

Bardziej szczegółowo

Gimnastyka artystyczna

Gimnastyka artystyczna Gimnastyka artystyczna Zbadano losową próbę N=40 dziewcząt i chłopców z klas o profilu ogólnym i sportowym pod kątem ich ogólnej sprawności fizycznej ocenianej na skali Hirscha (od 0 do 20 pkt.), gdzie

Bardziej szczegółowo

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną. laboratoria 30 zaliczenie z oceną

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną. laboratoria 30 zaliczenie z oceną Wydział: Psychologia Nazwa kierunku kształcenia: Psychologia Rodzaj przedmiotu: podstawowy Opiekun: dr Andrzej Tarłowski Poziom studiów (I lub II stopnia): Jednolite magisterskie Tryb studiów: Stacjonarne

Bardziej szczegółowo

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;

Bardziej szczegółowo

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW Założenia do analizy wariancji dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW anna_rajfura@sggw.pl Zagadnienia 1. Normalność rozkładu cechy Testy: chi-kwadrat zgodności, Shapiro-Wilka, Kołmogorowa-Smirnowa

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Zadania ze statystyki cz.8. Zadanie 1.

Zadania ze statystyki cz.8. Zadanie 1. Zadania ze statystyki cz.8. Zadanie 1. Wykonano pewien eksperyment skuteczności działania pewnej reklamy na zmianę postawy. Wylosowano 10 osobową próbę studentów, których poproszono o ocenę pewnego produktu,

Bardziej szczegółowo

Metodologia badań psychologicznych. Wykład 12. Korelacje

Metodologia badań psychologicznych. Wykład 12. Korelacje Metodologia badań psychologicznych Lucyna Golińska SPOŁECZNA AKADEMIA NAUK Wykład 12. Korelacje Korelacja Korelacja występuje wtedy gdy dwie różne miary dotyczące tych samych osób, zdarzeń lub obiektów

Bardziej szczegółowo

Regresja logistyczna (LOGISTIC)

Regresja logistyczna (LOGISTIC) Zmienna zależna: Wybór opcji zachodniej w polityce zagranicznej (kodowana jako tak, 0 nie) Zmienne niezależne: wiedza o Unii Europejskiej (WIEDZA), zamieszkiwanie w regionie zachodnim (ZACH) lub wschodnim

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat Anna Rajfura 1 Przykład W celu porównania skuteczności wybranych herbicydów: A, B, C sprawdzano, czy masa chwastów na poletku zależy

Bardziej szczegółowo

Przykład 1. (A. Łomnicki)

Przykład 1. (A. Łomnicki) Plan wykładu: 1. Wariancje wewnątrz grup i między grupami do czego prowadzi ich ocena 2. Rozkład F 3. Analiza wariancji jako metoda badań założenia, etapy postępowania 4. Dwie klasyfikacje a dwa modele

Bardziej szczegółowo

Wykład 9 Wnioskowanie o średnich

Wykład 9 Wnioskowanie o średnich Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Testowanie hipotez statystycznych Hipotezą statystyczną jest dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia

Bardziej szczegółowo

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

dr hab. Dariusz Piwczyński, prof. nadzw. UTP dr hab. Dariusz Piwczyński, prof. nadzw. UTP NIEZBĘDNE DO ZROZUMIENIA WYKŁADU POJĘCIA Doświadczenie jednogrupowe (jednopróbkowe), dwugrupowe (dwupróbkowe) Doświadczenie niezależne i wiązane (zależne, sparowane)

Bardziej szczegółowo

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane

Bardziej szczegółowo

JEDNOCZYNNIKOWA ANOVA

JEDNOCZYNNIKOWA ANOVA Analizę ANOVA wykorzystujemy do wykrycia różnic pomiędzy średnimi w więcej niż dwóch grupach/więcej niż w dwóch pomiarach JEDNOCZYNNIKOWA ANOVA porównania jednej zmiennej pomiędzy więcej niż dwoma grupami

Bardziej szczegółowo

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej

Bardziej szczegółowo

Analiza wariancji - ANOVA

Analiza wariancji - ANOVA Analiza wariancji - ANOVA Analizę wariancji, często określaną skrótem ANOVA (Analysis of Variance), zawdzięczamy angielskiemu biologowi Ronaldowi A. Fisherowi, który opracował ją w 1925 roku dla rozwiązywania

Bardziej szczegółowo

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę) PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na

Bardziej szczegółowo

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22 Spis treści Przedmowa do wydania pierwszego.... 11 Przedmowa do wydania drugiego.... 15 Wykaz symboli.... 17 Litery alfabetu greckiego wykorzystywane w podręczniku.... 17 Symbole wykorzystywane w zagadnieniach

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice Przedmowa do wydania polskiego Przedmowa CZĘŚĆ I. PODSTAWY STATYSTYKI Rozdział 1 Podstawowe pojęcia statystyki

Bardziej szczegółowo

Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby

Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby 1. Wstęp teoretyczny Prezentowane badanie dotyczy analizy wyników uzyskanych podczas badania grupy rodziców pod kątem wpływu ich przekonań

Bardziej szczegółowo

laboratoria 24 zaliczenie z oceną

laboratoria 24 zaliczenie z oceną Wydział: Psychologia Nazwa kierunku kształcenia: Psychologia Rodzaj przedmiotu: podstawowy Opiekun: dr Andrzej Tarłowski Poziom studiów (I lub II stopnia): Jednolite magisterskie Tryb studiów: Niestacjonarne

Bardziej szczegółowo

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde

Bardziej szczegółowo

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, 2018 Spis treści Przedmowa 13 O Autorach 15 Przedmowa od Tłumacza 17 1. Wprowadzenie i statystyka opisowa 19 1.1.

Bardziej szczegółowo

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.

Bardziej szczegółowo

Dwuczynnikowa ANOVA dla prób niezależnych w schemacie 2x2

Dwuczynnikowa ANOVA dla prób niezależnych w schemacie 2x2 Dwuczynnikowa ANOVA dla prób niezależnych w schemacie 2x2 Poniżej prezentujemy przykładowe pytania z rozwiązaniami dotyczącymi dwuczynnikowej analizy wariancji w schemacie 2x2. Wszystkie rozwiązania są

Bardziej szczegółowo

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 3. Zmienne losowe 4. Populacje i próby danych 5. Testowanie hipotez i estymacja parametrów 6. Test t 7. Test

Bardziej szczegółowo

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4. Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ

Bardziej szczegółowo

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej, Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (punktowa, przedziałowa) Weryfikacja

Bardziej szczegółowo

Spis treści. Księgarnia PWN: Bruce M. King, Edward W. Minium - Statystyka dla psychologów i pedagogów. Wstęp Wprowadzenie...

Spis treści. Księgarnia PWN: Bruce M. King, Edward W. Minium - Statystyka dla psychologów i pedagogów. Wstęp Wprowadzenie... Księgarnia PWN: Bruce M. King, Edward W. Minium - Statystyka dla psychologów i pedagogów Wstęp... 13 1. Wprowadzenie... 19 1.1. Statystyka opisowa.................................. 21 1.2. Wnioskowanie

Bardziej szczegółowo

Zadania ze statystyki, cz.6

Zadania ze statystyki, cz.6 Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z

Bardziej szczegółowo

Dysleksja jest dla inteligentnych?

Dysleksja jest dla inteligentnych? Dysleksja jest dla inteligentnych? Zbadano losową próbę 116 chłopców i dziewcząt z trudnościami w uczeniu się pod kątem ilorazu inteligencji (Badanie baterią APIS-Z). Uzyskano następujące wyniki: Tabela

Bardziej szczegółowo

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ Dopasowanie rozkładów Dopasowanie rozkładów- ogólny cel Porównanie średnich dwóch zmiennych 2 zmienne posiadają rozkład normalny -> test parametryczny (t- studenta) 2

Bardziej szczegółowo

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y

Bardziej szczegółowo

Badania eksperymentalne

Badania eksperymentalne Badania eksperymentalne Pomiar na skali porządkowej mgr Agnieszka Zięba Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa Najpopularniejsze sposoby oceny wyników eksperymentu

Bardziej szczegółowo

WNIOSKOWANIE STATYSTYCZNE

WNIOSKOWANIE STATYSTYCZNE STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących

Bardziej szczegółowo

Wykład 9 Testy rangowe w problemie dwóch prób

Wykład 9 Testy rangowe w problemie dwóch prób Wykład 9 Testy rangowe w problemie dwóch prób Wrocław, 18 kwietnia 2018 Test rangowy Testem rangowym nazywamy test, w którym statystyka testowa jest konstruowana w oparciu o rangi współrzędnych wektora

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta

Bardziej szczegółowo

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie

Bardziej szczegółowo

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38 Statystyka Wykład 8 Magdalena Alama-Bućko 23 kwietnia 2017 Magdalena Alama-Bućko Statystyka 23 kwietnia 2017 1 / 38 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia

Bardziej szczegółowo

Eksploracja Danych. Testowanie Hipotez. (c) Marcin Sydow

Eksploracja Danych. Testowanie Hipotez. (c) Marcin Sydow Testowanie Hipotez Wprowadzenie Testy statystyczne: pocz. XVII wieku (prace J.Arbuthnotta, liczba urodzeń noworodków obu płci w Londynie) Testowanie hipotez: Karl Pearson (pocz. XX w., testowanie zgodności,

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y

Bardziej szczegółowo

Analiza wariancji. dr Janusz Górczyński

Analiza wariancji. dr Janusz Górczyński Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z

Bardziej szczegółowo

Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych. Laboratorium VI: Testy nieparametryczne

Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych. Laboratorium VI: Testy nieparametryczne 1 Laboratorium VI: Testy nieparametryczne Spis treści Laboratorium VI: Testy nieparametryczne... 1 Testy nieparametryczne... 2 1. Tablica wielorozdzielcza... 3 2. Test χ 2 niezależności zmiennych... 3

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności: Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności

Bardziej szczegółowo

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak Autor prezentuje spójny obraz najczęściej stosowanych metod statystycznych, dodatkowo omawiając takie

Bardziej szczegółowo

Kolokwium ze statystyki matematycznej

Kolokwium ze statystyki matematycznej Kolokwium ze statystyki matematycznej 28.05.2011 Zadanie 1 Niech X będzie zmienną losową z rozkładu o gęstości dla, gdzie 0 jest nieznanym parametrem. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM

Bardziej szczegółowo

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne 1 Wybrane testy nieparametryczne 1. Test chi-kwadrat zgodności z rozkładem oczekiwanym 2. Test chi-kwadrat niezależności dwóch zmiennych kategoryzujących 3. Test U Manna-Whitney

Bardziej szczegółowo

Analiza wariancji jednej zmiennej (UNIANOVA)

Analiza wariancji jednej zmiennej (UNIANOVA) UNIANOVA ocena BY pĺ eä szkoĺ a doĺ wiadczenie /METHOD=SSTYPE(3) /INTERCEPT=INCLUDE /POSTHOC=szkoĹ a(snk) /PLOT=PROFILE(szkoĹ a*doĺ wiadczenie*pĺ eä doĺ wiadczenie*szkoĺ a*pĺ eä szkoĺ a*pĺ eä *doĺ wiadczenie

Bardziej szczegółowo

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej

Bardziej szczegółowo

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( ) Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału

Bardziej szczegółowo