Dysleksja jest dla inteligentnych?

Wielkość: px
Rozpocząć pokaz od strony:

Download "Dysleksja jest dla inteligentnych?"

Transkrypt

1 Dysleksja jest dla inteligentnych? Zbadano losową próbę 116 chłopców i dziewcząt z trudnościami w uczeniu się pod kątem ilorazu inteligencji (Badanie baterią APIS-Z). Uzyskano następujące wyniki: Tabela 1: Rozkład częstości występowania dysleksji w zależności od płci Dysleksja Brak Dysleksji Dziewczęta Chłopcy Inteligencja dziewcząt z dysleksją: 107, 85, 103, 107, 96, 95, 82, 111, 120, 115, 102, 113, 90, 100, 87, 91, 95, 107, 77, 113. Inteligencja chłopców z dysleksją: 97, 114, 86, 74, 89, 93, 99, 113, 110, 106, 107, 90, 102, 59, 112, 96, 96, 68, 76, 89, 101, 66, 92, 96, 110, 108, 85, 107, 108, 118, 109, 66, 85, 92, 109, 105, 97, 100, 94, 111, 60, 102. Inteligencja dziewcząt bez dysleksji: 95, 94, 110, 114, 100, 114, 101, 135, 86, 127, 109, 108, 106, 115, 109, 128, 118, 107, 98, 112, 129, 111, 104, 122, 105, 129, 129, 93, 150, 107, 116, 118. Inteligencja chłopców bez dysleksji: 84, 135, 108, 98, 103, 93, 110, 94, 104, 124, 123, 139, 127, 105, 119, 118, 94, 122, 102, 117, 138, Przygotuj zbiór danych w SPSS i wprowadź do niego zebrane w trakcie badania dane 2. Spraw, aby SPSS nie brał pod uwagę wyników inteligencji poniżej 75 pkt. (ale tylko inteligencji nie ma to dotyczyć innych zmiennych) bez usuwania ich ze zbioru danych. 3. Przekoduj (na inną zmienną) wyniki uzyskane przez badane osoby tak, aby wyróżnić dwie grupy osoby o inteligencji do 100 i powyżej 100 pkt. 4. Sprawdź, czy występowanie dysleksji jest skorelowane z płcią w badanej populacji? 5. Opisz rozkład wyników średnia, mediana, odch. std., skośność, kurtoza minimum i maksimum poziomu inteligencji w badanej populacji. Zinterpretuj wskaźniki statystyczne i zanalizuj rozkład wyników na histogramie. 6. Zweryfikuj hipotezę, że inteligencja osób z dysleksją różni się od inteligencji osób bez dysleksji. a. Jakim testem statystycznym należy zweryfikować postawioną hipotezę? b. Podaj wartość odpowiednich statystyk potwierdzających Twoją interpretację uzyskanych wyników. 7. Zweryfikuj hipotezę, że płeć jest moderatorem związku dysleksji i inteligencji że istnieje interakcja między płcią i dysleksją we wpływie na inteligencję. a. Jakim testem statystycznym należy zweryfikować tę hipotezę? b. Opisz wyniki i przedstaw odpowiednie statystyki oraz zinterpretuj wyniki przedstawione przez Ciebie na wykresie. Karol Karasiewicz 1

2 Odpowiedzi 1. Przygotuj zbiór danych w SPSS i wprowadź do niego zebrane w trakcie badania dane W badaniu występują trzy zmienne: a) Płeć zmienna nominalna (Kobieta vs. Mężczyzna), zgodnie ze standardem najlepiej kodować 0 Mężczyzna, 1 Kobieta; b) Dysleksja zmienna nominalna (Dysleksja vs. Brak dysleksji), zgodnie ze standardem najlepiej jest kodować tę zmienną 0 Brak dysleksji i 1 Dysleksja; c) Inteligencja zmienna ilościowa, wynik testu APIS-Z. Dodatkowo do zbioru danych wpisujemy zgodnie ze standardem zmienną identyfikatora ID. A wię w zbiorze danyh występować będzie 5 kolumn (zmiennych). Jednostką badaną, tzn. obserwacją statystyczną jest jedno dziecko jedna osoba. A więc w zbiorze danych występować będzie 116 wierszy. Zbiór danych został zapisany w pliku DANE.SAV Fragment zbioru danych przedstawia poniższa tabela: LP PŁEĆ DYSLEKSJA IQ Spraw, aby SPSS nie brał pod uwagę wyników inteligencji poniżej 75 pkt. (lecz tylko inteligencji, nie ma to dotyczyć innych zmiennyh) bez usuwania ich ze zbioru danych. Najprostszym sposobem na wyeliminowanie jakiejś wartości lub zakresu wartości ze zbioru analizowanych danych tylko w obrębie danej zmiennej jest wpisanie tej wartości (lub tego zakresu) do definicji braków danych w danej zmiennej. Można to zrobić wybierając widok ZMIENNE w edytorze danych SPSS i definiując braki danych. Ryc. 1 Karol Karasiewicz 2

3 Aby zdefiniować konkretne liczby, jako braki danych należałoby wybrać Dyskretne wartości braków danych, jednakże dla wskazania pewnego przedziału wartości, które należy traktować jako braki danych, trzeba wybrać Przedział wartości plus wartość dyskretna. Wpisując do pól Dolna granica i Górna granica konkretne liczby wskażemy przedział wartości, które będą traktowane, jako brak danych. Do pola górna granica powinniśmy wpisać wartość 75 ponieważ wynik IQ=75 i niższy ma być traktowany, jako brak danych. Natomiast do pola Dolna granica powinniśmy wpisać najmniejszą liczbę, jaka może wystąpić Możemy wpisać dowolną liczbę mniejszą od 75, ale jak bardzo mniejszą? SPSS posiada opcję LO (jak LOWEST), która sama oblicza najmniejszą możliwą wartość zmiennej i wydaje się to najwygodniejszym wyjściem z sytuacji. Podobnie do pola Górna granica moglibyśmy wpisać HI (jak HIGHEST) dla wymuszenia na SPSS obliczenia największej wartości, która będzie traktowana jako brak danych. Pamiętajmy jednak, aby nie wpisywać LO i HI jednocześnie, ponieważ wówczas wszystkie wpisane wartości będą traktowane, jako braki danych, Gdy ustalimy wartości, jak na powyższej rycinie (Ryc. 1) i zaakceptowaniu ich możemy sprawdzić, czy SPSS na pewno traktuje dane o inteligencji poniżej 75 punktów, jako braki np. przeprowadzając analizę statystyk opisowych dla IQ. Wybierzmy zatem ANALIZA OPIS STATYSTYCZNY STATYSTYKI OPISOWE i do zmiennych testowanych przenieśmy IQ. W uzyskanym raporcie można zauważyć, że najmniejszy analizowany wynik inteligencji to 76, natomiast ogółem analizowanych jest N=110 (a nie 116, jak na początku) obserwacji. A więc nasze zabiegi odniosły spodziewany skutek. 3. Przekoduj (na inną zmienną) wyniki uzyskane przez badane osoby tak, aby wyróżnić dwie grupy osoby o inteligencji do 100 i powyżej 100 pkt. Przeprowadzenie tej operacji jest niezwykle proste. Wystarczy wybrać polecenie PRZEKSZTAŁCENIA REKODUJ NA INNE ZMIENNE. Ryc. 2 W otwartym oknie kreatora rekodowania należy wskazać, jaką zmienną chcemy przekodować w naszym wypadku jest to IQ, a więc przenosimy IQ do pola Zmienna numeryczna --> Wynikowa. Następnie w polu Zmienna wynikowa koniecznie należy wpisać nazwę (zgodnie ze standardem nazywania zmiennych w SPSS) nowej zmiennej np. INTELIGENCJA i kliknąć przycisk ZMIEŃ. Karol Karasiewicz 3

4 Ryc. 3 Następnie należy kliknąć przycisk Wartości źródłowe i wynikowe, aby zdefiniować, jakie wartości należy przekodować na jakie inne wartości. Ryc. 4 W otwartym polu dialogowym można wskazać, żeby SPSS zamieniał przedział wartości na określoną wartość dyskretną. W naszym przypadku najbardziej efektywne będzie skorzystanie z opcji Zakres wartości od najmniejszej do podanej dla określenia przedziału od minimum do 100. i Zakres wartości od podanej do największej dla określenia przedziału wartości od 101 do maksimum. Koniecznie należy pamiętać, żeby w wartości wynikowej za pierwszym i drugim razem wpisać inną liczbę, najlepiej 0 i 1. Wynikowa zmienna INTELIGENCJA będzie dwukategorialna, ale będzie to sztuczny podział zmiennej ciągłej gdzie 0 reprezentować będzie jeden koniec kontinuum, a 1 koniec drugi. Stąd też stosowanie wartości 0 i 1 wydaje się bardziej wskazane niż wartości np. 1 i 2 (które są całkowicie dopuszczalne dla zmiennych nominalnych). Bardzo staranne i rzetelne jest po przekodowaniu zmiennej zdefiniować jej etykietę oraz etykiety wartości. W widoku edytora danych SPSS wybieramy zakładkę ZMIENNE i możemy zdefiniować etykiety zmiennej INTELIGENCJA 0 to DO 100 PKT. a 1 to POW. 100 PKT.. Dla sprawdzenia poprawności dokonanego podziału po zaakceptowaniu wybranych można przeprowadzić analizę rozkładu IQ np. w procedurze ŚREDNIE oddzielnie w grupie o wartości zmiennej INTELIGENCJA równej 0 i 1. Wybierzmy zatem ANALIZA PORÓWNANIA ŚREDNICH ŚREDNIE. Karol Karasiewicz 4

5 Ryc. 5 W otwartym polu dialogowym kreatora raportu średnich należy przenieść zmienną IQ (zmienna ciągła) do zmiennych zależnych i zmienną INTELIGENCJA (zmienna nominalna dwukategorialna) do zmiennych niezależnych. Następnie w polu OPCJE należy wskazać minimum i maksimum (aby ocenić granice przedziałów punktowych dla dwóch grup) i po zaakceptowaniu wyboru otrzymujemy raport wynikowy. Ryc. 6 W raporcie najważniejsze jest, żeby sprawdzić, czy minimum i maksimum dla przekodowanych przez nas przedziałów są prawidłowe. Zamieszczona poniżej tabela pokazuje, że rzeczywiście w przedziale inteligencji do 100 punktów maksimum jest 100, natomiast w przedziale inteligencji powyżej 100 punktów minimum wynosi 101. INTELIGENCJA Raport INTELIGENCJA Średnia N Odchylenie standardowe Minimum Maksimum DO 100 PKT. 91, , POW. 100 PKT. 113, , Ogółem 106, , Sprawdź, czy występowanie dysleksji jest skorelowane z płcią w badanej populacji? Niejednemu psu na imię Burek mówi pewne przysłowie i pospolita ta prawda odnosi się również do statystyki. Ponieważ wynikiem niejednej metody statystycznej jest korelacja. Aby sprawdzić korelację między dwiema zmiennymi nominalnymi (a płeć i dysleksja są zmiennymi nominalnymi) należy przeprowadzić nie test korelacji Pearsona, a test niezależności chi-kwadrat ( 2 ) popartą najlepiej współczynnikiem korelacyjnym phi. Karol Karasiewicz 5

6 Odpowiedź na to zadanie można postawić na dwa sposoby. Pierwszy jest oparty na analizie danych zebranych w zbiorze DANE.SAV tzw. Raw Data. Drugi daje dokładnie te same rezultaty i jest oparty na analizie podsumowania danych w tabeli kontyngencji. Zacznijmy od analizowania danych szczegółowych Raw Data. Mamy otwarty zbiór danych DANE.SAV. W menu ANALIZA wybieramy opcję OPIS STATYSTYCZNY i tam TABELE KRZYŻOWE. Ryc. 7 W otwartym oknie dialogowym wskazujemy zmienne (NOMINALNE), które chcemy ze sobą skorelować. Jedne zmienne przenosimy do listy Zmienne w wierszach, drugie do listy Zmienne w kolumnach. Pamiętajmy zmienne w wierszach będą korelowane ze zmiennymi w wierszach, ale zmienne w wierszach nie będą korelowane ze sobą nawzajem i zmienne w kolumnach ze sobą nawzajem również nie. My chcemy skorelować PŁEĆ z DYSLEKSJĄ jedną zatem zmienną przenosimy do wierszy, drugą do kolumn. Ryc. 8 Czy istnieje jakaś reguła, którą zmienną należy przenieść w które miejsce? Reguły są różne. Jedna z nich mówi, aby zmienną traktowaną jako zależna przenieść do kolumn, a zmienne niezależne do wierszy. Inna reguła wskazuje, że zmienną o większej liczbie kategorii przenieść do kolumn a tę o mniejszej do wierszy. Od strony statystycznej układ ten ma niewielkie znaczenie, a interpretacyjnego nie ma zgoła wcale. Analizowane dalej zależności mają charakter korelacyjny, zatem dotyczą współwystępowania, współzależności obu zmiennych ich układ nie jest więc istotny. Następnie możemy wskazać, jakiego rodzaju podsumowania chcemy otrzymać w analizowanym układzie kliknijmy w opcję KOMÓRKI. Należy w zasadzie wskazać liczebności OBSERWOWANE i to jest wskazanie obligatoryjne (bez tego trudno będzie dalej interpretować wyniki). Natomiast pozostałe wskazania są opcjonalne. Moim zdaniem warto (jeśli liczba obserwacji jest dość duża z pewnością większa od 50, a najlepiej większa od 100) wskazać jedną z opcji procentów. Tutaj wskazałem procenty w wierszach, Karol Karasiewicz 6

7 ponieważ chcę wiedzieć ile procent osób z dysleksją (lub bez) to kobiety, a ile to mężczyźni. Dla osób bardziej zaawansowanych w statystyce interesującym i bardzo informatywnym może okazać się wskazanie Standaryzowanych lub niestandaryzowanych reszt. Mogą one powiedzieć o wielkości odchyleń od liczebności oczekiwanej w danej komórce. Ryc. 9 Następnie należy wybrać statystyki podsumowujące, które pozwolą wprost oszacować korelacje między analizowanymi zmiennymi. W tym celu w oknie głównym analizy tabel krzyżowych należy kliknąć na polecenie STATYSTYKI. Ryc. 10 W naszym przypadku gdy analizowane są wyłącznie korelacje między zmiennymi dwukategorialnymi warto zażądać wyliczenia statystyki testowej chi-kwadrat ( 2 ) oraz współczynnika korelacji phi ( ). Gdyby analizowane były zależności między zmiennymi o większej liczbie kategorii (np. 2x3 lub 3x3 itd.) lepszym wskaźnikiem korelacji między zmiennymi byłby współczynnik kontyngencji zamiast phi. Natomiast, gdyby analizowane zmienne można zaklasyfikować do zmiennych porządkowych lub przedziałowych należałoby wybrać jeden z mocniejszych wskaźników przeznaczonych dla poszczególnego rodzaju danych. Karol Karasiewicz 7

8 Ryc. 11 I wreszcie na koniec warto zażądać od SPSSa zaprezentowania wyników podsumowujących w postaci wykresu słupkowego. Można to zrobić klikając opcję Pokaż zgrupowane wykresy słupkowe w głównym oknie dialogowym kreatora tabel krzyżowych. Ryc. 12 A więc analiza jest całkowicie gotowa. Po kliknięciu OK. możemy otrzymać pożądane wyniki. Ten sam rezultat otrzymamy przy pomocy poleceń SYNTAX. Należy utworzyć nowy plik poleceń klikając PLIK NOWY POLECENIA lub otworzyć już istniejący (PLIK OTWÓRZ POLECENIA), A następnie wpisać w otwartym oknie polecenie SYNTAX pozwalające przeprowadzić analizę tabel krzyżowych o następującej treści: CROSSTABS /TABLES = DYSLEKSJA BY PŁEĆ /CELLS = RAW COUNT /STATISTICS = PHI /BARCHART. W poleceniu tym CROSSTABS jest słowem kluczowym wywołującym procedurę analizy tabel krzyżowych. /VARIABLES wskazuje na to, jakie zmienne będą ze sobą korelowane. Zmienne w wierszach i kolumnach są rozdzielone słowem BY. /STATISTICS wskazuje, jakie mają być wyliczone statystyki tutaj CHISQ (chi-kwadrat niezależności) oraz PHI ( i V Cramera). /CELLS wskazuje, jakie podsumowania liczebności mają się wyświetlić tutaj RAW (tzn. procent w wierszach) i COUNT (tzn. liczebność obserwowana). I wreszcie /BARCHART wskazuje żądanie wykreślenia wykresu słupkowego. Druga opcja dla przeanalizowania odpowiedzi na to pytanie jest z jednej strony prostsza, z drugiej nieco bardziej skomplikowana. Opiera się ona na wprowadzeniu do SPSS Karol Karasiewicz 8

9 podsumowań tabeli kontyngencji. W zadaniu zostały podane liczebności grup kobiet z dysleksją, kobiet bez dysleksji, mężczyzn z dysleksją i bez dysleksji w postaci tabeli kontyngencji: Dysleksja Brak Dysleksji Dziewczęta Chłopcy Można tabelę tę przeformułować do postaci zbioru danych w SPSS. W zbiorze tym możemy mieć trzy zmienne: PŁEĆ (Kobieta vs. Mężczyzna), DYSLEKSJA (Dysleksja vs. Brak dysleksji) i LICZEBNOŚĆ liczba osób w danej grupie. Tabela ta wyglądałaby następująco: DYSLEKSJA PŁEĆ N DYSLEKSJA DZIEWCZĘTA 20 DYSLEKSJA CHŁOPCY 42 BRAK DYSLEKSJI DZIEWCZĘTA 32 BRAK DYSLEKSJI CHŁOPCY 22 Jeżeli wprowadzimy ten zbiór danych do SPSS w takiej postaci, jak jest to wskazane (Zapisano, jako TabelaKontyngencji.sav) wówczas SPSS po przeprowadzeniu analizy tabel krzyżowych będzie sądził, że w układzie DYSLEKSJAxPŁEĆ mamy jedynie po jednej obserwacji. Aby to zmienić należy nadać obserwacjom wagi zgodne z liczebnością danej grupy. Aby to zrobić należy wybrać polecenie DANE WAŻENIE OBSERWACJI. Ryc. 13 Następnie w oknie dialogowym kreatora nadawania wag obserwacjom powinniśmy wskazać zmienną, która ma pokazywać SPSSowi, jak wiele znaczy dana jedna obserwacja (w naszym przypadku badana grupa). Zmienną tą w niniejszym badaniu jest N. Ryc. 14 I teraz SPSS może przeprowadzić całą analizę tabel krzyżowych (patrz: Ryc. 7 do Ryc. 12)całkowicie poprawnie i otrzymane wyniki będą analogiczne do tych uzyskanych przy zastosowaniu poprzedniego sposobu. Różnica jest jedna jeśli celem samym w sobie jest oszacowanie korelacji między dwiema (lub więcej) zmiennymi, o których wiemy jaki mają układ w tabeli kontyngencji można z powodzeniem wykorzystać ten sposób mniej zapracowując się wpisując szczegółowo dane o każdym badanym (tzw. Raw Data ). Karol Karasiewicz 9

10 Ten sam efekt osiągniemy również poprzez zastosowanie (tzn. napisanie i uruchomienie) poleceń SYNTAX o następującej treści: *******************************************************************************************************. ** Początek pliku poleceń **. ** Przygotowuje zbiór danych do wprowadzenia stabelaryzowanych wyników **. DATA LIST LIST (TAB) SKIP=1 /DYSLEKSJA (F8.0) PŁEĆ (F8.0) N (F8.0). ** Wprowadza wyniki stabelaryzowane **. BEGIN DATA. DYSLEKSJA PŁEĆ N END DATA. ** Definiowanie poziomu pomiaru zmiennych **. VARIABLE LEVEL DYSLEKSJA PŁEĆ (NOM) /N (SCALE). ** Definiowanie etykiet wartości dla płci i dysleksji **. VALUE LABELS DYSLEKSJA 0 BRAK DYSLEKSJI 1 DYSLEKSJA /PŁEĆ 0 CHŁOPCY 1 DZIEWCZĘTA. ** Ważenie obserwacji przez zmienną N **. WEIGH BY N. ** Analiza tabel krzyżowych **. CROSSTABS /TABLES = DYSLEKSJA BY PŁEĆ /CELLS = ROW COUNT /STATISTICS = CHISQ PHI /BARCHART. ** Koniec pliku poleceń **. *******************************************************************************************************. Po przeprowadzeniu analizy tabel krzyżowych nie jest istotne, którym z powyższych sposobów zostanie ona przeprowadzona otrzymamy następujący raport. Karol Karasiewicz 10

11 Tabela krzyżowa DYSLEKSJA * PŁEĆ PŁEĆ Ogółem CHŁOPCY DZIEWCZĘTA DYSLEKSJA BRAK DYSLEKSJI Liczebność % z DYSLEKSJA 40,7% 59,3% 100,0% DYSLEKSJA Liczebność % z DYSLEKSJA 67,7% 32,3% 100,0% Ogółem Liczebność % z DYSLEKSJA 55,2% 44,8% 100,0% Powyższa tabela wskazuje rozkład liczebności kobiet i mężczyzn wśród osób z dysleksją i bez dysleksji. Wyniki pokazują, że większość, bo 59,3% osób bez dysleksji stanowią dziewczęta, natomiast w grupie osób z dysleksją stanowią one 44,8%. Testy Chi-kwadrat Wartość df Istotność asymptotyczna (dwustronna) Istotność dokładna (dwustronna) Istotność dokładna (jednostro nna) Chi-kwadrat Pearsona 8,508(b) 1,004 Poprawka na ciągłość(a) 7,451 1,006 Iloraz wiarygodności 8,598 1,003 Dokładny test Fishera,005,003 N Ważnych obserwacji 116 a Obliczone wyłącznie dla tabeli 2x2. b,0% komórek (0) ma liczebność oczekiwaną mniejszą niż 5. Minimalna liczebność oczekiwana wynosi 24,21. Test 2 Pearsona jest miarą siły związku między dwiema zmienymi o charakterze nominalnym. Gdyby można założyć, że obie zmienne są jedynie dwukategorialnymi reprezentacjami zmiennych ciągłych gdyby założyć, że Mężczyzna i Kobieta są dwoma biegunami jednego kontinuum oraz, że Dysleksja i Brak Dysleksji są również dwoma biegunami drugiego kontinuum, wówczas należałoby również wziąć poprawkę na ciągłość. W naszym przypadku raczej tak nie będziemy robić, wydaje się bowiem, że płeć i dysleksja są raczej zmiennymi nominalnymi, a nie ciągłymi. Stąd też interpretacja uzyskanego wyniku powinna być następująca: W wyniku analizy testem 2 Pearsona zaobserwowano istotny statystycznie związek ( 2 (df=1)= 8,508; p<0,01) między obu zmiennymi, a związek ten okazał się umiarkowanie silny ( =-0,271). Miary symetryczne Istotność Wartość przybliżona Nominalna przez Nominalna Phi -,271,004 V Kramera,271,004 N Ważnych obserwacji 116 a Nie zakładając hipotezy zerowej. b Użyto asymptotycznego błądu standardowego, przy założeniu hipotezy zerowej. Współczynnik Cramera wskazuje na siłę związku między dwiema dychotomicznymi (dwukategorialnymi) zmiennymi o charakterze nominalnym. W zasadzie (z pewnym przybliżeniem) można go traktować, jak klasyczny współczynnik korelacji (np. Pearsona), a mówi on o stopniu zgodności/niezgodności w rozkładzie liczebności grup na dwóch Karol Karasiewicz 11

12 poziomach danej zmiennej. Im większa jest wartość współczynnika tym silniejsza jest współzależność między obu zmiennymi. Przyjmuje się, że zależność jest słaba, gdy mieści się w przedziale -0,2 do 0,2; natomiast na zależność umiarkowanie silną wskazuje w przedziale od -0,4 do -0,2 lub 0,2 to 0,4. Wartość poniżej -0,4 lub powyżej 0,4 można traktować, jako wskaźnik silnej zależności między zmiennymi. Gdyby w niniejszym przykładzie analizowane były zmienne o większej niż 2 liczbie kategorii, bardziej stosownym do wskazania siły zależności między zmiennymi byłby współczynnik kontyngencji jest wykalibrowany w ten sposób, aby był bardziej odporny na zróżnicowany charakter zależności między zmiennymi związany ze zróżnicowaniem liczby stopni swobody testu 2. W zasadzie wykresu słupkowego nie trzeba objaśniać on stanowi graficzną reprezentację pierwszej z opisywanych w teście tabel. Jednakże może on podsunąć pytanie, czy różnica między liczebnością kobiet i mężczyzn w grupie z dysleksją jest istotna statystycznie? Albo, czy jest istotna statystycznie różnica między liczebnością kobiet i mężczyzn w grupie bez dysleksji? Odpowiedź (przybliżoną) na to pytanie można uzyskać budując przedziały ufności dla każdej z podgrup lub poprzez analizę testu 2 jednorodności zakładającego hipotezę zerową o równości liczebności w dwóch grupach. Ten drugi sposób wydaje się bardziej precyzyjny i zostanie tutaj opisany. Chcemy odpowiedzieć na pytanie czy liczba kobiet i mężczyzn w grupie dyslektyków jest taka sama, czy też inna? I analogicznie czy liczba kobiet i mężczyzn w grupie bez dysleksji jest taka sama, czy też inna? W tym celu najpierw dokonujemy podziału na podzbiory według zmiennej DYSLEKSJA tak, aby SPSS dokonywał oddzielnie analiz dla chłopców i dziewcząt. Wybieramy zatem polecenie DANE PODZIAŁ NA PODZBIORY. Karol Karasiewicz 12

13 Ryc. 15 I w otwartym oknie kreatora podziału na podzbiory wybieramy (najczęściej) opcję Porównaj grupy, a następnie w polu Grupy wyróżnione na podstawie umieszczamy zmienną DYSLEKSJA, ponieważ chcemy, aby SPSS podzielił dane na osoby z dysleksją i bez dysleksji. Ryc. 16 Gdy zaakceptujemy wybór w prawym dolnym rogu okna edytora danych (naszego zbioru danych) pojawi się informacja Podziały włączone lub Podziel wg. Dysleksja (w zależności od wersji programu SPSS. Teraz możemy przeprowadzić test równości liczności kobiet i mężczyzn w zależności od poziomu dysleksji. Poprzedni test 2 został wykonany na dwa sposoby, jednakże teraz niezależnie od sposobu poprzedniego działania mamy jeden sposób dalszego postępowania. Należy z menu ANALIZA wybrać grupę TESTY NIEPARAMETRYCZNE CHI-KWADRAT. Karol Karasiewicz 13

14 Ryc. 17 Test ten służy do weryfikacji hipotezy, że liczebność grup w danej zmiennej jest zgodna z oczekiwaną np. oczekiwać można (jak my to będziemy robić), że liczebność wszystkich grup jest równa. Ryc. 18 Do pola Zmienne testowane przenosimy zmienną płeć chcemy porównać liczebność kobiet i mężczyzn. Musimy jeszcze zdefiniować, jaka jest hipoteza zerowa, tzn. jaka jest oczekiwana liczebność porównywanych grup. Jeśli liczebność ma być równa w każdej z grup wybierzmy tę opcję. Gdybyśmy jednak oczekiwali określonej innej proporcji liczebności należałoby dokładnie określić proporcję liczebności dla każdej z grup wpisując ile setnych całej próby ma ona stanowić. Np. chcąc, żeby dwie grupy liczyły sobie po 50% należy wpisać wartość 0,5 dla każdej z grup. Ryc. 19 Karol Karasiewicz 14

15 I po zaakceptowaniu wszystkich wyborów uzyskujemy odpowiedź na zadane pytanie jaka jest różnica liczebności kobiet i mężczyzn w obu porównywanych grupach. Przedstawiona tabela testuje hipotezę, że liczebność kobiet i mężczyzn w grupie z dysleksją i bez dysleksji jest taka sama. Istotność testu 2 poniżej zadanego poziomu (najczęściej 0,05) daje podstawę do odrzucenia tej hipotezy zerowej i pozwala sądzić, że różnice są istotne statystycznie. W naszym przykładzie można zauważyć, że różnica liczebności kobiet i mężczyzn okazała się nieistotna statystycznie ( 2 (1)=1,852; p>0,15) w grupie osób bez dysleksji, natomiast w grupie osób z dysleksją ( 2 (1)=7,806; p<0,01) różnica ta jest statystycznie istotna. Statystyki testu WYSTĘPOWANIE DYSLEKSJI PŁEĆ NIE WYSTĘPUJE Chi-kwadrat(a,b) 1,852 df 1 Istotność asymptotyczna,174 WYSTĘPUJE Chi-kwadrat(a,b) 7,806 df 1 Istotność asymptotyczna,005 a 0 komórek (,0%) ma liczebność oczekiwaną mniejszą od 5. Minimalna liczebność oczekiwana w komórce wynosi 27,0. b 0 komórek (,0%) ma liczebność oczekiwaną mniejszą od 5. Minimalna liczebność oczekiwana w komórce wynosi 31,0. A więc po przeprowadzeniu obu testów testu 2 niezależności (w procedurze tabel krzyżowych) oraz testu 2 jednorodności możemy w pełni odpowiedzieć na postawione zadanie określić korelację między płcią i występowaniem dysleksji. Interpretacja uzyskanych wyników mogłaby brzmieć następująco. Wyniki przeprowadzonych analiz wskazują, że istotniej istotna statystycznie i umiarkowanie silna współzależność między płcią i występowaniem dysleksji ( 2 (1)=8,508; p=0,004). W grupie osób bez dysleksji liczebność kobiet i mężczyzn jest zbliżona (różnica jest statystycznie nieistotna 2 (1)=1,852; p=0,174) dziewczęta stanowią około 59,3%, natomiast w grupie osób z dysleksją dysproporcja liczebnośći kobiet i mężczyzn jest istotna statystycznie ( 2 (1)=7,806; p=0,005), a dziewczęta stanowią około 32,3% liczebności tej grupy. 5. Opisz rozkład wyników średnia, mediana, odch. std., skośność, kurtoza minimum i maksimum poziomu inteligencji w badanej populacji. Zinterpretuj wskaźniki statystyczne i zanalizuj rozkład wyników na histogramie. Wykonać do zadanie można jedynie na zbiorze danych tzw. Raw Data przedstawionym na samym początku nie można skorzystać z żadnego podsumowania tabelarycznego (jak to było przy analizie poprzedniego punktu). Aby dokonać opisu statystycznego zmiennych ciągłych można przeprowadzić analizę częstości bądź to łącznie w całej próbie, bądź to w podziale na płeć czy dysleksję. Podstawowym jest przeprowadzenie analizy dla całej badanej próby. Aby to zrobić, należy kliknąć ANALIZA OPIS STATYSTYCZNY CZĘSTOŚCI. Karol Karasiewicz 15

16 Ryc. 20 Po przeniesieniu żądanych zmiennych do zmiennych testowanych (a więc zmiennych, dla których będzie wykonany opis statystyczny) u nas jest to IQ należy kliknąć OPCJE i wskazać, które wskaźniki dla zmiennych mają być wyliczone (Najczęściej w badaniach psychologicznych są to ŚREDNIA, MEDIANA, ODCH. STANDARDOWE, MINIMUM i MAKSIMUM, SKOŚNOŚĆ i KURTOZA), a następnie WYKRESY, aby pokazać, które wykresy SPSS ma wykreślić (dla zmiennych ciągłych najczęściej są to HISTOGRAM Z KRZYWĄ NORMALNĄ). Ryc. 21 Po zaakceptowaniu wszystkich ustawień otrzymujemy raport z analizy częstości, w którym najważniejsze są tabela statystyk i histogram. N Statystyki INTELIGENCJA Ważne 110 Braki danych 6 Średnia 106,04 Mediana 107,00 Odchylenie standardowe 13,938 Skośność,433 Błąd standardowy skośności,230 Kurtoza,306 Błąd standardowy kurtozy,457 Minimum 76 Maksimum 150 Karol Karasiewicz 16

17 Najbardziej pożądana interpretacja uzyskanych wyników może wyglądać następująco: Wyniki przeprowadzonej analizy rozkładu wyników poziomu inteligencji wskazują, że badane dzieci charakteryzują się inteligencją w przedziale od 76 do 150 punktów. Przeciętne dziecko otrzymało M=106,04 punktu z odchyleniem standardowym SD=13,938 punktu. Oznacza to, że typowe badane dziecko charakteryzuje się wynikiem pomiaru inteligencji w przedziale 92,102 do 119,978 punktu 1. Połowa badanych dzieci uzyskała co najwyżej 107 punktów w skali inteligencji. Wskaźniki skośności i kurtozy bardzo bliskie zeru 2 wskazują, iż rozkład ma charakter symetryczny i mezokurtyczny, co potwierdza również histogram. Można zatem uznać, że analizowana zmienna ma charakter zblżony do normalnego do przeprowadzenia analiz statystycznych w odniesieniu do poziomu inteligencji można będzie zatem wykorzystać szereg klasycznych testów parametrycznych, które wymagają założenia o normalności rozkładu zmiennych. 6. Zweryfikuj hipotezę, że inteligencja osób z dysleksją różni się od inteligencji osób bez dysleksji. a. Jakim testem statystycznym należy zweryfikować postawioną hipotezę? Do weryfikacji postawionej hipotezy należy wykorzystać test t dla prób niezależnych. Aby go przeprowadzić należy wybrać polecenie ANALIZA PORÓWNANIA ŚREDNICH TEST T DLA PRÓB NIEZALEŻNYCH. 1 Przedział obliczamy jako Średnia odch. standardowe tzn. 103,04 13, Mieszczą się w przedziale -0,7 do 0,7 Karol Karasiewicz 17

18 Ryc. 22 W otwartym oknie kreatora analizy dla testu należy wskazać zmienną testowaną (zależną) musi to być zmienna ciągła o rozkładzie normalnym (co najmniej symetrycznym i mezokurtycznym) oraz zmienną grupującą (niezależną) najlepiej, gdzy jest to zmienna dwukategorialna (nominalna) np. DYSLEKSJA. I (gdy zaznaczona jest zmienna grupująca) należy zdefiniować grupy wartości liczbowe dla grupy pierwszej i drugiej u nas jest to 0 (Brak dysleksji) i 1 (Dysleksja). Ryc. 23 b. Podaj wartość odpowiednich statystyk potwierdzających Twoją interpretację uzyskanych wyników. W wyniku przeprowadzonego testu otrzymujemy raport składający się z dwóch tabel tabeli statystyk w grupach oraz tabeli dla testu t. Statystyki dla grup INTELIGENCJA WYSTĘPOWANIE DYSLEKSJI N Średnia Odchylenie standardowe Błąd standardowy średniej NIE WYSTĘPUJE ,30 14,290 1,945 WYSTĘPUJE ,00 10,612 1,418 Wyniki zamieszczone w powyższej tabeli wskazują, że przeciętnie osoba bez dysleksji charakteryzuje się inteligencją M=112,3 punktu z odchyleniem standardowym SD=14,290 punktu oznacza to, że typowy wynik w teście inteligencji w grupie osób bez dysleksji plasuje się w przedziale od 98,01 do 126,59 punktu. Natomiast przeciętna osoba z dysleksją charakteryzuje się wynikiem M=100,00 punktu z odchyleniem standardowym SD=10,512, co znaczy, że typowy wynik pomiaru inteligencji w tej grupie plasuje się w przedziale od 89,388 do 110,612 punktu. Przedstawiony w poniższej tabeli wynik testu Levene a dla jednorodności wariancji w obu grupach wskazuje, że grupy te można uznać za Karol Karasiewicz 18

19 homogeniczne (F(1;108)=3,681; p=0,058), natomiast test t dla prób niezależnych dla porównania średnich wskazał, że różnica wyników w porównywanych grupach jest wysoce istotna statystycznie (t(108)=5,136; p<0,001). Test dla prób niezależnych Test Levene'a jednorodności wariancji Test równości średnich INTELIGENCJA F Istotność t df Istotność (dwustronna) Założono równość wariancji 3,681,058 5, ,000 Nie założono równości wariancji 5,109 97,726,000 Zwróćmy uwagę, że istotność dwustronna przyjmuje wartość,000. W takich wypadkach zawsze piszemy p<0,001, ponieważ podstawowym założeniem statystyki jest to, iż w przyrodzie (a więc w danych naturalnych) zawsze istnieje jakieś prawdopodobieństwo różne od 0 i od Zweryfikuj hipotezę, że płeć jest moderatorem związku dysleksji i inteligencji że istnieje interakcja między płcią i dysleksją we wpływie na inteligencję. a. Jakim testem statystycznym należy zweryfikować tę hipotezę? Hipoteza o tym, że jakaś dyskretna tzn. skokowa (tutaj nawet dwukategorialna) zmienna jest moderatorem związku między dwiema zmiennymi jedną skokową (tutaj nawet dwukategorialną) i drugą ciągłą może być zweryfikowana za pomocą analizy wariancji dwuczynnikowej ANOVA dostępnej w ANALIZA OGÓLNY MODEL LINIOWY JEDNEJ ZMIENNEJ. Ryc. 24 W analizie tej zmienną zależną KONIECZNIE musi być zmienna ciągła o rozkładzie normalnym (u nas będzie to inteligencja tzn. IQ). Moderator (ewentualny) oraz zmienna niezależna powinny być zmiennymi nominalnymi (skokowymi) i stanowić powinny czynniki stałe 3. Zatem w oknie kreatora analizy OML jednej zmiennej (UNIANOVA) przenosimy IQ do pola zmiennej zależnej, a PŁEĆ i DYSLEKSJĘ do pola Czynniki stałe. Czynnikiem stałym może być taka zmienna nominalna (dyskretna), której poziomy analizowane w badaniu zawsze będą stałe np. płeć zawsze (z naprawdę wyjątkowymi wyjątkami) będzie 3 Modele z moderatorami ciągłymi lub czynnikami losowymi wychodzą nieco poza (bardzo podstawowy) poziom niniejszego opracowania Karol Karasiewicz 19

20 miała dwa poziomy Kobieta i Mężczyzna, jak również dysleksja występuje, nie występuje. Można zatem uznać obie zmienne za dyskretne (skokowe) i stałe. Ryc. 25 Dla pełnego zdefiniowania analizy potrzebujemy jeszcze co najmniej pewnych podstawowych statystyk i wykresów. Statystyk możemy zażądać poprzez przyciśnięcie polecenia OPCJE. Warto tam zaznaczyć statystyki opisowe, oceny wielkości efektu (Etakwadrat) oraz (czasami) test jednorodności wariancji. Ryc. 26 Natomiast w kreatorze wykresów warto przygotować wykres dla zobrazowania interakcji. Aby to zrobić przenosimy zmienną niezależną (tutaj DYSLEKSJA) do osi poziomej X, natomiast potencjalny moderator (tutaj PŁEĆ) do oddzielnych linii. I koniecznie należy kliknąć przycisk DODAJ tak, aby SPSS zapisał sobie w pamięci żądanie wykonania tego wykresu. Karol Karasiewicz 20

21 Ryc. 27 SPSS nie pozwala na wyklikanie myszą żądania analizy efektów prostych, tzn. różnic parami lub specjalnych kontrastów dla szczególnych hipotez. Ryc. 28 Stąd też zamiast akceptować w pełni przygotowaną przez wyklikanie w SPSS ANOVA lepiej użyć przycisku WKLEJ generującego polecenie SYNTAX, które daje o wiele większe możliwości i pozwala w pełni przygotować analizę. Polecenie to będzie wyglądało mniej więcej następująco: *******************************************************************************************************. UNIANOVA IQ BY PŁEĆ DYSLEKSJA /METHOD = SSTYPE(3) /INTERCEPT = INCLUDE /PLOT = PROFILE( DYSLEKSJA*PŁEĆ ) /PRINT = DESCRIPTIVE ETASQ HOMOGENEITY /CRITERIA = ALPHA(.05) /DESIGN = PŁEĆ DYSLEKSJA PŁEĆ*DYSLEKSJA. *******************************************************************************************************. W poleceniu tym chcąc zażądać analizy efektów prostych powinniśmy dodać dwie Prost linie opcji przed linią /DESIGN Powinny one wyglądać następująco: /EMMEANS = TABLES(DYSLEKSJA*PŁEĆ) COMPARE(DYSLEKSJA) /EMMEANS = TABLES(DYSLEKSJA*PŁEĆ) COMPARE(PŁEĆ) Karol Karasiewicz 21

22 Gdzie /EMMEANS jest słowem kluczowym wskazującym SPSSowi żądanie porównań parami. TABLES(DYSLEKSJA*PŁEĆ) pokazuje, jaką interakcję życzymy sobie zanalizować, a COMPARE pokazuje, jakie efekty proste chcemy w tej interakcji oszacować. W naszym przykładzie zażądaliśmy oszacowania interakcji DYSLEKSJA*PŁEĆ, a w jej ramach zażądaliśmy oceny istotności efektów prostych DYSLEKSJI (w pierwszej linii) i PŁCI (w drugiej). Dla modeli większych niż 2x2 do tych porównań zalecana jest ponadto poprawka Sheffe lub Bonferroniego poprzez dopisanie do każdej linii polecenia ADJ (BON) poprawka Bonferroniego lub ADJ (SHEFFE) dla poprawki Sheffego. A więc cały skrypt polecenia po dokonaniu przez nas poprawki będzie wyglądać mniej więcej w następujący sposób: *******************************************************************************************************. UNIANOVA IQ BY PŁEĆ DYSLEKSJA /METHOD = SSTYPE(3) /INTERCEPT = INCLUDE /PLOT = PROFILE( DYSLEKSJA*PŁEĆ ) /PRINT = DESCRIPTIVE ETASQ HOMOGENEITY /CRITERIA = ALPHA(.05) /EMMEANS = TABLES(DYSLEKSJA*PŁEĆ) COMPARE(DYSLEKSJA) /EMMEANS = TABLES(DYSLEKSJA*PŁEĆ) COMPARE(PŁEĆ) /DESIGN = PŁEĆ DYSLEKSJA PŁEĆ*DYSLEKSJA. *******************************************************************************************************. I teraz dopiero można uruchomić przygotowaną analizę i otrzymać pełen raport dotyczący postawionej hipotezy. b. Opisz wyniki i przedstaw odpowiednie statystyki oraz zinterpretuj wyniki przedstawione przez Ciebie na wykresie. Statystyki opisowe PŁEĆ M K Ogółem Zmienna zależna: INTELIGENCJA WYSTĘPOWANIE Odchylenie DYSLEKSJI Średnia standardowe N NIE WYSTĘPUJE 112,05 15, WYSTĘPUJE 100,11 9, Ogółem 104,64 13, NIE WYSTĘPUJE 112,47 13, WYSTĘPUJE 99,80 12, Ogółem 107,60 14, NIE WYSTĘPUJE 112,30 14, WYSTĘPUJE 100,00 10, Ogółem 106,04 13, Powyższa tabela pozwala na ocenę poziomu inteligencji kobiet i mężczyzn w zależności od występowania (lub nie) dysleksji. Będzie przydatna później, przy analizowaniu uzyskanych wyników w kontekście istotności efektów głównych, interakcji i efektów prostych. Kolejna tabela wskazuje na ważne założenie analizy wariancji, tzn. na jednorodność wariancji w obrębie porównywanych grup. Test Levene a okazał się statystycznie nieistotny (F(3;106)=1,926; p>0,10), co pozwala przyjąć założenie, że wariancje w porównywanych Karol Karasiewicz 22

23 grupach są jednorodne i oszacowania analizy wariancji nie są obciążone poprzez heterogeniczność wariancji. Test Levene'a równości wariancji błędu(a) Zmienna zależna: INTELIGENCJA F df1 df2 Istotność 1, ,130 Testuje hipotezę zerową zakładającą, że wariancja błędu zmiennej zależnej jest równa we wszystkich grupach. a Plan: Stała+PŁEĆ+DYSLEKSJA+PŁEĆ * DYSLEKSJA Testy efektów międzyobiektowych stanowią podstawowy wynik analizy wariancji UNIANOVA. Pozwalają one na ocenę istotności efektów głównych obu czynników (tutaj PŁEĆ i DYSLEKSJA) oraz ich interakcji (DYSLEKSJA*PŁEĆ). Zmienna zależna: INTELIGENCJA Testy efektów międzyobiektowych Źródło zmienności Typ III sumy kwadratów df Średni kwadrat F Istotność Czastkowe Eta kwadrat Model skorygowany 4160,176(a) ,725 8,640,000,196 Stała , , ,929,000,986 PŁEĆ,081 1,081,001,982,000 DYSLEKSJA 3918, ,327 24,412,000,187 PŁEĆ * DYSLEKSJA 3, ,491,022,883,000 Błąd 17013, ,506 Ogółem , Ogółem skorygowane 21173, a R kwadrat =,196 (Skorygowane R kwadrat =,174) Wyniki przeprowadzonej analizy wariancji wskazują, żę płeć nie różnicuje poziomu inteligencji uczniów (F(1;106)=0,001; p=0,982), natomiast potwierdza się silny i znaczący efekt zróżnicowania inteligencji w zależności od występowania dysleksji (F(1;106)=24,412; p<0,001; Eta 2 =0,187), który pozwala wyjaśnić około 18,7% ogółu wariancji wyników w zakresie pomiaru inteligencji testem APIS-Z 4. Jednocześnie wyniki tej analizy nie pozwalają na przyjęcie hipotezy, że istnieje istotna interakcja między płcią a występowaniem dysleksji w przewidywaniu poziomu inteligencji (F(1;106)=0,022; p=0,883). Można zatem powiedzieć, że przeprowadzona analiza pozwala na odrzucenie hipotezy, że płeć jest moderatorem związku dysleksji z inteligencją. Podsumowując wyniki przeprowadzonej analizy można powiedzieć, że wskazują one, że występowanie dysleksji jest istotnym czynnikiem kształtującym wynik testu APIS świadczącego o inteligencji, gdzie osoby z dysleksją średnio otrzymują (M=100,0; SD=10,612) wynik o 12 punktów niższy od przeciętnego wyniku osób bez dysleksji (M=112,3; SD=14,29), co stanowi około 96% odchylenia standardowego. Teoretycznie na tym wniosku można by poprzestać. Przedstawiony poniżej wykres bardzo ładnie obrazuje przedstawione powyżej zależności. Dla celów dydaktycznych jednak warto wskazać, jak można analizować efekty proste bo to zwykle przedstawia pewne trudności. 4 Informacja o teście jest o tyle istotna, że bateria testowa APIS jest narzędziem do pomiaru inteligencji opartą na metodzie papier-ołówek. Jest związana z presją czasową i wymaga szybkiego, sprawnego czytania. A więc można powiedzieć, że jest to narzędzie przynajmniej teoretycznie dyskryminujące osoby z dysleksją. Karol Karasiewicz 23

24 Efekty proste to różnica między dwoma średnimi. W modelu 2x2 możemy wyróżnić cztery (2 razy 2) interesujące efekty proste. Są one zaznaczone na poniższym schemacie. Ryc. 29 Karol Karasiewicz 24

25 Efekty proste DYSLEKSJI w grupie kobiet (oznaczone cyfrą 2, jako różnica między średnimi kobiet) i mężczyzn (oznaczona cyfrą 1, jako różnica między średnimi mężczyzn) są testowane w paragrafie 1. WYSTĘPOWANIE DYSLEKSJI * PŁEĆ. Znajduje się tam tabela oznaczona Testy jednej zmiennej. Wskazuje ona, że efekt prosty DYSLEKSJI w grupie MĘŻCZYZN (oznaczony cyfrą 1 patrz: Ryc. 29) jest statystycznie wysoce istotny F(1;106)=12,117; p=0,001; Eta 2 =0,103), jak również wysoce istotny statystycznie jest efekt prosty dysleksji w grupie kobiet (oznaczony cyfrą 2 patrz: Ryc. 29), gdzie (F(1;106)=12,307; p=0,001; Eta 2 =0,104). Oznacza to, że w grupie mężczyzn i kobiet istnieje istotna statystycznie różnica między poziomem inteligencji osób z dysleksją i bez dysleksji. PŁEĆ M K Testy jednej zmiennej Zmienna zależna: INTELIGENCJA Suma kwadratów df Średni kwadrat F Istotność Czastkowe Eta kwadrat Kontrast 1944, ,886 12,117,001,103 Błąd 17013, ,506 Kontrast 1975, ,350 12,307,001,104 Błąd 17013, ,506 Każde F testuje proste efekty WYSTĘPOWANIE DYSLEKSJI w ramach każdej kombinacji poziomów innych przedstawionych efektów. Testy te są oparte na liniowo niezależnych porównaniach parami pomiędzy oszacowanymi średnimi brzegowymi. Natomiast efekty Proste płci zostały oszacowane w paragrafie 2. WYSTĘPOWANIE DYSLEKSJI * PŁEĆ. Analogicznie testuje ona efekty proste płci w grupie osób bez dysleksji oznaczone cyfrą 3 (różnica między średnią kobiet i mężczyzn w grupie bez dysleksji) i oznaczony cyfrą 4 efekt prosty płci w grupie osób z dysleksją (różnica między średnią kobiet i mężczyzn w grupie z dysleksją). W tabeli Testy jednej zmiennej można odnaleźć oszacowania tychże efektów prostych. Testy jednej zmiennej Zmienna zależna: INTELIGENCJA WYSTĘPOWANIE DYSLEKSJI Suma kwadratów df Średni kwadrat F Istotność Czastkowe Eta kwadrat NIE WYSTĘPUJE Kontrast 2, ,336,015,904,000 Błąd 17013, ,506 WYSTĘPUJE Kontrast 1, ,244,008,930,000 Błąd 17013, ,506 Każde F testuje proste efekty PŁEĆ w ramach każdej kombinacji poziomów innych przedstawionych efektów. Testy te są oparte na liniowo niezależnych porównaniach parami pomiędzy oszacowanymi średnimi brzegowymi. Wyniki przeprowadzonej analizy wskazują, że nie występuje istotna statystycznie różnica między kobietami i mężczyznami w grupie osób bez dysleksji (F(1;106)=0,015; p=0,904), ani też wśród osób z dysleksją (F(1;106)=0,008; p=0,930). Można zatem powiedzieć, że wyniki tych analiz pozwalają wskazać, że płeć nie różnicuje poziomu inteligencji mierzonej testem APIS ani wśród osób z dysleksją, ani też wśród osób bez zaburzeń dyslektycznych. Karol Karasiewicz 25

Gimnastyka artystyczna

Gimnastyka artystyczna Gimnastyka artystyczna Zbadano losową próbę N=40 dziewcząt i chłopców z klas o profilu ogólnym i sportowym pod kątem ich ogólnej sprawności fizycznej ocenianej na skali Hirscha (od 0 do 20 pkt.), gdzie

Bardziej szczegółowo

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Zadanie Zbadano satysfakcję z życia w skali 1 do 10 w dwóch grupach rodziców: a) Rodzice dzieci zdrowych oraz b) Rodzice dzieci z niepełnosprawnością

Bardziej szczegółowo

Badanie zależności skala nominalna

Badanie zależności skala nominalna Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność

Bardziej szczegółowo

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe? 2 Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia czy pomiędzy zmiennymi istnieje związek/zależność. Stosujemy go w sytuacji, kiedy zmienna zależna mierzona jest na skali

Bardziej szczegółowo

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Jak sprawdzić normalność rozkładu w teście dla prób zależnych? Jak sprawdzić normalność rozkładu w teście dla prób zależnych? W pliku zalezne_10.sta znajdują się dwie zmienne: czasu biegu przed rozpoczęciem cyklu treningowego (zmienna 1) oraz czasu biegu po zakończeniu

Bardziej szczegółowo

Jednoczynnikowa analiza wariancji

Jednoczynnikowa analiza wariancji Jednoczynnikowa analiza wariancji Zmienna zależna ilościowa, numeryczna Zmienna niezależna grupująca (dzieli próbę na więcej niż dwie grupy), nominalna zmienną wyrażoną tekstem należy w SPSS przerekodować

Bardziej szczegółowo

GRUPY NIEZALEŻNE Chi kwadrat Pearsona GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara Q Cochrana

GRUPY NIEZALEŻNE Chi kwadrat Pearsona GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara Q Cochrana GRUPY NIEZALEŻNE Chi kwadrat Pearsona Testy stosujemy w sytuacji, kiedy zmienna zależna mierzona jest na skali nominalnej Liczba porównywanych grup (czyli liczba kategorii zmiennej niezależnej) nie ma

Bardziej szczegółowo

Dwuczynnikowa ANOVA dla prób niezależnych w schemacie 2x2

Dwuczynnikowa ANOVA dla prób niezależnych w schemacie 2x2 Dwuczynnikowa ANOVA dla prób niezależnych w schemacie 2x2 Poniżej prezentujemy przykładowe pytania z rozwiązaniami dotyczącymi dwuczynnikowej analizy wariancji w schemacie 2x2. Wszystkie rozwiązania są

Bardziej szczegółowo

Zadania ze statystyki, cz.6

Zadania ze statystyki, cz.6 Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z

Bardziej szczegółowo

Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby

Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby 1. Wstęp teoretyczny Prezentowane badanie dotyczy analizy wyników uzyskanych podczas badania grupy rodziców pod kątem wpływu ich przekonań

Bardziej szczegółowo

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( ) Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

Sposoby prezentacji problemów w statystyce

Sposoby prezentacji problemów w statystyce S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi) Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi) Czy miejsce zamieszkania różnicuje uprawianie sportu? Mieszkańcy

Bardziej szczegółowo

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1. Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny

Bardziej szczegółowo

Analizy wariancji ANOVA (analysis of variance)

Analizy wariancji ANOVA (analysis of variance) ANOVA Analizy wariancji ANOVA (analysis of variance) jest to metoda równoczesnego badania istotności różnic między wieloma średnimi z prób pochodzących z wielu populacji (grup). Model jednoczynnikowy analiza

Bardziej szczegółowo

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW Założenia do analizy wariancji dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW anna_rajfura@sggw.pl Zagadnienia 1. Normalność rozkładu cechy Testy: chi-kwadrat zgodności, Shapiro-Wilka, Kołmogorowa-Smirnowa

Bardziej szczegółowo

Metodologia badań psychologicznych. Wykład 12. Korelacje

Metodologia badań psychologicznych. Wykład 12. Korelacje Metodologia badań psychologicznych Lucyna Golińska SPOŁECZNA AKADEMIA NAUK Wykład 12. Korelacje Korelacja Korelacja występuje wtedy gdy dwie różne miary dotyczące tych samych osób, zdarzeń lub obiektów

Bardziej szczegółowo

Analiza wariancji jednej zmiennej (UNIANOVA)

Analiza wariancji jednej zmiennej (UNIANOVA) UNIANOVA ocena BY pĺ eä szkoĺ a doĺ wiadczenie /METHOD=SSTYPE(3) /INTERCEPT=INCLUDE /POSTHOC=szkoĹ a(snk) /PLOT=PROFILE(szkoĹ a*doĺ wiadczenie*pĺ eä doĺ wiadczenie*szkoĺ a*pĺ eä szkoĺ a*pĺ eä *doĺ wiadczenie

Bardziej szczegółowo

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...

Bardziej szczegółowo

Analiza korespondencji

Analiza korespondencji Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy

Bardziej szczegółowo

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu

Bardziej szczegółowo

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Przykład 2 Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Sondaż sieciowy analiza wyników badania sondażowego dotyczącego motywacji w drodze do sukcesu Cel badania: uzyskanie

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Wykład 5: Statystyki opisowe (część 2)

Wykład 5: Statystyki opisowe (część 2) Wykład 5: Statystyki opisowe (część 2) Wprowadzenie Na poprzednim wykładzie wprowadzone zostały statystyki opisowe nazywane miarami położenia (średnia, mediana, kwartyle, minimum i maksimum, modalna oraz

Bardziej szczegółowo

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss

Bardziej szczegółowo

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, 诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów

Bardziej szczegółowo

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej, Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (punktowa, przedziałowa) Weryfikacja

Bardziej szczegółowo

Wykład 9 Wnioskowanie o średnich

Wykład 9 Wnioskowanie o średnich Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i

Bardziej szczegółowo

Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś.

Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś. Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś. Województwo Urodzenia według płci noworodka i województwa. ; Rok 2008; POLSKA Ogółem Miasta Wieś Pozamałżeńskie- Miasta Pozamałżeńskie-

Bardziej szczegółowo

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem

Bardziej szczegółowo

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41 Statystyka Wykład 4 Magdalena Alama-Bućko 13 marca 2017 Magdalena Alama-Bućko Statystyka 13 marca 2017 1 / 41 Na poprzednim wykładzie omówiliśmy następujace miary rozproszenia: Wariancja - to średnia arytmetyczna

Bardziej szczegółowo

laboratoria 24 zaliczenie z oceną

laboratoria 24 zaliczenie z oceną Wydział: Psychologia Nazwa kierunku kształcenia: Psychologia Rodzaj przedmiotu: podstawowy Opiekun: dr Andrzej Tarłowski Poziom studiów (I lub II stopnia): Jednolite magisterskie Tryb studiów: Niestacjonarne

Bardziej szczegółowo

Efekt główny Efekt interakcyjny efekt jednego czynnika zależy od poziomu drugiego czynnika Efekt prosty

Efekt główny Efekt interakcyjny efekt jednego czynnika zależy od poziomu drugiego czynnika Efekt prosty ANOVA DWUCZYNNIKOWA testuje różnice między średnimi w grupach wyznaczonych przez dwa czynniki i ich kombinacje. Analiza pozwala ustalić wpływ dwóch czynników na wartości zmiennej zależnej (ilościowej!)

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie

Bardziej szczegółowo

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na

Bardziej szczegółowo

WNIOSKOWANIE STATYSTYCZNE

WNIOSKOWANIE STATYSTYCZNE STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących

Bardziej szczegółowo

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną. laboratoria 30 zaliczenie z oceną

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną. laboratoria 30 zaliczenie z oceną Wydział: Psychologia Nazwa kierunku kształcenia: Psychologia Rodzaj przedmiotu: podstawowy Opiekun: dr Andrzej Tarłowski Poziom studiów (I lub II stopnia): Jednolite magisterskie Tryb studiów: Stacjonarne

Bardziej szczegółowo

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie. STATISTICA INSTRUKCJA - 1 I. Wprowadzanie danych Podstawowe / Nowy / Arkusz Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą

Bardziej szczegółowo

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe

Bardziej szczegółowo

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane

Bardziej szczegółowo

Zadania ze statystyki cz.8. Zadanie 1.

Zadania ze statystyki cz.8. Zadanie 1. Zadania ze statystyki cz.8. Zadanie 1. Wykonano pewien eksperyment skuteczności działania pewnej reklamy na zmianę postawy. Wylosowano 10 osobową próbę studentów, których poproszono o ocenę pewnego produktu,

Bardziej szczegółowo

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33 Statystyka Wykład 4 Magdalena Alama-Bućko 19 marca 2018 Magdalena Alama-Bućko Statystyka 19 marca 2018 1 / 33 Analiza struktury zbiorowości miary położenia ( miary średnie) miary zmienności (rozproszenia,

Bardziej szczegółowo

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Oszacowanie i rozkład t

Oszacowanie i rozkład t Oszacowanie i rozkład t Marcin Zajenkowski Marcin Zajenkowski () Oszacowanie i rozkład t 1 / 31 Oszacowanie 1 Na podstawie danych z próby szacuje się wiele wartości w populacji, np.: jakie jest poparcie

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

Analiza wariancji - ANOVA

Analiza wariancji - ANOVA Analiza wariancji - ANOVA Analiza wariancji jest metodą pozwalającą na podział zmienności zaobserwowanej wśród wyników eksperymentalnych na oddzielne części. Każdą z tych części możemy przypisać oddzielnemu

Bardziej szczegółowo

Jedzenie w kawiarni KLASYCZNE PRZEBOJE

Jedzenie w kawiarni KLASYCZNE PRZEBOJE Jedzenie w kawiarni W pewnej kawiarni puszczano trojakiego rodzaju podkład muzyczny do posiłku ballady rockowe, klasyczne przeboje lub muzykę taneczną. Badano czas przeznaczony przez losowo wybranych gości

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta

Bardziej szczegółowo

Analiza Statystyczna

Analiza Statystyczna Lekcja 5. Strona 1 z 12 Analiza Statystyczna Do analizy statystycznej wykorzystać można wbudowany w MS Excel pakiet Analysis Toolpak. Jest on instalowany w programie Excel jako pakiet dodatkowy. Oznacza

Bardziej szczegółowo

MODELE LINIOWE. Dr Wioleta Drobik

MODELE LINIOWE. Dr Wioleta Drobik MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą

Bardziej szczegółowo

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej) Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej) 1 Podział ze względu na zakres danych użytych do wyznaczenia miary Miary opisujące

Bardziej szczegółowo

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych 1 Laboratorium III: Testy statystyczne Spis treści Laboratorium III: Testy statystyczne... 1 Wiadomości ogólne... 2 1. Krótkie przypomnienie wiadomości na temat testów statystycznych... 2 1.1. Weryfikacja

Bardziej szczegółowo

Zadanie 1. Analiza Analiza rozkładu

Zadanie 1. Analiza Analiza rozkładu Zadanie 1 data lab.zad 1; input czas; datalines; 85 3060 631 819 805 835 955 595 690 73 815 914 ; run; Analiza Analiza rozkładu Ponieważ jesteśmy zainteresowani wyznaczeniem przedziału ufności oraz weryfikacja

Bardziej szczegółowo

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: Zmienne losowe skokowe (dyskretne) przyjmujące co najwyżej przeliczalnie wiele wartości Zmienne losowe ciągłe

Bardziej szczegółowo

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii SPIS TREŚCI Przedmowa... 11 Wykaz symboli... 15 Litery alfabetu greckiego wykorzystywane w podręczniku... 15 Symbole wykorzystywane w zagadnieniach teorii mnogości (rachunku zbiorów)... 16 Symbole stosowane

Bardziej szczegółowo

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Zmienne muszą być zmiennymi ilościowym (liczymy i porównujemy średnie!) Są to testy parametryczne Nazwa

Bardziej szczegółowo

Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica

Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica 1. Zarządzanie danymi. Pierwszą czynnością w pracy z pakietem Statistica jest zazwyczaj wprowadzenie danych do arkusza. Oprócz możliwości

Bardziej szczegółowo

Statystyki opisowe i szeregi rozdzielcze

Statystyki opisowe i szeregi rozdzielcze Statystyki opisowe i szeregi rozdzielcze - ćwiczenia ĆWICZENIA Piotr Ciskowski ramka-wąsy przykład 1. krwinki czerwone Stanisz W eksperymencie farmakologicznym analizowano oddziaływanie pewnego preparatu

Bardziej szczegółowo

Tworzenie tabeli przestawnej krok po kroku

Tworzenie tabeli przestawnej krok po kroku Tabele przestawne Arkusz kalkulacyjny jest narzędziem przeznaczonym do zapisu, przechowywania i analizy danych. Jeśli w arkuszu zamierzamy gromadzić dane o osobach i cechach je opisujących (np. skąd pochodzą,

Bardziej szczegółowo

Niestandardowa tabela częstości

Niestandardowa tabela częstości raportowanie Niestandardowa tabela częstości Przemysław Budzewski Predictive Solutions Do czego dążymy W Generalnym Sondażu Społecznym USA w 1991 roku badaniu poddano respondentów należących do szeregu

Bardziej szczegółowo

ANALIZA WARIANCJI - KLASYFIKACJA WIELOCZYNNIKOWA

ANALIZA WARIANCJI - KLASYFIKACJA WIELOCZYNNIKOWA ANALIZA WARIANCJI - KLASYFIKACJA WIELOCZYNNIKOWA Na poprzednich zajęciach omawialiśmy testy dla weryfikacji hipotez, że kilka średnich dla analizowanej zmiennej grupującej mają jednakowe wartości średnie.

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;

Bardziej szczegółowo

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35 Statystyka Wykład 7 Magdalena Alama-Bućko 16 kwietnia 2017 Magdalena Alama-Bućko Statystyka 16 kwietnia 2017 1 / 35 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia

Bardziej szczegółowo

Estymacja punktowa i przedziałowa

Estymacja punktowa i przedziałowa Temat: Estymacja punktowa i przedziałowa Kody znaków: żółte wyróżnienie nowe pojęcie czerwony uwaga kursywa komentarz 1 Zagadnienia 1. Statystyczny opis próby. Idea estymacji punktowej pojęcie estymatora

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe Typy zmiennych Graficzne reprezentacje danych Statystyki opisowe Jakościowe charakterystyka przyjmuje kilka możliwych wartości, które definiują klasy Porządkowe: odpowiedzi na pytania w ankiecie ; nigdy,

Bardziej szczegółowo

% sumy wiersza nadrzędnego. % sumy kolumny nadrzędnej. % sumy elementu nadrzędnego. Porządkuj od najmniejszych do największych.

% sumy wiersza nadrzędnego. % sumy kolumny nadrzędnej. % sumy elementu nadrzędnego. Porządkuj od najmniejszych do największych. bieżąca w wyświetla wartości w kolejnych wierszach lub kolejnych kolumnach jako wartości skumulowane (w drugim wierszu wyświetla sumę wartości odpowiadających wierszom od do ; w wierszy od wiersza do,

Bardziej szczegółowo

7.4 Automatyczne stawianie prognoz

7.4 Automatyczne stawianie prognoz szeregów czasowych za pomocą pakietu SPSS Następnie korzystamy z menu DANE WYBIERZ OBSERWACJE i wybieramy opcję WSZYSTKIE OBSERWACJE (wówczas wszystkie obserwacje są aktywne). Wreszcie wybieramy z menu

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 Metody sprawdzania założeń w analizie wariancji: -Sprawdzanie równości (jednorodności) wariancji testy: - Cochrana - Hartleya - Bartletta -Sprawdzanie zgodności

Bardziej szczegółowo

Jak przekształcać zmienne jakościowe?

Jak przekształcać zmienne jakościowe? Data Preparation Jak przekształcać zmienne jakościowe? Marta Płonka Predictive Solutions W ostatnim artykule zobaczyliśmy, jak sprawdzić, czy między wybranymi przez nas predyktorami a zmienną przewidywaną

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Szkice rozwiązań z R:

Szkice rozwiązań z R: Szkice rozwiązań z R: Zadanie 1. Założono doświadczenie farmakologiczne. Obserwowano przyrost wagi ciała (przyrost [gram]) przy zadanych dawkach trzech preparatów (dawka.a, dawka.b, dawka.c). Obiektami

Bardziej szczegółowo

Zmienne zależne i niezależne

Zmienne zależne i niezależne Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }

Bardziej szczegółowo

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice Przedmowa do wydania polskiego Przedmowa CZĘŚĆ I. PODSTAWY STATYSTYKI Rozdział 1 Podstawowe pojęcia statystyki

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA Wykład 4: Wnioskowanie statystyczne Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA Idea wnioskowania statystycznego Celem analizy statystycznej nie jest zwykle tylko

Bardziej szczegółowo

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)

Bardziej szczegółowo

Test U Manna-Whitneya : Test H Kruskala-Wallisa Test Wilcoxona

Test U Manna-Whitneya : Test H Kruskala-Wallisa Test Wilcoxona Nieparametryczne odpowiedniki testów T-Studenta stosujemy gdy zmienne mierzone są na skalach porządkowych (nie można liczyć średniej) lub kiedy mierzone są na skalach ilościowych, a nie są spełnione wymagania

Bardziej szczegółowo

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Prezentacja materiału statystycznego Szeroko rozumiane modelowanie i prognozowanie jest zwykle kluczowym celem analizy danych. Aby zbudować model wyjaśniający relacje pomiędzy różnymi aspektami rozważanego

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

Analiza wariancji. dr Janusz Górczyński

Analiza wariancji. dr Janusz Górczyński Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik

Bardziej szczegółowo

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

dr hab. Dariusz Piwczyński, prof. nadzw. UTP dr hab. Dariusz Piwczyński, prof. nadzw. UTP Cechy jakościowe są to cechy, których jednoznaczne i oczywiste scharakteryzowanie za pomocą liczb jest niemożliwe lub bardzo utrudnione. nominalna porządek

Bardziej szczegółowo

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie

Bardziej szczegółowo

Wprowadzenie do analizy dyskryminacyjnej

Wprowadzenie do analizy dyskryminacyjnej Wprowadzenie do analizy dyskryminacyjnej Analiza dyskryminacyjna to zespół metod statystycznych używanych w celu znalezienia funkcji dyskryminacyjnej, która możliwie najlepiej charakteryzuje bądź rozdziela

Bardziej szczegółowo

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności: Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 55 jacek.mercik@pwr.wroc.pl (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW Elementy wykładu.

Bardziej szczegółowo