testowanie? 5.1. Metody szacowania rzetelności pomiaru testem 1

Wielkość: px
Rozpocząć pokaz od strony:

Download "testowanie? 5.1. Metody szacowania rzetelności pomiaru testem 1"

Transkrypt

1 5. Jakich informacji o teście dostarcza testowanie? Konrad Jankowski, Marcin Zajenkowski Wydział Psychologii Uniwersytet Warszawski Metody szacowania rzetelności pomiaru testem 1 Z zaprezentowanej w poprzednim rozdziale definicji rzetelności wynika, że jest to stosunek wariancji wyników prawdziwych do wariancji wyników otrzymanych. Jednakże wynik prawdziwy nie jest wielkością bezpośrednio obserwowalną, więc nie można również obliczyć bezpośrednio wariancji wyników prawdziwych. Oznacza to, że ze wzoru definicyjnego nie da się obliczyć rzetelności pomiaru konkretnym testem. Aby przezwyciężyć tę trudność, opracowano szereg metod, które umożliwiają oszacowanie rzetelności, czyli udziału wariancji wyników prawdziwych w wariancji wyników otrzymanych. Operacyjnie definiuje się rzetelność jako powtarzalność wyników. Mówiąc inaczej, im wyższa rzetelność pomiaru testem, tym wyniki dwukrotnego badania testem są bardziej zbliżone do siebie, co w praktyce będzie oznaczało wysoką korelację między nimi. Należy zauważyć, że oba pomiary mogą być zależne od siebie, gdyż osoba badana podczas drugiego badania testem będzie już go znała, co może wpływać na rezultaty uzyskane w drugim badaniu, dzięki np. nabyciu wprawy lub zapamiętaniu treści pozycji testowych. Aby drugi pomiar był w pełni niezależnym pomiarem badanej cechy, należałoby zastosować jakąś inną miarę tej cechy, tak aby uniknąć efektu zapamiętywania. Miara ta jednak nie może mieć całkowicie odrębnej formy lub odwoływać się do innych źródeł informacji, chodzi przecież o sprawdzenie powtarzalności wyników uzyskanych w konkretny sposób. Najlepiej byłoby mieć dwa testy, mierzące ten sam konstrukt teoretyczny, w których treść pozycji testowych jest odmienna. Testy takie nazywane są testami równoległymi. Oprócz pomiaru jednakowej cechy, testy takie powinny spełniać szereg formalnych warunków, aby uzyskany współczynnik korelacji między pomiarami można było interpretować jako rzetelność testu. Dalej opisane są praktyczne metody szacowania rzetelności. W niniejszym rozdziale zostaną omówione takie metody, jak: dwukrotne powtarzanie pomiaru (wiarygodność testu i stabilność bezwzględna), metoda wersji alternatywnych, metoda połówkowa, zgodność wewnętrzna i metoda sędziów kompetentnych. Założenie o równoległości testów dotyczy każdej z nich. W wypadku badania wiarygodności testu i stabilności bezwzględnej istotne jest, aby założenie równoległości było spełnione dla obu pomiarów tym samym testem. Przy wykorzystaniu wersji alternatywncyh istotne jest, by założenie równoległości spełniały 1 Przygotowanie rozdziału zostało sfinansowane ze środków na badania własne Wydziału Psychologii Uniwersytetu Warszawskiego, BW

2 5. Jakich informacji o teście dostarcza testowanie? wersje alternatywne testów. Natomiast w badaniu rzetelności metodą połówkową jako testy równoległe traktowane są połowy testu, a w zgodności wewnętrznej poszczególne jego pozycje. Testy równoległe to takie, które spełniają następujące założenia: X A = X B średnia wyników w teście A równa się średniej wyników w teście B; S A =S B odchylenie standardowe w teście A jest takie, jak w teście B; r iaja =r ibjb interkorelacje pozycji w teście A są takie, jak w teście B; r AZ =r BZ korelacja wyników testu A z jakąś zmienną Z jest taka, jak korelacja wyników testu B z tą samą zmienną Z. Należy zauważyć, że na współczynnik rzetelności, uzyskany przez zastosowanie każdej z metod, wpływają różne czynniki. Podstawowym czynnikiem, interesującym badacza jest rzetelność pomiaru testem. Ponadto występują dodatkowe czynniki, wpływające na wielkość współczynnika rzetelności, które są związane ze specyfiką konkretnej procedury badania rzetelności. Stanowią one dodatkowe źródło błędu pomiaru, zniekształcając tym samym wielkość współczynników rzetelności. Ważne jest, aby dobierając metodę badania rzetelności, minimalizować wpływ tych dodatkowych czynników, tak by uzyskany współczynnik rzetelności związany był przede wszystkim z doskonałością samego testu Metoda powtarzanego pomiaru Metoda szacowania rzetelności za pomocą powtarzanego pomiaru polega na dwukrotnym badaniu tych samych osób tym samym testem. Miarą rzetelności jest siła związku pomiędzy wynikami z obu badań. Takie oszacowanie może być przeprowadzone na dwa sposoby, różniące się odstępem czasu między pierwszym i drugim badaniem. Pierwszy z nich nazywany jest estymacją wiarygodności testu. Polega na tym, iż badani wykonują ten sam test dwa razy z rzędu, tzn. po skończeniu pierwszego badania następuje natychmiast drugie. Miarą rzetelności jest tu współczynnik korelacji pomiędzy wynikami obu pomiarów testem grupy osób. Badacze wskazują na szereg możliwych źródeł błędu związanych z tą metodą. Na wyniki pomiaru mogą bowiem wpływać, oprócz niedoskonałości narzędzia, chwilowe oscylacje funkcji poznawczych, stanu organizmu, pamięć i nabyta wprawa w wykonaniu testu, a także zmęczenie (Choynowski, 1971). Metoda ta powinna zatem być stosowana jedynie w przypadku testów, w których powtarzanie badania nie wpływa istotnie na wyniki, np. testów motorycznych czy testów, w których wskaźnikiem jest czas reakcji. Drugi sposób szacowania rzetelności przy pomocy powtarzanego pomiaru tym samym testem polega na tym, iż pomiędzy pierwszym a drugim badaniem tej samej grupy osób wprowadza się jakiś odstęp czasowy, np. tydzień, dwa miesiące 85

3 Konrad Jankowski, Marcin Zajenkowski 86 itp. Metoda ta nazywa się estymacją stabilności bezwzględnej testu lub popularnie test-retest (czasem używa się również nazwy stałość testu). Wielkość współczynnika korelacji (najczęściej r-pearsona) pomiędzy dwoma zbiorami wyników (z pierwszego i drugiego wykonania testu) jest tu miarą rzetelności. Stabilność bezwzględna mówi o tym, na ile wyniki testu są niezależne od losowych czynników związanych z osobą badaną lub sytuacją badania, i na ile są stałe w czasie. Kwestia interpretacji współczynnika stabilności bezwzględnej jako stałości wyników w czasie zostanie bardziej szczegółowo omówiona w dalszej części rozdziału. Psychometrzy wskazują na problemy związane z tą techniką (np. Brzeziński, 1996). Wiążą się one z faktem, iż osoby badane mają do czynienia dwukrotnie z tym samym testem. Prezentowany podczas drugiej sesji materiał nie jest dla nich nowy, tak jak przy pierwszym badaniu. Na wyniki drugiego pomiaru mogą zatem wpływać takie czynniki, jak pamięć czy uczenie się. Może to być szczególnie widoczne w testach inteligencji, np. takich, w których sprawdza się czyjąś wiedzę ogólną (np. w podteście Wiadomości z WAIS-R) lub znajomość synonimów słów (w podteście Synonimy z APIS-Z). Należy zdawać sobie sprawę, iż badając kogoś dwukrotnie tym samym testem, nie możemy wykluczyć, że w przerwie między pomiarami ktoś po prostu posiądzie nową wiedzę i np. dowie się, jaki jest synonim słowa prezentowanego we wcześniejszym badaniu. Ważne jest zatem, aby badana właściwość nie uległa zmianie podczas przerwy między pierwszym a drugim badaniem testem. W pewnych przypadkach zmiana właściwości jest na tyle wyraźna, że stosowanie metody test-retest staje się nieuzasadnione. Będzie to szczególnie zauważalne u dzieci, które podlegają dynamicznemu rozwojowi. Dobrym przykładem jest tu test DMI (Diagnoza Możliwości Intelektualnych) opracowany przez Matczak (001). Zdaniem autorki test ma mierzyć zdolność do operacyjnego myślenia, zgodnie z koncepcją Piageta. Owa zdolność kształtuje się w stadium operacji konkretnych (czyli w wieku od 6 7 lat do 11 1 lat). Badając zmiany rozwojowe, Matczak porównywała poprawność wykonania DMI M w różnych grupach wieku dzieci (od 6 do 10 lat). Okazało się, że poprawność wykonania istotnie wzrasta wraz z wiekiem. Pomiar stabilności bezwzględnej byłby w tym przypadku wysoce ryzykowny, gdyż zmiany w wykonaniu zadań mogłyby być widoczne nawet w krótkim okresie. Oznaczałoby to, że nie zostało spełnione założenie o równoległości testów, ponieważ średnia w drugim pomiarze byłaby wyższa niż w pierwszym. W związku z tym rzetelność szacowano inną metodą zgodności wewnętrznej (patrz punkt ). Podstawowym problemem staje się długość przerwy pomiędzy pomiarami. Niestety nie ustalono optymalnego odstępu czasowego. W związku z tym proponuje się, aby przerwa pomiędzy badaniami była na tyle długa, aby badani zdążyli zapomnieć prezentowany wcześniej materiał. Jednakże zbyt długa przerwa może spowodować, iż cecha mierzona przez test zmieni się u badanego.

4 5. Jakich informacji o teście dostarcza testowanie? Biorąc pod uwagę powyższe zastrzeżenia, badacze proponują, aby przerwa między pomiarami wahała się od kilku tygodni do kilku miesięcy. Odstęp zależy zazwyczaj od specyfiki przedmiotu pomiaru. Badając styl (np. poznawczy) czy postawę, możemy oczekiwać szybszych zmian (zalecana przerwa krótsza) niż w przypadku np. cech temperamentu (zalecana przerwa dłuższa). W polskiej adaptacji Kwestionariusza Radzenia Sobie w Sytuacjach Stresowych (ang. Coping Inventory of Stressful Situations, CISS) badano stabilność bezwzględną stylów radzenia sobie ze stresem w odstępie 3 tygodni (Strelau, Jaworowska, Wrześniewski i Szczepaniak, 005). Korelacje dla poszczególnych skal były dość wysokie i wahały się od 0,73 do 0,80. Strelau i Zawadzki (1997) w badaniach nad FCZ-KT (Formalna Charakterystyka Zachowania Kwestionariusz Temperamentu), narzędziem do pomiaru cech temperamentu postulowanych przez regulacyjną teorię temperamentu, zdecydowali się oszacować stabilność bezwzględną krótkoterminową (dwutygodniowa przerwa pomiędzy badaniami) oraz długoterminową (przerwa sześciomiesięczna). Współczynniki korelacji dla stałości krótkoterminowej wahały się od 0,68 do 0,93, a dla długoterminowej od 0,55 do 0,90 (w zależności od wieku i płci badanej grupy). Warto zwrócić uwagę, że na wyniki badania metodą test-retest, oprócz pamięci i uczenia się, mogą wpływać również czynniki związane z konkretną sytuacją, w której dokonywany jest pomiar (np. pora dnia, nastawienie badacza itp.) oraz stan osoby badanej (aktualny nastrój, stan fizyczny itp.). Wybierając stabilność bezwzględną do szacowania rzetelności pomiaru testem, należy o tym pamiętać. Ma to szczególne znaczenie w przypadku narzędzi mierzących stan, a nie cechę. Przykładem może być Przymiotnikowa Skala Nastroju UMACL (ang. UWIST Mood Adjective Check List). Goryńska (005), dokonując polskiej adaptacji, zdecydowała się m.in. oszacować stabilność poszczególnych wymiarów nastroju. Oczekiwała jednak, że korelacje pomiędzy pomiarami w odstępie jednego tygodnia będą istotne, choć niezbyt wysokie. Okazało się, iż współczynniki korelacji wahały się od 0,8 do 0,47, co w tym przypadku było zgodne z teorią, ponieważ nastrój, czyli stan, inaczej niż cecha, podlega względnie szybkim zmianom. Zastosowana metoda stabilności bezwzględnej miała w tym wypadku jednak więcej wspólnego z badaniem trafności teoretycznej (patrz punkt 5...) niż rzetelności Stabilność czasowa a założenie o równości średnich W większości testów psychologicznych przy pomiarze stabilności testu, zarówno bezwzględnej, jak i względnej (por. rozdział 5.1..), bierze się pod uwagę współczynnik korelacji, którego wysokie wartości interpretuje się jako wysoką stałość wyników testu w czasie. Należy podkreślić, że powyższa interpretacja jest prawdziwa jedynie, jeśli spełnione są założenia równoległości pomiarów 87

5 Konrad Jankowski, Marcin Zajenkowski testowych, szczególnie zaś założenie o równości średnich w obu pomiarach. Korelacja sama w sobie mówi jedynie o powiązaniu wyników w obu pomiarach, ich względnym uporządkowaniu, tzn. osoby, które miały wyższe wyniki w pierwszym pomiarze, będą miały też wyższe wyniki w drugim pomiarze. Aby mówić o stałości wyników w czasie, szczególnie istotne jest spełnienie założenia o równości średnich w obu pomiarach dla danej grupy osób. W praktyce założenie to często jest pomijane, co może prowadzić do poważnych błędów interpretacyjnych współczynnika stabilności. Zilustruje to przykład zawarty w tabeli 5.1. Skonstruowano dwa testy, A i B. Zbadano stabilność bezwzględną każdego z nich dla 5 osób. Okazało się, że współczynnik korelacji dla obu pomiarów testem A wyniósł 1, i podobnie korelacja dla obu pomiarów testem B również wyniosła 1. Interpretując jedynie współczynniki korelacji (bez sprawdzenia założeń o równoległości pomiarów), można by stwierdzić, że wyniki w teście A i wyniki w teście B są tak samo, idealnie stałe w czasie. Jednak, biorąc pod uwagę średnie, można zauważyć, że powyższa interpretacja jest słuszna jedynie w wypadku testu A, gdzie w pomiarze pierwszym (A1) i drugim (A) średnie w istocie są równe. Dla pomiarów w teście B, choć korelacja również wynosi 1, średnia w drugim pomiarze (B) jest wyższa o dwie jednostki od tej w pierwszym (B1). Zatem, wyniki osób w teście B nie były stabilne w czasie, lecz nastąpiło systematyczne ich podwyższenie (może się tak zdarzyć np. przy badaniu stabilności testu inteligencji u dzieci). Inną metodą statystyczną możliwą do zastosowania w prezentowanym przykładzie jest współczynnik korelacji wewnątrzklasowej. Pozwala on na uwzględnienie różnicy w wynikach uzyskanych przez osoby badane w obu pomiarach. O ile w wypadku testu A korelacja wewnątrzklasowa będzie wynosiła 1, o tyle w teście B będzie mniejsza od 1 (ze względu na wyższe wyniki uzyskane przez osoby badane w drugim pomiarze). Tabela 5.1. Wyniki dwukrotnego badania testem A (A1,A) i testem B (B1,B) grupy pięciu osób Nr osoby A1 A B1 B Średnia Korelacja r A1A =1 r B1B =1 88 Podsumowując, interpretacja współczynnika stabilności testu, jako niezmienności wyników w czasie, jest uprawniona tylko, jeśli są spełnione założenia o równoległości testów, szczególnie o równości średnich w obu pomiarach.

6 5. Jakich informacji o teście dostarcza testowanie? Wiarygodność testu służy do badania rzetelności pomiaru testem oraz wskazuje na stopień, w jakim wynik testu jest zależny od chwilowych, przypadkowych zmian. Polega na dwukrotnym badaniu tych samych osób tym samym testem. Stabilność bezwzględna służy do badania rzetelności pomiaru testem oraz pokazuje, w jakim stopniu wyniki testu są wrażliwe na przypadkowe zmiany związane z dłuższym upływem czasu. Polega na badaniu dwa razy tych samych osób tym samym testem z przerwą czasową między pomiarami Metoda wersji alternatywnych W poprzednim paragrafie omówiono metody szacowania rzetelności za pomocą dwukrotnego badania tej samej grupy osób tym samym testem. Niniejsza część poświęcona jest metodom szacowania rzetelności za pomocą dwukrotnego badania tej samej grupy osób wersjami alternatywnymi testu. Można zauważyć spore podobieństwo między szacowaniem rzetelności metodą test-retest a metodą wersji alternatywnych. Jedyną różnicą między powyższymi dwoma metodami w zakresie procedury badania jest posłużenie się tym samym testem albo posłużenie się wersjami alternatywnymi testu. Badanie rzetelności metodą wersji alternatywnych ma następujący przebieg. Po pierwsze, należy skonstruować dwie wersje danego testu. Obie wersje powinny różnić się pod względem treści, tzn. składać się z innych treściowo pozycji, ale jednocześnie spełniać założenie równoległości (por. idea testów równoległych paragraf 5.3.). Następnie należy przebadać tę samą grupę osób najpierw jedną, a potem drugą wersją danego testu. Podobnie jak za pomocą metody test-retest, tak poprzez zastosowanie procedury testów alternatywnych można uzyskać dwa współczynniki rzetelności, w zależności od zastosowanej długości przerwy czasowej między pomiarem pierwszą i drugą wersją testu. Współczynnik równoważności międzytestowej pod względem zastosowanej przerwy czasowej między pomiarami jest odpowiednikiem współczynnika wiarygodności w metodzie test-retest. Inaczej mówiąc, współczynnik równoważności międzytestowej uzyskuje się korelując ze sobą wyniki z dwóch testów alternatywnych przeprowadzonych na tej samej grupie osób, przy czym między badaniem oboma testami nie ma przerwy czasowej. Po zakończeniu rozwiązywania pierwszej wersji, osoby badane natychmiast przystępują do rozwiązywania drugiej wersji testu. Uzyskany w ten sposób współczynnik korelacji, najczęściej r-pearsona, traktuje się jako współczynnik równoważności międzytestowej. Współczynnik stabilności względnej to korelacja między wynikami w dwóch testach alternatywnych uzyskanych przez tę samą grupę osób, ale pomiędzy badaniem testem pierwszym i testem drugim wprowadza się przerwę czasową. 89

7 Konrad Jankowski, Marcin Zajenkowski Jego długość powinna być dobrana w zależności od tego, co mierzą testy alternatywne oraz od specyfiki grupy, dla której chcemy oszacować rzetelność testów. Jeśli testy przeznaczone są do pomiaru względnie stałych czasowo właściwości, jak np. cech temperamentu, to przerwa ta może być dłuższa, np. kilka miesięcy. Dłuższych przerw zazwyczaj nie stosuje się ze względu na potencjalne trudności badawcze mogłoby być trudno dotrzeć do tych samych osób np. po upływie kilku lat. Jeśli istnieje podejrzenie, że badana właściwość psychiczna może szybko ulegać zmianom, przerwa między oboma pomiarami powinna być krótsza. Krótkie przerwy czasowe będą również właściwsze w przypadku osób, u których badana właściwość może szybko ulec zmianie ze względów rozwojowych. Grupą taką z pewnością będą dzieci. Łatwo można wyobrazić sobie, że poziom wykonania np. testu inteligencji zmieniłby się znacznie, gdyby przebadano dzieci w piątej klasie, a następnie te same dzieci po roku, w szóstej klasie. Zważywszy, że dodatkowo występują różnice w tempie rozwoju dzieci, to uzyskany współczynnik korelacji między pomiarami testami alternatywnymi byłby zniekształcony. Nie odzwierciedlałby on zatem tego, jak dokładny jest pomiar tymi testami. W praktyce ustalanie długości przerwy czasowej między pomiarami podczas szacowania stabilności względnej wiąże się z takimi samymi problemami, jak w wypadku stabilności bezwzględnej (por. rozdział ) Współczynnik równoważności międzytestowej służy do badania rzetelności pomiaru testem oraz wskazuje na stopień podobieństwa między wersjami alternatywnymi testu. Polega na dwukrotnym badaniu tych samych osób, po kolei dwiema wersjami testu. Współczynnik stabilności względnej służy do badania rzetelności pomiaru testem oraz wskazuje na stopień podobieństwa między wersjami alternatywnymi testu i na przypadkowe zmiany wyników związane z upływem czasu. Polega na zbadaniu tych samych osób pierwszą wersją testu, a po upływie pewnego czasu drugą wersją testu Metoda połówkowa 90 W poprzednich paragrafach omówiono metody szacowania rzetelności na podstawie dwukrotnego pomiaru. Metoda połówkowa pozwala na oszacowanie rzetelności pomiaru testem na podstawie jednokrotnego badania tej samej grupy osób jednym testem. Jest to jedna z pierwszych metod badania zgodności wewnętrznej, jakie wymyślono. Technika ta opiera się na pomyśle wyodrębnienia dwóch testów równoległych w ramach tego samego testu, a następnie skorelowaniu ze sobą wyników uzyskanych w tych połówkach. Procedura badania polega na tym, że grupa osób wykonuje test, następnie test jest dzielony na dwie połówki, po czym koreluje się ze sobą zbiory wyników uzyskanych z pierwszej i drugiej połówki. Tak po-

8 5. Jakich informacji o teście dostarcza testowanie? wstały współczynnik korelacji mówi o rzetelności jedynie połowy testu. Dlatego też należy skorzystać ze wzoru Spearmana-Browna, który pozwala oszacować rzetelność całego testu na podstawie rzetelności jego połowy: r tt rzetelność całego testu; r pp współczynnik korelacji między połówkami testu. rpp rtt= (5.1) 1 + rpp Podstawiając w miejsce r pp wartość współczynnika korelacji między połowami testu, otrzymamy współczynnik rzetelności całego testu. Warto zauważyć, że wzór na rzetelność połówkową jest specjalnym przypadkiem ogólniejszego wzoru Spearmana-Browna na zależność między rzetelnością pomiaru testem a zmianą jego długości. r ttn nrtti = (5.) 1+ ( n 1) rtti r ttn współczynnik rzetelności testu po jego przedłużeniu; r tti współczynnik rzetelności testu przed jego przedłużeniem; n współczynnik przedłużenia testu (ile razy należy przedłużyć test). Powyższy wzór pozwala na oszacowanie rzetelności pomiaru testem (r ttn ) po jego n krotnym przedłużeniu, znając rzetelność pomiaru testem przed jego przedłużeniem (r tti ). Skoro znamy rzetelność połowy testu, rzetelność całego testu to inaczej rzetelność połowy testu po dwukrotnym przedłużeniu. W takim razie, gdy wstawimy za n wartość, otrzymamy wzór 5.1. Ze wzoru 5. wynika, że rzetelność pomiaru testem wzrasta w miarę jego wydłużania, w związku z czym rzetelność całego testu będzie zawsze większa niż rzetelność jego połówek (niż korelacja miedzy połówkami testu). Podstawowe pytanie dotyczy tego, w jaki sposób podzielić test na połowy. Podział ten powinien być przeprowadzony tak, aby połówki testu były względem siebie równoległe. Możliwych jest kilka rozwiązań. Prosty podział na połowy zachodzi wtedy, gdy m.in. narzędzie zawierające 10 pozycji testowych, podzielonoby w ten sposób, że w pierwszej połowie znajdą się te o numerach 1 5, a w drugiej o numerach Podział taki może mieć sens w przypadku krótkich testów o podobnych wskaźnikach trudności pozycji (m.in. kwestionariuszy osobowości). Jeśli kolejne pozycje testowe miałyby rosnące wskaźniki trudności, to przy takim podziale otrzymanoby połowę łatwą i połowę trudną, a więc założenie o równoległości połówek testu byłoby złamane. Jeśli 91

9 Konrad Jankowski, Marcin Zajenkowski test byłby bardzo długi, nastawienie osoby badanej mogłoby być istotnie różne podczas rozwiązywania pierwszej i drugiej połowy testu (m.in. zmęczenie), a więc różnice w sytuacji badania mogłyby w efekcie doprowadzić do złamania założenia o równoległości połówek. Dobór losowy sprowadza się do podzielenia pozycji do obu połówek w sposób przypadkowy. Metoda taka jest odpowiednia, jeśli poszczególne pozycje testu nie różnią się zbytnio ze względu na ich trudność, zatem może być właściwa dla kwestionariuszy osobowości. Natomiast, jeśli trudność pozycji wzrasta, tak jak to się często zdarza w przypadku testów inteligencji, moglibyśmy otrzymać dwie połowy testu różniące się trudnością. Dobór parzyste nieparzyste polega na tym, że do jednej połówki testu włącza się pozycje testowe o numerach parzystych, a do drugiej o numerach nieparzystych. Dzięki temu, przy wzrastającej trudności kolejnych pozycji, zadania łatwe i trudne rozłożą się do obu połówek równomiernie, dzięki czemu połowy testu będą do siebie zbliżone pod względem trudności. Dobór uwzględniający właściwości pozycji testowych, polega na tym że do obu połówek przydziela się pozycje, tak aby połówki testu spełniały założenia testów równoległych. Kryterium podobieństwa może być też trudność pozycji i, w efekcie, związana z tym trudność obu połówek testu. Metoda ta będzie odpowiednia dla testów, których pozycje nie są równoległe, ale da się utworzyć równoległe połówki testu. Przykładem mogą być testy, których pozycje mają różny format odpowiedzi, tzn. w teście znajdują się pozycje posiadające dwu-, trzy-, czterokategorialny format odpowiedzi. Dobór pozycji testowych do obu połówek ma zasadnicze znaczenie dla wielkości współczynnika rzetelności. Najniższa wartość współczynnika rzetelności wystąpi, jeśli pozycje testu będą wysoko skorelowane w obrębie swojej połówki testu i nisko między połówkami testu. Przypadek taki otrzymalibyśmy, gdyby m.in. w teście o rosnącej trudności pozycji zastosować prosty podział na połowy. Wtedy odpowiedzi na pozycje w obrębie połówek testu byłyby wysoko skorelowane ze sobą, natomiast korelacja między połówkami byłaby niska. Natomiast najwyższa wartość współczynnika rzetelności w metodzie połówkowej wystąpi, jeśli wysoko skorelowane pozycje zostaną rozdzielone do oddzielnych połówek testu. Metodę połówkową zastosowano m.in. do analizy rzetelności w Teście Matryc Ravena wersja Dla Zaawansowanych (Jaworowska i Szustrowa, 199). W narzędziu tym mamy do czynienia z rosnącą trudnością zadań, a zatem autorki polskiej adaptacji zdecydowały się podzielić test na dwie połówki ze względu na pozycje parzyste i nieparzyste. Następnie oszacowały rzetelność pomiaru testem przy pomocy wzoru Spearmana-Browna, uzyskując wartość bliską 0,80. 9

10 5. Jakich informacji o teście dostarcza testowanie? Metoda połówkowa służy do badania rzetelności pomiaru testem oraz wskazuje na stopień podobieństwa między jego połówkami. Polega na jednokrotnym badaniu testem grupy osób Zgodność wewnętrzna Inną techniką, obok metody połówkowej, oszacowania rzetelności po jednokrotnym badaniu danym testem jest estymacja zgodności wewnętrznej (ang. internal consistency). Kuder i Richardson (005) zwrócili uwagę na niejednoznaczność wyniku procedury dzielenia na połowy. Stwierdzili, iż podział testu na dwie połówki jest arbitralny i w zależności od sposobu przepołowienia otrzymamy inne oszacowanie rzetelności. W celu uniknięcia tego problemu, przyjęli założenie, iż test składający się z n pozycji można podzielić na n części. Wynika z tego, że liczba wszystkich możliwych części testu równa jest liczbie jego pozycji. Aby otrzymać dobre oszacowanie zgodności wewnętrznej, trzeba również przyjąć, że pozycje testowe są równoległe (mają równe średnie i wariancje) oraz że wszystkie pozycje w teście mierzą ten sam czynnik (cechę). Autorzy opracowali 1 wzorów, z czego najczęściej stosowane są dwa (nazywane skrótowo od ich nazwisk KR 0 i KR 1 ). Pierwszy z nich odnosi się do przypadków, w których bierze się pod uwagę średnią wariancję wszystkich pozycji testowych. Wzór ten można przedstawić w następujący sposób: (5.3) k p i q i s c k i= 1 liczba pozycji testowych; proporcja odpowiedzi diagnostycznych (zgodnych z kluczem) na i-tą pozycję testową; proporcja odpowiedzi niediagnostycznych (niezgodnych z kluczem); wariancja wyników ogólnych testu; suma dla k pozycji. 93

11 Konrad Jankowski, Marcin Zajenkowski Drugi wzór (KR 1 ) wymaga założenia, że pozycje testowe mają taką samą trudność (równe proporcje odpowiedzi zgodnych i niezgodnych z kluczem). Ma on postać: KR 1 = k k 1 kpq k liczba pozycji w teście; p średnia trudność pozycji testowych; q = 1 p. (5.4) Wykazano (Cronbach, 005), że KR 0 jest równy średniej współczynników rzetelności połówkowej, policzonych dla wszystkich możliwych podziałów testu na połówki. W praktyce oznacza to, że niektóre oszacowania rzetelności metodą połówkową będą niższe, a niektóre wyższe niż współczynnik KR 0. Wzory Kudera i Richardson przełamały problem metody połówkowej, ale miały pewne ograniczenie. Można je było stosować jedynie do testów z dwukategorialnymi odpowiedziami, czyli odpowiedziami typu: tak nie, zgadzam się nie zgadzam się, poprawne niepoprawne itp. Cronbach (005) zaproponował wzór, który da się zastosować do wszelkich testów, a więc nie tylko z dychotomicznym formatem odpowiedzi. Metoda ta, obecnie najczęściej stosowana do szacowania zgodności wewnętrznej, uznawana jest za najlepszy sposób szacowania rzetelności (Hornowska, 003). Dlatego też poświęcimy jej więcej uwagi. Wzór, o którym mowa, znany jako alfa Cronbacha, przedstawia się następująco: s c s c α = k k 1 1 ( i= 1 ) k s c s i (5.5) 94 k s c k s i i= 1 liczba pozycji testowych; wariancja wyników ogólnych testu; suma wariancji pozycji testowych. Rozważmy przykład zastosowania wzoru alfa Cronbacha. W tabeli 5.. zamieszczono wyniki pięciu osób z pewnego testu, w którym zakres dostępnych odpowiedzi wyrażony był na skali Likerta (od 1 do 5). W kolejnych kolumnach przedstawiono odpowiedzi każdej osoby, obliczenia wariancji dla całego testu oraz wariancji poszczególnych pozycji testowych. W celu obliczenia wariancji, należy odjąć każdy wynik od średniej, a następnie uzyskaną wartość podnieść do kwadratu. Wariancję stanowi stosunek sumy

12 5. Jakich informacji o teście dostarcza testowanie? odchyleń wyników od średniej podniesionych do kwadratu do liczby osób badanych minus jeden. W tabeli 5.. przedstawiono kolejne kroki obliczania wyników wariancji całego testu i poszczególnych pozycji testowych. Kolejne kroki obliczeń oznaczono jako A, B, C, D w dolnym wierszu tabeli 5.. Wszystkie obliczenia przebiegają w ten sam sposób, zarówno jeżeli chodzi o wariancję całego testu, jak i poszczególnych pozycji. W kroku A należy zsumować wszystkie wyniki otrzymane (całego testu i kolejnych pozycji), a następnie (krok B) policzyć średnią tychże. Znając średnią wartość, możemy odjąć od niej każdy poszczególny wynik otrzymany, jak też zostało to uczynione w kolumnie oznaczonej (X X ). Otrzymane w ten sposób wartości należy podnieść do kwadratu (wynik tego działania przedstawia w tabeli 5.. kolumna (X X ) ). W kroku C należy zsumować wszystkie wartości podniesione do kwadratu, a następnie podzielić je przez liczbę osób badanych minus jeden (krok D). W ten sposób uzyskano wariancje odpowiednio dla całego testu oraz każdej kolejnej pozycji. Tabela 5.. Wyniki poszczególnych pozycji testowych oraz wyniki ogólne dla 5 osób badanych w teście składającym się z 4 pozycji Osoby Kolejne kroki A. obliczeń: B. C. D. Pozycje testowe Cały test Pozycja 1 Pozycja Pozycja 3 Pozycja * ΣX c (X c X c) ** (X c X c) *** * X 1 (X 1 X 1 ) ** (X 1 X 1 ) *** * X (X X ) ** (X X ) *** * X 3 (X 3 X 3 ) ** (X 3 X 3 ) *** * X 4 (X 4 X 4 ) ** (X 4 X 4 ) *** Σ X c = 60 X c = 1 Σ(X c X c ) = = 100 s c = 100/4 = = 5 Σ X 1 = 15 X 1 = 3 Σ(X 1 X 1 ) = = 10 s 1 = 10/4 = =.5 Σ X = 15 X = 3 Σ(X X ) = = 10 s = 10/4 = =.5 Σ X 3 = 15 X 3 = 3 Σ( X 3 X 3 ) = = 10 s 3 = 10/4 = =.5 * 1 kolumna, ** kolumna, *** 3 kolumna. X wynik otrzymany przez daną osobę; X średnia wyników otrzymanych; ΣX suma wyników otrzymanych; (X X ) odchylenie wyniku otrzymanego przez daną osobę od średniej; (X X ) kwadrat odchylenia wyniku otrzymanego przez daną osobę od średniej; Σ(X X ) suma kwadratów odchyleń wyników otrzymanych od średniej; s wariancja wyników. Σ X 4 = 15 X 4 = 3 Σ( X 4 X 4 ) = = 10 s 4 = 10/4 = =.5 95

13 Konrad Jankowski, Marcin Zajenkowski W przykładzie wariancja każdej pozycji wynosi,5, zatem suma wariancji wszystkich pozycji równa się 10. Wariancja całego testu wynosi 5. Podstawiając uzyskane dane do wzoru 5.5, otrzymujemy: α = 4 ( ) = 0,80 Zgodność wewnętrzna wskazuje, na ile dany test jest jednorodny (homogeniczny), czyli na ile wszystkie pozycje w teście odnoszą się do tej samej cechy (czynnika). Im bardziej jednorodny zbiór pytań (zadań) tworzących test (tzn. wysoko skorelowanych ze sobą), tym wyższą otrzyma się zgodność wewnętrzną. Założenie o jednoczynnikowej strukturze testu może być szczególnie ważne w przypadku baterii testów. Przykładem takiego testu jest narzędzie do pomiaru inteligencji APIS-Z (Matczak, Jaworowska, Szustrowa i Ciechanowicz, 006), które składa się z ośmiu podtestów. Autorki uznały, że chcąc oszacować rzetelność dla wyniku ogólnego (sumy wyników przeliczonych z poszczególnych podtestów), należy wybrać inną metodę niż zgodność wewnętrzna, gdyż w przypadku tej baterii testów trudno mówić o jej jednorodności. Oszacowanie rzetelności metodą zgodności wewnętrznej stosowano m.in. w Inwentarzu Osobowości NEO-FFI Costy i McCrae. Narzędzie to stworzono do pomiaru tzw. Wielkiej Piątki, czyli ekstrawersji, neurotyczności, otwartości na doświadczenie, sumienności i ugodowości. Zdaniem autorów są to cechy uniwersalne, co oznacza możliwość ich wyodrębnienia, niezależnie od badanej kultury, płci i wieku itd. Autorzy polskiej adaptacji (Zawadzki, Strelau, Szczepaniak i Śliwińska, 1998) zbadali zgodność wewnętrzną przy użyciu wzoru alfa Cronbacha. Wyniki, w zależności od skali, wahały się od 0,68 do 0,86. Dokonano także oszacowania rzetelności w grupach jednorodnych ze względu na płeć i wiek. Okazało się, że w grupie kobiet i mężczyzn wartość alfa Cronbacha jest do siebie zbliżona, ale wykazuje dużą zmienność w zależności od wieku badanych. Jednorodność skal obniża się wraz z wiekiem i jest najniższa w grupie osób z przedziału wiekowego Współczynnik alfa Cronbacha jest szczególnie niski w przypadku skali otwartości i wynosi 0,44 dla kobiet i 0,50 dla mężczyzn. Przykład ten pokazuje, w jaki sposób współczynnik zgodności wewnętrznej może być zależny od konkretnej próby. W jednej grupie test może okazać się bardziej jednorodny, a w innej mniej. Zgodność wewnętrzna służy do badania rzetelności pomiaru testem oraz wskazuje na stopień, w jakim pozycje testowe odnoszą się do tego samego konstruktu. Polega na jednokrotnym badaniu testem grupy osób. 96

14 5. Jakich informacji o teście dostarcza testowanie? Zgodność ocen sędziów Innym sposobem szacowania rzetelności może być stopień zgodności ocen wydawanych przez sędziów kompetentnych. Metoda ta stosowana jest najczęściej w przypadku testów, w których pytania mają charakter otwarty i nie ma klucza pozwalającego na jednoznaczną ocenę odpowiedzi badanych. Sędziowie przyznają punkty za odpowiedzi na pozycje testowe tych samych osób. W przypadku tej metody ważne jest, aby sędziowie byli dobrze zaznajomieni z przyjętymi kryteriami oceny, a także, by ich oceny były niezależne od siebie. Miarą rzetelności jest tu stopień zgodności między sędziami. Jeżeli test ocenia dwóch sędziów, najczęściej oblicza się prosty współczynnik korelacji (np. r-pearsona), w przypadku większej liczby oceniających wykorzystuje się współczynnik korelacji W-Kendalla (zob. np. Brzeziński, 1996). Wartość (od 0 do 1) współczynnika wskazuje na stopień zgodności między sędziami im wyższa wartość, tym wyższa zbieżność ocen. Warto zauważyć, że w wypadku analizy zgodności sędziów, uzyskany współczynnik w istocie informuje o rzetelności ocen dokonanych przez sędziów. Źródłem błędu omawianej metody szacowania rzetelności jest subiektywność ocen sędziów. Na współczynnik zgodności mogą bowiem wpływać różnice pomiędzy sędziami. Duża rozbieżność w ocenach wskazuje na znaczący udział czynników subiektywnych. Przykładem narzędzia, w którym zastosowano omawianą metodę jest Test Niedokończonych Zdań Rottera (Jaworowska i Matczak, 1998). Test ten składa się z początków zdań, które osoba badana ma uzupełnić zgodnie ze swoimi skojarzeniami i odczuciami. Na podstawie przyjętych kryteriów, diagnosta przyznaje punkty za każde uzupełnienie. Jak zauważają autorki polskiego opracowania, przy tego rodzaju procedurze istnieje element subiektywizmu. Problem rzetelności wiąże się z pytaniem, czy gdyby ten sam arkusz odpowiedzi oceniały różne osoby, to wynik ogólny byłby taki sam czy też nie. Badając rzetelność tego testu, wylosowano po 30 protokołów mężczyzn i kobiet z każdej z trzech wersji testu. Następnie odpowiedzi osób badanych oceniane były przez dwóch sędziów kompetentnych, dysponujących kryteriami oceny. W celu ustalenia zbieżności między sędziami, obliczono współczynnik korelacji rangowej ρ Spearmana. Wartości korelacji wahały się od 0,89 do 0,97. Zgodność ocen sędziów zastosowano również w Teście Płynności Figuralnej Ruffa (RFFT) (Łojek i Stańczak, 007). W teście tym osobie badanej prezentuje się kwadraty z rozmieszczonym w nich układem kropek oraz bodźców zakłócających. Zadaniem badanego jest połączenie linią prostą co najmniej dwóch kropek tak, aby powstała nowa figura. Badający zlicza liczbę unikalnych połączeń oraz liczbę błędów perseweracyjnych. Autorki polskiej adaptacji zwracają uwagę, że w RFFT mogą się pojawić rozbieżności w ocenianiu, wynikające z różnorodności możliwych do popełnienia pomyłek perseweracyjnych. Badacz może czasem błędnie zakwalifikować jako poprawną figurę powtórzoną lub jako niepoprawny 97

15 Konrad Jankowski, Marcin Zajenkowski wzór oryginalny. W związku z tym, zdecydowano się oszacować rzetelność metodą zgodności sędziów, aby określić, na ile jednoznaczny jest algorytm oceniania. Uzyskany wysoki współczynnik W-Kendalla wskazywał na dużą zbieżność ocen trzech sędziów oraz mały wpływ czynników subiektywnych. Zgodność ocen sędziów służy do badania rzetelności pomiaru testem oraz wskazuje, na ile obiektywna jest ocena odpowiedzi osób badanych. Polega na tym, że te same arkusze odpowiedzi są oceniane przez sędziów kompetentnych Porównanie metod szacowania rzetelności Przed wybraniem metody estymacji rzetelności, należy uwzględnić specyfikę testu oraz czynniki wpływające na wartość danego współczynnika. Każdy z nich bowiem, mówi o innym, specyficznym źródle błędu. Poniżej prezentujemy skrótowe zestawienie wszystkich metod szacowania rzetelności (tabela 5.3.). Tabela 5.3. Zestawienie metod szacowania rzetelności Metoda Najczęstsze zastosowanie Testy, w których uczenie się nie ma wpływu na wyniki np. testy motoryczne; testy na czas reakcji Wiarygodność testu Stabilność bezwzględna Równoważność międzytestowa Stabilność względna Źródło błędu specyficzne dla metody Losowe zmiany związane ze stanem osoby badanej i sytuacją badania Losowe zmiany związane z upływem czasu Dobór pozycji do wersji testu Dobór pozycji do wersji testu Informacje o teście W jakim stopniu test jest wrażliwy na przypadkowe zmiany związane z osobą badaną i sytuacją testowania W jakim stopniu wyniki testu są stałe w czasie Stopień podobieństwa między wersjami alternatywnymi testu Stopień podobieństwa między wersjami alternatywnymi testu. W jakim stopniu pomiar jest stały w czasie Przy pomiarze cech np. kwestionariusze osobowości, testy inteligencji Rzadko stosowana metoda Przy pomiarze cech np. kwestionariusze osobowości, testy inteligencji 98

16 5. Jakich informacji o teście dostarcza testowanie? Tabela 5.3. c.d. Metoda połówkowa Zgodność wewnętrzna Zgodność ocen sędziów Dobór pozycji do połówek testu Niejednorodność pozycji testu Niejasne kryteria oceny odpowiedzi; rozbieżność ocen sędziów W jakim stopniu test jest jednorodny W jakim stopniu test jest jednorodny W jakim stopniu na ocenę odpowiedzi osób badanych wpływają czynniki subiektywne związane z oceniającymi Testy, w których pozycje mają różną trudność np. testy inteligencji Testy, w których pozycje są równoległe np. kwestionariusze osobowości; testy mierzące style, stany Testy, w których brak jednoznacznych kryteriów oceny odpowiedzi, np. metody swobodne Metody szacowania rzetelności w SPSS W części tej zostaną zaprezentowane procedury obliczania wcześniej omówionych współczynników rzetelności, za pomocą pakietu statystycznego SPSS. Każda omówiona metoda zawiera przykład, który został policzony na danych znajdujących się na dołączonej do podręcznika płycie. W tekście, w nawiasach, znajdują się nazwy plików zawierających dane, na których był liczony konkretny przykład Metody dwukrotnego badania tej samej grupy osób W części tej zostanie opisany sposób obliczania wiarygodności testu, stabilności bezwzględnej, równoważności międzytestowej i stabilności względnej w SPSS. W metodach tych jako współczynnik rzetelności traktowana będzie wartość korelacji r-pearsona między pierwszym a drugim pomiarem danym testem (dla wiarygodności testu i stabilności bezwzględnej) albo między pomiarem testem pierwszym a drugim (dla równoważności międzytestowej i stabilności względnej). Mówiąc inaczej, miarą rzetelności pomiaru testem będzie wielkość korelacji między dwoma zbiorami wyników danej grupy osób. Wymienione metody zostaną omówione razem, gdyż sposób postępowania w przypadku każdej z nich jest identyczny. Procedura postępowania zostanie omówiona na przykładzie. W pierwszym kroku należy uzyskać dwa zbiory wyników testu na danej grupie osób i policzyć dla każdej osoby wynik otrzymany (sumaryczny wynik w teście). 99

17 Konrad Jankowski, Marcin Zajenkowski Rysunek 5.1. Okienko arkusza danych z wynikami testu przygotowanymi do analizy stabilności bezwzględnej W prezentowanym przykładzie (plik danych: stabilnosc.sav) przebadano 100 osób dwa razy tym samym testem z tygodniową przerwą między pomiarami (czyli przeprowadzono badanie stabilności bezwzględnej). Test, którego rzetelność sprawdzono, składa się z 10 pozycji. W sumie można było uzyskać od 10 do 0 punktów. Obliczono wyniki całkowite dla każdej osoby, w pierwszym i drugim pomiarze tym testem, które następnie wprowadzono do arkusza danych SPSS. Wiersze reprezentują kolejne osoby badane, a kolumny wyniki otrzymane w pierwszym i drugim badaniu (rys. 5.1.). W następnej kolejności należy obliczyć korelację między oboma zbiorami wyników. Jak wspomnieliśmy wcześniej, istotne jest również sprawdzenie równości średnich z obu pomiarów. W tym celu należy wejść w: Analiza -> Porównywanie średnich -> Test t dla prób zależnych (rys. 5..). Rysunek 5.. Okienko wyboru testu t dla prób zależnych 100

18 5. Jakich informacji o teście dostarcza testowanie? Rysunek 5.3. Okienko testu t dla prób zależnych Po przerzuceniu zmiennych pomiar1 i pomiar, należy kliknąć OK (rys. 5.3.). Rysunek 5.4. Wydruk analizy testu t dla prób zależnych Ukaże się wydruk analizy (rys. 5.4.). Z tabeli dolnej Test dla prób zależnych można odczytać istotność dwustronną, która wskazuje, czy wystąpiły różnice między średnimi pomiaru 1 i pomiaru. W prezentowanym przykładzie różnice nie wystąpiły, gdyż istotność dwustronna jest większa od wartości 0,05. Skoro spełnione jest założenie o równości średnich między pomiarami, możemy odczytać wartość korelacji r-pearsona z tabeli Korelacje dla prób zależnych. Wynosi ona 0,98 przy poziomie istotności p<0,001. Zatem rzetelność naszego testu badana metodą stabilności bezwzględnej wynosi 0,98. Ponieważ nie wystąpił żaden efekt, który powodowałby podwyższenie lub obniżenie wyników (średnie pomiarów nie różnią się), uprawnione jest stwierdzenie, że wyniki tego testu są stałe w czasie. 101

19 Konrad Jankowski, Marcin Zajenkowski Metoda połówkowa w SPSS W części tej zostanie przedstawiony sposób obliczania rzetelności metodą połówkową Spearmana-Browna w SPSS na poniższym przykładzie. Skonstruowano kwestionariusz osobowości, składający się z 0 pytań. Zbadano jego rzetelność za pomocą metody połówkowej. Przebadano w tym celu 60 studentów. Ich wyniki zapisano w arkuszu danych programu SPSS (plik danych: połówkowa.sav). W wierszach znajdują się wyniki kolejnych osób, a w kolumnach o nagłówkach p1, p,..., p0 znajdują się odpowiedzi na kolejne pytania (rys. 5.5.). Rysunek 5.5. Okienko arkusza danych z wynikami testu przygotowanymi do analizy rzetelności metodą połówkową Aby obliczyć rzetelność należy wejść do: Analiza->Skalowanie->Analiza rzetelności (rys. 5.6.). Następnie należy zaznaczyć model połówkowy oraz przerzucić wszystkie pozycje testu do okna Elementy (rys. 5.7.). 10 Rysunek 5.6. Okienko wyboru analizy rzetelności

20 5. Jakich informacji o teście dostarcza testowanie? Rysunek 5.7. Okienko analizy rzetelności z zaznaczonym modelem połówkowym Wydruk analizy rzetelności metodą połówkową prezentuje rys Rysunek 5.8. Wydruk analizy rzetelności metodą połówkową Rzetelność powyższego testu zbadana metodą połówkową wynosi 0,703. Współczynnik Spearmana-Browna w tym przykładzie jest taki sam przy założeniu równej i nierównej długości testu. Wartości te różniłyby się nieznacznie, gdyby test składał się, inaczej niż w powyższym przykładzie, z nieparzystej liczby pozycji. Korelacja międzypołówkowa to współczynnik korelacji r-pearsona między wyodrębnionymi połowami testu. Po podstawieniu tej wartości (0,54) do wzoru 5.1, w miejsce r pp uzyskalibyśmy wyliczoną wartość współczynnika Spearmana- -Browna przy założeniu o równej długości. 103

21 Konrad Jankowski, Marcin Zajenkowski Poniżej znajduje się wiersz poleceń do wykonania analizy rzetelności metodą połówkową dla wcześniejszego przykładu. RELIABILITY /VARIABLES=p1 p p3 p4 p5 p6 p7 p8 p9 p10 p11 p1 p13 p14 p15 p16 p17 p18 p19 p0 /SCALE( ALL VARIABLES ) ALL/MODEL=SPLIT. Podział na połowy dokonuje się w taki sposób, że do pierwszej części zalicza się pozycje od p1 do p10 a do drugiej pozostałe. Aby zbadać rzetelność połówkową przy innym podziale testu na połowy, np. dzieląc go na pozycje parzyste i nieparzyste, należałoby w polu Elementy (rys. 5.7.) wprowadzić najpierw pozycje o numerach nieparzystych (czyli 1, 3, 5 itd.), a następnie o numerach parzystych (czyli, 4, 6 itd.). Wiersz poleceń wyglądałby wtedy następująco: RELIABILITY /VARIABLES=p1 p3 p5 p7 p9 p11 p13 p15 p17 p19 p p4 p6 p8 p10 p1 p14 p16 p18 p0 /SCALE( ALL VARIABLES ) ALL/MODEL=SPLIT Alfa Cronbacha w SPSS 104 W części tej zostanie przedstawiony sposób obliczania zgodności wewnętrznej za pomocą alfy Cronbacha w SPSS na poniższym przykładzie. Skonstruowano kwestionariusz osobowości, składający się z 0 pytań, i zaplanowano zbadać jego zgodność wewnętrzną. Przebadano w tym celu 60 osób, a ich wyniki zapisano w arkuszu danych programu SPSS (alfa.sav). W wierszach znajdują się wyniki kolejnych osób, a w kolumnach o nagłówkach p1,p,...,p0 znajdują się odpowiedzi na kolejne pytania. Aby policzyć alfę Cronbacha, należy wejść do: Analiza-> Skalowanie-> Analiza rzetelności (rys. 5.6.). Wszystkie pozycje, składające się na skalę, której zgodność będzie badana, należy przerzucić do okna Elementy: (rys. 5.9.). Należy zwrócić uwagę, czy w okienku Model: zaznaczona jest Alfa. Po kliknięciu przycisku Statystyki, pokaże się okno (rys ), w którym warto zaznaczyć opcję Skala przy wykluczeniu pozycji. Opcja ta umożliwia przewidzenie wartości alfy, jeśli usunięto by daną pozycję z analizy rzetelności. Po kliknięciu Dalej i OK, pojawią się wydruki przeprowadzonej analizy (rys ). Wartość alfy należy odczytać z okna Alfa Cronbacha. Dla analizowanego kwestionariusza wynosi ona 0,715. Z tabeli Statystyki pozycji Ogółem można odczytać, że zgodność wewnętrzna tego kwestionariusza wzrosłaby najbardziej, gdyby usunąć pozycję p13, i wyniosłaby wtedy 0,78. Zatem, można zwiększać

22 5. Jakich informacji o teście dostarcza testowanie? zgodność wewnętrzną poprzez eliminowanie pozycji testu, które zmniejszają jego rzetelność. Poniżej znajduje się wiersz poleceń do wykonania analizy rzetelności metodą alfy Cronbacha dla powyższego przykładu. RELIABILITY /VARIABLES=p1 p p3 p4 p5 p6 p7 p8 p9 p10 p11 p1 p13 p14 p15 p16 p17 p18 p19 p0 /SCALE( ALL VARIABLES ) ALL/MODEL=ALPHA /SUMMARY=TOTAL. Rysunek 5.9. Okienko analizy rzetelności z zaznaczoną alfą Cronbacha Rysunek Okienko statystyki w analizie rzetelności 105

23 Konrad Jankowski, Marcin Zajenkowski Rysunek Wydruk analizy rzetelności metodą alfy Cronbacha Rzetelność pomiaru testem jako zgodność sędziów w SPSS W części tej zostanie przedstawiony sposób obliczania zgodności sędziów w SPSS na poniższym przykładzie. Skonstruowano test rysunkowy do badania nasilenia depresyjności u dzieci. Polega on na poproszeniu dziecka o narysowanie domu na czystej kartce A4, standardowym, dwunastokolorowym zestawem kredek. Przebadano nim dziesięcioro dzieci. Ponieważ nie ma prostego klucza przyznawania punktów za wykonanie tego testu (tzn. nie ma szablonu, który można by przyłożyć do rysunku i zliczyć punkty), poproszono trzech sędziów o ocenę wykonania każdego testu i przyznanie odpowiedniej liczby punktów w zależności od nasilenia depresyjności. Sędziowie dysponują kryteriami do przyznawania punktów, gdzie 0 oznacza brak depresji, a 10 jej wysokie nasilenie. Oceny testów zostały przedstawione na rys Rysunek 5.1. Okienko arkusza danych z wynikami przygotowanymi do analizy zgodności sędziów

24 5. Jakich informacji o teście dostarcza testowanie? Każdy wiersz reprezentuje sędziego, a kolumny kolejne dzieci, których testy były oceniane. Zaznaczona komórka reprezentuje ocenę przeprowadzoną przez trzeciego sędziego testu wykonanego przez dziecko numer 10. Tak przygotowane dane można podać analizie zgodności sędziów (zgodnosc_sedziow.sav). W tym celu należy wejść do: Analiza-> Testy nieparametryczne-> K prób zależnych (rys ) i przenieść wszystkie zmienne do okna Zmienne testowane oraz zaznaczyć na dole test W Kendalla (jednocześnie odznaczając Friedman, dla przejrzystości wydruku analiz) (rys ). Rysunek Okienko wyboru analizy zgodności sędziów Rysunek Okienko testów dla kilku prób zależnych z zaznaczonym W-Kendalla 107

25 Konrad Jankowski, Marcin Zajenkowski Rysunek Wydruk analizy W-Kendalla Rys przedstawia wydruk analiz. Najbardziej interesujący jest współczynnik W-Kendalla, który wynosi 0,919, przy poziomie istotności 0,003 (W = 0,913; chi (9) = 4,811; p<0,01). Oznacza to, że sędziowie dość zgodnie ocenili testy wykonane przez poszczególne dzieci, co oznacza wysoką rzetelność tego testu. Poniżej znajduje się wiersz poleceń do obliczenia współczynnika W-Kendalla dla zaprezentowanego przykładu. NPAR TESTS /KENDALL = os1 os os3 os4 os5 os6 os7 os8 os9 os10 /MISSING LISTWISE. 108 Pytania sprawdzające 1. Wyjaśnij, w jaki sposób założenie o równoległości testów odnosi się do wszystkich omówionych metod szacowania rzetelności.. Wskaż podobieństwa i różnice między współczynnikiem stabilności bezwzględnej a współczynnikiem stabilności względnej. 3. Zbadano dwukrotnie 100 osób pewnym kwestionariuszem osobowości w odstępie tygodni. Uzyskano korelację pomiędzy pomiarami równą 0,8 oraz istotne statystycznie różnice w średnich w obu badaniach. Czy na podstawie

26 5. Jakich informacji o teście dostarcza testowanie? uzyskanych wyników możemy powiedzieć, że kwestionariusz ten jest stabilny czasowo? Uzasadnij odpowiedź. 4. Od czego zależy długość przerwy czasowej w badaniu stabilności względnej? 5. Skonstruowano test inteligencji płynnej, w którym poziom trudności zadań wzrasta stopniowo. Jakiej metody szacowania rzetelności w grupie dzieci należałoby użyć w tym przypadku? Uzasadnij wybór. 6. W pewnym teście ocenia się osobowość osób badanych na podstawie ich skojarzeń z określonymi słowami. Badani mają zapisywać wszystkie skojarzenia, jakie przychodzą im do głowy w związku z danym słowem. W celu oszacowania rzetelności tego testu, arkusze odpowiedzi osób badanych przedstawiono trzem kompetentnym psychologom. Poproszono ich, aby na podstawie określonych kryteriów ocenili każdą odpowiedź badanych na skali od 1 do 3. Następnie obliczono współczynnik W-Kendalla i uzyskano wartość 0,1. O czym świadczy ten wynik? Zadania 1. W pewnym teście inteligencji postanowiono obliczyć rzetelność metodą połówkową. Po zbadaniu odpowiedniej grupy osób, podzielono test na dwie połówki. W jednej znajdowały się pozycje parzyste a w drugiej nieparzyste. Następnie obliczono współczynnik korelacji między połówkami, który wynosił 0,6. Oblicz rzetelność tego testu.. Poniżej, w tabeli 5.4., przedstawiono wyniki pięciu osób uzyskane w pewnym kwestionariuszu osobowości. Kwestionariusz składał się z pięciu pozycji, a zakres możliwych odpowiedzi wyrażony był na trójstopniowej skali (od 1 do 3). Oblicz jego zgodność wewnętrzną przy użyciu wzoru alfa Cronbacha na podstawie przedstawionych danych. Tabela 5.4. Wyniki pięciu osób w kolejnych, czterech pozycjach testowych Osoby Pozycje testowe

Psychometria PLAN NAJBLIŻSZYCH WYKŁADÓW. Co wyniki testu mówią nam o samym teście? A. Rzetelność pomiaru testem. TEN SLAJD JUŻ ZNAMY

Psychometria PLAN NAJBLIŻSZYCH WYKŁADÓW. Co wyniki testu mówią nam o samym teście? A. Rzetelność pomiaru testem. TEN SLAJD JUŻ ZNAMY definicja rzetelności błąd pomiaru: systematyczny i losowy Psychometria Co wyniki testu mówią nam o samym teście? A. Rzetelność pomiaru testem. rozkład X + błąd losowy rozkład X rozkład X + błąd systematyczny

Bardziej szczegółowo

Klasyczny model rzetelności H. Gulliksen (1950) X = T +E

Klasyczny model rzetelności H. Gulliksen (1950) X = T +E Klasyczny model rzetelności H. Gulliksen (1950) gdzie: X = wynik obserwowany T = wynik prawdziwy E = błąd pomiaru X = T +E Założenia: (1) M E = 0 (założenie o nieobciążoności narzędzia pomiarowego) ()

Bardziej szczegółowo

Rzetelność ma dwa aspekty: konsystencja (precyzja pomiaru) stabilność pomiaru (powtarzalność wyników)

Rzetelność ma dwa aspekty: konsystencja (precyzja pomiaru) stabilność pomiaru (powtarzalność wyników) 6. RZETELNOŚĆ TESTU Metody szacowania rzetelności Rodzaje testu a wybór metody szacowania rzetelności Czynniki wpływające na rzetelność pomiaru Kryteria akceptacji rzetelności pomiaru Praktyczne wykorzystanie

Bardziej szczegółowo

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1. Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w

Bardziej szczegółowo

Trafność czyli określanie obszaru zastosowania testu

Trafność czyli określanie obszaru zastosowania testu Trafność czyli określanie obszaru zastosowania testu Trafność jest to dokładność z jaką test mierzy to, co ma mierzyć Trafność jest to stopień, w jakim test jest w stanie osiągnąć stawiane mu cele Trafność

Bardziej szczegółowo

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane

Bardziej szczegółowo

Zadania ze statystyki cz.8. Zadanie 1.

Zadania ze statystyki cz.8. Zadanie 1. Zadania ze statystyki cz.8. Zadanie 1. Wykonano pewien eksperyment skuteczności działania pewnej reklamy na zmianę postawy. Wylosowano 10 osobową próbę studentów, których poproszono o ocenę pewnego produktu,

Bardziej szczegółowo

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012

Bardziej szczegółowo

1. TESTY PSYCHOLOGICZNE

1. TESTY PSYCHOLOGICZNE 1. TESTY PSYCHOLOGICZNE 1. pojęcie testu psychologicznego 2. zastosowanie 3. podstawowe wymogi (standaryzacja, obiektywność, rzetelność, trafność, normalizacja) 4. cecha psychologiczna w ujęciu psychologicznym

Bardziej szczegółowo

5. WNIOSKOWANIE PSYCHOMETRYCZNE

5. WNIOSKOWANIE PSYCHOMETRYCZNE 5. WNIOSKOWANIE PSYCHOMETRYCZNE Model klasyczny Gulliksena Wynik otrzymany i prawdziwy Błąd pomiaru Rzetelność pomiaru testem Standardowy błąd pomiaru Błąd estymacji wyniku prawdziwego Teoria Odpowiadania

Bardziej szczegółowo

Zajęcia 1. Rzetelność

Zajęcia 1. Rzetelność Wzory Psychometria Zajęcia 1. Rzetelność 1950 Guliksen, za Spearmanem (1910) przyjmuje, że: t = T + e t wynik otrzymany T wynik prawdziwy pozycja danej osoby na kontinuum cechy (zdolności); przysługuje

Bardziej szczegółowo

Kognitywistyka II r. Terminy wykładów. Literatura - psychometria. Teorie inteligencji i sposoby jej pomiaru (1)

Kognitywistyka II r. Terminy wykładów. Literatura - psychometria. Teorie inteligencji i sposoby jej pomiaru (1) Kognitywistyka II r Teorie inteligencji i sposoby jej pomiaru (1) Terminy wykładów 13. 03. 2008 27. 03. 2008 03. 04. 2008 17. 04. 2008 24. 04. 2008 08. 05. 2008 15. 05. 2008 29. 05. 2008 05. 06. 2008 12.

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

Rodzaje testów. Testy. istnieje odpowiedź prawidłowa. autoekspresja brak odpowiedzi prawidłowej ZGADYWANIE TRAFNOŚĆ SAMOOPISU

Rodzaje testów. Testy. istnieje odpowiedź prawidłowa. autoekspresja brak odpowiedzi prawidłowej ZGADYWANIE TRAFNOŚĆ SAMOOPISU Rodzaje testów Testy wiedza umiejętności zdolności właściwości poznawcze właściwości afektywne uczucia postawy osobowość emocje wierzenia istnieje odpowiedź prawidłowa autoekspresja brak odpowiedzi prawidłowej

Bardziej szczegółowo

Definicja testu psychologicznego

Definicja testu psychologicznego Definicja testu psychologicznego Badanie testowe to taka sytuacja, w której osoba badana uczestniczy dobrowolnie, świadoma celu jakim jest jej ocena. Jest to sytuacja tworzona specjalnie dla celów diagnostycznych,

Bardziej szczegółowo

ćwiczenia 30 zaliczenie z oceną

ćwiczenia 30 zaliczenie z oceną Wydział: Psychologia Nazwa kierunku kształcenia: Psychologia Rodzaj przedmiotu: podstawowy Opiekun: dr Krzysztof Fronczyk Poziom studiów (I lub II stopnia): Jednolite magisterskie Tryb studiów: Stacjonarne

Bardziej szczegółowo

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2014/2015

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2014/2015 Krakowska Akademia im. Andrzeja Frycza Modrzewskiego Karta przedmiotu obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 014/015 WydziałPsychologii i Nauk Humanistycznych Kierunek studiów:

Bardziej szczegółowo

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności: Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Psychometria. Testy Psychologiczne. Test Psychologiczny. Test Psychologiczny. Test Psychologiczny (wg APA) Test Psychologiczny. Test Psychologiczny

Psychometria. Testy Psychologiczne. Test Psychologiczny. Test Psychologiczny. Test Psychologiczny (wg APA) Test Psychologiczny. Test Psychologiczny Psychometria Testy Psychologiczne W 2 Nie wiemy czy mierzone cechy, stany czy postawy istnieją w rzeczywistości, bo nie mamy do nich bezpośredniego dostępu. Dlatego nazywane są też zmiennymi lub konstruktami,

Bardziej szczegółowo

10. Podstawowe wskaźniki psychometryczne

10. Podstawowe wskaźniki psychometryczne 10. Podstawowe wskaźniki psychometryczne q analiza własności pozycji testowych q metody szacowania mocy dyskryminacyjnej q stronniczość pozycji testowych q własności pozycji testowych a kształt rozkładu

Bardziej szczegółowo

Metodologia badań psychologicznych. Wykład 4 Testy

Metodologia badań psychologicznych. Wykład 4 Testy Metodologia badań psychologicznych Lucyna Golińska SPOŁECZNA AKADEMIA NAUK Wykład 4 Testy Definicja testu Pierwszy test- James McKeen Cattell w 1890r. (mental test and measurements) test do badania zdolności

Bardziej szczegółowo

Zmienne zależne i niezależne

Zmienne zależne i niezależne Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }

Bardziej szczegółowo

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Jak sprawdzić normalność rozkładu w teście dla prób zależnych? Jak sprawdzić normalność rozkładu w teście dla prób zależnych? W pliku zalezne_10.sta znajdują się dwie zmienne: czasu biegu przed rozpoczęciem cyklu treningowego (zmienna 1) oraz czasu biegu po zakończeniu

Bardziej szczegółowo

Dwuczynnikowa ANOVA dla prób niezależnych w schemacie 2x2

Dwuczynnikowa ANOVA dla prób niezależnych w schemacie 2x2 Dwuczynnikowa ANOVA dla prób niezależnych w schemacie 2x2 Poniżej prezentujemy przykładowe pytania z rozwiązaniami dotyczącymi dwuczynnikowej analizy wariancji w schemacie 2x2. Wszystkie rozwiązania są

Bardziej szczegółowo

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna Ćwiczenie 4 ANALIZA KORELACJI, BADANIE NIEZALEŻNOŚCI Analiza korelacji jest działem statystyki zajmującym się badaniem zależności pomiędzy rozkładami dwu lub więcej badanych cech w populacji generalnej.

Bardziej szczegółowo

15. PODSUMOWANIE ZAJĘĆ

15. PODSUMOWANIE ZAJĘĆ 15. PODSUMOWANIE ZAJĘĆ Efekty kształcenia: wiedza, umiejętności, kompetencje społeczne Przedmiotowe efekty kształcenia Pytania i zagadnienia egzaminacyjne EFEKTY KSZTAŁCENIA WIEDZA Wykazuje się gruntowną

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x ZJAZD 4 KORELACJA, BADANIE NIEZALEŻNOŚCI, ANALIZA REGRESJI Analiza korelacji i regresji jest działem statystyki zajmującym się badaniem zależności i związków pomiędzy rozkładami dwu lub więcej badanych

Bardziej szczegółowo

Zjawisko dopasowania w sytuacji komunikacyjnej. Patrycja Świeczkowska Michał Woźny

Zjawisko dopasowania w sytuacji komunikacyjnej. Patrycja Świeczkowska Michał Woźny Zjawisko dopasowania w sytuacji komunikacyjnej Patrycja Świeczkowska Michał Woźny 0.0.0 pomiar nastroju Przeprowadzone badania miały na celu ustalenie, w jaki sposób rozmówcy dopasowują się do siebie nawzajem.

Bardziej szczegółowo

Zadanie 1. Za pomocą analizy rzetelności skali i wspólczynnika Alfa- Cronbacha ustalić, czy pytania ankiety stanowią jednorodny zbiór.

Zadanie 1. Za pomocą analizy rzetelności skali i wspólczynnika Alfa- Cronbacha ustalić, czy pytania ankiety stanowią jednorodny zbiór. L a b o r a t o r i u m S P S S S t r o n a 1 W zbiorze Pytania zamieszczono odpowiedzi 25 opiekunów dzieci w wieku 8. lat na następujące pytania 1 : P1. Dziecko nie reaguje na bieżące uwagi opiekuna gdy

Bardziej szczegółowo

Wykład 3 Hipotezy statystyczne

Wykład 3 Hipotezy statystyczne Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza

Bardziej szczegółowo

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę

Bardziej szczegółowo

Kontekstowe wskaźniki efektywności nauczania - warsztaty

Kontekstowe wskaźniki efektywności nauczania - warsztaty Kontekstowe wskaźniki efektywności nauczania - warsztaty Przygotowała: Aleksandra Jasińska (a.jasinska@ibe.edu.pl) wykorzystując materiały Zespołu EWD Czy dobrze uczymy? Metody oceny efektywności nauczania

Bardziej szczegółowo

Zadanie 1. Analiza Analiza rozkładu

Zadanie 1. Analiza Analiza rozkładu Zadanie 1 data lab.zad 1; input czas; datalines; 85 3060 631 819 805 835 955 595 690 73 815 914 ; run; Analiza Analiza rozkładu Ponieważ jesteśmy zainteresowani wyznaczeniem przedziału ufności oraz weryfikacja

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie. STATISTICA INSTRUKCJA - 1 I. Wprowadzanie danych Podstawowe / Nowy / Arkusz Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą

Bardziej szczegółowo

Pobieranie prób i rozkład z próby

Pobieranie prób i rozkład z próby Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.

Bardziej szczegółowo

Standardowe techniki diagnostyczne

Standardowe techniki diagnostyczne Wydział Psychologii Uniwersytetu Warszawskiego Standardowe techniki diagnostyczne Zajęcia nr 13: Pomiar stylów radzenia sobie ze stresem Mgr Karolina Stala Co powinno znaleźć się w raporcie zbiorczym?

Bardziej szczegółowo

Zadania ze statystyki, cz.6

Zadania ze statystyki, cz.6 Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

JEDNOCZYNNIKOWA ANOVA

JEDNOCZYNNIKOWA ANOVA Analizę ANOVA wykorzystujemy do wykrycia różnic pomiędzy średnimi w więcej niż dwóch grupach/więcej niż w dwóch pomiarach JEDNOCZYNNIKOWA ANOVA porównania jednej zmiennej pomiędzy więcej niż dwoma grupami

Bardziej szczegółowo

Statystyka i Analiza Danych

Statystyka i Analiza Danych Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki -

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Psychometria. klasyczna teoria rzetelności testu. trafność. Co wyniki testu mówią nam o samym teście? B. Trafność pomiaru testem.

Psychometria. klasyczna teoria rzetelności testu. trafność. Co wyniki testu mówią nam o samym teście? B. Trafność pomiaru testem. Psychometria Co wyniki testu mówią nam o samym teście? B. Trafność pomiaru testem. klasyczna teoria rzetelności testu W6 dr Łukasz Michalczyk Trafność czy udało się zmierzyć to, co zamierzaliśmy zmierzyć

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

Liczba zadań a rzetelność testu na przykładzie testów biegłości językowej z języka angielskiego

Liczba zadań a rzetelność testu na przykładzie testów biegłości językowej z języka angielskiego Ewaluacja biegłości językowej Od pomiaru do sztuki pomiaru Liczba zadań a rzetelność testu na przykładzie testów biegłości językowej z języka angielskiego Tomasz Żółtak Instytut Badań Edukacyjnych oraz

Bardziej szczegółowo

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska D syst D śr m 1 3 5 2 4 6 śr j D 1

Bardziej szczegółowo

Zawartość. Zawartość

Zawartość. Zawartość Opr. dr inż. Grzegorz Biesok. Wer. 2.05 2011 Zawartość Zawartość 1. Rozkład normalny... 3 2. Rozkład normalny standardowy... 5 3. Obliczanie prawdopodobieństw dla zmiennych o rozkładzie norm. z parametrami

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 Metody sprawdzania założeń w analizie wariancji: -Sprawdzanie równości (jednorodności) wariancji testy: - Cochrana - Hartleya - Bartletta -Sprawdzanie zgodności

Bardziej szczegółowo

Porównywanie populacji

Porównywanie populacji 3 Porównywanie populacji 2 Porównywanie populacji Tendencja centralna Jednostki (w grupie) według pewnej zmiennej porównuje się w ten sposób, że dokonuje się komparacji ich wartości, osiągniętych w tej

Bardziej szczegółowo

Metodologia badań psychologicznych. Wykład 12. Korelacje

Metodologia badań psychologicznych. Wykład 12. Korelacje Metodologia badań psychologicznych Lucyna Golińska SPOŁECZNA AKADEMIA NAUK Wykład 12. Korelacje Korelacja Korelacja występuje wtedy gdy dwie różne miary dotyczące tych samych osób, zdarzeń lub obiektów

Bardziej szczegółowo

Katedra Biotechnologii i Genetyki Zwierząt, Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Katedra Biotechnologii i Genetyki Zwierząt, Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy Temat: Weryfikacja hipotez statystycznych dla jednej i dwóch średnich. MS EXCEL Do weryfikacji różnic między dwiema grupami jednostek doświadczalnych w MS Excelu wykorzystujemy funkcję o nazwie T.TEST.

Bardziej szczegółowo

Wszystkie wyniki w postaci ułamków należy podawać z dokładnością do czterech miejsc po przecinku!

Wszystkie wyniki w postaci ułamków należy podawać z dokładnością do czterech miejsc po przecinku! Pracownia statystyczno-filogenetyczna Liczba punktów (wypełnia KGOB) / 30 PESEL Imię i nazwisko Grupa Nr Czas: 90 min. Łączna liczba punktów do zdobycia: 30 Czerwona Niebieska Zielona Żółta Zaznacz znakiem

Bardziej szczegółowo

Oszacowanie i rozkład t

Oszacowanie i rozkład t Oszacowanie i rozkład t Marcin Zajenkowski Marcin Zajenkowski () Oszacowanie i rozkład t 1 / 31 Oszacowanie 1 Na podstawie danych z próby szacuje się wiele wartości w populacji, np.: jakie jest poparcie

Bardziej szczegółowo

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem. Teoria błędów Wskutek niedoskonałości przyrządów, jak również niedoskonałości organów zmysłów wszystkie pomiary są dokonywane z określonym stopniem dokładności. Nie otrzymujemy prawidłowych wartości mierzonej

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną Wydział: Psychologia Nazwa kierunku kształcenia: Psychologia Rodzaj przedmiotu: podstawowy Opiekun: dr Joanna Piekarska Poziom studiów (I lub II stopnia): Jednolite magisterskie Tryb studiów: Niestacjonarne

Bardziej szczegółowo

Wydział Matematyki. Testy zgodności. Wykład 03

Wydział Matematyki. Testy zgodności. Wykład 03 Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy

Bardziej szczegółowo

Wykład 5: Statystyki opisowe (część 2)

Wykład 5: Statystyki opisowe (część 2) Wykład 5: Statystyki opisowe (część 2) Wprowadzenie Na poprzednim wykładzie wprowadzone zostały statystyki opisowe nazywane miarami położenia (średnia, mediana, kwartyle, minimum i maksimum, modalna oraz

Bardziej szczegółowo

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy

Bardziej szczegółowo

Kognitywistyka II r. Analiza zadań. Rodzaje testów. Teorie inteligencji i sposoby jej pomiaru (3) Testy. istnieje odpowiedź prawidłowa

Kognitywistyka II r. Analiza zadań. Rodzaje testów. Teorie inteligencji i sposoby jej pomiaru (3) Testy. istnieje odpowiedź prawidłowa Kognitywistyka II r Teorie inteligencji i sposoby jej pomiaru (3) Analiza zadań Rodzaje testów Testy wiedza umiejętności zdolności właściwości poznawcze właściwości afektywne uczucia postawy osobowość

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta

Bardziej szczegółowo

ANALIZA JAKOŚCIOWA I ILOŚCIOWA TESTÓW SZKOLNYCH MATERIAŁ SZKOLENIOWY

ANALIZA JAKOŚCIOWA I ILOŚCIOWA TESTÓW SZKOLNYCH MATERIAŁ SZKOLENIOWY ANALIZA JAKOŚCIOWA I ILOŚCIOWA TESTÓW SZKOLNYCH MATERIAŁ SZKOLENIOWY Instrukcja przeprowadzania analiz badań edukacyjnych i sporządzania raportów po badaniach. Cele prowadzenia analiz jakościowych i ilościowych

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

RAPORT z diagnozy umiejętności matematycznych

RAPORT z diagnozy umiejętności matematycznych RAPORT z diagnozy umiejętności matematycznych przeprowadzonej w klasach czwartych szkoły podstawowej 1 Analiza statystyczna Wskaźnik Liczba uczniów Liczba punktów Łatwość zestawu Wyjaśnienie Liczba uczniów,

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4 Inne układy doświadczalne 1) Układ losowanych bloków Stosujemy, gdy podejrzewamy, że może występować systematyczna zmienność między powtórzeniami np. - zmienność

Bardziej szczegółowo

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny

Bardziej szczegółowo

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15 VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady

Bardziej szczegółowo

Hipotezy statystyczne

Hipotezy statystyczne Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej

Bardziej szczegółowo

CIĄGI wiadomości podstawowe

CIĄGI wiadomości podstawowe 1 CIĄGI wiadomości podstawowe Jak głosi definicja ciąg liczbowy to funkcja, której dziedziną są liczby naturalne dodatnie (w zadaniach oznacza się to najczęściej n 1) a wartościami tej funkcji są wszystkie

Bardziej szczegółowo

Oleg Gorbaniuk. Katolicki Uniwersytet Lubelski Jana Pawła II Uniwersytet Zielonogórski. Zastosowania statystyki i data mining w badaniach naukowych

Oleg Gorbaniuk. Katolicki Uniwersytet Lubelski Jana Pawła II Uniwersytet Zielonogórski. Zastosowania statystyki i data mining w badaniach naukowych Wykorzystywanie procedury sędziów kompetentnych w naukach społecznych i możliwości jej oceny psychometrycznej za pomocą narzędzi dostępnych w Statistica Oleg Gorbaniuk Katolicki Uniwersytet Lubelski Jana

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)

Bardziej szczegółowo

(narzędzie do pomiaru cech zachowania oprac. dr hab. Zbigniew Spendel)

(narzędzie do pomiaru cech zachowania oprac. dr hab. Zbigniew Spendel) TEST PSYCHOLOGICZNY/ PEDAGOGICZNY (narzędzie do pomiaru cech zachowania oprac. dr hab. Zbigniew Spendel) 1. Jest narzędziem diagnostycznym posługiwanie się nim musi być uzasadnione celem postępowania diagnostycznego

Bardziej szczegółowo

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N = HISTOGRAM W pewnych przypadkach interesuje nas nie tylko określenie prawdziwej wartości mierzonej wielkości, ale także zbadanie całego rozkład prawdopodobieństwa wyników pomiarów. W takim przypadku wyniki

Bardziej szczegółowo

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY Weryfikacja hipotez statystycznych Statystyka i demografia PROJEKT DOFINANSOWANY ZE ŚRODKÓW NARODOWEGO BANKU POLSKIEGO URZĄD STATYSTYCZNY

Bardziej szczegółowo

Pochodna i różniczka funkcji oraz jej zastosowanie do obliczania niepewności pomiarowych

Pochodna i różniczka funkcji oraz jej zastosowanie do obliczania niepewności pomiarowych Pochodna i różniczka unkcji oraz jej zastosowanie do obliczania niepewności pomiarowych Krzyszto Rębilas DEFINICJA POCHODNEJ Pochodna unkcji () w punkcie określona jest jako granica: lim 0 Oznaczamy ją

Bardziej szczegółowo

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( ) Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału

Bardziej szczegółowo

Badanie zależności skala nominalna

Badanie zależności skala nominalna Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność

Bardziej szczegółowo

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1 Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie

Bardziej szczegółowo

4. Postęp arytmetyczny i geometryczny. Wartość bezwzględna, potęgowanie i pierwiastkowanie liczb rzeczywistych.

4. Postęp arytmetyczny i geometryczny. Wartość bezwzględna, potęgowanie i pierwiastkowanie liczb rzeczywistych. Jarosław Wróblewski Matematyka dla Myślących, 008/09. Postęp arytmetyczny i geometryczny. Wartość bezwzględna, potęgowanie i pierwiastkowanie liczb rzeczywistych. 15 listopada 008 r. Uwaga: Przyjmujemy,

Bardziej szczegółowo

Niepewności pomiarów

Niepewności pomiarów Niepewności pomiarów Międzynarodowa Organizacja Normalizacyjna (ISO) w roku 1995 opublikowała normy dotyczące terminologii i sposobu określania niepewności pomiarów [1]. W roku 1999 normy zostały opublikowane

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną

Bardziej szczegółowo

Prawdopodobieństwo i rozkład normalny cd.

Prawdopodobieństwo i rozkład normalny cd. # # Prawdopodobieństwo i rozkład normalny cd. Michał Daszykowski, Ivana Stanimirova Instytut Chemii Uniwersytet Śląski w Katowicach Ul. Szkolna 9 40-006 Katowice E-mail: www: mdaszyk@us.edu.pl istanimi@us.edu.pl

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

Psychometria. Psychometria. Co wyniki testu mówią nam o samym teście? Co wyniki testu mówią nam o samym teście?

Psychometria. Psychometria. Co wyniki testu mówią nam o samym teście? Co wyniki testu mówią nam o samym teście? Psychometria Co wyniki mówią nam o samym teście? C. Właściwości sychometryczne ozycji testowych. W7 dr Łukasz Michalczyk związkie ozycji testowych z testem ojmowanym jako całość Test jako narzędzie obejmuje

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA Opis zakładanych efektów kształcenia na studiach podyplomowych Nazwa studiów: BIOSTATYSTYKA PRAKTYCZNE ASPEKTY STATYSTYKI W BADANIACH MEDYCZNYCH Typ studiów: doskonalące Symbol Efekty kształcenia dla studiów

Bardziej szczegółowo

Hipotezy statystyczne

Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej próbki losowej. Hipotezy

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby

Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby 1. Wstęp teoretyczny Prezentowane badanie dotyczy analizy wyników uzyskanych podczas badania grupy rodziców pod kątem wpływu ich przekonań

Bardziej szczegółowo

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na

Bardziej szczegółowo

Wykład 9 Wnioskowanie o średnich

Wykład 9 Wnioskowanie o średnich Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie

Bardziej szczegółowo