Kolejna z analiz wielozmiennowych Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki



Podobne dokumenty
Zadanie 1. Za pomocą analizy rzetelności skali i wspólczynnika Alfa- Cronbacha ustalić, czy pytania ankiety stanowią jednorodny zbiór.

ANALIZY WIELOZMIENNOWE

Szukanie struktury skali mierzącej problematyczne zachowania finansowe.

ANALIZY WIELOZMIENNOWE

Analiza składowych głównych. Wprowadzenie

Zmienne zależne i niezależne

Szukanie struktury skali mierzącej problematyczne zachowania finansowe.

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VIII: Analiza kanoniczna

Zasady rzetelnego pomiaru efektywności transferu wiedzy w e-learningu akademickim

KORELACJE I REGRESJA LINIOWA

ANALIZA CZYNNIKOWA Przykład 1

08. Normalizacja wyników testu

CELE ANALIZY CZYNNIKOWEJ

(x j x)(y j ȳ) r xy =

10. Podstawowe wskaźniki psychometryczne

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

Prawdopodobieństwo i statystyka

Analiza składowych głównych

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice

Analiza głównych składowych- redukcja wymiaru, wykł. 12

Testy nieparametryczne

Kontekstowe wskaźniki efektywności nauczania - warsztaty

Zajęcia 1. Rzetelność

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Rozkłady statystyk z próby

Statystyka i eksploracja danych

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Elementy statystyki wielowymiarowej

Kolokwium ze statystyki matematycznej

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

MODELE LINIOWE. Dr Wioleta Drobik

Egzamin ze Statystyki, Studia Licencjackie Stacjonarne czerwiec 2007 Temat A

ANALIZA CZYNNIKOWA W BADANIACH STRUKTURY RELACJI W MARKETINGU RELACYJNYM

Własności statystyczne regresji liniowej. Wykład 4

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Ekonometria. Zajęcia

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

1. Eliminuje się ze zbioru potencjalnych zmiennych te zmienne dla których korelacja ze zmienną objaśnianą jest mniejsza od krytycznej:

Dwuczynnikowa ANOVA dla prób niezależnych w schemacie 2x2

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Psychometria. norma (wg Słownika Języka Polskiego) NORMY. Co testy mówią nam o właściwościach osób badanych?

Analiza korespondencji

Stosowana Analiza Regresji

Liczba zadań a rzetelność testu na przykładzie testów biegłości językowej z języka angielskiego

Psychometria PLAN NAJBLIŻSZYCH WYKŁADÓW. Co wyniki testu mówią nam o samym teście? A. Rzetelność pomiaru testem. TEN SLAJD JUŻ ZNAMY

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

Rozkład materiału nauczania

Spis treści. LaboratoriumV: Podstawy korelacji i regresji. Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych

Wprowadzenie (1) Przedmiotem analizy czynnikowej jest badanie wewnętrznych zależności w zbiorze zmiennych. Jest to modelowanie niejawne. Oprócz zmienn

Analiza współzależności zjawisk

Idea. Analiza składowych głównych Analiza czynnikowa Skalowanie wielowymiarowe Analiza korespondencji Wykresy obrazkowe.

ZASTOSOWANIE ANALIZY GŁÓWNYCH SKŁADOWYCH W EWALUACJI SKALI POMIARU UŻYTECZNOŚCI SERWISU INTERNETOWEGO

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

Metodologia badań psychologicznych. Wykład 12. Korelacje

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

metoda momentów, Wartość oczekiwana (pierwszy moment) dla zmiennej o rozkładzie γ(α, λ) to E(X) = αλ, drugi moment (wariancja) to

Egzamin ze statystyki, Studia Licencjackie Stacjonarne. TEMAT C grupa 1 Czerwiec 2007

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak

Czy egzaminy zewnętrzne mogą pomóc szkole w rozwoju? Ewa Stożek Sulejówek, czerwiec 2013

Regresja logistyczna (LOGISTIC)

R-PEARSONA Zależność liniowa

Spis treści 3 SPIS TREŚCI

Analiza składowych głównych idea

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Budowanie macierzy danych geograficznych Procedura normalizacji Budowanie wskaźnika syntetycznego

RAPORT WSKAŹNIK EDUKACYJNEJ WARTOŚCI DODANEJ PO EGZAMINIE GIMNAZJALNYM W ROKU SZKOLNYM 2012/2013

ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA. dr inż. Aleksander Astel

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Badanie zależności skala nominalna

ANALIZA REGRESJI WIELOKROTNEJ. Zastosowanie statystyki w bioinżynierii Ćwiczenia 8

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Rozdział 8. Regresja. Definiowanie modelu

Wprowadzenie do analizy korelacji i regresji

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Ważne rozkłady i twierdzenia

STATYSTYKA Statistics. Inżynieria Środowiska. II stopień ogólnoakademicki

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Analiza Współzależności

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Metody Ilościowe w Socjologii

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Graficzna prezentacja danych statystycznych

Podstawowe definicje statystyczne

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Transkrypt:

Analiza czynnikowa Kolejna z analiz wielozmiennowych Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki Budowa wskaźnika Indeks był banalny I miał wady: o Czy wszystkie podpytania były ze sobą połączone merytorycznie i statystycznie? o Czy wszystkie podpytania mierzyły tak naprawdę to samo? o Czy wszystkie podpytania były jednakowo ważne dla wskaźnika? Analiza czynnikowa jest bardziej skomplikowana, ale eliminuje ww. problemy Jest kilka metod określania liczby czynników; najpopularniejsze: Metoda Kaisera o przyjmuje istnienie tylu czynników, ile czynników ma wartość własną większą niż 1 o wartość własna określa procent wyjaśnianych przez dany czynnik wariancji o jeśli czynnik nie wyjaśnia więcej wariancji niż pojedyncza zmienna to nie ma sensu metoda Catella o z wykresem osypiska o wyszukuje się punkt reprezentujący czynnik, za którym kończy się stromizna o zlicza się czynniki powyżej tego punktu tyle ich właśnie trzeba wyodrębnić!!! korzystamy tu także z metody głównych składowych o Tylko ona pozwala uzyskać takie czynniki, które będą wyjaśniały maksymalny procent wariancji wyjściowych zmiennych Jest kilka metod obliczania ładunków czynnikowych metoda osi głównych o rekomendowana o stara się zmaksymalizować powiązania pomiędzy czynnikami a stwierdzeniami skali o nie wymaga rozkładu normalnego metoda największej wiarygodności o wymaga rozkładu normalnego o podaje poziom istotności różnicy między strukturą idealną (modelową) w strukturą uzyskaną w badaniu Rotacja by zwiększyć dopasowanie rotacje ortogonalne o najpopularniejsza: Varimax o zakładamy brak korelacji między czynnikami o przydaje się, gdy przygotowujemy predyktory dla regresji rotacje nieortogonalne (ukośne) o najpopularniejsza: Oblimin o zakładamy pewien stopień skorelowania czynników o pokaże nam też, jeśli tej korelacji nie będzie Analizę możemy prowadzić na danych surowych -> macierz korelacji danych zestandaryzowanych -> macierz kowariancji [standaryzacja: Analiza -> opis statystyczny -> statystyki opisowe -> zapisz standaryzowane wartości jako zmienne ]

Przy wyborze zmiennych trzeba uważać na: związki merytoryczne kierunek pytania braki odpowiedzi R11b Zbyt ufamy nauce, za mało R11c Religia-więcej konfliktów niż 1 zdec. zgoda, 5 zdec. niezgoda -> rośnie zaufanie R11d Osoby religijne często zbyt 1 zdec. zgoda, 5 zdec. niezgoda -> rośnie zaufanie R19a zajmuje się osobiście R19c R34a Religia sprzyja odnalezieniu wewnętrznego R34b Religia sprzyja zawieraniu przyjaźni R34c Religia sprzyja R34d Religia sprzyja spotykaniu właściwych ludzi Kontrola braków danych Odwrócenie R11c i R11d Analiza -> redukcja wymiarów -> analiza czynnikowa Zmienne -> wszystkie brane pod uwagę zmienne Statystyki o Statystyki opisowe o Rozwiązania wstępne o K-M-O Wyodrębnianie o Domyślne głównych składowych o Macierz korelacji, bo mamy dane surowe o Pokaż nierotowane rozwiązania czynnikowe o Wyodrębnianie na podstawie wartości własnej większe niż 1 Rotacja o Wersja pierwsza: Varimax o Wersja druga: Oblimin Opcje o Sortuj wg wartości ładunków czynnikowych o Ukryj małe współczynniki (wartość bezwzględna poniżej 0,4)

Interpretacja tabel: a) Całkowita wyjaśniona wariancja Skład Początkowe wartości własne Sumy kwadratów ładunków po Sumy kwadratów ładunków po rotacji owa wyodrębnieniu Ogółem % % Ogółem % wariancji % Ogółem % wariancji % wariancji skumulowa skumulowa skumulowany ny ny 1 3,736 41,514 41,514 3,736 41,514 41,514 2,788 30,983 30,983 2 1,353 15,033 56,547 1,353 15,033 56,547 1,802 20,020 51,002 3 1,083 12,028 68,576 1,083 12,028 68,576 1,582 17,573 68,576 4,778 8,639 77,215 5,685 7,609 84,824 6,485 5,386 90,210 7,402 4,462 94,671 8,286 3,183 97,854 9,193 2,146 100,000 Metoda wyodrębniania czynników głównych składowych. b) Wartość własna powyżej 1 to 3 czynniki Wyjaśniają w sumie (po rotacji) 68,6% wariancji (czyli 2/3 przypadków) to sporo Macierz składowych a Składowa 1 2 3 spotykaniu właściwych ludzi,811 zawieraniu przyjaźni,774 odnalezieniu wewnętrznego,749,719 zajmuje się osobiście,680,653,482 Osoby religijne często zbyt,744 Religia-więcej konfliktów niż,412,696 Zbyt ufamy nauce, za mało,435,653 Metoda wyodrębniania czynników - Głównych składowych. a. 3 liczba wyodrębnionych składowych.

Nie rotowana macierz składowych Pomijamy c) Macierz rotowanych składowych a Składowa 1 2 3,846 odnalezieniu wewnętrznego,831 spotykaniu właściwych ludzi,766 zawieraniu przyjaźni,763 Zbyt ufamy nauce, za mało zajmuje się osobiście Religia-więcej konfliktów niż Osoby religijne często zbyt,779,763,610,862,834 Metoda wyodrębniania czynników - Głównych składowych. Metoda rotacji - Varimax z normalizacją Kaisera. a. Rotacja osiągnęła zbieżność w 4 iteracjach. d) Rotowana macierz Pokazuje, co ładuje każdy czynnik Czy można te czynniki nazwać? Testy Kaisera-Mayera-Olkina i Bartletta Miara KMO adekwatności doboru próby,768 Przybliżone chi-kwadrat 3352,786 Test sferyczności Bartletta df 36 Istotność,000 Test istotny (p<0,05) pokazuje, że między zmiennymi są istotne współczynniki korelacji Miara większa nić 0,5 wskazuje na dobre własności danych, a im bliżej 1 tym lepiej

e) Zasoby zmienności wspólnej Początkowe Po wyodrębnieniu Zbyt ufamy nauce, za mało 1,000,615 Religia-więcej konfliktów niż 1,000,768 Osoby religijne często zbyt 1,000,727 zajmuje się osobiście 1,000,567 1,000,678 odnalezieniu wewnętrznego 1,000,714 zawieraniu przyjaźni 1,000,671 1,000,724 spotykaniu właściwych ludzi 1,000,708 Metoda wyodrębniania czynników głównych składowych. Określa ile procent wariancji zmiennej wyjściowej udało się odtworzyć w nowo powstałych czynnikach Im wyższa -> tym lepiej zmienna wpisuje się w czynnik To samo dla rotacji Oblimin a) Całkowita wyjaśniona wariancja b) Macierz składowa bez rotacji c) Macierz modelowa po rotacji, pokazuje czynniki Macierz modelowa a Składowa 1 2 3,894 odnalezieniu wewnętrznego,862 zawieraniu przyjaźni,759 spotykaniu właściwych ludzi,750 Religia-więcej konfliktów niż,876

Osoby religijne często zbyt Zbyt ufamy nauce, za mało zajmuje się osobiście,850,823,745,553 Metoda wyodrębniania czynników - Głównych składowych. Metoda rotacji - Oblimin z normalizacją Kaisera. a. Rotacja osiągnęła zbieżność w 5 iteracjach. d) Macierz korelacji składowych Składowa 1 2 3 1 1,000,261,380 2,261 1,000,210 3,380,210 1,000 Metoda wyodrębniania czynników - Głównych składowych. Metoda rotacji - Oblimin z normalizacją Kaisera. Korelacje pomiędzy czynnikami Pokazuje, że to lepsza rotacja, bo korelacje są całkiem całkiem e) Test K-M-O f) Zasób zmienności wspólnej Aby utworzyć wskaźnik a) Można postępować jak w przypadku indeksu, ale dodając teraz do siebie tylko składowe danego czynnika b) Albo wykorzystać opcję automatycznego tworzenia wskaźnika o Która uwzględnia, że poszczególne zmienne nie ładują czynnika w takim samym stopniu Oceny -> zapisz jako zmienne -> metoda Anderson-Rubin Na końcu bazy nowe zmienne Są wystandaryzowane do rozkładu normalnego Wartości należy interpretować w kategoriach odległości od średniej (o ile części odchylenia standardowego w obie strony) Ujemne niski wynik na skali Okolice zera przeciętny Dodatni wysoki wynik na skali Zapisany w ten sposób wskaźnik można wykorzystać przy innych analizach jako zmienną

Analiza rzetelności Wiemy, że pyt re34 w całości utworzyło jeden czynnik, jest więc dobrym materiałem na wskaźnik (skalę) O tym, jak bardzo dobra jest to skala mówi nam analiza rzetelności Analiza -> skalowanie -> analiza rzetelności Statystyki o Pozycja testowa o Skala przy wykluczeniu Statystyki rzetelności Alfa Cronbacha Liczba pozycji,851 4 Min 0,5 0,7 i wyżej skala jest rzetelna Statystyki pozycji Ogółem Średnia skali po Wariancja skali Korelacja Alfa Cronbacha usunięciu po usunięciu pozycji Ogółem po usunięciu pozycji pozycji pozycji odnalezieniu wewnętrznego 6,99 5,748,662,824 zawieraniu przyjaźni 6,46 4,818,721,798 7,01 5,705,663,823 spotykaniu właściwych ludzi 6,43 4,712,737,791 Czy dałoby się jeszcze poprawić rzetelność skali? Analiza czynnikowa a analiza rzetelności Można je wykonywać w dowolnej kolejności Jeśli najpierw czynnikowa, to rzetelności potem nas tylko upewnia Jeśli najpierw rzetelności, to czynnikowa może pokazać, czy nie ma podskal Dla re18 Trudno powiedzieć -> jako środek skali Analiza rzetelności Analiza czynnikowa z rotację oblimin Analiza rzetelności dla podskal