Wybór optymalnej liczby składowych w analizie czynnikowej Test Równolegości Horn a i test MAP Velicera

Podobne dokumenty
Analiza składowych głównych. Wprowadzenie

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

Zadanie 1. Za pomocą analizy rzetelności skali i wspólczynnika Alfa- Cronbacha ustalić, czy pytania ankiety stanowią jednorodny zbiór.

Kurs ZDAJ MATURĘ Z MATEMATYKI MODUŁ 5 Zadania funkcje cz.1

3. Analiza własności szeregu czasowego i wybór typu modelu

Analiza autokorelacji

Kolejna z analiz wielozmiennowych Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki

Szukanie struktury skali mierzącej problematyczne zachowania finansowe.

Elementy statystyki wielowymiarowej

Analiza głównych składowych- redukcja wymiaru, wykł. 12

Matematyka licea ogólnokształcące, technika

Metodologia badań psychologicznych. Wykład 12. Korelacje

Naszym zadaniem jest rozpatrzenie związków między wierszami macierzy reprezentującej poziomy ekspresji poszczególnych genów.

ANALIZA CZYNNIKOWA Przykład 1

INFORMATYKA W SELEKCJI

KORELACJE I REGRESJA LINIOWA

Projekt Sieci neuronowe

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Badanie normalności rozkładu

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin. Henryk Bujak

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1

Prawdopodobieństwo i statystyka

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

I. Oprogramowanie sieciowe do prowadzenia analiz statystycznych wyników badań naukowych

Metody Statystyczne. Metody Statystyczne

Ćwiczenia IV

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Statystyka i eksploracja danych

Zmienne zależne i niezależne

Próbny egzamin z matematyki dla uczniów klas II LO i III Technikum. w roku szkolnym 2012/2013

Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2

STATYSTYKA MATEMATYCZNA

PROGNOZOWANIE PRZYCHODÓW ZE SPRZEDAŻY

Rok akademicki: 2012/2013 Kod: JFM s Punkty ECTS: 3. Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

R-PEARSONA Zależność liniowa

LUBELSKA PRÓBA PRZED MATURĄ 09 MARCA Kartoteka testu. Maksymalna liczba punktów. Nr zad. Matematyka dla klasy 3 poziom podstawowy

Rozkład materiału nauczania

Ekonometria. Zajęcia

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

ROZKŁAD MATERIAŁU NAUCZANIA KLASA 1, ZAKRES PODSTAWOWY

Wprowadzenie do analizy korelacji i regresji

Straty sieciowe a opłaty dystrybucyjne

Elżbieta Jasińska Katedra Informacji o Terenie, Akademia Górniczo-Hutnicza w Krakowie

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

STATYSTYKA MATEMATYCZNA

OGŁOSZENIE O ZAMÓWIENIU nr 1/2013 (POWYŻEJ 14 tys. EURO)

Dopasowywanie modelu do danych

Ćwiczenia nr 4. Arkusz kalkulacyjny i programy do obliczeń statystycznych

Zestaw A-1: Organizacja plików: Oddajemy tylko źródła programów (pliki o rozszerzeniach.adb i.ads)!!! Zad. 1: 4,3,3 2,2,1 Zad. 2: 3,3,3 Zad.

Idea. Analiza składowych głównych Analiza czynnikowa Skalowanie wielowymiarowe Analiza korespondencji Wykresy obrazkowe.

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

Program MC. Obliczyć radialną funkcję korelacji. Zrobić jej wykres. Odczytać z wykresu wartość radialnej funkcji korelacji w punkcie r=

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VIII: Analiza kanoniczna

Wykład 3 Hipotezy statystyczne

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną

Prognozowanie cen surowców w rolnych na podstawie szeregów w czasowych - uwarunkowania i metody. Sylwia Grudkowska NBP Mariusz Hamulczuk IERIGś-PIB

Monitorowanie i Diagnostyka w Systemach Sterowania na studiach II stopnia specjalności: Systemy Sterowania i Podejmowania Decyzji

7.4 Automatyczne stawianie prognoz

Metody i analiza danych

Wydział Matematyki. Testy zgodności. Wykład 03

KLASA III LO Poziom podstawowy (wrzesień/październik)

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version

Regresja logistyczna (LOGISTIC)

Analiza współzależności zjawisk

Wymagania edukacyjne z matematyki w XVIII Liceum Ogólnokształcącym w Krakowie, zakres podstawowy. Klasa druga.

Zjawisko dopasowania w sytuacji komunikacyjnej. Patrycja Świeczkowska Michał Woźny

Ruch jednostajnie przyspieszony wyznaczenie przyspieszenia

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ

SPIS TREŚCI WSTĘP LICZBY RZECZYWISTE 2. WYRAŻENIA ALGEBRAICZNE 3. RÓWNANIA I NIERÓWNOŚCI

Algorytmy genetyczne w interpolacji wielomianowej

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

1. Napisz program, który wyświetli Twoje dane jako napis Witaj, Imię Nazwisko. 2. Napisz program, który wyświetli wizytówkę postaci:

Sterowanie wielkością zamówienia w Excelu - cz. 3

SPIS TREŚCI. Do Czytelnika... 7

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Metody podziału kosztów na zmienne i stałe

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

KLASYFIKACJA. Słownik języka polskiego

CELE ANALIZY CZYNNIKOWEJ

Analiza Statystyczna

ROZKŁAD MATERIAŁU DO II KLASY LICEUM (ZAKRES ROZSZERZONY) A WYMAGANIA PODSTAWY PROGRAMOWEJ.

WYKRESY SPORZĄDZANE W UKŁADZIE WSPÓŁRZĘDNYCH:

Wprowadzenie Model ARMA Sezonowość Prognozowanie Model regresji z błędami ARMA. Modele ARMA

STATYSTYKA MATEMATYCZNA, LISTA 3

Zasady rzetelnego pomiaru efektywności transferu wiedzy w e-learningu akademickim

Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa. Diagnostyka i niezawodność robotów

Stosowana Analiza Regresji

MODELE LINIOWE. Dr Wioleta Drobik

Funkcje IV. Wymagania egzaminacyjne:

Spacery losowe generowanie realizacji procesu losowego

Definicje PN ISO Definicje PN ISO 3951 interpretacja Zastosowanie normy PN-ISO 3951:1997

Dostawa oprogramowania. Nr sprawy: ZP /15

Transkrypt:

Wybór optymalnej liczby składowych w analizie czynnikowej Test Równolegości Horn a i test MAP Velicera Wielu badaczy podejmuje decyzje o optymalnej liczbie składowych do wyodrębnienia na podstawie arbitralnych metod: kryterium Kaisera lub wykres osypiska. Obie metody są dostępne w większości spośród dostępnych pakietów statystycznych, Niestety obie metody przeceniają bądź niedoszacowują optymalnej liczby składowych (Zwick & Velicer, 1986). Nie zawsze też podparcie wyników o wykres osypiska jednoznacznie wskazuje na sposób interpretacji wyników, także wśród ekspertów (Crawford & Koopman, 1979; Streiner, 1998). Analiza Równoległości Horn a oraz test MAP Velicera pozwalają w bardziej dokładny sposób na zbadanie optymalnej liczby składowych do wyodrębnienia. Test MAP oparty jest na średnich wartościach korelacji cząstkowych pomiędzy zmiennymi kolejno usuwanymi z wpływu czynników. Składowa z najwyższą wartością własną (eigenvalue) jest usuwana jako pierwsza i jego wpływ na zależność miedzy itemami jest wyłączony. Następnie, z drugim czynnikiem tez z największą wartością własną jest usuwany itp. W każdym kroku, obliczany jest kwadrat średniej korelacji cząstkowej pomiędzy itemami, którego wartość początkowo maleje, lecz po kilku krokach zaczyna wzrastać. Krok, w którym uzyskano najniższą wartość kwadratu średniej korelacji cząstkowej określa zalecaną liczbą składowych do wyodrębnienia. Test Równoległości (PA) Horn a jest niejako adaptacją kryterium Kaisera, która dodatkowo wykorzystuje informacje z próbek losowych. Głównym założeniem testu jest to, że liczba czynników pochodzących z rzeczywistych danych powinna mieć większe wartości własne od tych pochodzących z losowych danych o tej samej wielkości próby i liczby zmiennych. W pierwszym kroku PA, generowanych jest około tysiąca losowych zbiorów danych o tej samej liczbie obserwacji i liczbie zmiennych jak w dostępnym zbiorze danych. Następnie wykonywana jest analiza czynnikowa dla każdego z dostępnych zbiorów danych (wyliczane są wartości eigenvalue). Na kolejnym etapie wyliczany jest 95. Percentyl dla największej drugiej, trzeciej itp. wartości własnej

w danym zbiorze danych. Wówczas możliwe jest porównanie wartości własne z oryginalnego zestawu danych i 95. Percentyla wartości własnych pochodzących z losowych danych. Wyodrębmiany tyle czynników, gdzie wartości własne z rzeczywistych danych są większe od wartości własnych pochodzących z losowych danych. Analiza w SPSS Obie analizy możliwe są do przeprowadzenia w nowym okienku dialogowym dostępnym do pobrania ze strony: www.bedynska.com.pl. W jedno okienko dialogowe zautomatyzowano makra dostępne w artykule Briana P. O Connor a SPSS and SAS programs for determining the numer of components using paralel analysis and Velicer s MAP test (2000). Po zainstalowaniu okienka dialogowego analiza -> redukcja wymiarów -> MAP i Parallel. analizę znajdziemy przechodząc w Następnie przerzucamy zmienne niezbędne do wykonania analizy; ustalamy specyfikację dla testu Równoległości (Parallel) i klikamy ok.

Wydruk dla analizy MAP W powyższym przykładzie, optymalna liczba komponentów (składowych) to wyodrębnienia to 3.

Wydruk dla analizy równoległości (Parallel) Na wydruku widoczne są wartości dla losowych zbiorów danych. Następnie za pomocą prostego wykresu liniowego, gdzie na osi X umieszczamy poszczególne itemy, natomiast na osi Y na oddzielnych liniach wartości własne dla danych rzeczywistych i losowych decydujemy o liczbie składowych do wyodrębnienia. W naszym przykładzie, optymalna liczba czynników do wyodrębnienia to 3.

wartość własna 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 item dane rzeczywiste dane losowe