Dodatek 4 Przygotowanie analiz w programie Mplus

Podobne dokumenty
MODEL STRUKTURALNY RELACJI MIĘDZY SATYSFAKCJĄ

Ćwiczenia nr 2. Edycja tekstu (Microsoft Word)

Instrukcja korzystania ze skryptu kroswalidacja.py

Przykłady zastosowań funkcji tekstowych w arkuszu kalkulacyjnym

Importowanie danych z Excela

INFORMATYKA W SELEKCJI

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Systemy operacyjne. Laboratorium 9. Perl wyrażenia regularne. Jarosław Rudy Politechnika Wrocławska 28 lutego 2017

WYKORZYSTANIE ANALIZY WIELOGRUPOWEJ DO PORÓWNANIA RYNKU PRACY W REGIONACH

Struktura pliku wejściowego ipko biznes przelewy zagraniczne (MT103 / CSV)

WYDZIAŁ ELEKTROTECHNIKI, AUTOMATYKI I INFORMATYKI INSTYTUT AUTOMATYKI I INFORMATYKI KIERUNEK AUTOMATYKA I ROBOTYKA STUDIA STACJONARNE I STOPNIA

wykorzystywane podczas zajęć wykład, ćwiczenia, Konwersatorium

Struktura pliku wejściowego ippk Plik Dyspozycje

Instrukcja dotycząca konwersji dokumentów LaTeX do plików w formacie RTF

Wgrywanie danych z plików excela do bazy MS SQL 2008 server

Wprowadzania liczb. Aby uniknąć wprowadzania ułamka jako daty, należy poprzedzać ułamki cyfrą 0 (zero); np.: wpisać 0 1/2

Struktura pliku wejściowego ippk Plik Składkowy

Struktura pliku wejściowego ippk Plik Dyspozycje

Stałe, znaki, łańcuchy znaków, wejście i wyjście sformatowane

Struktura pliku wejściowego ippk Plik Dyspozycje

Struktura pliku wejściowego ipko biznes ELIXIR - O

Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica

Komunikacja sterownika PLC Fatek jako master w protokole ModBus RTU

Zastosowanie Analizy Czynnikowej i modelowania IRT w opracowaniu skal pomiarowych, na przykładzie skali nauczanie pod egzamin

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Trochę o plikach wsadowych (Windows)

Spis treści OPIS PLIKU W FORMACIE CSV Z DANYMI PPE LUB EP 1

Symfonia Finanse i Księgowość

WellCommerce Poradnik: Dodawanie języka i waluty. autor: Adrian Potępa (biuro@eclairsoaware.pl)

1. Przypisy, indeks i spisy.

Specyfikacja pliku do importu danych sprawozdania Z-12 za 2014 rok

Podręcznik użytkownika Wprowadzający aplikacji Wykaz2

29. Poprawność składniowa i strukturalna dokumentu XML

IBM SPSS Statistics - Essentials for R: Instrukcje instalacji dla System Mac OS

Tytuły Wykonawcze. Opis systemu tworzenia dokumentacji TW-1

Przypomnienie: Ćwiczenie 1.

1 Podstawy c++ w pigułce.

Podręcznik użytkownika Publikujący aplikacji Wykaz2

Struktura pliku wejściowego ippk Plik Korekt Składek

Struktura pliku wejściowego ippk Plik Rejestracyjny

Organizacja edytora danych

Laboratorium WDEC. Opis posługiwania się pakietem AMPL

Instrukcja dotycząca konwersji dokumentów LaTeX do plików w formacie RTF

Wyrażenie include(sciezka_do_pliku) pozwala na załadowanie (wnętrza) pliku do skryptu php. Plik ten może zawierać wszystko, co może się znaleźć w

2 Zarówno zanonimizowany zbiór danych ilościowych, jak i opis jego struktury powinny mieć format csv:

Zmienne powłoki. Wywołanie wartości następuje poprzez umieszczenie przed nazwą zmiennej znaku dolara ($ZMIENNA), np. ZMIENNA=wartosc.

Technologie Informacyjne - Linux 2

Tematy lekcji informatyki klasa 4a luty/marzec 2013

Wielowymiarowa Analiza Korespondencji. Wielowymiarowa Analiza Danych z wykorzystaniem pakietu SPSS. Joanna Ciecieląg, Marek Pęczkowski WNE UW

ANALIZA DANYCH PIERWOTNYCH mgr Małgorzata Kromka

Tom 6 Opis oprogramowania

Make jest programem komputerowym automatyzującym proces kompilacji programów, na które składa się wiele zależnych od siebie plików.

Wprowadzenie do programowania w języku Visual Basic. Podstawowe instrukcje języka

Struktura pliku wejściowego ipko biznes ELIXIR-O

AKADEMIA MORSKA W SZCZECINIE WI-ET / IIT / ZTT. Instrukcja do zajęc laboratoryjnych nr 1 AUTOMATYZACJA I ROBOTYZACJA PROCESÓW PRODUKCYJNYCH

Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0

Stochastyczne Metody Analizy Danych. PROJEKT: Analiza kluczowych parametrów turbin wiatrowych

IBM SPSS Statistics - Essentials for R: Instrukcje instalacji dla Windows

Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa. Diagnostyka i niezawodność robotów

Pakiety i interfejsy. Tomasz Borzyszkowski

Zadanie 8. Dołączanie obiektów

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Tom 6 Opis oprogramowania

Budowa i oprogramowanie komputerowych systemów sterowania. Laboratorium 4. Metody wymiany danych w systemach automatyki DDE

Specyfikacja pliku importu danych sprawozdania Z-12 za 2010 rok

KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański

Instrukcja obsługi. Generatora CSV

XML i nowoczesne technologie zarządzania treścią 2007/08

Windows XP Wiersz polecenia

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

etrader Pekao Podręcznik użytkownika Strumieniowanie Excel

Metody numeryczne Technika obliczeniowa i symulacyjna Sem. 2, EiT, 2014/2015

Programowanie w języku Python. Grażyna Koba

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Języki skryptowe w programie Plans

Wielogrupowy Model IRT Analizy Symulacyjne

PRZYKŁADOWY TEST EGZAMINACYJNY

S88 Badanie rzutu kostką sześcienną

Wstęp do programowania INP003203L rok akademicki 2018/19 semestr zimowy. Laboratorium 2. Karol Tarnowski A-1 p.

I. Oprogramowanie sieciowe do prowadzenia analiz statystycznych wyników badań naukowych

Użycie Visual Basic for Applications ("VBA")

Tom 6 Opis oprogramowania Część 8 Narzędzie do kontroli danych elementarnych, danych wynikowych oraz kontroli obmiaru do celów fakturowania

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Obliczenia inżynierskie arkusz kalkulacyjny. Technologie informacyjne

Temat 1. Więcej o opracowywaniu tekstu

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Układy VLSI Bramki 1.0

SZYBKI START. Tworzenie nowego połączenia w celu zaszyfrowania/odszyfrowania danych lub tekstu 2. Szyfrowanie/odszyfrowanie danych 4

Systemy liczbowe używane w technice komputerowej

Administracja sieciowymi systemami operacyjnymi III Klasa - Linux

wersja 1.0 ośrodek komputerowy uj cm ul. mikołaja kopernika 7e, Kraków tel

Skrypty powłoki Skrypty Najcz ciej u ywane polecenia w skryptach:

Sage Symfonia Finanse i Księgowość

Pracownia Informatyczna Instytut Technologii Mechanicznej Wydział Inżynierii Mechanicznej i Mechatroniki. Podstawy Informatyki i algorytmizacji

Problemy techniczne. 3. Udostępnić folder nadrzędny do folderu z danymi (czyli folder Finanse Optivum) operatorom programu na końcówkach roboczych.

L E X. Generator analizatorów leksykalnych

Analiza najczęstszych błędów w sprawozdawanych danych

ĆWICZENIE 1 SKŁAD TEKSTU DO DRUKU

Pliki. Operacje na plikach w Pascalu

Transkrypt:

Dodatek 4 Przygotowanie analiz w programie Mplus Paweł Grygiel, Instytut Badań Edukacyjnych Grzegorz Humenny, Instytut Badań Edukacyjnych W tej części zostaną omówione podstawowe informacje związane z przygotowywaniem danych i ich modelowaniem w Mplusie, w tym modeli wykorzystanych między innymi w rozdziale 21. Przybliżymy historię powstania tego programu, a następnie omówimy podstawowe zasady związane z przygotowaniem plików do analiz. Skupimy się na wyjaśnieniu budowy pliku poleceń oraz podstaw składni języka Mplus. W ostatniej części przedstawimy przykładowe pliki poleceń i krótko je skomentujemy. D 4.1. Mplus historia i teraźniejszość W drugiej połowie ubiegłego stulecia powstało wiele programów komputerowych, służących do analiz równań strukturalnych (structural equation modeling, SEM). Do najpopularniejszych można zaliczyć: Lisrel, Amos, EQS, Lavaan czy Mplus. Ostatni z wymienionych cieszy się obecnie największą popularnością. O jego znaczącej roli świadczy choćby fakt, że w 2014 roku w abstraktach lub słowach kluczowych artykułów publikowanych na łamach kwartalnika Structural Equation Modeling pojawiło się osiem odwołań do Mplusa (po raz pierwszy w 2000 roku). Dodajmy, że dominujący w latach dziewięćdziesiątych program Lisrel w tym samym roku przywołano w ten sposób tylko raz (w 1995 roku aż cztery razy) 1. Bezpośrednim poprzednikiem pakietu Mplus był tworzony od 1987 roku program Liscomp (Muthén, 1988), w którym Bengt Muthén po raz pierwszy zastosował sformułowany przez siebie ogólny model równań strukturalnych oraz procedury szacowania modeli jednocześnie dla zmiennych dychotomicznych, porządkowych i ciągłych, a także modele wielogrupowe (Muthén, 1984). Pod koniec lat osiemdziesiątych Liscomp był intensywnie rozwijany przez autora (1989a; 1989b; 1990). Ważnym i na ówczesne czasy nowatorskim rozwiązaniem wprowadzonym w pakiecie była trzystopniowa procedura uzyskiwania oszacowań parametrów, błędów standardowych oraz statystyk dopasowania modelu, oparta na teście chi-kwadrat (Muthén i Satorra, 1995). 1 Nie oznacza to oczywiście, że jedynie w ośmiu analizach przedstawionych na łamach Structural Equation Modeling w 2014 roku wykorzystano omawiany pakiet. Z pewnością było ich więcej. Na oficjalnej stronie Mplusa co pewien czas pojawiają się informacje o liczbie artykułów publikowanych w Structural Equation Modeling a wykorzystujących do analiz statystycznych ten program. W naszym przykładzie wzięliśmy pod uwagę jedynie abstrakt i słowa kluczowe, określone w polu topic w bazie Web of Science. 472

Przygotowanie analiz w programie Mplus W 1998 roku została udostępniona pierwsza wersja programu Mplus. Obok funkcjonalności, które posiadał jego poprzednik, program umożliwiał definiowanie zmiennych ukrytych, zarówno ciągłych, jak i porządkowych. Dawał między innymi możliwość analizy modeli jedno- i dwupoziomowych dla zróżnicowanej liczby zmiennych zależnych z możliwością analizy braków danych. Umożliwiał prowadzenie eksploracyjnej i konfirmacyjnej analizy czynnikowej. Pozwalał też na prowadzenie analizy danych podłużnych z wykorzystaniem modeli wzrostu i analizy modeli efektów mieszanych z uwzględnieniem złożonych schematów doboru próby i powiązanych z nimi wag. Przewagą Mplusa od początku była elastyczność i unikatowe połączenie w jednym programie różnorodnych typów analiz zmiennych ukrytych na podstawie różnych typów zmiennych obserwowalnych (Heck, 2000). Współczesna popularność Mplusa wynika nie tylko z elastyczności (konstrukcja programu umożliwia dołączanie nowych algorytmów), lecz także z systematycznego rozwijania tego programu przez twórców. Nowe wersje zawierają najczęściej algorytmy niedostępne nigdzie indziej lub najbardziej obiecujące implementacje zapożyczone z innych pakietów statystycznych 2. Popularności Mplusowi dodaje także sprawnie moderowana lista dyskusyjna oraz dobre wsparcie techniczne. Przygotowując się do przeprowadzenia własnych analiz warto sięgnąć do kilku publikacji poświęconych modelowaniu za pomocą pakietu Mplus (np.: Byrne, 2011; Geiser, 2013; Kelloway, 2014; Muthén i Muthén, 2012 czy Wang i Wang, 2012). Przydatne informacje na temat możliwych do wykonania analiz statystycznych, można odnaleźć również na listach dyskusyjnych poświęconych modelom strukturalnym: SEMnet (https://listserv.ua.edu/archives/semnet.html) oraz Mplusowi jako takiemu (http://www.statmodel.com/cgi-bin/discus/discus.cgi). D 4.2. Przygotowanie plików z danymi W Mplusie najczęściej wykorzystuje się trzy rodzaje plików: (1) pliki poleceń o rozszerzeniu.inp; (2) pliki wynikowe o rozszerzeniu.out oraz (3) pliki z danymi z różnymi rozszerzeniami, w zależności od typu pliku np. dat, csv. Plik z danymi musi mieć format ASCII, może być w formacie fixed (o stałej szerokości) lub rozdzielany, np..csv. W pierwszym wierszu arkusza danych nie mogą znajdować się nazwy zmiennych. Dopuszczalne są jedynie zmienne numeryczne. Przykładowo, eksportując wyniki z pakietu SPSS, należy wybrać zakładki Zapisz dane jako polecenie Rozdzielany tabulatorami (*.dat) oraz Kodowanie lokalne, przy niezaznaczonej opcji Zapisz nazwy zmiennych do arkusza. Eksportując dane z Excela, należy w poleceniu Zapisz plik wybrać format: Zwykły tekst (MS_DOS) z rozszerzeniem.txt, lub tekst z formatowaniem (rozdzielany spacjami) z rozszerzeniem.prn. Jeżeli zmienne zawierają ułamki (np. wzrost 1,81 m) należy pamiętać, że 2 Przykładami są np.: model two-tier full-information item factor analysis, pierwotnie udostępniony przez Li Caia w pakiecie IRTpro (Cai, Thissen i Du Toit, 2011) oraz flexmirt (Cai, 2013), rotacja podwójnego czynnika wykorzystywana do analiz eksploracyjnych (Jennrich i Bentler, 2012) początkowo udostępniona w programie Matlab (2015) czy rotacja celowa (Browne, 1972a; 1972b) po raz pierwszy zastosowana w programie CEFA (Browne, Cudeck, Tateneni i Mels, 2008). 473

Modele cech ukrytych w badaniach edukacyjnych, psychologii i socjologii oznaczenie miejsc dziesiętnych następuje poprzez wstawienie kropki, a nie przecinka (powinno być więc: 1.81). Jeżeli nasze dane zawierają braki, należy wskazać programowi, jakiego symbolu używać będziemy na ich określenie. Mplus umożliwia oznaczanie braków danych na kilka sposobów: poprzez znak kropki (.), gwiazdki (*), jako puste miejsce ( ), czy wreszcie poprzez przypisanie im określonej wartości, na przykład 999. Z różnych względów preferowaną formą jest ostatnia z wymienionych. Należy oczywiście mieć na uwadze, aby użyta liczba nie powielała jakichkolwiek wartości, które mogłyby wystąpić w danych. W naszym przypadku wszystkie wartości 999 zostaną potraktowane jako braki danych. D 4.3. najważniejsze informacje związane z tworzeniem pliku poleceń w Mplusie Tabela D 4.1. Struktura pliku poleceń w Mplus. Główne części pliku poleceń TITLE DATA VARIABLE DEFINE ANALYSIS MODEL OUTPUT SAVEDATA PLOT MONTECARLO Opis Tytuł analizy. Informacje o pliku z danymi (zawsze obowiązkowe). Informacje na temat zmiennych znajdujących się w zbiorze danych (zawsze obowiązkowe). Przekształcenia istniejących zmiennych i tworzenie nowych zmiennych. Techniczne szczegóły analizy (m.in. wybór estymatora). Opis modelu, który ma być estymowany. Żądanie dodatkowych wyników. Zapisywanie wyników analiz np. wartości czynnikowych. Żądanie wykresów dla analizowanych zmiennych. Szczegóły analiz symulacyjnych. Należy zwrócić uwagę, że: Jedna linia poleceń nie może mieć więcej niż 90 znaków; Każda linia polecenia musi kończyć się średnikiem; Wielkość liter nie ma znaczenia; Nazwa zmiennej nie może mieć więcej niż osiem znaków. Nazwy dłuższe zostaną obcięte do tej długości; W jednym pliku poleceń może się znajdować tylko jeden model. Użyteczne rozwiązanie do generowania większej liczby podobnych syntaksów daje pakiet MplusAutomation R; Uruchomienie pojedynczego pliku poleceń wygeneruje jeden plik z wynikami; Komentarze w pliku poleceń rozpoczynają się od! (np.!to jest komentarz); W poleceniach sformułowania are, is oraz = są ekwiwalentne (np. rotation are wlsmv jest równoważne rotation = wlsmv). 474

Przygotowanie analiz w programie Mplus D 4.3.1. Część DATA W tym miejscu powinna znaleźć się przynajmniej nazwa pliku z danymi, wprowadzona poleceniem: FILE IS nazwa_pliku. W przypadku podania samej nazwy pliku, powinien się on znajdować w tym samym katalogu co plik poleceń. Jeśli dane znajdują się w innym katalogu, należy podać pełna ścieżkę dostępu do pliku z danymi. Przykład: data: file is Mydata.dat lub: data: file is F:\Mplus analyses\langexample\mydata.dat D 4.3.2. Część VARIABLE Następna część dotyczy określenia najważniejszych zmiennych i ich cech. Składa się z następujących części: VARIABLE: names are wskazuje nazwy wszystkich zmiennych znajdujących się w wejściowym pliku z danymi; usevariables are jest listą wszystkich zmiennych, które zostaną wykorzystane w modelu; missing are to sposób oznaczania braków danych w pliku z danymi wejściowymi (patrz Tabela D 4.2); categorical are to lista zmiennych, które mają charakter porządkowy (nie są ciągłe). Mplus umożliwia w przypadku niektórych typów analiz wykorzystywanie także zmiennych nominalnych (polecenie nominal are) i (lub) na przykład liczebności (polecenie count); cluster is w przypadku zmiennych, dla których gromadzone są informacje relacyjne, na przykład dzieci w ramach klas, należy wskazać zmienną, dzięki której możliwe jest przypisanie poszczególnych przypadków do tych grup. Tabela D 4.2. Podstawowe polecenia w części VARIABLE. Fragment pliku poleceń Opis names are klasa_id g1 g2 g3 g4 g5; Lista wszystkich zmiennych znajdujących się w bazie danych. usevariables are g1 g2 g3 g5; Lista zmiennych, które będą wykorzystane w danej analizie/ modelu. Zmienne niewymienione nie zostaną użyte w analizach. W naszym przypadku nie wykorzystujemy zmiennych klasa_id oraz g4. missing are all (-999); Kod dla braków dla wszystkich zmiennych (all) ustalony na wartość 999. categorical are g1 g2 g3 g5; Zmienne g1, g2, g3 oraz g5 traktowane jako porządkowe. Alternatywnie, zamiast wymieniać wszystkie zmienne jakościowe, wystarczy użyć polecenia all (tj. categorical are all) przez co wszystkie zmienne wymienione w poleceniu usevariables are zostaną potraktowane jako jakościowe. 475

Modele cech ukrytych w badaniach edukacyjnych, psychologii i socjologii D 4.3.3. Część ANALYSIS ANALYSIS umożliwia określenie technicznych aspektów związanych z prowadzonymi analizami. W przypadku analiz czynnikowych szczególnie przydatna może okazać się możliwość wyboru sposobu estymacji czynników oraz rotacji w przypadku eksploracyjnej analizy czynnikowej (EFA). Dla zmiennych jakościowych (wskazanych komendą categorical are ) Mplus domyślnie stosuje estymator WLSMV, który możemy zmienić, wpisując na przykład estimator is mlr, czyli zastępując domyślny estymator WLSMV estymatorem MLR lub innymi, dostępnymi w pakiecie. W części tej można również zażądać wykonania eksploracyjnej analizy czynnikowej, wykorzystując komendę type is efa (x y), gdzie x oznacza minimalną liczbę czynników, y zaś liczbę maksymalną. Na przykład polecenie: analysis: type is efa (1 4); spowoduje przeprowadzenie EFA dla rozwiązań z jednym, dwoma, trzema i czterema czynnikami osobno. Natomiast: analysis: type is efa (2 2); spowoduje przeprowadzenie EFA dla rozwiązania z dwoma czynnikami. W przypadku analiz eksploracyjnych zmiennych jakościowych domyślną metodą rotacji jest Geomin. Można ją zmienić, wpisując nazwę alternatywnej metody rotacji w poleceniu rotation is... (np. rotation is cf-equamax). Jeżeli nasze dane mają charakter wielopoziomowy, należy wziąć to pod uwagę i wpisać w części ANALYSIS: type is complex. Wprowadzenie tego polecenia zakłada, że w części VARIABLE poleceniem cluster is... określiliśmy zmienną, dzięki której możliwe będzie przypisanie poszczególnych przypadków do grup (np. przypisanie uczniów do klas). D 4.3.4. Część MODEL Specyfikacji modelu statystycznego dokonuje się w części MODEL. Możemy tu wyspecyfikować zarówno różne odmiany konfirmacyjnych modeli czynnikowych, analizy ścieżek czy (bardziej złożonych) modeli równań strukturalnych. W części tej wykorzystywane są następujące słowa kluczowe: on dla regresji zmiennej zależnej na zmienną niezależną np.: zależna on niezależna; by dla konfirmacyjnej analizy czynnikowej, w której czynnik mierzony jest poprzez zmienne obserwowalne, np.: czynnik by zmienna1 zmienna2 zmienna3; 476

Przygotowanie analiz w programie Mplus with dla korelacji/kowariancji zmiennych ze sobą, np.: zmienna1 with zmienna2; [x] do określenia średniej lub stałej zmiennej x, np.: [zmienna1]; x bez dodatkowych nawiasów do określenia wariancji zmiennej x, np.: zmienna1; * dla wartości początkowych; @ do przypisania konkretnych wartości, np.: czynnik@1;!określa wariancję czynnika na równą 1; (liczba) do określenia, które parametry mają byś sobie równie, np.: czynnik by zmienna1 zmienna2 zmienna3 (1);! wskazuje że wszystkie ładunki czynnikowe mają być sobie równe. Należy zwrócić uwagę, że w przypadku analizy czynnikowej Mplus domyślnie zakłada, że pierwsza zmienna, znajdująca się po znaku by będzie zmienną markerem, czyli jej ładunek czynnikowy zostanie ustalony na 1. Innymi słowy, brak jakiegokolwiek symbolu po pierwszej zmiennej wskazywał będzie Mplusowi, że zgadzamy się, aby ładunek czynnikowy tej właśnie zmiennej ustalił na 1 (moglibyśmy zrobić to samodzielnie, stosując polecenie: g1@1). W konsekwencji, w rozwiązaniu niestandaryzowanym wielkości ładunków czynnikowych pozostałych zmiennych odzwierciedlać będą relacje z tą właśnie zmienną. Wartości większe niż 1 świadczyć będą o tym, że dana zmienna bardziej ładuje czynnik niż marker, zaś wartości mniejsze niż 1, że ładuje ona mniej niż marker. Mplus jest oprogramowaniem elastycznym, umożliwiającym zmianę wielu domyślnych parametrów. Możemy na przykład zastosować alternatywny sposób identyfikacji zmiennej ukrytej. Zamiast użyć pierwszej zmiennej jako markera poprzez (domyślne) ustalenie ładunku na 1 (g1@1), możemy go uwolnić (poprzez dodanie gwiazdki przy nazwie tej zmiennej w części g1*), zaś dla identyfikacji zmiennej ukrytej ustalić jej wariancję na 1 (poprzez dodatnie symbolu @ oraz wartości 1 w części MODEL, tj. samotnosc@1). Domyślnie średnia takiej zmiennej ([samotnosc@0]) będzie równa 0. Należy również pamiętać, że w przypadku zmiennych obserwowalnych: nazwa zmiennej podana bez nawiasu oznacza ładunek czynnikowy, a nazwa zmiennej w nawiasie kwadratowym wraz ze znakiem $ oznacza określony próg zmiennej, na przykład polecenie [gr1$1] oznacza jeden próg zmiennej g1, zaś: [gr4$3] oznacza trzeci próg zmiennej gr4. Natomiast 477

Modele cech ukrytych w badaniach edukacyjnych, psychologii i socjologii w przypadku zmiennych ukrytych: nazwa zmiennej, podana w nawiasie kwadratowym oznacza średnią, np. [samotnosc@0], zaś jej nazwa w nawiasie okrągłym oznacza wariancję, np. (samotnosc*). Mplus umożliwia także określenie czy w danym przypadku parametr traktujemy jako stały, czy pozwalamy na jego estymację. W Mplusie stosujemy dwa podstawowe symbole: gwiazdkę (*) oraz małpkę (@). Pierwszy z nich wykorzystujemy, gdy wielość danego parametru ma być swobodnie estymowana przez program. Na przykład polecenie: g1* oznaczać będzie, że ładunek czynnikowy zmiennej g1 ma być szacowany przez program (nie zakładamy jakiejś jego konkretnej wartości). Zastosowanie wpisu: g1@1 oznaczać będzie, że chcemy, aby program założył, że ładunek zmiennej g1 ma być równy dokładnie 1. Możliwe jest również określenie dwóch lub więcej parametrów jako równych sobie (mających taką samą wartość). W tym celu należy przy każdym parametrze, który chcemy zrównać, wstawić w okrągłym nawiasie ten sam znak (liczbę lub literę). Innym sposobem jest umieszczenie wszystkich parametrów, które chcemy zrównać w jednej linii i na jej końcu wstawić w okrągłym nawiasie liczbę lub literę. Przykładowo, gdybyśmy chcieli określić jako takie same wszystkie ładunki czynnikowe, należałoby zastosować następującą komendę: Ramka D 4.1. Przykład definiowania ładunków czynnikowych w Mplus. samotnosc by g1* (1) g2 (1) g3 (1) g4 (1) g5 (1) g6 (1) g7 (1) g8 (1) g9 (1) g10 (1) g11 (1); W takim zapisie estymowany byłby model Rascha, w którym moc dyskryminacyjna wszystkich pozycji skali jest taka sama. Należy zwrócić uwagę na symbol gwiazdki po g1. Zapis taki powoduje, że jest estymowana wartość ładunku dla zmiennej g1. Jego brak (np. samotność by g1 (1) ) doprowadziłby do tego, że wszystkie ładunki byłyby równe 1 (ponieważ wszystkie ładunki mają być równe sobie, a ładunek g1 domyślnie byłby równy 1). 478

Przygotowanie analiz w programie Mplus D 4.3.5. Część OUTPUT Mplus oferuje znaczną liczbę dodatkowych wyników analiz, które należy zamówić w części OUTPUT. W przypadku analiz czynnikowych zawsze przydatne jest zamówienie rozwiązania standaryzowanego (polecenie standardized), indeksów modyfikacyjnych (modindices) oraz kowariancji/korelacji reszt (residual). Przykład: OUTPUT: standardized modindices residual; D 4.3.6. Część PLOT W przypadku wykresów można zażyczyć sobie utworzenie wszystkich trzech ich typów dostępnych w pakiecie Mplus, poprzez komendę: PLOT: type is plot1 plot2 plot3 D 4.3.7. Część SAVEDATA Mplus daje również możliwość zapisania wartości czynnikowych w nowym pliku z danymi. Chęć zapisania takiego pliku zgłasza się w części SAVEDATA: poprzez określenie nazwy pliku za pomocą polecenia file is (wraz z ewentualną ścieżką dostępu) oraz zawartości pliku komendą save =, np.: savedata: file is wynik1.dat; save = fscores; W tym przypadku zapisalibyśmy w pliku wyniki.dat wartości czynnikowe (fscores) dla każdego respondenta. Należy jednocześnie pamiętać, że miejsca dziesiętne w pliku wynikowym oddzielone będą znakiem. (kropki). Tak więc przed importem wyników na przykład do SPSS-a należy je przekodować w dowolnym edytorze tekstów przez zamienienie znaków. (kropki) na znaki, (przecinki). 479

Modele cech ukrytych w badaniach edukacyjnych, psychologii i socjologii D 4.3.8. Pliki poleceń wykorzystane w analizach omówionych w rozdziale 21 Tabela D 4.3. Eksploracyjna analiza czynnikowa opis wykorzystanych funkcji. TITLE: efa1 DATA: file is baza.dat; Polecenia Dowolny tytuł. Opis Nazwa pliku z danymi. Bez ścieżki dostępu, jeśli został zapisany w tym samym katalogu co plik poleceń. VARIABLE: names are Wymienienie wszystkich zmiennych, które id_ucz klasa plec g1 g2 g3 g4 g5 g6 g7 g8 g9 g10 znajdują się w pliku z danymi. g11; usevariables are g1 g2 g3 g4 g5 g6 g7 g8 g9 g10 Lista zmiennych wykorzystanych g11; w analizach. missing are all(-999); Ustalenie, że wartość 999 to brak danych. categorical are g1 g2 g3 g4 g5 g6 g7 g8 g9 g10 g11; idvariable is id_ucz; cluster is klasa; ANALYSIS: type is complex; type is efa (1 4); rotation is geomin; estimator = wlsmv; OUTPUT: stand; PLOT: type is plot1 plot2 plot3; Ustalenie, że zmienne tworzące skalę samotności mają charakter porządkowy. Jeżeli wszystkie wykorzystane w analizach zmienne mają taki charakter można wpisać categorical are all Określenie zmiennej, w której zapisane są identyfikatory przypadków. Ważne szczególnie, jeśli wyniki analiz chcemy zapisać a następnie połączyć z innym zbiorem danych. Zmienna, względem której następuje grupowanie uczniów w tym przypadku podział na klasy. Polecenie to współwystępuje z ANALYSIS: type is complex; Ustalenie, że dane mają charakter grupowy (pochodzą z losowania warstwowego), tworzą wiązki. Polecenie to współwystępuje z VARIABLE: cluster is klasa; Ustalenie, że przeprowadzona ma zostać eksploracyjna analiza czynnikowa, przyjmująca za rozwiązanie od 1 do 4 czynników Wskazanie rodzaju rotacji czynników, który ma być użyty w analizie eksploracyjnej. Występuje w powiązaniu z type is efa Wybór estymatora. Domyślny dla zmiennych porządkowych wlsmv można zmienić na inny np. ml, co może wiązać się ze znacznym wydłużeniem czasu analiz. Zażądanie przedstawienia jako wynik, poza informacjami podstawowymi, również wyników standaryzowanych. Żądanie przygotowania wszystkich typów wykresów. 480

Przygotowanie analiz w programie Mplus Ramka D 4.2. Eksploracyjna analiza czynnikowa wygląd pliku poleceń. TITLE: efa1 DATA: file is baza.dat; VARIABLE: names are id_ucz klasa plec g1 g2 g3 g4 g5 g6 g7 g8 g9 g10 g11; usevariables are g1 g2 g3 g4 g5 g6 g7 g8 g9 g10 g11; missing are all(-999); categorical are g1 g2 g3 g4 g5 g6 g7 g8 g9 g10 g11; idvariable is id_ucz; cluster is klasa; ANALYSIS: type is complex; type is efa (1 4); rotation is geomin; estimator = wlsmv; OUTPUT: stand; PLOT: type is plot1 plot2 plot3; 481

Modele cech ukrytych w badaniach edukacyjnych, psychologii i socjologii Tabela D 4.4. Jednoczynnikowy model konfirmacyjny (model 2PLM) opis wykorzystanych funkcji. Polecenia Początek jak w Tabeli D 4.3. ANALYSIS: type is complex; estimator = wlsmv; samotnosc by g1* g2 g3 g4 g5 g6 g7 g8 g9 g10 g11; samotnosc @1; [samotnosc@0]; OUTPUT: stand mod; SAVEDATA: save = fscores; file = samotnosc2.dat; Opis Ustalenie, że dane mają charakter grupowy (pochodzą z losowania warstwowego), tworzą wiązki. Polecenie to współwystępuje z VARIABLE: cluster is klasa; Wybór estymatora. Domyślny dla zmiennych porządkowych wlsmv można zmienić na inny, np. ml, co może wiązać się ze znacznym wydłużeniem czasu analiz. Zdefiniowanie nazwy zmiennej ukrytej samotnosc i wymienienie wszystkich pozycji służących do jej pomiaru. Określenie skali zmiennej ukrytej poprzez ustalenie wariancji na 1. Występuje w powiązaniu z symbolem * wstawionym po pierwszej zmiennej definiującej czynnik: g1*. Ustala średnią zmiennej ukrytej na 0. Jest to wartość domyślna, którą można zmienić. Zażądanie przedstawienia wyników standaryzowanych i indeksów modyfikacyjnych Polecenie zapisania estymowanych wartości zmiennej ukrytej (lub zmiennych ukrytych). Nazwanie pliku: samotnosc1.dat, w którym zostaną zapisane estymacje, z domyślną lokalizacją w folderze, w którym znajduje się plik poleceń. Lokalizację można zmienić poprzez podanie pełnej ścieżki dostępu. 482

Przygotowanie analiz w programie Mplus Ramka D 4.3. Jednoczynnikowy model konfirmacyjny (model 2PLM) wygląd pliku poleceń. TITLE: cfa1 DATA: file is baza.dat; VARIABLE: names are id_ucz klasa plec g1 g2 g3 g4 g5 g6 g7 g8 g9 g10 g11; usevariables are g1 g2 g3 g4 g5 g6 g7 g8 g9 g10 g11; missing are all(-999); categorical are g1 g2 g3 g4 g5 g6 g7 g8 g9 g10 g11; idvariable is id_ucz; cluster is klasa; ANALYSIS: type is complex; estimator = wlsmv; samotnosc by g1* g2 g3 g4 g5 g6 g7 g8 g9 g10 g11; samotnosc @1; [samotnosc@0]; OUTPUT: stand mod; PLOT: type is plot1 plot2 plot3; SAVEDATA: save = fscores; file = samotnosc2.dat; 483

Modele cech ukrytych w badaniach edukacyjnych, psychologii i socjologii Tabela D 4.5. Jednoczynnikowy model konfirmacyjny (model 1PLM) opis wykorzystanych funkcji. Polecenia Początek jak w Tabeli D 4.4. Model: samotnosc by g1* (1) g2 (1) g3 (1) g4 (1) g5 (1) g6 (1) g7 (1) g8 (1) g9 (1) g10 (1) g11 (1); Zakończenie jak w Tabeli D 4.3. Opis Zdefiniowanie nazwy zmiennej ukrytej samotnosc i wymienienie wszystkich pozycji służących do jej pomiaru. 484

Przygotowanie analiz w programie Mplus Ramka D 4.4. Jednoczynnikowy model konfirmacyjny (model 1PLM) wygląd pliku poleceń. TITLE: cfa1-1pl DATA: file is baza.dat; VARIABLE: names are id_ucz klasa plec g1 g2 g3 g4 g5 g6 g7 g8 g9 g10 g11; usevariables are g1 g2 g3 g4 g5 g6 g7 g8 g9 g10 g11; missing are all(-999); categorical are g1 g2 g3 g4 g5 g6 g7 g8 g9 g10 g11; idvariable is id_ucz; cluster is klasa; ANALYSIS: type is complex; estimator = wlsmv; samotnosc by g1* (1) g2 (1) g3 (1) g4 (1) g5 (1) g6 (1) g7 (1) g8 (1) g9 (1) g10 (1) g11 (1); samotnosc@1; [samotnosc@0]; OUTPUT: stand mod; PLOT: type is plot1 plot2 plot3; SAVEDATA: save = fscores; file = samotnosc3.dat; 485

Modele cech ukrytych w badaniach edukacyjnych, psychologii i socjologii Tabela D 4.6. Dwuczynnikowy model konfirmacyjny opis wykorzystanych funkcji. Polecenia Początek jak w Tabeli D 4.4. emoc by g2* g3 g5 g6 g9 g10; Opis Zdefiniowanie nazwy zmiennej ukrytej emoc i wymienienie wszystkich pozycji służących do jej pomiaru. emoc@1; Określenie skali zmiennej ukrytej poprzez ustalenie wariancji na 1. Występuje w powiązaniu z symbolem * wstawionym po pierwszej zmiennej definiującej czynnik: g2*. spolec by g1* g4 g7 g8 g11; Zdefiniowanie nazwy zmiennej ukrytej spolec i wymienienie wszystkich pozycji służących do jej pomiaru. spolec@1; Określenie skali zmiennej ukrytej poprzez ustalenie wariancji na 1. Występuje w powiązaniu z symbolem * wstawionym po pierwszej zmiennej definiującej czynnik: g1*. Czynniki emoc i spolec są domyślnie skorelowane. Zakończenie jak w Tabeli D 4.3. 486

Przygotowanie analiz w programie Mplus Ramka D 4.5. Dwuczynnikowy model konfirmacyjny wygląd pliku poleceń. TITLE: cfa2 DATA: file is baza.dat; VARIABLE: names are id_ucz klasa plec g1 g2 g3 g4 g5 g6 g7 g8 g9 g10 g11; usevariables are g1 g2 g3 g4 g5 g6 g7 g8 g9 g10 g11; missing are all(-999); categorical are g1 g2 g3 g4 g5 g6 g7 g8 g9 g10 g11; idvariable is id_ucz; cluster is klasa; ANALYSIS: type is complex; estimator = wlsmv; emoc by g2* g3 g5 g6 g9 g10; emoc@1; spolec by g1* g4 g7 g8 g11; spolec@2; OUTPUT: stand mod; PLOT: type is plot1 plot2 plot3; SAVEDATA: save = fscores; file = samotnosc4.dat; 487

Modele cech ukrytych w badaniach edukacyjnych, psychologii i socjologii Tabela D 4.7. Model podwójnego czynnika (bi-factor) opis wykorzystanych funkcji. Polecenia Początek jak w Tabeli D 4.3. samotnosc by g1* g2-g11; samotnosc @1; emoc by g2* g3 g5 g6 g9 g10; emoc @1; spolec by g1* g4 g7 g8 g11; spolec @1; samotnosc with emoc-spolec@0; emoc with spolec@0; Zakończenie jak w Tabeli D 4.3. Opis Zdefiniowanie nazwy czynnika głównego samotnosc i wymienienie wszystkich pozycji służących do jego pomiaru. Określenie skali zmiennej ukrytej poprzez ustalenie wariancji na 1. Występuje w powiązaniu z symbolem * wstawionym po pierwszej zmiennej definiującej czynnik: g1*. Zdefiniowanie nazwy podczynnika emoc i wymienienie wszystkich pozycji służących do jego pomiaru. Określenie skali zmiennej ukrytej poprzez ustalenie wariancji na 1. Występuje w powiązaniu z symbolem * wstawionym po pierwszej zmiennej definiującej czynnik: g1*. Zdefiniowanie nazwy podczynnika spolec i wymienienie wszystkich pozycji służących do jego pomiaru. Określenie skali zmiennej ukrytej poprzez ustalenie wariancji na 1. Występuje w powiązaniu z symbolem * wstawionym po pierwszej zmiennej definiującej czynnik: g1*. Zgodnie z założeniami modelu podwójnego czynnika, korelacja pomiędzy czynnikami została ustalona na 0 (brak korelacji). 488

Przygotowanie analiz w programie Mplus Ramka D 4.6. Model podwójnego czynnika (bi-factor) wygląd pliku poleceń. TITLE: bi-factor data: file is baza.dat; VARIABLE: names are id_ucz klasa plec g1 g2 g3 g4 g5 g6 g7 g8 g9 g10 g11; usevariables are g1 g2 g3 g4 g5 g6 g7 g8 g9 g10 g11; missing are all(-999); categorical are g1 g2 g3 g4 g5 g6 g7 g8 g9 g10 g11; idvariable is id_ucz; cluster is klasa; ANALYSIS: type is complex; estimator = wlsmv; samotnosc by g1* g2-g11; samotnosc @1; emoc by g2* g3 g5 g6 g9 g10; emoc @1; spolec by g1* g4 g7 g8 g11; spolec @1; samotnosc with emoc-spolec@0; emoc with spolec@0; OUTPUT: stand mod; PLOT: type is plot1 plot2 plot3; SAVEDATA: save = fscores; file = samotnosc5.dat; 489

Modele cech ukrytych w badaniach edukacyjnych, psychologii i socjologii Literatura Browne, M. W. (1972a). Oblique rotation to a partially specified target. British Journal of Mathematical and Statistical Psychology, 25(2), 207 212. Browne, M. W. (1972b). Orthogonal rotation to a partially specified target. British Journal of Mathematical and Statistical Psychology, 25(1), 115 120. Browne, M. W., Cudeck, R., Tateneni, K. i Mels, G. (2008). CEFA: a comprehensive exploratory factor analysis, version 3.02 [Oprogramowanie komputerowe i podręcznik]. Pobrano z http://faculty.psy.ohio-state. edu/browne/software.php Byrne, B. M. (2011). Structural equation modeling with Mplus: basic concepts, applications, and programming. New York: Routledge. Cai, L. (2013). flexmirt version 2: flexible multilevel multidimensional item analysis and test scoring [Oprogramowanie komputerowe]. Chapel Hill: Vector Psychometric Group. Cai, L., Thissen, D. i Du Toit, S. (2011). IRTPRO for Windows [Oprogramowanie komputerowe]. Lincolnwood: Scientific Software International. Geiser, C. (2013). Data analysis with Mplus. New York: Guilford Press. Heck, R. H. (2000). Software review: Mplus 1.04. Structural Equation Modeling: A Multidisciplinary Journal, 7(2), 309 317. Jennrich, R. i Bentler, P. (2012). Exploratory bi-factor analysis: the oblique case. Psychometrika, 77(3), 442 454. Kelloway, E. K. (2014). Using Mplus for structural equation modeling: a researcher s guide. Los Angeles: Sage. Matlab (2015). Version 8.5 (R2015a). Natick: The MathWorks Inc. Muthén, B. O. (1984). A general structural equation model with dichotomous, ordered categorical, and continuous latent variable indicators. Psychometrika, 49(1), 115 132. Muthén, B. O. (1988). LISCOMP: analysis of linear structural equations with a comprehensive measurement model : a program for advanced research. Mooresville: Scientific Software. Muthén, B. O. (1989a). Multiple-group structural modeling with non-normal continuous variables. British Journal of Mathematical and Statistical Psychology, 42(1), 55 62. Muthén, B. O. (1989b). Tobit factor analysis. British Journal of Mathematical and Statistical Psychology, 42(2), 241 250. Muthén, B. O. (1990). Moments of the censored and truncated bivariate normal distribution. British Journal of Mathematical and Statistical Psychology, 43(1), 131 143. Muthén, B. O. i Satorra, A. (1995). Technical aspects of Muthén s Liscomp approach to estimation of latent variable relations with a comprehensive measurement model. Psychometrika, 60(4), 489 503. Muthén, L. K. i Muthén, B. O. (2012). Mplus user s guide. Seventh edition. Los Angles: Muthén & Muthén. Wang, J. i Wang, X. (2012). Structural equation modeling: applications using Mplus. Chichester Hoboken: Wiley. 490