Wielowymiarowa Analiza Korespondencji Wielowymiarowa Analiza Danych z wykorzystaniem pakietu SPSS Joanna Ciecieląg, Marek Pęczkowski WNE UW
ANALIZA KORESPONDENCJI opisowa i eksploracyjna technika analizy danych jakościowych. pozwala na graficzne przedstawienie zmiennych w niskowymiarowej przestrzeni stosunkowo łatwo interpretowalne wyniki technika redukcji danych przedstawienie danych w bardziej przystępnej formie, kosztem utraty pewnej ilości informacji zaliczana do tej samej klasy co analiza czynnikowa
ANALIZA KORESPONDENCJI Analizę korespondencji w podstawowym zastosowaniu wykonuje się dla przypadku dwóch zmiennych jakościowych. Klasyczne zastosowanie jest jednak rzadko stosowane, właśnie ze względu na konieczność ograniczenia się do dwóch zmiennych. Jednak metoda ta pozwala również na analizę bezpośrednio tablic wielodzielnych
ANALIZA KORESPONDENCJI Przykład. Analiza wizerunku marek produktów Dysponując ocenami baterii stwierdzeń dla poszczególnych marek można stworzyć sztuczną zmienną zawierającą średnie oceny marek dla tych stwierdzeń drugą zmienną będzie wtedy identyfikator marki. Na bazie powstałej tablicy kontyngencji można otrzymać mapę percepcji, która pozwala w jednym układzie współrzędnych zaznaczyć marki i stwierdzenia. Wzajemne położenie marek i stwierdzeń pozwala wnioskować, na ile poszczególne marki są związane z każdym z nich oraz czym różnią się ich wizerunki.
ANALIZA KORESPONDENCJI Jak zrobić to w praktyce? Przykład zbioru danych: wizer_czynniki.sav banki.sav konieczne jest utworzenie zmiennej systemowej rowcat_: val lab rowcat_ 1 'NA SPECJALNE OKAZJE' 2 'NATURALNE' 3 'DOBRY MARKETING' 4 'TRADYCYJNE' 5 'NIEDROGIE'. exe.
ANALIZA KORESPONDENCJI *Pierwsze wiersze. CORRESPONDENCE ( 5,3 ) TABLE = all /DIMENSIONS = 2 /MEASURE = euclid /STANDARDIZE = RCMEAN /NORMALIZATION = SYMMETRICAL /PRINT = TABLE RPOINTS CPOINTS /PLOT = NDIM(1,MAX) BIPLOT(20) (' OUTFILE=score('xxx.sav / /supplementary =row(4,5). exe. Liczba wierszy - stwierdzeń Liczba kolumn - marek ( średnich Miara odległości euclid (dla ( odsetków chisq (dla Zmienne pasywne
ANALIZA KORESPONDENCJI Zmienne pasywne: nie wpływają na geometryczną orientację przestrzeni dzięki temu możliwe jest umieszczenie dodatkowych zmiennych np. demograficznych, które mogą być pomocne w interpretacji wyników. mogą też służyć do porównywania różnych grup przypadku wystąpienia efektu dźwigni, kategorie rzadko występujące mogą być potraktowane jako zmienne pasywne, podobnie jak braki danych
HOMALS Większe możliwości analizy daje również wielowymiarowa analiza korespondencji, nazywana też analizą homogeniczności (HOMALS), będąca rozszerzeniem analizy korespondencji na przypadek wielu zmiennych. HOM ogeneity analysis via A lternating L east S quares => HOMALS
HOMALS Dane wejściowe: nominalne, ewentualnie porządkowe z ograniczoną liczbą poziomów Cele Odkrycie kluczowych, ukrytych cech respondentów Wskazanie współwystępujących grup kategorii Identyfikacja związków przyczynowo-skutkowych Stworzenie mapy percepcyjnej Identyfikacja jednorodnych grup respondentów
HOMALS Obiekty o podobnych profilach są blisko siebie Kategorie o podobnej zawartości są blisko siebie Homogeniczność danej grupy zmiennych jest mierzona przez: obliczenie sumy kwadratów odchyleń dla każdego obiektu ( OSS ) ( TSS ) oraz sumy kwadratów odchyleń pomiędzy obiektami Miarą homogeniczności jest stosunek OSS i TSS homogeniczność jest doskonała gdy OSS=0 Celem jest optymalne skwantyfikowanie zmiennych (przypisanie ich kategoriom wartości liczbowych), w ten sposób, by zmaksymalizować homogeniczność
HOMALS Przygotowanie danych dla SPSS: kodowanie kategorii liczbami naturalnymi, zaczynając od 1 nie ma kategorii pasywnych każda kategoria musi być kodowana kolejną liczbą naturalną unikać kategorii rzadko występujących (<10% próby) w szczególności takie kategorie mogą mieć tak wysoki wkład w całkowitą zmienność zbioru, że wyznaczą jeden z wymiarów, choć nie będzie on odpowiadał żadnej kategorii latentnej
HOMALS HOMALS może być zastosowany do konstruowania syntetycznych skal mierzących cechy latentne (ukryte): analiza wartości punktów w układzie współrzędnych jako wartości do ( PCA konstrukcji skali (podobnie jak w
HOMALS *Tworzenie skali: (pliki stw.sav stw.sps ) HOMALS ( p4(3 /VARIABLES=p2(7) p3(2) /ANALYSIS=p2 p3 p4 /DIMENSION=1 /PRINT FREQ EIGEN DISCRIM QUANT ( NDIM(ALL,MAX /PLOT QUANT OBJECT ( 1 ) = /SAVE /MAXITER = 100 /CONVERGENCE =.00001. TYLKO jeden wymiar zachowuje jeden wymiar - jako skalę
HOMALS HOMALS kwantyfikuje nie tylko kategorie zmiennych ale też każdą obserwację Współrzędne punktu na każdym wymiarze są wyliczone tak, aby punkt reprezentujący każdą obserwację był środkiem ciężkości dla skwantyfikowanych kategorii do których należy W SPSS w opcjach możemy utworzyć współrzędnymi nowe zmienne ze