Wielowymiarowa Analiza Korespondencji. Wielowymiarowa Analiza Danych z wykorzystaniem pakietu SPSS. Joanna Ciecieląg, Marek Pęczkowski WNE UW

Podobne dokumenty
ANALIZA KORESPONDENCJI

Skalowanie wielowymiarowe idea

Analiza składowych głównych. Wprowadzenie

Przypomnienie: Ćwiczenie 1.

Idea. Analiza składowych głównych Analiza czynnikowa Skalowanie wielowymiarowe Analiza korespondencji Wykresy obrazkowe.

Analiza korespondencji

W1. Wprowadzenie. Statystyka opisowa

BADANIA U&A ANALIZA PRZYKŁADOWA

Analiza składowych głównych idea

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

Badania marketingowe : podstawy metodyczne / Stanisław Kaczmarczyk. - wyd. 4. Warszawa, 2011

Podstawowe pojęcia statystyczne

Badania eksperymentalne

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38

STATYSTYKA I DOŚWIADCZALNICTWO

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

ANALIZA DANYCH PIERWOTNYCH mgr Małgorzata Kromka

Testy nieparametryczne

Zagadnienia do próbnych matur z poziomu podstawowego.

STATYSTYKA I DOŚWIADCZALNICTWO

Badania marketingowe. Podstawy metodyczne Stanisław Kaczmarczyk

Badania sondażowe. Wprowadzenie. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP

Statystyka w pracy badawczej nauczyciela

Wykład ze statystyki. Maciej Wolny

ANALIZA CZYNNIKOWA Przykład 1

Badania Statystyczne

Wykład 10 Skalowanie wielowymiarowe

Analiza współzależności zjawisk

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

Analiza korespondencji

SPIS TREŚCI CZĘŚĆ I : PRZEZNACZENIE, PROCES I PODSTAWY METODOLOGICZNE BADAŃ MARKETINGOWYCH...17

Statystyka. Wykład 7. Magdalena Alama-Bućko. 3 kwietnia Magdalena Alama-Bućko Statystyka 3 kwietnia / 36

Opis przedmiotu: Probabilistyka I

Katedra Biotechnologii i Genetyki Zwierząt, Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

dr Jerzy Pusz, st. wykładowca, Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej B. Ogólna charakterystyka przedmiotu

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Doświadczalnictwo leśne. Wydział Leśny SGGW Studia II stopnia

Wykorzystanie programu MS Excel do opracowań statystycznych

Badanie ankietowe dotyczące funkcjonalności aplikacji geoportalowej

WYKŁAD 3 - KARTODIAGRAMY HALINA KLIMCZAK

Przygotowanie danych

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

Wprowadzenie Pojęcia podstawowe Szeregi rozdzielcze STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP.

Wielowymiarowa analiza regionalnego zróżnicowania rolnictwa w Polsce

CELE ANALIZY CZYNNIKOWEJ

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VIII: Analiza kanoniczna

WYKRESY SPORZĄDZANE W UKŁADZIE WSPÓŁRZĘDNYCH:

Zmienne zależne i niezależne

METODY STATYSTYKI W IDENTYFIKACJI BRAKUJĄCYCH KOMPETENCJI MIĘKKICH

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

WYBRANE METODY ANALIZY STATYSTYCZNEJ W OCENIE EFEKTÓW KSZTAŁCENIA NA PRZYKŁADZIE WYNIKÓW EGZAMINU ZE STATYSTYKI OPISOWEJ

Analiza składowych głównych

WYMAGANIA OGÓLNE NA POSZCZEGÓLNE OCENY Z GEOGRAFII W KLASACH I-III GIMNAZJUM

Wizualizacja danych przestrzennych. dr Marta Kuc-Czarnecka

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Wymagania edukacyjne na poszczególne stopnie szkolne z geografii w klasie I gimnazjum Ocenę celująca otrzymuje uczeń, który: - opanował wiadomości i

Cz. II. Metodologia prowadzonych badań. Rozdz. 1. Cele badawcze. Rozdz. 2. Metody i narzędzia badawcze. Celem badawczym niniejszego projektu jest:

WYMAGANIA EDUKACYJNE. niezbędne do otrzymania przez ucznia poszczególnych. śródrocznych i rocznych ocen klasyfikacyjnych z geografii.

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Tworzenie szablonów użytkownika

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

SIGMA KWADRAT. Wykorzystanie programu MS Excel do opracowań statystycznych CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

WYKSZTAŁCENIE I WIEK ROLNIKÓW A WSKAŹNIK POSTĘPU NAUKOWO-TECHNICZNEGO

DANE PRZEWIERTU. Przewiert Sterowany. Wersja 8 E P I - G R A F

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

ALGORYTMY SZTUCZNEJ INTELIGENCJI

Konferencja "Zarządzanie w organizacjach publicznych" Mariusz Topolski

Badanie zależności skala nominalna

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1

Hierarchiczna analiza skupień

O czym w Sejmie piszczy? Analiza tekstowa przemówień poselskich

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Przyjmuje dowolne wartości z określonego przedziału (skończonego lub nie). Zmienne ciągłe: wzrost, czas rozwiązana testu, kwota dochodu

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin. Henryk Bujak

Katedra Biotechnologii i Genetyki Zwierząt, Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

ANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Zadania ze statystyki cz.5 I rok socjologii miary związków między zmiennymi jakościowymi

CZĘŚĆ I. PRZYGOTOWANIE PROCESU BADAŃ MARKETINGOWYCH Faza identyfikacji problemów decyzyjnych lub okoliczności sprzyjających

Opis przedmiotu. Karta przedmiotu - Probabilistyka I Katalog ECTS Politechniki Warszawskiej

Jak korzystać z arkusza kalkulacyjnego?

Wykorzystanie metod badania współwystępowania w badaniach marketingowych na przykładzie określania pozycji marki na rynku.

Analiza współzależności dwóch cech I

ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA. dr inż. Aleksander Astel

Przykładowa analiza danych

Podstawy statystyki matematycznej w programie R

Naszym zadaniem jest rozpatrzenie związków między wierszami macierzy reprezentującej poziomy ekspresji poszczególnych genów.

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Elementy statystyki wielowymiarowej

Niestandardowa tabela częstości

author: Andrzej Dudek

Transkrypt:

Wielowymiarowa Analiza Korespondencji Wielowymiarowa Analiza Danych z wykorzystaniem pakietu SPSS Joanna Ciecieląg, Marek Pęczkowski WNE UW

ANALIZA KORESPONDENCJI opisowa i eksploracyjna technika analizy danych jakościowych. pozwala na graficzne przedstawienie zmiennych w niskowymiarowej przestrzeni stosunkowo łatwo interpretowalne wyniki technika redukcji danych przedstawienie danych w bardziej przystępnej formie, kosztem utraty pewnej ilości informacji zaliczana do tej samej klasy co analiza czynnikowa

ANALIZA KORESPONDENCJI Analizę korespondencji w podstawowym zastosowaniu wykonuje się dla przypadku dwóch zmiennych jakościowych. Klasyczne zastosowanie jest jednak rzadko stosowane, właśnie ze względu na konieczność ograniczenia się do dwóch zmiennych. Jednak metoda ta pozwala również na analizę bezpośrednio tablic wielodzielnych

ANALIZA KORESPONDENCJI Przykład. Analiza wizerunku marek produktów Dysponując ocenami baterii stwierdzeń dla poszczególnych marek można stworzyć sztuczną zmienną zawierającą średnie oceny marek dla tych stwierdzeń drugą zmienną będzie wtedy identyfikator marki. Na bazie powstałej tablicy kontyngencji można otrzymać mapę percepcji, która pozwala w jednym układzie współrzędnych zaznaczyć marki i stwierdzenia. Wzajemne położenie marek i stwierdzeń pozwala wnioskować, na ile poszczególne marki są związane z każdym z nich oraz czym różnią się ich wizerunki.

ANALIZA KORESPONDENCJI Jak zrobić to w praktyce? Przykład zbioru danych: wizer_czynniki.sav banki.sav konieczne jest utworzenie zmiennej systemowej rowcat_: val lab rowcat_ 1 'NA SPECJALNE OKAZJE' 2 'NATURALNE' 3 'DOBRY MARKETING' 4 'TRADYCYJNE' 5 'NIEDROGIE'. exe.

ANALIZA KORESPONDENCJI *Pierwsze wiersze. CORRESPONDENCE ( 5,3 ) TABLE = all /DIMENSIONS = 2 /MEASURE = euclid /STANDARDIZE = RCMEAN /NORMALIZATION = SYMMETRICAL /PRINT = TABLE RPOINTS CPOINTS /PLOT = NDIM(1,MAX) BIPLOT(20) (' OUTFILE=score('xxx.sav / /supplementary =row(4,5). exe. Liczba wierszy - stwierdzeń Liczba kolumn - marek ( średnich Miara odległości euclid (dla ( odsetków chisq (dla Zmienne pasywne

ANALIZA KORESPONDENCJI Zmienne pasywne: nie wpływają na geometryczną orientację przestrzeni dzięki temu możliwe jest umieszczenie dodatkowych zmiennych np. demograficznych, które mogą być pomocne w interpretacji wyników. mogą też służyć do porównywania różnych grup przypadku wystąpienia efektu dźwigni, kategorie rzadko występujące mogą być potraktowane jako zmienne pasywne, podobnie jak braki danych

HOMALS Większe możliwości analizy daje również wielowymiarowa analiza korespondencji, nazywana też analizą homogeniczności (HOMALS), będąca rozszerzeniem analizy korespondencji na przypadek wielu zmiennych. HOM ogeneity analysis via A lternating L east S quares => HOMALS

HOMALS Dane wejściowe: nominalne, ewentualnie porządkowe z ograniczoną liczbą poziomów Cele Odkrycie kluczowych, ukrytych cech respondentów Wskazanie współwystępujących grup kategorii Identyfikacja związków przyczynowo-skutkowych Stworzenie mapy percepcyjnej Identyfikacja jednorodnych grup respondentów

HOMALS Obiekty o podobnych profilach są blisko siebie Kategorie o podobnej zawartości są blisko siebie Homogeniczność danej grupy zmiennych jest mierzona przez: obliczenie sumy kwadratów odchyleń dla każdego obiektu ( OSS ) ( TSS ) oraz sumy kwadratów odchyleń pomiędzy obiektami Miarą homogeniczności jest stosunek OSS i TSS homogeniczność jest doskonała gdy OSS=0 Celem jest optymalne skwantyfikowanie zmiennych (przypisanie ich kategoriom wartości liczbowych), w ten sposób, by zmaksymalizować homogeniczność

HOMALS Przygotowanie danych dla SPSS: kodowanie kategorii liczbami naturalnymi, zaczynając od 1 nie ma kategorii pasywnych każda kategoria musi być kodowana kolejną liczbą naturalną unikać kategorii rzadko występujących (<10% próby) w szczególności takie kategorie mogą mieć tak wysoki wkład w całkowitą zmienność zbioru, że wyznaczą jeden z wymiarów, choć nie będzie on odpowiadał żadnej kategorii latentnej

HOMALS HOMALS może być zastosowany do konstruowania syntetycznych skal mierzących cechy latentne (ukryte): analiza wartości punktów w układzie współrzędnych jako wartości do ( PCA konstrukcji skali (podobnie jak w

HOMALS *Tworzenie skali: (pliki stw.sav stw.sps ) HOMALS ( p4(3 /VARIABLES=p2(7) p3(2) /ANALYSIS=p2 p3 p4 /DIMENSION=1 /PRINT FREQ EIGEN DISCRIM QUANT ( NDIM(ALL,MAX /PLOT QUANT OBJECT ( 1 ) = /SAVE /MAXITER = 100 /CONVERGENCE =.00001. TYLKO jeden wymiar zachowuje jeden wymiar - jako skalę

HOMALS HOMALS kwantyfikuje nie tylko kategorie zmiennych ale też każdą obserwację Współrzędne punktu na każdym wymiarze są wyliczone tak, aby punkt reprezentujący każdą obserwację był środkiem ciężkości dla skwantyfikowanych kategorii do których należy W SPSS w opcjach możemy utworzyć współrzędnymi nowe zmienne ze