Analiza czynnikowa Analiza głównych składowych
|
|
- Agnieszka Czarnecka
- 8 lat temu
- Przeglądów:
Transkrypt
1 Analiza czynnikowa Analiza głównych składowych Wielowymiarowa Analiza Danych z wykorzystaniem pakietu SPSS Joanna Ciecieląg, Marek Pęczkowski WNE UW
2 Wskazniki Metryczne Kategorialne Modelowanie strukturalne Analiza cech ukrytych Analiza profili ukrytych Analiza klas ukrytch Metryczna Kategorialna Zmienna ukryta Metody czynnikowe Ogólne modele mieszanek Źródło: A.Sagan Skalowanie w badaniach marketingowych
3 Rola metod czynnikowych Mają charakter eksploracyjny wyodrębniają zmienne ukryte a posteriori Wykorzystują metodę dekompozycji wg wartości własnych Zmienne ukryte wyjaśniają maksymalną ilość zmienności lub powiązań w oryginalnym zbiorze danych Są interpretowane jako skorelowane lub niezależne wymiary leżące u podstaw kształtowania się zjawiska Pozwalają na redukcję danych zastępując wiele zmiennych skorelowanych nowym zbiorem zmiennych U podstaw redukcji leży zasada kompromisu między uproszczeniem struktury a jakością odwzorowania Źródło: A.Sagan Skalowanie w badaniach marketingowych
4 Zastosowanie Główne zastosowania czynnikowych technik analitycznych: 1) redukcja liczby zmiennych 2) wykrywanie struktury w związkach między zmiennymi formułowanie i weryfikacja hipotez dotyczących istnienia i charakteru prawidłowości kształtujących związki między zmiennymi (klasyfikacja zmiennych)
5 Przykłady Przykład 1 ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani oceniali wiele jej różnych cech (smak, zapach, konsystencja, kolor, kształt, opakowanie itp.) Wykorzystując analizę czynnikową można sprawdzić, czy możliwe jest wyodrębnienie kilku ogólnych, ukrytych czynników, warunkujących stosunek respondentów do nowego produktu (np. wymiary "łączna ocena smaku i zapachu" czy ocena wyglądu ). Przykład 2 badanie satysfakcji klientów danej firmy Zestaw wielu pytań dotyczących różnych aspektów działania firmy analizowanie każdego pytania osobno daje wiele szczegółowych informacji, analiza czynnikowa pozwala natomiast na uzyskanie ogólnego, syntetycznego obrazu powodów wpływających na satysfakcję klientów.
6 Punkt wyjścia Pierwszym krokiem w tworzeniu modelu czynnikowego jest zbudowanie macierzy korelacji między zmiennymi pierwotnymi i jej wstępna analiza. Macierz korelacji zwykle powstaje na bazie zmiennych standaryzowanych Jeżeli współczynniki korelacji są niskie, lub żadna ze zmiennych nie koreluje wysoko z którąkolwiek z pozostałych, to stosowanie dalszej procedury opartej o model czynnikowy może prowadzić do niewiarygodnych wyników. Zwykle macierz korelacji poddaje się dalszej analizie, jeżeli przeciętnie współczynniki korelacji są większe od 0.3 (=> testy) Jeśli w zbiorze znajdują się pewne odrębne grupy zmiennych wysoko ze sobą skorelowanych, to oznacza, że niosą one te same informacje. Każda taka grupa może być zastąpiona jednym czynnikiem syntetyczną miarą informacji zawartej w danej grupie zmiennych
7 Ogólny podział metod analizy czynnikowej A. Model "klasyczny" analizy czynnikowej (podział wariancji całkowitej ( specyficzną zmiennych na dwie części: wariancję wspólną i wariancję klasyczna analiza czynnikowa analiza kanoniczna B. Model "komponentowy" analizy czynnikowej (nieuwzględnianie ( wariancji struktury metoda głównych składowych analiza współzależności
8 Czynniki Czynnik jest nową zmienną, która nie jest bezpośrednio obserwowalna, ale jest wyznaczana na podstawie zmiennych pierwotnych. Czynniki te odzwierciedlają w zwięzły (syntetyczny) sposób znaczącą część informacji zawartą w zbiorze danych, a jednocześnie każdy z nich niesie nowe treści merytoryczne. Mogą one też być postrzegane jako pewne identyfikatory grupujące wyjściowe zmienne w spójne pod względem merytorycznym grupy.
9 Czynniki wykorzystanie Analiza badanych zjawisk z punktu widzenia nowych, syntetycznych kategorii, którymi są wyodrębnione czynniki Tworzenie skal i miar złożonych z kilku pytań Ustalanie wag określających znaczenie, jakie należy przypisać poszczególnym zmiennym i czynnikom w trakcie analiz Ortogonalizacja przestrzeni, w której rozpatrywane są obiekty, będące przedmiotem badań Konstruowanie modeli ekonometrycznych (regresja)
10 Przykład Mamy dwa pytania: Czy są zadowoleni ze swojego hobby? Jak intensywnie uprawiają hobby? Odpowiedzi będą ze sobą wysoce skorelowane, możemy więc wnioskować, że są one redundantne. Połączenie dwóch zmiennych w jeden czynnik: Dopasowanie linii, która "najlepiej" oddaje związek liniowy między oboma zmiennymi. Gdybyśmy mogli zdefiniować taką zmienną, która w przybliżeniu określałaby linię regresji na wykresie rozrzutu, wówczas zmienna ta obejmowałaby większość informacji zawartej w obu pytaniach. W kolejnych analizach można by było wykorzystać taki nowy czynnik, w zastępstwie pierwotnych pytań. Jest to w pewnym sensie redukcja dwóch zmiennych do jednego czynnika. Nowy czynnik jest w rzeczywistości kombinacją liniową tych dwóch zmiennych.
11 Dane Zmienne mierzone na skali przedziałowej lub ilorazowej (skala Likerta, dyferencjał semantyczny) Zmienne, które są wskaźnikami ukrytych konceptów (nie przypadkowe ) Odpowiednie próby: zaleca się aby było przynajmniej cztery lub pięć razy tyle obserwacji (rozmiar próby) ile jest zmiennych.
12 Procedura Wybór zmiennych do analizy Wyznaczenie macierzy korelacji (kowariancji) Stwierdzenie zasadności przeprowadzenia analizy czynnikowej Wybór modelu czynnikowego Wyznaczenie głównych składowych / czynników wybór ich liczby Rotacja Interpretacja
13 Metodologia Przedmiot analizy: macierz danych, zawierająca n realizacji m zmiennych: X x ij, x ij 0, j i 1,2,..., m 1,2,..., n Zmienne pierwotne podlegają standaryzacji: Z = [ z ij ]
14 Metodologia Podstawą do wyznaczania elementów macierzy współczynników czynników jest macierz korelacji: R n 1 1 ', 1... ij r Z Z z z p j m ip ij n n i 1 Wariancje na głównej przekątnej są miarą zasobów informacyjnych zmiennych pierwotnych.
15 Model czynnikowy Jeżeli macierz korelacji zmiennych pierwotnych jest odpowiednia do zastosowania analizy czynnikowej można przejść do następnego etapu - wyboru modelu czynnikowego. Określa on sposób identyfikacji czynników. Metody czynnikowe dzieli się najogólniej na dwie podstawowe grupy: analiza głównych składowych metody klasycznej analizy czynnikowej (np. metoda osi głównych, metoda największej wiarygodności)
16 Analiza czynnikowa... stanowi zespół metod i procedur statystycznych pozwalających na badanie wzajemnych relacji między dużą liczbą zmiennych i wykrywanie ukrytych powiązań między zmiennymi Pozwala na sprowadzenie dużej liczby badanych zmiennych do znacznie mniejszej liczby wzajemnie niezależnych (nieskorelowanych) czynników Analiza czynnikowa to metoda modelowania liniowego zakłada się, że zmienne można przedstawić za pomocą liniowej funkcji zmiennych nieobserwowalnych (czynników), przy czym wszystkie zmienne przedstawiane są jako funkcje tych samych czynników W praktyce poszukujemy modelu czynnikowego, który by pasował do zastanej macierzy korelacji zmiennych pierwotnych
17 Analiza głównych składowych jest metodą transformacji zmiennych w nowe, ortogonalne zmienne, tzw. główne składowe. To przede wszystkim procedura ortogonalizacji zmiennych ułatwiająca budowę teoretycznego modelu opisującego strukturę i związki między badanymi zjawiskami. Klasyczna analiza czynnikowa zaś sama w sobie jest takim modelem => Mimo podobnych celów i wyników NIE SĄ tym samym metodologia się różni!! 17
18 Metoda głównych składowych polega na przekształceniu obserwowalnych zmiennych wejściowych w nowe, nieobserwowalne i zarazem nieskorelowane zmienne nazywane głównymi składowymi każda z głównych składowych jest liniową funkcją zmiennych wejściowych główne składowe są tak uporządkowane, aby wariancje kolejnych głównych składowych (stanowiące miarę ich zasobów informacyjnych o badanym zjawisku) były coraz mniejsze suma wariancji wszystkich zmiennych wejściowych jest równa sumie wariancji głównych składowych, co oznacza że przekształcenie zmiennych wejściowych w główne składowe nie prowadzi do żadnych strat informacji o badanym zjawisku kilka pierwszych głównych składowych zawiera zdecydowaną większość informacji o badanym zjawisku, dostarczanych przez zmienne wejściowe, co pozwala na redukcję liczby głównych składowych przy możliwie małej stracie informacji wejściowych
19 Metoda głównych składowych W praktyce chodzi o sprawdzenie, czy kilka nowych zmiennych wyjaśnia maksymalnie dużo zmienności wyjściowego układu przy zachowaniu nieskorelowania, co daje w efekcie redukcję wymiaru.
20 Metoda głównych składowych Zmienne pierwotne po standaryzacji można przedstawić jako liniową kombinację głównych składowych: Z T = AG T G = A T Z gdzie: Z - macierz i standaryzowanych zmiennych pierwotnych A - macierz współczynników składowych głównych G - macierz i składowych głównych 20
21 Metoda głównych składowych Pierwsza główna składowa G 1 jest taką kombinacją zmiennych pierwotnych, dla której wariancja próbkowa jest największa wśród wszystkich kombinacji liniowych (przy warunku jednoznacznego wyznaczenia wektora współczynników). Druga główna składowa G 2 - analogicznie - jest kombinacją liniową zmiennych pierwotnych, dla której wariancja próbkowa jest kolejna największa (przy warunku jednoznacznego wyznaczenia wektora współczynników oraz dodatkowym, zapewniającym ortogonalność powstałych składowych - konsekwencją tego jest sumowanie się kolejnych wariancji głównych składowych do wariancji całkowitej).
22 Metoda głównych składowych Każda i-ta główna składowa jest liniowa kombinacją zmiennych pierwotnych i wyjaśnia i-tą część całkowitej zmienności. Kolejne główne składowe są tak wyznaczane, aby wariancje kolejnych składowych były coraz mniejsze. Można wyznaczyć tyle głównych składowych, ile mamy zmiennych wyjściowych, jednak zazwyczaj kilka pierwszych wystarcza do wyjaśnienia większości wariancji układu zmiennych.
23 Znaczenie i użyteczność składowej głównej jest mierzona wielkością wyjaśnianej przez nią całkowitej zmienności. I tak, jeśli w układzie sześciu zmiennych pierwsza składowa wyjaśnia np. 85% zmienności, to znaczy to, że niemal cała zmienność tego układu da się przedstawić na prostej zamiast w sześciu wymiarach. W efekcie powstaje nam tyle głównych składowych, ile było początkowo zmiennych: nadal mamy układ m-wymiarowy. Ale w praktyce ograniczamy się do kilku pierwszych głównych składowych, które wyjaśniają z góry ustaloną część wariancji całkowitej, np. 75%.
24 Klasyczna analiza czynnikowa analiza czynnikowa jest metodą badania struktury wewnętrznych zależności obserwacji wielowymiarowych każda zmienna obserwowalna (wejściowa) przedstawiana jest jako kombinacja liniowa pewnej liczby nieobserwowalnych zmiennych, zwanych czynnikami, wspólnych dla całego zbioru zmiennych wejściowych oraz jednego nieobserwowalnego czynnika swoistego dla tej zmiennej czynniki wspólne i czynniki swoiste nie są ze sobą skorelowane. celem analizy czynnikowej jest znalezienie takiego zbioru czynników wspólnych oraz określenie ich relacji ze zmiennymi obserwowalnymi, który pozwala na wyjaśnienie struktury powiązań między zmiennymi obserwowalnymi
25 Klasyczna analiza czynnikowa Zakładamy, że źródłem wzajemnych zależności (skorelowania) między zmiennymi są ukryte wspólne czynniki, które można uznać za nośniki tej samej informacji, chcemy zatem je wyodrębnić w formie nowych, syntetycznych zmiennych. Jednak zakładamy też, że nie cała wariancja zmiennych jest powodowana tymi ukrytymi wspólnymi czynnikami każda zmienna pierwotna charakteryzuje się też pewnymi specyficznymi właściwościami.
26 Klasyczna analiza czynnikowa Zatem każda z obserwowalnych zmiennych Z jest funkcją liniową zmiennych nieobserwowalnych (czynników wspólnych) oraz pojedynczej zmiennej specyficznej: Z = AF + BU gdzie: Z - macierz j standaryzowanych zmiennych pierwotnych A - macierz ładunków czynnikowych czynników wspólnych F - macierz czynników wspólnych B macierz (diagonalna) ładunków czynnikowych czynników specyficznych U - macierz czynników specyficznych Założenia: - czynniki wspólne nie są skorelowane ze sobą - czynniki specyficzne również nie są ze sobą skorelowane - czynniki wspólne nie są skorelowane z czynnikami specyficznymi 26
27 Klasyczna analiza czynnikowa Podstawą identyfikacji składników wspólnych i specyficznych w macierzy R jest w analizie czynnikowej podział wariancji poszczególnych zmiennych na wariancję wspólną i specyficzną: h j 2 - zasób zmienności wspólnej /communality/ - część wariancji objaśniona przez czynniki wspólne w j 2 - zasób zmienności swoistej - pozostałość po odjęciu zasobu zmienności wspólnej od wariancji całkowitej
28 Klasyczna analiza czynnikowa Dążymy do eliminacji wpływu czynników specyficznych na rzecz czynników wspólnych. W tym celu zastępujemy w macierzy R współczynniki korelacji na głównej przekątnej zasobami zmienności wspólnej, otrzymując tzw. zredukowaną macierz korelacji : ~ R r~ ij rij dla i j r~ 2 ij hj dla i j
29 Klasyczna analiza czynnikowa Wartości h j 2 ustala się na poziomie: średniej arytmetycznej współczynników korelacji danej zmiennej z innymi zmiennymi: h j 2 = 1 m m i 1 r ij najwyższego co do modułu współczynnika korelacji j-tej zmiennej z pozostałymi: h 2 j = max [ r ij ], i j współczynnika determinacji wielorakiej R 2 danej zmiennej z innymi zmiennymi
30 Klasyczna analiza czynnikowa Kolejne wartości i wektory własne służą do uzyskania ładunków czynnikowych kolejnych czynników. Ładunki te odzwierciedlają korelację wspólnym czynnikiem. pomiędzy j-tą zmienną pierwotną i l-tym Najczęściej wybierane metody wyodrębniania czynników: Metoda Osi Głównych (Principal Axis Factor) Metoda Największej Wiarygodności (Maximum Likelihood)
31
32 Kryteria stosowalności analizy czynnikowej Silne korelacje między zmiennymi Indeks KMO (Kaiser-Meyer-Olkin) indeks ten porównuje cząstkowe współczynniki korelacji z dwuzmiennowymi współczynnikami korelacji. Przyjmuje wartości od 0 do 1, gdzie ) oznacza, że spodziewana redukcja będzie niewielka, więc stosowanie analizy czynnikowej nie ma sensu. Jest sens, gdy KMO jest większe od 0.5 Test Sferyczności Bartletta - test hipotezy, że macierz współczynników korelacji jest macierzą jednostkową, co oznacza, że nie ma istotnych korelacji między zmiennymi. Odrzucenie hipotezy zerowej świadczy o zasadności przeprowadzenia analizy
33 KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy.,831 Bartlett's Test of Sphericity Approx. Chi-Square 11905,395 df 300 Sig.,000 33
34 Kryteria wyboru liczby czynników 1. Kryterium Kaisera - metoda "wartości własnej (lambda) większej od jedności" - jest najczęściej stosowana. Jej podstawą jest to, że każda główna składowa powinna wyjaśniać przynajmniej tyle, ile jedna zmienna pierwotna. Metoda ta powinna być stosowana gdy ilość zmiennych jest większa od 20. Gdy liczba zmiennych jest mniejsza istnieje tendencja wyodrębniania zbyt małej ilości czynników 2. Kryterium Joliffe a j.w., lecz graniczna wartość to 0,7. Korekta wynika stąd, że główne składowe, które w populacji mają wartość własną >1 mogą mieć w próbie tę wartość mniejszą niż 1, ze względu na błąd losowy próby
35 Kryteria wyboru liczby czynników 3. Wykres osypiska (kryterium Cattella) wykres ilości czynników i ich wartości własnych. Identyfikujemy na nim "punkt załamania", w którym kąt załamania krzywej ("rumowisko"). Punkt ten określa liczbę czynników kwalifikujących się do dalszej analizy. Chodzi o to, aby uchwycić punkt, w którym dalsze zwiększanie liczby czynników będzie powodowało jedynie niewielkie przyrosty w sensie wyjaśnianej wariancji (gdy wykres zaczyna się wypłaszczać ). Metoda ta jest nieco bardziej "liberalna" niż metoda >1, pozwala włączyć do dalszej analizy nieco większą liczbę czynników 4. Skumulowany procent wyjaśnionej wariancji analizowanych zmiennych - do ogólnej liczby wybranych czynników zalicza się te czynniki, które w sumie wyjaśniają np.. 75%, 80% lub 90% wariancji, a żaden następny nie tłumaczy więcej niż 5% wariancji 5. Interpretowalność merytoryczna czynników
36 36
37 Składowa Ogółem Początkowe wartości własne % wariancji % skumulowany Ogółem Sumy kwadratów ładunków po wyodrębnieniu % wariancji % skumulowany Sumy kwadratów ładunków po rotacji Ogółem % wariancji % skumulowany 1 13,843 55,373 55,373 13,843 55,373 55,373 6,552 26,208 26, ,609 6,436 61,809 1,609 6,436 61,809 4,068 16,274 42, ,200 4,800 66,610 1,200 4,800 66,610 3,207 12,828 55,311 4,875 3,501 70,110,875 3,501 70,110 3,039 12,157 67,468 5,768 3,072 73,182,768 3,072 73,182 1,429 5,714 73,182 6,718 2,872 76,054 7,596 2,383 78,438 8,578 2,311 80,749 9,504 2,016 82,765 10,455 1,818 84,583 11,390 1,561 86,144 12,374 1,495 87,640 13,344 1,375 89,015 14,316 1,262 90,277 15,291 1,164 91,441 16,280 1,120 92,562 17,268 1,072 93,634 18,254 1,015 94,649 19,230,920 95,569 20,221,885 96,454 21,211,843 97,297 22,192,769 98,066 23,179,718 98,784 24,168,672 99,456 Metoda wyodrębniania czynników - Głównych składowych.
38 Kryteria wyboru liczby czynników Najrozsądniejszą zasadą jest zatrzymanie się na takiej liczbie czynników, które są sensowne. Jeśli czynnik, który miałby być wyłączony przestaje być sensowny, to nie powinien być uwzględniany. => Wybór liczby czynników jest zazwyczaj bardzo subiektywny
39 Interpretacja Czynnik jest interpretowany na podstawie ładunków czynnikowych (ew. rotowanych) Ładunki czynnikowe są korelacjami miedzy czynnikami a początkowymi zmiennymi => dostarczają informacji do subiektywnego zidentyfikowania i nazwania nieobserwowalnych czynników głównych (wymiarów) Każdy czynnik podlega interpretacji ze względu na te zmienne pierwotne, które mają wysokie ładunki czynnikowe. Istotne ładunki czynnikowe to najczęściej > 0.3 Ideanie byłoby, gdyby każda zmienna miała duży ładunek tylko dla jednego czynnika jeśli jest inaczej, zmienną pierwotną należy uwzględnić w interpretacji wszystkich czynników, dla których jej ładunek jest istotny. Zmienne pierwotne bez dużych ładunków w żadnym z czynników usunąć z analizy.
40 Przykład 1a. Badanie satysfakcji pracowników FIRMY X Zmienne wpływające na satysfakcje z pracy zostały w drodze analizy czynnikowej podzielone na dwa czynniki. Pierwsza skupia te aspekty, które mówią o satysfakcji z siebie, jako pracownika i własnych osiągnięć, a druga aspekty związane z dbałością firmy i możliwościami jakie daje FIRMA. Czynniki zadowolenia z pracy na stacji Ocena aspektów w podziale na prowadzących i pracowników stacji (skala: 1 zdecydowanie się nie zgadzam 5 zdecydowanie się zgadzam) Firma Prowadzący [N=450] Pracownik [N=675]
41 Przykład 1b. Badanie satysfakcji pracowników FIRMY X Czynniki wyodrębnione miejsce pracownika w społeczności FIRMY X Firmą Firmy Prowadzący Ocena aspektów w podziale na prowadzących i pracowników (skala: 1 zdecydowanie się nie zgadzam 5 zdecydowanie się zgadzam) Firmy Firma 3.5 wartość istotnie większa Prowadzący [N=450] Pracownik [N=675]
42 Przykład 2. Alkohole wymiary oceny Składowa Lubię poprawiać sobie nią nastrój,787,302,200 Marka dla ludzi takich jak ja,783,213,219,291 Poleciłbym tę markę innym,739,352,241,337 Ta marka wódki jest ceniona przez znajomych, z którymi ją piję,716,361,203,223 Na spotkania z przyjaciółmi,691,464,250,219 Po wypiciu nawet dużej ilości wódki tej marki, następnego dnia czuję się dobrze,670,225,216,366 Zakupił(a)bym tę markę organizując ważne przyjęcie dla dużej liczby osób,660,478,257 Wódka tej marki łatwo wchodzi,631,360,313,261 Marka warta swej ceny,592,310,208,530 Wódka tej marki jest mocna,714,322 Marka dobra na prezent,361,635,340 Odpowiednia do uczczenia specjalnych okazji,476,618,361 Nie wstydził(a)bym się wódką tej marki poczęstować gości,435,597,291,308 Nadaje się do dobrej zabawy w męskim towarzystwie,583,594,272 Prestiżowa marka,495,567,263,363 Odrobina wódki tej marki pomaga rozkręcić zabawę / imprezę,458,520,306,249,249 Jest odpowiednia przede wszystkim dla kobiet,774 Pasuje do deseru,259,765 Wódka tej marki nie ma ostrego zapachu,328,682,224 Jest na tyle łagodna, że nie trzeba jej zagryzać ani popijać,270,567,315,438 Marka naprawdę inna od pozostałych,394,223,725 Osobom, które jej nigdy nie próbowały jej smak może nie przypaść do gustu,690,338 Wódka tej marki ma oryginalny smak,250,310,271,620,253 Marka bardzo wysokiej jakości,493,421,256,583 Można używać jej w celach leczniczych, np. w trakcie przeziębienia,226,203,718
43 Przykład 2 cd. 1. to marka moja i moich znajomych: Lubię poprawiać sobie nią nastrój, Marka dla ludzi takich jak ja, Poleciłbym tę markę innym, Ta marka wódki jest ceniona przez znajomych, z którymi ją piję, Na spotkania z przyjaciółmi, Po wypiciu nawet dużej ilości wódki tej marki, następnego dnia czuję się dobrze, Zakupił(a)bym tę markę organizując ważne przyjęcie dla dużej liczby osób, Wódka tej marki łatwo wchodzi, Marka warta swej ceny 2. dobra do zabawy: Wódka tej marki jest mocna, Marka dobra na prezent, Odpowiednia do uczczenia specjalnych okazji, Nie wstydził(a)bym się wódką tej marki poczęstować gości, Nadaje się do dobrej zabawy w męskim towarzystwie, Prestiżowa marka, Odrobina wódki tej marki pomaga rozkręcić zabawę / imprezę 3. kobieca, delikatna: Jest odpowiednia przede wszystkim dla kobiet, Pasuje do deseru, Wódka tej marki nie ma ostrego zapachu, Jest na tyle łagodna, że nie trzeba jej zagryzać ani popijać, 4. wyjątkowa, wysokiej jakości, inna: Marka naprawdę inna od pozostałych, Istnieje krąg ludzi lubiących tę markę ale osobom, które jej nigdy nie próbowały jej smak może nie przypaść do gustu, Wódka tej marki ma oryginalny smak, Marka bardzo wysokiej jakości 5. lecznicza: Można używać jej w celach leczniczych, np. w trakcie przeziębienia
44 Wyznaczanie wartości czynników Na koniec najczęściej potrzebny jest sposób wyznaczenia wartości poszczególnych czynników dla kolejnych obserwacji. Jest wiele metod szacowania wartości czynników (np. w SPSS są 3): Regresyjna (daje oszacowania najbliższe rzeczywistym wartościom czynnikowym) Bartletta Andersona-Rubina
45 Rotacja Na ogół dąży się do tego, aby ładunki czynnikowe, tj. współczynniki korelacji między poszczególnym wskaźnikiem a danym czynnikiem, miały wartości bliskie 0 lub bliskie maksymalnej wartości +1 lub 1. Poszukuje się takiego układu czynnikowego, aby każdy wskaźnik miał wysoki ładunek tylko na jednym czynniku i aby każdy czynnik miał wartości tych ładunków bliskie 0 dla kilku wskaźników i bliskie wartościom maksymalnym dla pozostałych. Nie zawsze bezpośrednio osiągalne = > rotacja Rotacja polega na sprowadzeniu struktury ładunków do prostej struktury, w której punkty reprezentujące zmienne skupiają się wokół osi czynników, co zapewniła możliwie najłatwiejszą interpretację czynników.
46 Rotacja Najczęściej stosuje się procedury rotacji ortogonalnej: VARIMAX upraszcza interpretację czynników (minimalizuje liczbę zmiennych potrzebnych do wyjaśnienia danego czynnika) upraszcza QUARTIMAX interpretację zmiennych (minimalizuje liczbę czynników potrzebnych do wyjaśnienia danej zmiennej). Rotacje nieortogonalne dopuszczamy skorelowanie powstałych czynników!
47 Podsumowanie Analiza czynnikowa Ch. Spearman (1904), L.L. Thurstone (1913) H. Hotteling (1933) orientacja kowariancyjna: punktem wyjścia jest zredukowana macierz korelacji model otwarty: obok wariancji cech uwzględnia się także wariancję nieobjaśnianą (zm. pominięte, losowość obserwacji) Analiza głównych składowych orientacja wariancyjna: punktem wyjścia jest zwykła macierz korelacji model zamknięty: uwzględnia się wyłącznie wariancję badanych zmiennych każda zmienna pierwotna jest funkcją nieobserwowanych czynników wspólnych i czynnika swoistego zmienne pierwotne są liniową funkcją składowych głównych (a główne składowe można przedstawić jako kombinacje liniowe zmiennych pierwotnych) buduje się teoretyczny model zjawiska i sprawdza, czy jest zgodny z danymi empirycznymi Celem analizy jest identyfikacja ukrytych zmiennych wychodzi się od obserwacji empirycznych, a następnie buduje model teoretyczny Celem analizy jest uproszczenie struktury danych równanie podstawowe: Z=AF + BU równanie podstawowe: Z T = AG T / G = A T Z 47
48 PCA Zwyczaje zakupowe Component FA Factor Z1b. I try to buy products which are currently advertised,740,110 Z1b. I am curious about new products which,671,267 appear in shops Z1b. I am curious about new products which appear in,721,232 -,108 Z1b. I try to buy products which are currently,660,102 shops advertised Z1b. I just enjoy spending my free time in a store,652,183 Z1b. I just enjoy spending my free time in a store,564,200,111 Z1b. I often shop for products I need at parties, social gatherings etc.,635,182 Z1b. I often shop for products I need at parties, social gatherings etc. Z1b. I often buy ready-to-use products or instant products,572 -,151 Z1b. I often buy ready-to-use products or instant products Z1b. When I shop, I often opt for diet/light products,425,119,252,374 Z1b. Most of my shopping is unplanned / decide to buy things on impulse, on the spur of the moment Z1b. I take a lot of care to learn what my loved ones really,677,197 Z1b. When I shop, I often opt for diet/light like and I shop to with their preferences in mind products,542,185,469,410 -,233,365,138,171,354 Z1b. It is very important for me that products I buy are really healthful/natural Z1b. I spend considerable time looking for fresh/safe products Z1b. Most of my shopping is unplanned / decide to buy things on impulse, on the spur of the moment Z1b. I try to choose stores where I know the sales staff and I can have a nice chat with them Z1b. It is important for me that products I buy are recognised and appreciate by people around me and impress others Z1b. When shopping I want to show I am a good homemaker/host to make sure nobody can blaming for not taking enough care of my home Z1b. As a rule, I do not hesitate to make comments to the staff if things in a store are not the way think they should be Z1b. I enjoy shopping with a shopping list I prepared earlier,676,277 Z1b. It is very important for me that products I buy are really healthful/natural,195,591,148,207 Z1b. I take a lot of care to learn what my loved ones really like and I shop to with their preferences in mind,440 -,471,282 Z1b. I spend considerable time looking for fresh/safe products -,230,156,656,212 Z1b. When shopping I want to show I am a good homemaker/host to make sure nobody can blaming for not taking enough care of my home,392,168,650 Z1b. It is important for me that products I buy are recognised and appreciate by people around me and impress others,226,391,629 Z1b. I try to choose stores where I know the sales staff and I can have a nice chat with them -,166,204,739 Z1b. I enjoy shopping with a shopping list I prepared earlier,396 -,197,675 Z1b. As a rule, I do not hesitate to make comments to the staff if things in a store are not the way think they should be,633,180,540,212,143,499,127,245,196,346,619,363,152,610 -,137,204,353,187,219,389,379 48
49 ANALIZA CZYNNIKOWA Analiza eksploracyjna czynniki są początkowo nieznane i zostają wyodrębnione dzięki analizie: dane grupowane są w zbiory zmiennych najsilniej ze sobą skorelowanych wykrywanie związków między zmiennymi bez wstępnych założeń Analiza konfirmacyjna weryfikacja hipotez co do określonej z góry struktury czynników i estymacja parametrów założonego modelu
50 Dziękuję za uwagę
ANALIZA CZYNNIKOWA Przykład 1
ANALIZA CZYNNIKOWA... stanowi zespół metod i procedur statystycznych pozwalających na badanie wzajemnych relacji między dużą liczbą zmiennych i wykrywanie ukrytych uwarunkowań, ktore wyjaśniają ich występowanie.
Bardziej szczegółowoCELE ANALIZY CZYNNIKOWEJ
ANALIZA CZYNNIKOWA... stanowi zespół metod i procedur statystycznych pozwalających na badanie wzajemnych relacji między dużą liczbą zmiennych i wykrywanie ukrytych uwarunkowań, ktore wyjaśniają ich występowanie.
Bardziej szczegółowoAnaliza składowych głównych. Wprowadzenie
Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących
Bardziej szczegółowoZmienne zależne i niezależne
Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }
Bardziej szczegółowoKolejna z analiz wielozmiennowych Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki
Analiza czynnikowa Kolejna z analiz wielozmiennowych Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki Budowa wskaźnika Indeks był banalny I miał wady: o Czy
Bardziej szczegółowoPrawdopodobieństwo i statystyka
Wykład XV: Zagadnienia redukcji wymiaru danych 2 lutego 2015 r. Standaryzacja danych Standaryzacja danych Własności macierzy korelacji Definicja Niech X będzie zmienną losową o skończonym drugim momencie.
Bardziej szczegółowoWprowadzenie (1) Przedmiotem analizy czynnikowej jest badanie wewnętrznych zależności w zbiorze zmiennych. Jest to modelowanie niejawne. Oprócz zmienn
Analiza czynnikowa Wprowadzenie (1) Przedmiotem analizy czynnikowej jest badanie wewnętrznych zależności w zbiorze zmiennych. Jest to modelowanie niejawne. Oprócz zmiennych, które są bezpośrednio obserwowalne
Bardziej szczegółowoZadanie 1. Za pomocą analizy rzetelności skali i wspólczynnika Alfa- Cronbacha ustalić, czy pytania ankiety stanowią jednorodny zbiór.
L a b o r a t o r i u m S P S S S t r o n a 1 W zbiorze Pytania zamieszczono odpowiedzi 25 opiekunów dzieci w wieku 8. lat na następujące pytania 1 : P1. Dziecko nie reaguje na bieżące uwagi opiekuna gdy
Bardziej szczegółowoAnaliza składowych głównych
Analiza składowych głównych Wprowadzenie (1) W przypadku regresji naszym celem jest predykcja wartości zmiennej wyjściowej za pomocą zmiennych wejściowych, wykrycie związku między wielkościami wejściowymi
Bardziej szczegółowoStatystyka i eksploracja danych
Wykład XII: Zagadnienia redukcji wymiaru danych 12 maja 2014 Definicja Niech X będzie zmienną losową o skończonym drugim momencie. Standaryzacją zmiennej X nazywamy zmienną losową Z = X EX Var (X ). Definicja
Bardziej szczegółowoAnaliza głównych składowych- redukcja wymiaru, wykł. 12
Analiza głównych składowych- redukcja wymiaru, wykł. 12 Joanna Jędrzejowicz Instytut Informatyki Konieczność redukcji wymiaru w eksploracji danych bazy danych spotykane w zadaniach eksploracji danych mają
Bardziej szczegółowoAnaliza składowych głównych idea
Analiza składowych głównych idea Analiza składowych głównych jest najczęściej używanym narzędziem eksploracyjnej analizy danych. Na metodę tę można spojrzeć jak na pewną technikę redukcji wymiarowości
Bardziej szczegółowoIdea. Analiza składowych głównych Analiza czynnikowa Skalowanie wielowymiarowe Analiza korespondencji Wykresy obrazkowe.
Idea (ang. Principal Components Analysis PCA) jest popularnym używanym narzędziem analizy danych. Na metodę tę można spojrzeć jak na pewną technikę redukcji wymiarowości danych. Jest to metoda nieparametryczna,
Bardziej szczegółowoStatystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Bardziej szczegółowoRegresja logistyczna (LOGISTIC)
Zmienna zależna: Wybór opcji zachodniej w polityce zagranicznej (kodowana jako tak, 0 nie) Zmienne niezależne: wiedza o Unii Europejskiej (WIEDZA), zamieszkiwanie w regionie zachodnim (ZACH) lub wschodnim
Bardziej szczegółowoSzukanie struktury skali mierzącej problematyczne zachowania finansowe.
Szukanie struktury skali mierzącej problematyczne zachowania finansowe. Celem poniższej analizy było stworzenie skali mierzącej problematyczne zachowania finansowej. Takie zachowania zdefiniowano jako
Bardziej szczegółowoAnaliza korespondencji
Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy
Bardziej szczegółowoSzczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Bardziej szczegółowoRegresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Regresja wielokrotna Model dla zależności liniowej: Y=a+b 1 X 1 +b 2 X 2 +...+b n X n Cząstkowe współczynniki regresji wielokrotnej: b 1,..., b n Zmienne niezależne (przyczynowe): X 1,..., X n Zmienna
Bardziej szczegółowoElementy statystyki wielowymiarowej
Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Elementy statystyki wielowymiarowej 1.1 Kowariancja i współczynnik korelacji 1.2 Macierz kowariancji 1.3 Dwumianowy rozkład normalny 1.4 Analiza składowych
Bardziej szczegółowoSzczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Bardziej szczegółowoSzukanie struktury skali mierzącej problematyczne zachowania finansowe.
Szukanie struktury skali mierzącej problematyczne zachowania finansowe. Celem poniższej analizy było stworzenie skali mierzącej problematyczne zachowania finansowe. Takie zachowania zdefiniowano jako zachowania
Bardziej szczegółowoAnaliza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817
Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Zadanie 1: wiek 7 8 9 1 11 11,5 12 13 14 14 15 16 17 18 18,5 19 wzrost 12 122 125 131 135 14 142 145 15 1 154 159 162 164 168 17 Wykres
Bardziej szczegółowoMETODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA
METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu
Bardziej szczegółowoEkonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007
, transformacja liniowa i estymacja modelu KMNK Paweł Cibis pawel@cibis.pl 9 marca 2007 1 Miary dopasowania modelu do danych empirycznych Współczynnik determinacji Współczynnik zbieżności Skorygowany R
Bardziej szczegółowoSYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia
Bardziej szczegółowoSkalowanie wielowymiarowe idea
Skalowanie wielowymiarowe idea Jedną z wad metody PCA jest możliwość używania jedynie zmiennych ilościowych, kolejnym konieczność posiadania pełnych danych z doświadczenia(nie da się użyć PCA jeśli mamy
Bardziej szczegółowoMikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 12 Mikołaj Czajkowski Wiktor Budziński Dane panelowe Co jeśli mamy do dyspozycji dane panelowe? Kilka obserwacji od tych samych respondentów, w różnych punktach czasu (np. ankieta realizowana
Bardziej szczegółowoMODELE LINIOWE. Dr Wioleta Drobik
MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą
Bardziej szczegółowo(x j x)(y j ȳ) r xy =
KORELACJA. WSPÓŁCZYNNIKI KORELACJI Gdy w badaniu mamy kilka cech, często interesujemy się stopniem powiązania tych cech między sobą. Pod słowem korelacja rozumiemy współzależność. Mówimy np. o korelacji
Bardziej szczegółowoKORELACJE I REGRESJA LINIOWA
KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem
Bardziej szczegółowoWybór optymalnej liczby składowych w analizie czynnikowej Test Równolegości Horn a i test MAP Velicera
Wybór optymalnej liczby składowych w analizie czynnikowej Test Równolegości Horn a i test MAP Velicera Wielu badaczy podejmuje decyzje o optymalnej liczbie składowych do wyodrębnienia na podstawie arbitralnych
Bardziej szczegółowo5. WNIOSKOWANIE PSYCHOMETRYCZNE
5. WNIOSKOWANIE PSYCHOMETRYCZNE Model klasyczny Gulliksena Wynik otrzymany i prawdziwy Błąd pomiaru Rzetelność pomiaru testem Standardowy błąd pomiaru Błąd estymacji wyniku prawdziwego Teoria Odpowiadania
Bardziej szczegółowoInżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VIII: Analiza kanoniczna
1 Laboratorium VIII: Analiza kanoniczna Spis treści Laboratorium VIII: Analiza kanoniczna... 1 Wiadomości ogólne... 2 1. Wstęp teoretyczny.... 2 Przykład... 2 Podstawowe pojęcia... 2 Założenia analizy
Bardziej szczegółowo10. Redukcja wymiaru - metoda PCA
Algorytmy rozpoznawania obrazów 10. Redukcja wymiaru - metoda PCA dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. PCA Analiza składowych głównych: w skrócie nazywana PCA (od ang. Principle Component
Bardziej szczegółowoBadania eksperymentalne
Badania eksperymentalne Analiza CONJOINT mgr Agnieszka Zięba Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa Najpopularniejsze sposoby oceny wyników eksperymentu w schematach
Bardziej szczegółowoMikroekonometria 14. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 14 Mikołaj Czajkowski Wiktor Budziński Symulacje Analogicznie jak w przypadku ciągłej zmiennej zależnej można wykorzystać metody Monte Carlo do analizy różnego rodzaju problemów w modelach
Bardziej szczegółowoRegresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna
Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować
Bardziej szczegółowoEkonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej
Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej Paweł Cibis pawel@cibis.pl 23 lutego 2007 1 Regresja liniowa 2 wzory funkcje 3 Korelacja liniowa
Bardziej szczegółowoMetody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin. Henryk Bujak
Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin Henryk Bujak e-mail: h.bujak@ihar.edu.pl Ocena różnorodności fenotypowej Różnorodność fenotypowa kolekcji roślinnych zasobów
Bardziej szczegółowoREGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji
Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji
Bardziej szczegółowoWielowymiarowa Analiza Korespondencji. Wielowymiarowa Analiza Danych z wykorzystaniem pakietu SPSS. Joanna Ciecieląg, Marek Pęczkowski WNE UW
Wielowymiarowa Analiza Korespondencji Wielowymiarowa Analiza Danych z wykorzystaniem pakietu SPSS Joanna Ciecieląg, Marek Pęczkowski WNE UW ANALIZA KORESPONDENCJI opisowa i eksploracyjna technika analizy
Bardziej szczegółowoZadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.
tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1
Bardziej szczegółowoEstymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych
Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych 3.1. Estymacja parametrów i ocena dopasowania modeli z jedną zmienną 23. Właściciel komisu w celu zbadania
Bardziej szczegółowoSTATYSTYKA I DOŚWIADCZALNICTWO Wykład 8
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8 Regresja wielokrotna Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X 1, X 2, X 3,...) na zmienną zależną (Y).
Bardziej szczegółowoWeryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Bardziej szczegółowoZałóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb
Współzależność Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb (x i, y i ). Geometrycznie taką parę
Bardziej szczegółowoSpis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Bardziej szczegółowoparametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,
诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów
Bardziej szczegółowoRegresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).
Statystyka i opracowanie danych Ćwiczenia 12 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA WIELORAKA Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych
Bardziej szczegółowoMODEL STRUKTURALNY RELACJI MIĘDZY SATYSFAKCJĄ
MODEL STRUKTURALNY RELACJI MIĘDZY SATYSFAKCJĄ I LOJALNOŚCIĄ WOBEC MARKI Adam Sagan Akademia Ekonomiczna w Krakowie, Katedra Analizy Rynku i Badań Marketingowych Wstęp Modelowanie strukturalne ma wielorakie
Bardziej szczegółowoStosowana Analiza Regresji
Stosowana Analiza Regresji Wykład VIII 30 Listopada 2011 1 / 18 gdzie: X : n p Q : n n R : n p Zał.: n p. X = QR, - macierz eksperymentu, - ortogonalna, - ma zera poniżej głównej diagonali. [ R1 X = Q
Bardziej szczegółowo3. Modele tendencji czasowej w prognozowaniu
II Modele tendencji czasowej w prognozowaniu 1 Składniki szeregu czasowego W teorii szeregów czasowych wyróżnia się zwykle następujące składowe szeregu czasowego: a) składowa systematyczna; b) składowa
Bardziej szczegółowoTesty nieparametryczne
Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów
Bardziej szczegółowoMETODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Bardziej szczegółowoSTATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss
Bardziej szczegółowoEtapy modelowania ekonometrycznego
Etapy modelowania ekonometrycznego jest podstawowym narzędziem badawczym, jakim posługuje się ekonometria. Stanowi on matematyczno-statystyczną formę zapisu prawidłowości statystycznej w zakresie rozkładu,
Bardziej szczegółowoRozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów
Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,
Bardziej szczegółowoKorelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego
Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy
Bardziej szczegółowoBudowanie macierzy danych geograficznych Procedura normalizacji Budowanie wskaźnika syntetycznego
Metody Analiz Przestrzennych Budowanie macierzy danych geograficznych Procedura normalizacji Budowanie wskaźnika syntetycznego mgr Marcin Semczuk Zakład Przedsiębiorczości i Gospodarki Przestrzennej Instytut
Bardziej szczegółowoAnaliza współzależności dwóch cech I
Analiza współzależności dwóch cech I Współzależność dwóch cech W tym rozdziale pokażemy metody stosowane dla potrzeb wykrywania zależności lub współzależności między dwiema cechami. W celu wykrycia tych
Bardziej szczegółowoANALIZA CZYNNIKOWA W BADANIACH STRUKTURY RELACJI W MARKETINGU RELACYJNYM
dr Magdalena Kowalska-Musiał Wyższa Szkoła Zarządzania i Bankowości w Krakowie ANALIZA CZYNNIKOWA W BADANIACH STRUKTURY RELACJI W MARKETINGU RELACYJNYM Wprowadzenie Zgodnie z najnowszymi trendami strategie
Bardziej szczegółowoANALIZA DYNAMIKI DOCHODU KRAJOWEGO BRUTTO
ANALIZA DYNAMIKI DOCHODU KRAJOWEGO BRUTTO Wprowadzenie Zmienność koniunktury gospodarczej jest kształtowana przez wiele różnych czynników ekonomicznych i pozaekonomicznych. Znajomość zmienności poszczególnych
Bardziej szczegółowoZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA. dr inż. Aleksander Astel
ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA dr inż. Aleksander Astel Gdańsk, 22.12.2004 CHEMOMETRIA dziedzina nauki i techniki zajmująca się wydobywaniem użytecznej informacji z wielowymiarowych
Bardziej szczegółowoZaawansowana eksploracja danych - sprawozdanie nr 1 Rafał Kwiatkowski 89777, Poznań
Zaawansowana eksploracja danych - sprawozdanie nr 1 Rafał Kwiatkowski 89777, Poznań 6.11.1 1 Badanie współzależności atrybutów jakościowych w wielowymiarowych tabelach danych. 1.1 Analiza współzależności
Bardziej szczegółowoSzkice rozwiązań z R:
Szkice rozwiązań z R: Zadanie 1. Założono doświadczenie farmakologiczne. Obserwowano przyrost wagi ciała (przyrost [gram]) przy zadanych dawkach trzech preparatów (dawka.a, dawka.b, dawka.c). Obiektami
Bardziej szczegółowoModelowanie glikemii w procesie insulinoterapii
Dawid Kaliszewski Modelowanie glikemii w procesie insulinoterapii Promotor dr hab. inż. Zenon Gniazdowski Cel pracy Zbudowanie modelu predykcyjnego przyszłych wartości glikemii diabetyka leczonego za pomocą
Bardziej szczegółowoEkonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007
Modele regresji wielorakiej - dobór zmiennych, szacowanie Paweł Cibis pawel@cibis.pl 1 kwietnia 2007 1 Współczynnik zmienności Współczynnik zmienności wzory Współczynnik zmienności funkcje 2 Korelacja
Bardziej szczegółowoZasady rzetelnego pomiaru efektywności transferu wiedzy w e-learningu akademickim
Zasady rzetelnego pomiaru efektywności transferu wiedzy w e-learningu akademickim Wojciech BIZON Wydział Ekonomiczny Uniwersytet Gdański 1 Problem w długim horyzoncie czasowym do rozwiązania: w jaki sposób
Bardziej szczegółowoStatystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
Bardziej szczegółowoREGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ
REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ Korelacja oznacza fakt współzależności zmiennych, czyli istnienie powiązania pomiędzy nimi. Siłę i kierunek powiązania określa się za pomocą współczynnika korelacji
Bardziej szczegółowoStatystyka i Analiza Danych
Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania wybranych technik regresyjnych do modelowania współzależności zjawisk Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki
Bardziej szczegółowoweryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)
PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
Bardziej szczegółowoNatalia Nehrebecka Stanisław Cichocki. Wykład 13
Natalia Nehrebecka Stanisław Cichocki Wykład 13 1 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje nietypowe i błędne 4. Współliniowość 2 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje
Bardziej szczegółowoMetodologia badań psychologicznych. Wykład 12. Korelacje
Metodologia badań psychologicznych Lucyna Golińska SPOŁECZNA AKADEMIA NAUK Wykład 12. Korelacje Korelacja Korelacja występuje wtedy gdy dwie różne miary dotyczące tych samych osób, zdarzeń lub obiektów
Bardziej szczegółowoStatystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Bardziej szczegółowoEkonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 23 marca 2006
, transformacja liniowa i estymacja modelu KMNK Paweł Cibis pcibis@o2.pl 23 marca 2006 1 Miary dopasowania modelu do danych empirycznych Współczynnik determinacji Współczynnik zbieżności 2 3 Etapy transformacji
Bardziej szczegółowoCo to jest analiza regresji?
Co to jest analiza regresji? Celem analizy regresji jest badanie związków pomiędzy wieloma zmiennymi niezależnymi (objaśniającymi) a zmienną zależną (objaśnianą), która musi mieć charakter liczbowy. W
Bardziej szczegółowoWprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
Bardziej szczegółowoSTATYSTYKA I DOŚWIADCZALNICTWO Wykład 5
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y
Bardziej szczegółowoPDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
Bardziej szczegółowoTestowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;
LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny
Bardziej szczegółowoANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH
ANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH - Adrian Gorgosz - Paulina Tupalska ANALIZA WIELOPOZIOMOWA (AW) Multilevel Analysis Obecna od lat 80. Popularna i coraz częściej stosowana
Bardziej szczegółowoWykład 10 Skalowanie wielowymiarowe
Wykład 10 Skalowanie wielowymiarowe Wrocław, 30.05.2018r Skalowanie wielowymiarowe (Multidimensional Scaling (MDS)) Główne cele MDS: przedstawienie struktury badanych obiektów przez określenie treści wymiarów
Bardziej szczegółowoAnaliza kanoniczna w pigułce
Analiza kanoniczna w pigułce Przemysław Biecek Seminarium Statystyka w medycynie Propozycje tematów prac dyplomowych 1/14 Plan 1 Słów kilka o podobnych metodach (PCA, regresja) 2 Motywacja, czyli jakiego
Bardziej szczegółowoWprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe
Wprowadzenie do teorii ekonometrii Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Zajęcia Wykład Laboratorium komputerowe 2 Zaliczenie EGZAMIN (50%) Na egzaminie obowiązują wszystkie informacje
Bardziej szczegółowoTeoretyczne podstawy analizy indeksowej klasyfikacja indeksów, konstrukcja, zastosowanie
Teoretyczne podstawy analizy indeksowej klasyfikacja indeksów, konstrukcja, zastosowanie Szkolenie dla pracowników Urzędu Statystycznego nt. Wybrane metody statystyczne w analizach makroekonomicznych dr
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 2 3 1. Wprowadzenie do danych panelowych a) Charakterystyka danych panelowych b) Zalety i ograniczenia 2. Modele ekonometryczne danych panelowych a) Model efektów
Bardziej szczegółowoBadanie zależności skala nominalna
Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność
Bardziej szczegółowoHierarchiczna analiza skupień
Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym
Bardziej szczegółowoMikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 13 Mikołaj Czajkowski Wiktor Budziński Endogeniczność regresja liniowa W regresji liniowej estymujemy następujące równanie: i i i Metoda Najmniejszych Kwadratów zakłada, że wszystkie zmienne
Bardziej szczegółowoWojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)
Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition) Robert Respondowski Click here if your download doesn"t start automatically Wojewodztwo Koszalinskie:
Bardziej szczegółowoĆwiczenie: Wybrane zagadnienia z korelacji i regresji
Ćwiczenie: Wybrane zagadnienia z korelacji i regresji W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Stanisza r xy = 0 zmienne nie są skorelowane 0 < r xy 0,1
Bardziej szczegółowoWeryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Bardziej szczegółowoRecenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Redakcja i korekta Bogdan Baran Projekt graficzny okładki Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2011 ISBN
Bardziej szczegółowoTRANSFORMACJE I JAKOŚĆ DANYCH
METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING TRANSFORMACJE I JAKOŚĆ DANYCH Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej
Bardziej szczegółowoStatystyka opisowa. Wykład V. Regresja liniowa wieloraka
Statystyka opisowa. Wykład V. e-mail:e.kozlovski@pollub.pl Spis treści 1 Prosta regresji cechy Y względem cech X 1,..., X k. 2 3 Wyznaczamy zależność cechy Y od cech X 1, X 2,..., X k postaci Y = α 0 +
Bardziej szczegółowoAproksymacja funkcji a regresja symboliczna
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą
Bardziej szczegółowoKorelacja, autokorelacja, kowariancja, trendy. Korelacja określa stopień asocjacji między zmiennymi
Korelacja, autokorelacja, kowariancja, trendy Korelacja określa stopień asocjacji między zmiennymi Kowariancja Wady - ograniczenia. Wartość kowariancji zależy od rozmiarów zmienności zmiennej.. W konsekwencji
Bardziej szczegółowow analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą
Bardziej szczegółowo