Analiza czynnikowa Analiza głównych składowych

Wielkość: px
Rozpocząć pokaz od strony:

Download "Analiza czynnikowa Analiza głównych składowych"

Transkrypt

1 Analiza czynnikowa Analiza głównych składowych Wielowymiarowa Analiza Danych z wykorzystaniem pakietu SPSS Joanna Ciecieląg, Marek Pęczkowski WNE UW

2 Wskazniki Metryczne Kategorialne Modelowanie strukturalne Analiza cech ukrytych Analiza profili ukrytych Analiza klas ukrytch Metryczna Kategorialna Zmienna ukryta Metody czynnikowe Ogólne modele mieszanek Źródło: A.Sagan Skalowanie w badaniach marketingowych

3 Rola metod czynnikowych Mają charakter eksploracyjny wyodrębniają zmienne ukryte a posteriori Wykorzystują metodę dekompozycji wg wartości własnych Zmienne ukryte wyjaśniają maksymalną ilość zmienności lub powiązań w oryginalnym zbiorze danych Są interpretowane jako skorelowane lub niezależne wymiary leżące u podstaw kształtowania się zjawiska Pozwalają na redukcję danych zastępując wiele zmiennych skorelowanych nowym zbiorem zmiennych U podstaw redukcji leży zasada kompromisu między uproszczeniem struktury a jakością odwzorowania Źródło: A.Sagan Skalowanie w badaniach marketingowych

4 Zastosowanie Główne zastosowania czynnikowych technik analitycznych: 1) redukcja liczby zmiennych 2) wykrywanie struktury w związkach między zmiennymi formułowanie i weryfikacja hipotez dotyczących istnienia i charakteru prawidłowości kształtujących związki między zmiennymi (klasyfikacja zmiennych)

5 Przykłady Przykład 1 ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani oceniali wiele jej różnych cech (smak, zapach, konsystencja, kolor, kształt, opakowanie itp.) Wykorzystując analizę czynnikową można sprawdzić, czy możliwe jest wyodrębnienie kilku ogólnych, ukrytych czynników, warunkujących stosunek respondentów do nowego produktu (np. wymiary "łączna ocena smaku i zapachu" czy ocena wyglądu ). Przykład 2 badanie satysfakcji klientów danej firmy Zestaw wielu pytań dotyczących różnych aspektów działania firmy analizowanie każdego pytania osobno daje wiele szczegółowych informacji, analiza czynnikowa pozwala natomiast na uzyskanie ogólnego, syntetycznego obrazu powodów wpływających na satysfakcję klientów.

6 Punkt wyjścia Pierwszym krokiem w tworzeniu modelu czynnikowego jest zbudowanie macierzy korelacji między zmiennymi pierwotnymi i jej wstępna analiza. Macierz korelacji zwykle powstaje na bazie zmiennych standaryzowanych Jeżeli współczynniki korelacji są niskie, lub żadna ze zmiennych nie koreluje wysoko z którąkolwiek z pozostałych, to stosowanie dalszej procedury opartej o model czynnikowy może prowadzić do niewiarygodnych wyników. Zwykle macierz korelacji poddaje się dalszej analizie, jeżeli przeciętnie współczynniki korelacji są większe od 0.3 (=> testy) Jeśli w zbiorze znajdują się pewne odrębne grupy zmiennych wysoko ze sobą skorelowanych, to oznacza, że niosą one te same informacje. Każda taka grupa może być zastąpiona jednym czynnikiem syntetyczną miarą informacji zawartej w danej grupie zmiennych

7 Ogólny podział metod analizy czynnikowej A. Model "klasyczny" analizy czynnikowej (podział wariancji całkowitej ( specyficzną zmiennych na dwie części: wariancję wspólną i wariancję klasyczna analiza czynnikowa analiza kanoniczna B. Model "komponentowy" analizy czynnikowej (nieuwzględnianie ( wariancji struktury metoda głównych składowych analiza współzależności

8 Czynniki Czynnik jest nową zmienną, która nie jest bezpośrednio obserwowalna, ale jest wyznaczana na podstawie zmiennych pierwotnych. Czynniki te odzwierciedlają w zwięzły (syntetyczny) sposób znaczącą część informacji zawartą w zbiorze danych, a jednocześnie każdy z nich niesie nowe treści merytoryczne. Mogą one też być postrzegane jako pewne identyfikatory grupujące wyjściowe zmienne w spójne pod względem merytorycznym grupy.

9 Czynniki wykorzystanie Analiza badanych zjawisk z punktu widzenia nowych, syntetycznych kategorii, którymi są wyodrębnione czynniki Tworzenie skal i miar złożonych z kilku pytań Ustalanie wag określających znaczenie, jakie należy przypisać poszczególnym zmiennym i czynnikom w trakcie analiz Ortogonalizacja przestrzeni, w której rozpatrywane są obiekty, będące przedmiotem badań Konstruowanie modeli ekonometrycznych (regresja)

10 Przykład Mamy dwa pytania: Czy są zadowoleni ze swojego hobby? Jak intensywnie uprawiają hobby? Odpowiedzi będą ze sobą wysoce skorelowane, możemy więc wnioskować, że są one redundantne. Połączenie dwóch zmiennych w jeden czynnik: Dopasowanie linii, która "najlepiej" oddaje związek liniowy między oboma zmiennymi. Gdybyśmy mogli zdefiniować taką zmienną, która w przybliżeniu określałaby linię regresji na wykresie rozrzutu, wówczas zmienna ta obejmowałaby większość informacji zawartej w obu pytaniach. W kolejnych analizach można by było wykorzystać taki nowy czynnik, w zastępstwie pierwotnych pytań. Jest to w pewnym sensie redukcja dwóch zmiennych do jednego czynnika. Nowy czynnik jest w rzeczywistości kombinacją liniową tych dwóch zmiennych.

11 Dane Zmienne mierzone na skali przedziałowej lub ilorazowej (skala Likerta, dyferencjał semantyczny) Zmienne, które są wskaźnikami ukrytych konceptów (nie przypadkowe ) Odpowiednie próby: zaleca się aby było przynajmniej cztery lub pięć razy tyle obserwacji (rozmiar próby) ile jest zmiennych.

12 Procedura Wybór zmiennych do analizy Wyznaczenie macierzy korelacji (kowariancji) Stwierdzenie zasadności przeprowadzenia analizy czynnikowej Wybór modelu czynnikowego Wyznaczenie głównych składowych / czynników wybór ich liczby Rotacja Interpretacja

13 Metodologia Przedmiot analizy: macierz danych, zawierająca n realizacji m zmiennych: X x ij, x ij 0, j i 1,2,..., m 1,2,..., n Zmienne pierwotne podlegają standaryzacji: Z = [ z ij ]

14 Metodologia Podstawą do wyznaczania elementów macierzy współczynników czynników jest macierz korelacji: R n 1 1 ', 1... ij r Z Z z z p j m ip ij n n i 1 Wariancje na głównej przekątnej są miarą zasobów informacyjnych zmiennych pierwotnych.

15 Model czynnikowy Jeżeli macierz korelacji zmiennych pierwotnych jest odpowiednia do zastosowania analizy czynnikowej można przejść do następnego etapu - wyboru modelu czynnikowego. Określa on sposób identyfikacji czynników. Metody czynnikowe dzieli się najogólniej na dwie podstawowe grupy: analiza głównych składowych metody klasycznej analizy czynnikowej (np. metoda osi głównych, metoda największej wiarygodności)

16 Analiza czynnikowa... stanowi zespół metod i procedur statystycznych pozwalających na badanie wzajemnych relacji między dużą liczbą zmiennych i wykrywanie ukrytych powiązań między zmiennymi Pozwala na sprowadzenie dużej liczby badanych zmiennych do znacznie mniejszej liczby wzajemnie niezależnych (nieskorelowanych) czynników Analiza czynnikowa to metoda modelowania liniowego zakłada się, że zmienne można przedstawić za pomocą liniowej funkcji zmiennych nieobserwowalnych (czynników), przy czym wszystkie zmienne przedstawiane są jako funkcje tych samych czynników W praktyce poszukujemy modelu czynnikowego, który by pasował do zastanej macierzy korelacji zmiennych pierwotnych

17 Analiza głównych składowych jest metodą transformacji zmiennych w nowe, ortogonalne zmienne, tzw. główne składowe. To przede wszystkim procedura ortogonalizacji zmiennych ułatwiająca budowę teoretycznego modelu opisującego strukturę i związki między badanymi zjawiskami. Klasyczna analiza czynnikowa zaś sama w sobie jest takim modelem => Mimo podobnych celów i wyników NIE SĄ tym samym metodologia się różni!! 17

18 Metoda głównych składowych polega na przekształceniu obserwowalnych zmiennych wejściowych w nowe, nieobserwowalne i zarazem nieskorelowane zmienne nazywane głównymi składowymi każda z głównych składowych jest liniową funkcją zmiennych wejściowych główne składowe są tak uporządkowane, aby wariancje kolejnych głównych składowych (stanowiące miarę ich zasobów informacyjnych o badanym zjawisku) były coraz mniejsze suma wariancji wszystkich zmiennych wejściowych jest równa sumie wariancji głównych składowych, co oznacza że przekształcenie zmiennych wejściowych w główne składowe nie prowadzi do żadnych strat informacji o badanym zjawisku kilka pierwszych głównych składowych zawiera zdecydowaną większość informacji o badanym zjawisku, dostarczanych przez zmienne wejściowe, co pozwala na redukcję liczby głównych składowych przy możliwie małej stracie informacji wejściowych

19 Metoda głównych składowych W praktyce chodzi o sprawdzenie, czy kilka nowych zmiennych wyjaśnia maksymalnie dużo zmienności wyjściowego układu przy zachowaniu nieskorelowania, co daje w efekcie redukcję wymiaru.

20 Metoda głównych składowych Zmienne pierwotne po standaryzacji można przedstawić jako liniową kombinację głównych składowych: Z T = AG T G = A T Z gdzie: Z - macierz i standaryzowanych zmiennych pierwotnych A - macierz współczynników składowych głównych G - macierz i składowych głównych 20

21 Metoda głównych składowych Pierwsza główna składowa G 1 jest taką kombinacją zmiennych pierwotnych, dla której wariancja próbkowa jest największa wśród wszystkich kombinacji liniowych (przy warunku jednoznacznego wyznaczenia wektora współczynników). Druga główna składowa G 2 - analogicznie - jest kombinacją liniową zmiennych pierwotnych, dla której wariancja próbkowa jest kolejna największa (przy warunku jednoznacznego wyznaczenia wektora współczynników oraz dodatkowym, zapewniającym ortogonalność powstałych składowych - konsekwencją tego jest sumowanie się kolejnych wariancji głównych składowych do wariancji całkowitej).

22 Metoda głównych składowych Każda i-ta główna składowa jest liniowa kombinacją zmiennych pierwotnych i wyjaśnia i-tą część całkowitej zmienności. Kolejne główne składowe są tak wyznaczane, aby wariancje kolejnych składowych były coraz mniejsze. Można wyznaczyć tyle głównych składowych, ile mamy zmiennych wyjściowych, jednak zazwyczaj kilka pierwszych wystarcza do wyjaśnienia większości wariancji układu zmiennych.

23 Znaczenie i użyteczność składowej głównej jest mierzona wielkością wyjaśnianej przez nią całkowitej zmienności. I tak, jeśli w układzie sześciu zmiennych pierwsza składowa wyjaśnia np. 85% zmienności, to znaczy to, że niemal cała zmienność tego układu da się przedstawić na prostej zamiast w sześciu wymiarach. W efekcie powstaje nam tyle głównych składowych, ile było początkowo zmiennych: nadal mamy układ m-wymiarowy. Ale w praktyce ograniczamy się do kilku pierwszych głównych składowych, które wyjaśniają z góry ustaloną część wariancji całkowitej, np. 75%.

24 Klasyczna analiza czynnikowa analiza czynnikowa jest metodą badania struktury wewnętrznych zależności obserwacji wielowymiarowych każda zmienna obserwowalna (wejściowa) przedstawiana jest jako kombinacja liniowa pewnej liczby nieobserwowalnych zmiennych, zwanych czynnikami, wspólnych dla całego zbioru zmiennych wejściowych oraz jednego nieobserwowalnego czynnika swoistego dla tej zmiennej czynniki wspólne i czynniki swoiste nie są ze sobą skorelowane. celem analizy czynnikowej jest znalezienie takiego zbioru czynników wspólnych oraz określenie ich relacji ze zmiennymi obserwowalnymi, który pozwala na wyjaśnienie struktury powiązań między zmiennymi obserwowalnymi

25 Klasyczna analiza czynnikowa Zakładamy, że źródłem wzajemnych zależności (skorelowania) między zmiennymi są ukryte wspólne czynniki, które można uznać za nośniki tej samej informacji, chcemy zatem je wyodrębnić w formie nowych, syntetycznych zmiennych. Jednak zakładamy też, że nie cała wariancja zmiennych jest powodowana tymi ukrytymi wspólnymi czynnikami każda zmienna pierwotna charakteryzuje się też pewnymi specyficznymi właściwościami.

26 Klasyczna analiza czynnikowa Zatem każda z obserwowalnych zmiennych Z jest funkcją liniową zmiennych nieobserwowalnych (czynników wspólnych) oraz pojedynczej zmiennej specyficznej: Z = AF + BU gdzie: Z - macierz j standaryzowanych zmiennych pierwotnych A - macierz ładunków czynnikowych czynników wspólnych F - macierz czynników wspólnych B macierz (diagonalna) ładunków czynnikowych czynników specyficznych U - macierz czynników specyficznych Założenia: - czynniki wspólne nie są skorelowane ze sobą - czynniki specyficzne również nie są ze sobą skorelowane - czynniki wspólne nie są skorelowane z czynnikami specyficznymi 26

27 Klasyczna analiza czynnikowa Podstawą identyfikacji składników wspólnych i specyficznych w macierzy R jest w analizie czynnikowej podział wariancji poszczególnych zmiennych na wariancję wspólną i specyficzną: h j 2 - zasób zmienności wspólnej /communality/ - część wariancji objaśniona przez czynniki wspólne w j 2 - zasób zmienności swoistej - pozostałość po odjęciu zasobu zmienności wspólnej od wariancji całkowitej

28 Klasyczna analiza czynnikowa Dążymy do eliminacji wpływu czynników specyficznych na rzecz czynników wspólnych. W tym celu zastępujemy w macierzy R współczynniki korelacji na głównej przekątnej zasobami zmienności wspólnej, otrzymując tzw. zredukowaną macierz korelacji : ~ R r~ ij rij dla i j r~ 2 ij hj dla i j

29 Klasyczna analiza czynnikowa Wartości h j 2 ustala się na poziomie: średniej arytmetycznej współczynników korelacji danej zmiennej z innymi zmiennymi: h j 2 = 1 m m i 1 r ij najwyższego co do modułu współczynnika korelacji j-tej zmiennej z pozostałymi: h 2 j = max [ r ij ], i j współczynnika determinacji wielorakiej R 2 danej zmiennej z innymi zmiennymi

30 Klasyczna analiza czynnikowa Kolejne wartości i wektory własne służą do uzyskania ładunków czynnikowych kolejnych czynników. Ładunki te odzwierciedlają korelację wspólnym czynnikiem. pomiędzy j-tą zmienną pierwotną i l-tym Najczęściej wybierane metody wyodrębniania czynników: Metoda Osi Głównych (Principal Axis Factor) Metoda Największej Wiarygodności (Maximum Likelihood)

31

32 Kryteria stosowalności analizy czynnikowej Silne korelacje między zmiennymi Indeks KMO (Kaiser-Meyer-Olkin) indeks ten porównuje cząstkowe współczynniki korelacji z dwuzmiennowymi współczynnikami korelacji. Przyjmuje wartości od 0 do 1, gdzie ) oznacza, że spodziewana redukcja będzie niewielka, więc stosowanie analizy czynnikowej nie ma sensu. Jest sens, gdy KMO jest większe od 0.5 Test Sferyczności Bartletta - test hipotezy, że macierz współczynników korelacji jest macierzą jednostkową, co oznacza, że nie ma istotnych korelacji między zmiennymi. Odrzucenie hipotezy zerowej świadczy o zasadności przeprowadzenia analizy

33 KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy.,831 Bartlett's Test of Sphericity Approx. Chi-Square 11905,395 df 300 Sig.,000 33

34 Kryteria wyboru liczby czynników 1. Kryterium Kaisera - metoda "wartości własnej (lambda) większej od jedności" - jest najczęściej stosowana. Jej podstawą jest to, że każda główna składowa powinna wyjaśniać przynajmniej tyle, ile jedna zmienna pierwotna. Metoda ta powinna być stosowana gdy ilość zmiennych jest większa od 20. Gdy liczba zmiennych jest mniejsza istnieje tendencja wyodrębniania zbyt małej ilości czynników 2. Kryterium Joliffe a j.w., lecz graniczna wartość to 0,7. Korekta wynika stąd, że główne składowe, które w populacji mają wartość własną >1 mogą mieć w próbie tę wartość mniejszą niż 1, ze względu na błąd losowy próby

35 Kryteria wyboru liczby czynników 3. Wykres osypiska (kryterium Cattella) wykres ilości czynników i ich wartości własnych. Identyfikujemy na nim "punkt załamania", w którym kąt załamania krzywej ("rumowisko"). Punkt ten określa liczbę czynników kwalifikujących się do dalszej analizy. Chodzi o to, aby uchwycić punkt, w którym dalsze zwiększanie liczby czynników będzie powodowało jedynie niewielkie przyrosty w sensie wyjaśnianej wariancji (gdy wykres zaczyna się wypłaszczać ). Metoda ta jest nieco bardziej "liberalna" niż metoda >1, pozwala włączyć do dalszej analizy nieco większą liczbę czynników 4. Skumulowany procent wyjaśnionej wariancji analizowanych zmiennych - do ogólnej liczby wybranych czynników zalicza się te czynniki, które w sumie wyjaśniają np.. 75%, 80% lub 90% wariancji, a żaden następny nie tłumaczy więcej niż 5% wariancji 5. Interpretowalność merytoryczna czynników

36 36

37 Składowa Ogółem Początkowe wartości własne % wariancji % skumulowany Ogółem Sumy kwadratów ładunków po wyodrębnieniu % wariancji % skumulowany Sumy kwadratów ładunków po rotacji Ogółem % wariancji % skumulowany 1 13,843 55,373 55,373 13,843 55,373 55,373 6,552 26,208 26, ,609 6,436 61,809 1,609 6,436 61,809 4,068 16,274 42, ,200 4,800 66,610 1,200 4,800 66,610 3,207 12,828 55,311 4,875 3,501 70,110,875 3,501 70,110 3,039 12,157 67,468 5,768 3,072 73,182,768 3,072 73,182 1,429 5,714 73,182 6,718 2,872 76,054 7,596 2,383 78,438 8,578 2,311 80,749 9,504 2,016 82,765 10,455 1,818 84,583 11,390 1,561 86,144 12,374 1,495 87,640 13,344 1,375 89,015 14,316 1,262 90,277 15,291 1,164 91,441 16,280 1,120 92,562 17,268 1,072 93,634 18,254 1,015 94,649 19,230,920 95,569 20,221,885 96,454 21,211,843 97,297 22,192,769 98,066 23,179,718 98,784 24,168,672 99,456 Metoda wyodrębniania czynników - Głównych składowych.

38 Kryteria wyboru liczby czynników Najrozsądniejszą zasadą jest zatrzymanie się na takiej liczbie czynników, które są sensowne. Jeśli czynnik, który miałby być wyłączony przestaje być sensowny, to nie powinien być uwzględniany. => Wybór liczby czynników jest zazwyczaj bardzo subiektywny

39 Interpretacja Czynnik jest interpretowany na podstawie ładunków czynnikowych (ew. rotowanych) Ładunki czynnikowe są korelacjami miedzy czynnikami a początkowymi zmiennymi => dostarczają informacji do subiektywnego zidentyfikowania i nazwania nieobserwowalnych czynników głównych (wymiarów) Każdy czynnik podlega interpretacji ze względu na te zmienne pierwotne, które mają wysokie ładunki czynnikowe. Istotne ładunki czynnikowe to najczęściej > 0.3 Ideanie byłoby, gdyby każda zmienna miała duży ładunek tylko dla jednego czynnika jeśli jest inaczej, zmienną pierwotną należy uwzględnić w interpretacji wszystkich czynników, dla których jej ładunek jest istotny. Zmienne pierwotne bez dużych ładunków w żadnym z czynników usunąć z analizy.

40 Przykład 1a. Badanie satysfakcji pracowników FIRMY X Zmienne wpływające na satysfakcje z pracy zostały w drodze analizy czynnikowej podzielone na dwa czynniki. Pierwsza skupia te aspekty, które mówią o satysfakcji z siebie, jako pracownika i własnych osiągnięć, a druga aspekty związane z dbałością firmy i możliwościami jakie daje FIRMA. Czynniki zadowolenia z pracy na stacji Ocena aspektów w podziale na prowadzących i pracowników stacji (skala: 1 zdecydowanie się nie zgadzam 5 zdecydowanie się zgadzam) Firma Prowadzący [N=450] Pracownik [N=675]

41 Przykład 1b. Badanie satysfakcji pracowników FIRMY X Czynniki wyodrębnione miejsce pracownika w społeczności FIRMY X Firmą Firmy Prowadzący Ocena aspektów w podziale na prowadzących i pracowników (skala: 1 zdecydowanie się nie zgadzam 5 zdecydowanie się zgadzam) Firmy Firma 3.5 wartość istotnie większa Prowadzący [N=450] Pracownik [N=675]

42 Przykład 2. Alkohole wymiary oceny Składowa Lubię poprawiać sobie nią nastrój,787,302,200 Marka dla ludzi takich jak ja,783,213,219,291 Poleciłbym tę markę innym,739,352,241,337 Ta marka wódki jest ceniona przez znajomych, z którymi ją piję,716,361,203,223 Na spotkania z przyjaciółmi,691,464,250,219 Po wypiciu nawet dużej ilości wódki tej marki, następnego dnia czuję się dobrze,670,225,216,366 Zakupił(a)bym tę markę organizując ważne przyjęcie dla dużej liczby osób,660,478,257 Wódka tej marki łatwo wchodzi,631,360,313,261 Marka warta swej ceny,592,310,208,530 Wódka tej marki jest mocna,714,322 Marka dobra na prezent,361,635,340 Odpowiednia do uczczenia specjalnych okazji,476,618,361 Nie wstydził(a)bym się wódką tej marki poczęstować gości,435,597,291,308 Nadaje się do dobrej zabawy w męskim towarzystwie,583,594,272 Prestiżowa marka,495,567,263,363 Odrobina wódki tej marki pomaga rozkręcić zabawę / imprezę,458,520,306,249,249 Jest odpowiednia przede wszystkim dla kobiet,774 Pasuje do deseru,259,765 Wódka tej marki nie ma ostrego zapachu,328,682,224 Jest na tyle łagodna, że nie trzeba jej zagryzać ani popijać,270,567,315,438 Marka naprawdę inna od pozostałych,394,223,725 Osobom, które jej nigdy nie próbowały jej smak może nie przypaść do gustu,690,338 Wódka tej marki ma oryginalny smak,250,310,271,620,253 Marka bardzo wysokiej jakości,493,421,256,583 Można używać jej w celach leczniczych, np. w trakcie przeziębienia,226,203,718

43 Przykład 2 cd. 1. to marka moja i moich znajomych: Lubię poprawiać sobie nią nastrój, Marka dla ludzi takich jak ja, Poleciłbym tę markę innym, Ta marka wódki jest ceniona przez znajomych, z którymi ją piję, Na spotkania z przyjaciółmi, Po wypiciu nawet dużej ilości wódki tej marki, następnego dnia czuję się dobrze, Zakupił(a)bym tę markę organizując ważne przyjęcie dla dużej liczby osób, Wódka tej marki łatwo wchodzi, Marka warta swej ceny 2. dobra do zabawy: Wódka tej marki jest mocna, Marka dobra na prezent, Odpowiednia do uczczenia specjalnych okazji, Nie wstydził(a)bym się wódką tej marki poczęstować gości, Nadaje się do dobrej zabawy w męskim towarzystwie, Prestiżowa marka, Odrobina wódki tej marki pomaga rozkręcić zabawę / imprezę 3. kobieca, delikatna: Jest odpowiednia przede wszystkim dla kobiet, Pasuje do deseru, Wódka tej marki nie ma ostrego zapachu, Jest na tyle łagodna, że nie trzeba jej zagryzać ani popijać, 4. wyjątkowa, wysokiej jakości, inna: Marka naprawdę inna od pozostałych, Istnieje krąg ludzi lubiących tę markę ale osobom, które jej nigdy nie próbowały jej smak może nie przypaść do gustu, Wódka tej marki ma oryginalny smak, Marka bardzo wysokiej jakości 5. lecznicza: Można używać jej w celach leczniczych, np. w trakcie przeziębienia

44 Wyznaczanie wartości czynników Na koniec najczęściej potrzebny jest sposób wyznaczenia wartości poszczególnych czynników dla kolejnych obserwacji. Jest wiele metod szacowania wartości czynników (np. w SPSS są 3): Regresyjna (daje oszacowania najbliższe rzeczywistym wartościom czynnikowym) Bartletta Andersona-Rubina

45 Rotacja Na ogół dąży się do tego, aby ładunki czynnikowe, tj. współczynniki korelacji między poszczególnym wskaźnikiem a danym czynnikiem, miały wartości bliskie 0 lub bliskie maksymalnej wartości +1 lub 1. Poszukuje się takiego układu czynnikowego, aby każdy wskaźnik miał wysoki ładunek tylko na jednym czynniku i aby każdy czynnik miał wartości tych ładunków bliskie 0 dla kilku wskaźników i bliskie wartościom maksymalnym dla pozostałych. Nie zawsze bezpośrednio osiągalne = > rotacja Rotacja polega na sprowadzeniu struktury ładunków do prostej struktury, w której punkty reprezentujące zmienne skupiają się wokół osi czynników, co zapewniła możliwie najłatwiejszą interpretację czynników.

46 Rotacja Najczęściej stosuje się procedury rotacji ortogonalnej: VARIMAX upraszcza interpretację czynników (minimalizuje liczbę zmiennych potrzebnych do wyjaśnienia danego czynnika) upraszcza QUARTIMAX interpretację zmiennych (minimalizuje liczbę czynników potrzebnych do wyjaśnienia danej zmiennej). Rotacje nieortogonalne dopuszczamy skorelowanie powstałych czynników!

47 Podsumowanie Analiza czynnikowa Ch. Spearman (1904), L.L. Thurstone (1913) H. Hotteling (1933) orientacja kowariancyjna: punktem wyjścia jest zredukowana macierz korelacji model otwarty: obok wariancji cech uwzględnia się także wariancję nieobjaśnianą (zm. pominięte, losowość obserwacji) Analiza głównych składowych orientacja wariancyjna: punktem wyjścia jest zwykła macierz korelacji model zamknięty: uwzględnia się wyłącznie wariancję badanych zmiennych każda zmienna pierwotna jest funkcją nieobserwowanych czynników wspólnych i czynnika swoistego zmienne pierwotne są liniową funkcją składowych głównych (a główne składowe można przedstawić jako kombinacje liniowe zmiennych pierwotnych) buduje się teoretyczny model zjawiska i sprawdza, czy jest zgodny z danymi empirycznymi Celem analizy jest identyfikacja ukrytych zmiennych wychodzi się od obserwacji empirycznych, a następnie buduje model teoretyczny Celem analizy jest uproszczenie struktury danych równanie podstawowe: Z=AF + BU równanie podstawowe: Z T = AG T / G = A T Z 47

48 PCA Zwyczaje zakupowe Component FA Factor Z1b. I try to buy products which are currently advertised,740,110 Z1b. I am curious about new products which,671,267 appear in shops Z1b. I am curious about new products which appear in,721,232 -,108 Z1b. I try to buy products which are currently,660,102 shops advertised Z1b. I just enjoy spending my free time in a store,652,183 Z1b. I just enjoy spending my free time in a store,564,200,111 Z1b. I often shop for products I need at parties, social gatherings etc.,635,182 Z1b. I often shop for products I need at parties, social gatherings etc. Z1b. I often buy ready-to-use products or instant products,572 -,151 Z1b. I often buy ready-to-use products or instant products Z1b. When I shop, I often opt for diet/light products,425,119,252,374 Z1b. Most of my shopping is unplanned / decide to buy things on impulse, on the spur of the moment Z1b. I take a lot of care to learn what my loved ones really,677,197 Z1b. When I shop, I often opt for diet/light like and I shop to with their preferences in mind products,542,185,469,410 -,233,365,138,171,354 Z1b. It is very important for me that products I buy are really healthful/natural Z1b. I spend considerable time looking for fresh/safe products Z1b. Most of my shopping is unplanned / decide to buy things on impulse, on the spur of the moment Z1b. I try to choose stores where I know the sales staff and I can have a nice chat with them Z1b. It is important for me that products I buy are recognised and appreciate by people around me and impress others Z1b. When shopping I want to show I am a good homemaker/host to make sure nobody can blaming for not taking enough care of my home Z1b. As a rule, I do not hesitate to make comments to the staff if things in a store are not the way think they should be Z1b. I enjoy shopping with a shopping list I prepared earlier,676,277 Z1b. It is very important for me that products I buy are really healthful/natural,195,591,148,207 Z1b. I take a lot of care to learn what my loved ones really like and I shop to with their preferences in mind,440 -,471,282 Z1b. I spend considerable time looking for fresh/safe products -,230,156,656,212 Z1b. When shopping I want to show I am a good homemaker/host to make sure nobody can blaming for not taking enough care of my home,392,168,650 Z1b. It is important for me that products I buy are recognised and appreciate by people around me and impress others,226,391,629 Z1b. I try to choose stores where I know the sales staff and I can have a nice chat with them -,166,204,739 Z1b. I enjoy shopping with a shopping list I prepared earlier,396 -,197,675 Z1b. As a rule, I do not hesitate to make comments to the staff if things in a store are not the way think they should be,633,180,540,212,143,499,127,245,196,346,619,363,152,610 -,137,204,353,187,219,389,379 48

49 ANALIZA CZYNNIKOWA Analiza eksploracyjna czynniki są początkowo nieznane i zostają wyodrębnione dzięki analizie: dane grupowane są w zbiory zmiennych najsilniej ze sobą skorelowanych wykrywanie związków między zmiennymi bez wstępnych założeń Analiza konfirmacyjna weryfikacja hipotez co do określonej z góry struktury czynników i estymacja parametrów założonego modelu

50 Dziękuję za uwagę

ANALIZA CZYNNIKOWA Przykład 1

ANALIZA CZYNNIKOWA Przykład 1 ANALIZA CZYNNIKOWA... stanowi zespół metod i procedur statystycznych pozwalających na badanie wzajemnych relacji między dużą liczbą zmiennych i wykrywanie ukrytych uwarunkowań, ktore wyjaśniają ich występowanie.

Bardziej szczegółowo

CELE ANALIZY CZYNNIKOWEJ

CELE ANALIZY CZYNNIKOWEJ ANALIZA CZYNNIKOWA... stanowi zespół metod i procedur statystycznych pozwalających na badanie wzajemnych relacji między dużą liczbą zmiennych i wykrywanie ukrytych uwarunkowań, ktore wyjaśniają ich występowanie.

Bardziej szczegółowo

Analiza składowych głównych. Wprowadzenie

Analiza składowych głównych. Wprowadzenie Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących

Bardziej szczegółowo

Zmienne zależne i niezależne

Zmienne zależne i niezależne Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }

Bardziej szczegółowo

Kolejna z analiz wielozmiennowych Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki

Kolejna z analiz wielozmiennowych Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki Analiza czynnikowa Kolejna z analiz wielozmiennowych Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki Budowa wskaźnika Indeks był banalny I miał wady: o Czy

Bardziej szczegółowo

Prawdopodobieństwo i statystyka

Prawdopodobieństwo i statystyka Wykład XV: Zagadnienia redukcji wymiaru danych 2 lutego 2015 r. Standaryzacja danych Standaryzacja danych Własności macierzy korelacji Definicja Niech X będzie zmienną losową o skończonym drugim momencie.

Bardziej szczegółowo

Wprowadzenie (1) Przedmiotem analizy czynnikowej jest badanie wewnętrznych zależności w zbiorze zmiennych. Jest to modelowanie niejawne. Oprócz zmienn

Wprowadzenie (1) Przedmiotem analizy czynnikowej jest badanie wewnętrznych zależności w zbiorze zmiennych. Jest to modelowanie niejawne. Oprócz zmienn Analiza czynnikowa Wprowadzenie (1) Przedmiotem analizy czynnikowej jest badanie wewnętrznych zależności w zbiorze zmiennych. Jest to modelowanie niejawne. Oprócz zmiennych, które są bezpośrednio obserwowalne

Bardziej szczegółowo

Zadanie 1. Za pomocą analizy rzetelności skali i wspólczynnika Alfa- Cronbacha ustalić, czy pytania ankiety stanowią jednorodny zbiór.

Zadanie 1. Za pomocą analizy rzetelności skali i wspólczynnika Alfa- Cronbacha ustalić, czy pytania ankiety stanowią jednorodny zbiór. L a b o r a t o r i u m S P S S S t r o n a 1 W zbiorze Pytania zamieszczono odpowiedzi 25 opiekunów dzieci w wieku 8. lat na następujące pytania 1 : P1. Dziecko nie reaguje na bieżące uwagi opiekuna gdy

Bardziej szczegółowo

Analiza składowych głównych

Analiza składowych głównych Analiza składowych głównych Wprowadzenie (1) W przypadku regresji naszym celem jest predykcja wartości zmiennej wyjściowej za pomocą zmiennych wejściowych, wykrycie związku między wielkościami wejściowymi

Bardziej szczegółowo

Statystyka i eksploracja danych

Statystyka i eksploracja danych Wykład XII: Zagadnienia redukcji wymiaru danych 12 maja 2014 Definicja Niech X będzie zmienną losową o skończonym drugim momencie. Standaryzacją zmiennej X nazywamy zmienną losową Z = X EX Var (X ). Definicja

Bardziej szczegółowo

Analiza głównych składowych- redukcja wymiaru, wykł. 12

Analiza głównych składowych- redukcja wymiaru, wykł. 12 Analiza głównych składowych- redukcja wymiaru, wykł. 12 Joanna Jędrzejowicz Instytut Informatyki Konieczność redukcji wymiaru w eksploracji danych bazy danych spotykane w zadaniach eksploracji danych mają

Bardziej szczegółowo

Analiza składowych głównych idea

Analiza składowych głównych idea Analiza składowych głównych idea Analiza składowych głównych jest najczęściej używanym narzędziem eksploracyjnej analizy danych. Na metodę tę można spojrzeć jak na pewną technikę redukcji wymiarowości

Bardziej szczegółowo

Idea. Analiza składowych głównych Analiza czynnikowa Skalowanie wielowymiarowe Analiza korespondencji Wykresy obrazkowe.

Idea. Analiza składowych głównych Analiza czynnikowa Skalowanie wielowymiarowe Analiza korespondencji Wykresy obrazkowe. Idea (ang. Principal Components Analysis PCA) jest popularnym używanym narzędziem analizy danych. Na metodę tę można spojrzeć jak na pewną technikę redukcji wymiarowości danych. Jest to metoda nieparametryczna,

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Regresja logistyczna (LOGISTIC)

Regresja logistyczna (LOGISTIC) Zmienna zależna: Wybór opcji zachodniej w polityce zagranicznej (kodowana jako tak, 0 nie) Zmienne niezależne: wiedza o Unii Europejskiej (WIEDZA), zamieszkiwanie w regionie zachodnim (ZACH) lub wschodnim

Bardziej szczegółowo

Szukanie struktury skali mierzącej problematyczne zachowania finansowe.

Szukanie struktury skali mierzącej problematyczne zachowania finansowe. Szukanie struktury skali mierzącej problematyczne zachowania finansowe. Celem poniższej analizy było stworzenie skali mierzącej problematyczne zachowania finansowej. Takie zachowania zdefiniowano jako

Bardziej szczegółowo

Analiza korespondencji

Analiza korespondencji Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Regresja wielokrotna Model dla zależności liniowej: Y=a+b 1 X 1 +b 2 X 2 +...+b n X n Cząstkowe współczynniki regresji wielokrotnej: b 1,..., b n Zmienne niezależne (przyczynowe): X 1,..., X n Zmienna

Bardziej szczegółowo

Elementy statystyki wielowymiarowej

Elementy statystyki wielowymiarowej Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Elementy statystyki wielowymiarowej 1.1 Kowariancja i współczynnik korelacji 1.2 Macierz kowariancji 1.3 Dwumianowy rozkład normalny 1.4 Analiza składowych

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Szukanie struktury skali mierzącej problematyczne zachowania finansowe.

Szukanie struktury skali mierzącej problematyczne zachowania finansowe. Szukanie struktury skali mierzącej problematyczne zachowania finansowe. Celem poniższej analizy było stworzenie skali mierzącej problematyczne zachowania finansowe. Takie zachowania zdefiniowano jako zachowania

Bardziej szczegółowo

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Zadanie 1: wiek 7 8 9 1 11 11,5 12 13 14 14 15 16 17 18 18,5 19 wzrost 12 122 125 131 135 14 142 145 15 1 154 159 162 164 168 17 Wykres

Bardziej szczegółowo

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu

Bardziej szczegółowo

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007 , transformacja liniowa i estymacja modelu KMNK Paweł Cibis pawel@cibis.pl 9 marca 2007 1 Miary dopasowania modelu do danych empirycznych Współczynnik determinacji Współczynnik zbieżności Skorygowany R

Bardziej szczegółowo

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska. SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia

Bardziej szczegółowo

Skalowanie wielowymiarowe idea

Skalowanie wielowymiarowe idea Skalowanie wielowymiarowe idea Jedną z wad metody PCA jest możliwość używania jedynie zmiennych ilościowych, kolejnym konieczność posiadania pełnych danych z doświadczenia(nie da się użyć PCA jeśli mamy

Bardziej szczegółowo

Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński Mikroekonometria 12 Mikołaj Czajkowski Wiktor Budziński Dane panelowe Co jeśli mamy do dyspozycji dane panelowe? Kilka obserwacji od tych samych respondentów, w różnych punktach czasu (np. ankieta realizowana

Bardziej szczegółowo

MODELE LINIOWE. Dr Wioleta Drobik

MODELE LINIOWE. Dr Wioleta Drobik MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą

Bardziej szczegółowo

(x j x)(y j ȳ) r xy =

(x j x)(y j ȳ) r xy = KORELACJA. WSPÓŁCZYNNIKI KORELACJI Gdy w badaniu mamy kilka cech, często interesujemy się stopniem powiązania tych cech między sobą. Pod słowem korelacja rozumiemy współzależność. Mówimy np. o korelacji

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

Wybór optymalnej liczby składowych w analizie czynnikowej Test Równolegości Horn a i test MAP Velicera

Wybór optymalnej liczby składowych w analizie czynnikowej Test Równolegości Horn a i test MAP Velicera Wybór optymalnej liczby składowych w analizie czynnikowej Test Równolegości Horn a i test MAP Velicera Wielu badaczy podejmuje decyzje o optymalnej liczbie składowych do wyodrębnienia na podstawie arbitralnych

Bardziej szczegółowo

5. WNIOSKOWANIE PSYCHOMETRYCZNE

5. WNIOSKOWANIE PSYCHOMETRYCZNE 5. WNIOSKOWANIE PSYCHOMETRYCZNE Model klasyczny Gulliksena Wynik otrzymany i prawdziwy Błąd pomiaru Rzetelność pomiaru testem Standardowy błąd pomiaru Błąd estymacji wyniku prawdziwego Teoria Odpowiadania

Bardziej szczegółowo

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VIII: Analiza kanoniczna

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VIII: Analiza kanoniczna 1 Laboratorium VIII: Analiza kanoniczna Spis treści Laboratorium VIII: Analiza kanoniczna... 1 Wiadomości ogólne... 2 1. Wstęp teoretyczny.... 2 Przykład... 2 Podstawowe pojęcia... 2 Założenia analizy

Bardziej szczegółowo

10. Redukcja wymiaru - metoda PCA

10. Redukcja wymiaru - metoda PCA Algorytmy rozpoznawania obrazów 10. Redukcja wymiaru - metoda PCA dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. PCA Analiza składowych głównych: w skrócie nazywana PCA (od ang. Principle Component

Bardziej szczegółowo

Badania eksperymentalne

Badania eksperymentalne Badania eksperymentalne Analiza CONJOINT mgr Agnieszka Zięba Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa Najpopularniejsze sposoby oceny wyników eksperymentu w schematach

Bardziej szczegółowo

Mikroekonometria 14. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 14. Mikołaj Czajkowski Wiktor Budziński Mikroekonometria 14 Mikołaj Czajkowski Wiktor Budziński Symulacje Analogicznie jak w przypadku ciągłej zmiennej zależnej można wykorzystać metody Monte Carlo do analizy różnego rodzaju problemów w modelach

Bardziej szczegółowo

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować

Bardziej szczegółowo

Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej

Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej Paweł Cibis pawel@cibis.pl 23 lutego 2007 1 Regresja liniowa 2 wzory funkcje 3 Korelacja liniowa

Bardziej szczegółowo

Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin. Henryk Bujak

Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin. Henryk Bujak Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin Henryk Bujak e-mail: h.bujak@ihar.edu.pl Ocena różnorodności fenotypowej Różnorodność fenotypowa kolekcji roślinnych zasobów

Bardziej szczegółowo

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji

Bardziej szczegółowo

Wielowymiarowa Analiza Korespondencji. Wielowymiarowa Analiza Danych z wykorzystaniem pakietu SPSS. Joanna Ciecieląg, Marek Pęczkowski WNE UW

Wielowymiarowa Analiza Korespondencji. Wielowymiarowa Analiza Danych z wykorzystaniem pakietu SPSS. Joanna Ciecieląg, Marek Pęczkowski WNE UW Wielowymiarowa Analiza Korespondencji Wielowymiarowa Analiza Danych z wykorzystaniem pakietu SPSS Joanna Ciecieląg, Marek Pęczkowski WNE UW ANALIZA KORESPONDENCJI opisowa i eksploracyjna technika analizy

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych 3.1. Estymacja parametrów i ocena dopasowania modeli z jedną zmienną 23. Właściciel komisu w celu zbadania

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8 Regresja wielokrotna Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X 1, X 2, X 3,...) na zmienną zależną (Y).

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta

Bardziej szczegółowo

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb Współzależność Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb (x i, y i ). Geometrycznie taką parę

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, 诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów

Bardziej szczegółowo

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y). Statystyka i opracowanie danych Ćwiczenia 12 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA WIELORAKA Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych

Bardziej szczegółowo

MODEL STRUKTURALNY RELACJI MIĘDZY SATYSFAKCJĄ

MODEL STRUKTURALNY RELACJI MIĘDZY SATYSFAKCJĄ MODEL STRUKTURALNY RELACJI MIĘDZY SATYSFAKCJĄ I LOJALNOŚCIĄ WOBEC MARKI Adam Sagan Akademia Ekonomiczna w Krakowie, Katedra Analizy Rynku i Badań Marketingowych Wstęp Modelowanie strukturalne ma wielorakie

Bardziej szczegółowo

Stosowana Analiza Regresji

Stosowana Analiza Regresji Stosowana Analiza Regresji Wykład VIII 30 Listopada 2011 1 / 18 gdzie: X : n p Q : n n R : n p Zał.: n p. X = QR, - macierz eksperymentu, - ortogonalna, - ma zera poniżej głównej diagonali. [ R1 X = Q

Bardziej szczegółowo

3. Modele tendencji czasowej w prognozowaniu

3. Modele tendencji czasowej w prognozowaniu II Modele tendencji czasowej w prognozowaniu 1 Składniki szeregu czasowego W teorii szeregów czasowych wyróżnia się zwykle następujące składowe szeregu czasowego: a) składowa systematyczna; b) składowa

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss

Bardziej szczegółowo

Etapy modelowania ekonometrycznego

Etapy modelowania ekonometrycznego Etapy modelowania ekonometrycznego jest podstawowym narzędziem badawczym, jakim posługuje się ekonometria. Stanowi on matematyczno-statystyczną formę zapisu prawidłowości statystycznej w zakresie rozkładu,

Bardziej szczegółowo

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,

Bardziej szczegółowo

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy

Bardziej szczegółowo

Budowanie macierzy danych geograficznych Procedura normalizacji Budowanie wskaźnika syntetycznego

Budowanie macierzy danych geograficznych Procedura normalizacji Budowanie wskaźnika syntetycznego Metody Analiz Przestrzennych Budowanie macierzy danych geograficznych Procedura normalizacji Budowanie wskaźnika syntetycznego mgr Marcin Semczuk Zakład Przedsiębiorczości i Gospodarki Przestrzennej Instytut

Bardziej szczegółowo

Analiza współzależności dwóch cech I

Analiza współzależności dwóch cech I Analiza współzależności dwóch cech I Współzależność dwóch cech W tym rozdziale pokażemy metody stosowane dla potrzeb wykrywania zależności lub współzależności między dwiema cechami. W celu wykrycia tych

Bardziej szczegółowo

ANALIZA CZYNNIKOWA W BADANIACH STRUKTURY RELACJI W MARKETINGU RELACYJNYM

ANALIZA CZYNNIKOWA W BADANIACH STRUKTURY RELACJI W MARKETINGU RELACYJNYM dr Magdalena Kowalska-Musiał Wyższa Szkoła Zarządzania i Bankowości w Krakowie ANALIZA CZYNNIKOWA W BADANIACH STRUKTURY RELACJI W MARKETINGU RELACYJNYM Wprowadzenie Zgodnie z najnowszymi trendami strategie

Bardziej szczegółowo

ANALIZA DYNAMIKI DOCHODU KRAJOWEGO BRUTTO

ANALIZA DYNAMIKI DOCHODU KRAJOWEGO BRUTTO ANALIZA DYNAMIKI DOCHODU KRAJOWEGO BRUTTO Wprowadzenie Zmienność koniunktury gospodarczej jest kształtowana przez wiele różnych czynników ekonomicznych i pozaekonomicznych. Znajomość zmienności poszczególnych

Bardziej szczegółowo

ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA. dr inż. Aleksander Astel

ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA. dr inż. Aleksander Astel ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA dr inż. Aleksander Astel Gdańsk, 22.12.2004 CHEMOMETRIA dziedzina nauki i techniki zajmująca się wydobywaniem użytecznej informacji z wielowymiarowych

Bardziej szczegółowo

Zaawansowana eksploracja danych - sprawozdanie nr 1 Rafał Kwiatkowski 89777, Poznań

Zaawansowana eksploracja danych - sprawozdanie nr 1 Rafał Kwiatkowski 89777, Poznań Zaawansowana eksploracja danych - sprawozdanie nr 1 Rafał Kwiatkowski 89777, Poznań 6.11.1 1 Badanie współzależności atrybutów jakościowych w wielowymiarowych tabelach danych. 1.1 Analiza współzależności

Bardziej szczegółowo

Szkice rozwiązań z R:

Szkice rozwiązań z R: Szkice rozwiązań z R: Zadanie 1. Założono doświadczenie farmakologiczne. Obserwowano przyrost wagi ciała (przyrost [gram]) przy zadanych dawkach trzech preparatów (dawka.a, dawka.b, dawka.c). Obiektami

Bardziej szczegółowo

Modelowanie glikemii w procesie insulinoterapii

Modelowanie glikemii w procesie insulinoterapii Dawid Kaliszewski Modelowanie glikemii w procesie insulinoterapii Promotor dr hab. inż. Zenon Gniazdowski Cel pracy Zbudowanie modelu predykcyjnego przyszłych wartości glikemii diabetyka leczonego za pomocą

Bardziej szczegółowo

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007 Modele regresji wielorakiej - dobór zmiennych, szacowanie Paweł Cibis pawel@cibis.pl 1 kwietnia 2007 1 Współczynnik zmienności Współczynnik zmienności wzory Współczynnik zmienności funkcje 2 Korelacja

Bardziej szczegółowo

Zasady rzetelnego pomiaru efektywności transferu wiedzy w e-learningu akademickim

Zasady rzetelnego pomiaru efektywności transferu wiedzy w e-learningu akademickim Zasady rzetelnego pomiaru efektywności transferu wiedzy w e-learningu akademickim Wojciech BIZON Wydział Ekonomiczny Uniwersytet Gdański 1 Problem w długim horyzoncie czasowym do rozwiązania: w jaki sposób

Bardziej szczegółowo

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( ) Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału

Bardziej szczegółowo

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ Korelacja oznacza fakt współzależności zmiennych, czyli istnienie powiązania pomiędzy nimi. Siłę i kierunek powiązania określa się za pomocą współczynnika korelacji

Bardziej szczegółowo

Statystyka i Analiza Danych

Statystyka i Analiza Danych Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania wybranych technik regresyjnych do modelowania współzależności zjawisk Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki

Bardziej szczegółowo

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na

Bardziej szczegółowo

Natalia Nehrebecka Stanisław Cichocki. Wykład 13

Natalia Nehrebecka Stanisław Cichocki. Wykład 13 Natalia Nehrebecka Stanisław Cichocki Wykład 13 1 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje nietypowe i błędne 4. Współliniowość 2 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje

Bardziej szczegółowo

Metodologia badań psychologicznych. Wykład 12. Korelacje

Metodologia badań psychologicznych. Wykład 12. Korelacje Metodologia badań psychologicznych Lucyna Golińska SPOŁECZNA AKADEMIA NAUK Wykład 12. Korelacje Korelacja Korelacja występuje wtedy gdy dwie różne miary dotyczące tych samych osób, zdarzeń lub obiektów

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 23 marca 2006

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 23 marca 2006 , transformacja liniowa i estymacja modelu KMNK Paweł Cibis pcibis@o2.pl 23 marca 2006 1 Miary dopasowania modelu do danych empirycznych Współczynnik determinacji Współczynnik zbieżności 2 3 Etapy transformacji

Bardziej szczegółowo

Co to jest analiza regresji?

Co to jest analiza regresji? Co to jest analiza regresji? Celem analizy regresji jest badanie związków pomiędzy wieloma zmiennymi niezależnymi (objaśniającymi) a zmienną zależną (objaśnianą), która musi mieć charakter liczbowy. W

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny

Bardziej szczegółowo

ANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH

ANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH ANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH - Adrian Gorgosz - Paulina Tupalska ANALIZA WIELOPOZIOMOWA (AW) Multilevel Analysis Obecna od lat 80. Popularna i coraz częściej stosowana

Bardziej szczegółowo

Wykład 10 Skalowanie wielowymiarowe

Wykład 10 Skalowanie wielowymiarowe Wykład 10 Skalowanie wielowymiarowe Wrocław, 30.05.2018r Skalowanie wielowymiarowe (Multidimensional Scaling (MDS)) Główne cele MDS: przedstawienie struktury badanych obiektów przez określenie treści wymiarów

Bardziej szczegółowo

Analiza kanoniczna w pigułce

Analiza kanoniczna w pigułce Analiza kanoniczna w pigułce Przemysław Biecek Seminarium Statystyka w medycynie Propozycje tematów prac dyplomowych 1/14 Plan 1 Słów kilka o podobnych metodach (PCA, regresja) 2 Motywacja, czyli jakiego

Bardziej szczegółowo

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Wprowadzenie do teorii ekonometrii Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Zajęcia Wykład Laboratorium komputerowe 2 Zaliczenie EGZAMIN (50%) Na egzaminie obowiązują wszystkie informacje

Bardziej szczegółowo

Teoretyczne podstawy analizy indeksowej klasyfikacja indeksów, konstrukcja, zastosowanie

Teoretyczne podstawy analizy indeksowej klasyfikacja indeksów, konstrukcja, zastosowanie Teoretyczne podstawy analizy indeksowej klasyfikacja indeksów, konstrukcja, zastosowanie Szkolenie dla pracowników Urzędu Statystycznego nt. Wybrane metody statystyczne w analizach makroekonomicznych dr

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1 2 3 1. Wprowadzenie do danych panelowych a) Charakterystyka danych panelowych b) Zalety i ograniczenia 2. Modele ekonometryczne danych panelowych a) Model efektów

Bardziej szczegółowo

Badanie zależności skala nominalna

Badanie zależności skala nominalna Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność

Bardziej szczegółowo

Hierarchiczna analiza skupień

Hierarchiczna analiza skupień Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym

Bardziej szczegółowo

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński Mikroekonometria 13 Mikołaj Czajkowski Wiktor Budziński Endogeniczność regresja liniowa W regresji liniowej estymujemy następujące równanie: i i i Metoda Najmniejszych Kwadratów zakłada, że wszystkie zmienne

Bardziej szczegółowo

Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)

Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition) Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition) Robert Respondowski Click here if your download doesn"t start automatically Wojewodztwo Koszalinskie:

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji Ćwiczenie: Wybrane zagadnienia z korelacji i regresji W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Stanisza r xy = 0 zmienne nie są skorelowane 0 < r xy 0,1

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Redakcja i korekta Bogdan Baran Projekt graficzny okładki Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2011 ISBN

Bardziej szczegółowo

TRANSFORMACJE I JAKOŚĆ DANYCH

TRANSFORMACJE I JAKOŚĆ DANYCH METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING TRANSFORMACJE I JAKOŚĆ DANYCH Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej

Bardziej szczegółowo

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka Statystyka opisowa. Wykład V. e-mail:e.kozlovski@pollub.pl Spis treści 1 Prosta regresji cechy Y względem cech X 1,..., X k. 2 3 Wyznaczamy zależność cechy Y od cech X 1, X 2,..., X k postaci Y = α 0 +

Bardziej szczegółowo

Aproksymacja funkcji a regresja symboliczna

Aproksymacja funkcji a regresja symboliczna Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą

Bardziej szczegółowo

Korelacja, autokorelacja, kowariancja, trendy. Korelacja określa stopień asocjacji między zmiennymi

Korelacja, autokorelacja, kowariancja, trendy. Korelacja określa stopień asocjacji między zmiennymi Korelacja, autokorelacja, kowariancja, trendy Korelacja określa stopień asocjacji między zmiennymi Kowariancja Wady - ograniczenia. Wartość kowariancji zależy od rozmiarów zmienności zmiennej.. W konsekwencji

Bardziej szczegółowo

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych. Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą

Bardziej szczegółowo