WPROWADZENIE DO MODELOWANIA ZJAWISK SPOŁECZNYCH I PRZYKŁADY ZASTOSOWAŃ W STATISTICA
|
|
- Zdzisław Tomczyk
- 6 lat temu
- Przeglądów:
Transkrypt
1 WPROWADZENIE DO MODELOWANIA ZJAWISK SPOŁECZNYCH I PRZYKŁADY ZASTOSOWAŃ W STATISTICA Adam Sagan, Uniwersytet Ekonomiczny w Krakowie, Katedra Analizy Rynku i Badań Marketingowych Wykorzystanie podejścia modelowego w badaniach społecznych (badaniach socjologicznych, psychologicznych czy marketingowych) jest związane z zastosowaniem różnorakich metod statystycznych i ekonometrycznych do opisu, wyjaśniania i predykcji zjawisk społecznych. W badaniach społecznych można wyróżnić trzy typy modeli: modele opisowe (deskryptywne), modele wyjaśniające (eksplanacyjne) i modele predykcyjne. Celem modeli opisowych jest poprawne odzwierciedlenie wewnętrznej struktury danych pozwalającej na wyodrębnienie najistotniejszych regularności i zależności. Modele te pozwalają na przedstawienie struktury danych w syntetyczny sposób, umożliwiają optymalną redukcję danych (najczęściej kosztem utraconej informacji, niewyjaśnionej wariancji czy bezwładności). Ważną rolę w modelach opisowych odgrywa dopasowanie modelu (model fit), mówiące, jak dobrze model (np. zestaw zmiennych niezależnych) odtwarza istniejące dane (obserwacje indywidualne, macierz wariancji kowariancji, macierz korelacji itp.). Do modeli opisowych należą modele eksploracyjnej analizy danych, analiza głównych składowych, analiza log-liniowa czy konfirmacyjna analiza czynnikowa. Copyright StatSoft Polska 2014, info@danewiedzasukces.pl 5
2 Modele eksplanacyjne są tworzone w celu poprawnego odzwierciedlenia zależności przyczynowych. W modelach tych dużą rolę odgrywa ocena egzogeniczności (i endogeniczności) zmiennych, wyodrębnienie zależności warunkowych oraz kontrola analizowanych relacji przyczynowo-skutkowych. Ważnym warunkiem oceny modelu jest poprawna jego specyfikacja i ocena obciążenia (bias). Poprawne modele eksplanacyjne powinny charakteryzować się zarówno wysoką mocą eksplanacyjną (niskim błędem specyfikacji), jak i wysoką mocą predykcyjną (niskim błędem przewidywania). W modelach tych występuje na ogół taka zależność, że im wyższy jest ich błąd specyfikacji (np. błędna teoria leżąca u ich podstaw), tym niższa jest ich moc predykcyjna. Modele te powinny się cechować również niskim prawdopodobieństwem falsyfikacji (odrzucenia). Do tego typu modeli należą ekonometryczne modele wielorównaniowe o równaniach współzależnych, modele strukturalne i ścieżkowe. Trzecie z wyodrębnionych modeli to modele predykcyjne. Mają one na celu poprawne przewidywanie przyszłych (lub nowych) obserwacji na podstawie danego modelu. Dużą rolę odgrywa w nich wykorzystywanie prób uczących (budowa modelu) i prób testowych (predykcja nowych obserwacji). Jakość przewidywania jest najczęściej mierzona na podstawie różnorodnych metod tzw. walidacji krzyżowej (wielokrotny podział prób na testowe i uczące). Modele predykcyjne powinny cechować się zarówno wysokim poziomem konfirmacji, jak i wysoką trafnością przewidywania (moc predykcyjna), a jednocześnie ich trafność wyjaśniania może być mniejsza (niska moc eksplanacyjna). Moc i trafność predykcyjna jest oceniana na podstawie miar zmienności losowej oszacowań z kolejnych prób w procedurach walidacyjnych (sampling variance). Do tego typu modeli predykcyjnych należy większość podejść z obszaru data mining, drzewa klasyfikacyjne i regresyjne, analiza reguł asocjacyjnych i sekwencyjnych, sieci neuronowe itp.). Należy podkreślić, że generalnie modele charakteryzujące się dużym błędem specyfikacji (niską mocą eksplanacyjną) mogą równocześnie mieć dużą moc predykcyjną (bias variance trade off). Jest to sytuacja występująca w przypadku wykorzystywania dużej liczby skorelowanych (współliniowych) predyktorów oraz szumów (błędów losowych) w danych. Oznacza to, że modele, które poprawnie 6 Copyright StatSoft Polska 2014, info@danewiedzasukces.pl
3 przewidują rzeczywistość, mogą jednocześnie błędnie ją wyjaśniać i przedstawiać jej nieprawdziwy obraz. Jak w każdym obszarze analiz, próby wyjaśniania i opisu tych zjawisk wiążą się z rozwiązaniem problemu poprawnej specyfikacji modelu związanej z naturą zjawisk społecznych. Specyfika modelowania zjawisk społecznych wiąże się z: 1) subiektywnym i jakościowym charakterem wskaźników wykorzystywanych w pomiarze (niemetryczny charakter pomiaru mierzonych własności), 2) deklaratywną postacią danych wynikających z odpowiedzi na pytania o opinie, postawy, nastawienia i subiektywną wiedzę badanego (problem odtworzenia intencji badanego na podstawie odpowiedzi na pozycje kwestionariusza), 3) nieobserwowalnym charakterem mierzonych cech dotyczących wiedzy, opinii, postaw czy wartości respondentów (wprowadzanie do analizy zmiennych ukrytych wynikających z nieobserwowalnych własności i założeń teoretycznych badacza), 4) kontekstowością analizowanych zjawisk i wpływem czynników sytuacyjnych w modelowanych zjawiskach (analiza chwilowych stanów emocjonalnych i poznawczych jednostek) 5) hierarchicznością układów społecznych, wynikających z przynależności respondentów do grup społecznych, instytucji, kręgów kulturowych itp. Wszystkie wspomniane czynniki powodują konieczność uwzględnienia dodatkowych założeń w procesie budowy modelu i poświęcenia szczególnej uwagi problemowi poprawnej specyfikacji modelu, uwzględnienia rzetelności narzędzi pomiaru i wyboru właściwych metod analizy danych. Niemetryczny charakter wskaźników w badaniach społecznych Z punktu widzenia teorii pomiaru i klasyfikacji skal pomiarowych najbardziej popularną klasyfikacją jest propozycja Stevensa, który dzieli skale pomiarowe na cztery podstawowe typy: nominalny, porządkowy, przedziałowy i stosunkowy. W badaniach społecznych z wykorzystaniem pytań informacyjnych i wskaźnikowych (otwartych Copyright StatSoft Polska 2014, info@danewiedzasukces.pl 7
4 i zamkniętych) oraz skal najczęściej pomiar jest wykonywany na poziomie skali nominalnej (np. pytanie o płeć) i porządkowej (np. pytanie dotyczące rankingu marek produktów). Rzadziej stosowane są pytania na poziomie przedziałowym lub stosunkowym (np. pytanie dotyczące dochodów w złotówkach lub wzrostu w centymetrach). Specyficznym rodzajem narzędzi pomiaru w badaniach społecznych są skale postaw i opinii, w których respondent ujawnia swoją postawę na skalach binarnych (tak nie) lub wielopunktowych (najczęściej pięcio- lub siedmiopunktowych). Wykorzystywane są również binarne wskaźniki mierzonych cech wynikające z określonych zachowań lub stanu posiadania (np. posiadanie willi z basenem jako wskaźnika sukcesu zawodowego). Popularność tych typów skal i wskaźników powoduje, że często skale 5 lub 7-punktowe są interpretowane jako przedziałowe (metryczne) i wykorzystywane w budowie modelu jako dane ilościowe 1. Są one podstawą budowy takich skal postaw, jak skale: Likerta, Stapela czy Guttmana (w wersji politomicznej). Traktowanie skal typu Likerta jako metrycznych powoduje jednak pewne problemy w modelowaniu zjawisk. Po pierwsze: występuje tłumienie współczynnika korelacji Pearsona (jest on niższy niż dla odpowiadającej im skali metrycznej). Po drugie: błędy standardowe w oszacowaniach parametrów modelu są niedoszacowane (zbyt małe) w porównaniu do metrycznych odpowiedników tych skal. Po trzecie: wskaźniki globalnego dopasowania modelu, jak np. statystyka 2, są zbyt wysokie (efekt inflacji wskaźnika), co prowadzi do wyższego prawdopodobieństwa odrzucania poprawnego modelu (szczególnie, gdy skale mają mniej niż 5 kategorii i cechują się dużą skośnością). Obciążenie modelu jest znaczne, gdy stosowane są binarne wskaźniki (jako metryczne) oraz wtedy, gdy występują efekty 1 Jednym z nieporozumień wynikających z traktowania skal ocen jako skal przedziałowych jest niepoprawna interpretacja punktów na skali jako jednostek równo oddalowych od siebie (różnice między a 5 są jednakowe). Skala przedziałowa powinna spełniać założenie, że równym przyrostom punktów na skali ocen powinny towarzyszyć równe przyrosty mierzonych przez taką skalę własności (np. siły postaw czy opinii), a nie tylko równych różnic między umownymi punktami skali. 8 Copyright StatSoft Polska 2014, info@danewiedzasukces.pl
5 sufitu i podłogi zorientowane opozycyjnie (pseudoczynniki ekstremalnych odpowiedzi). Jednym z rozwiązań problemu stosowania niemetrycznych wskaźników w modelowaniu zjawisk społecznych jest wykorzystanie teorii progów (thresholds). W podejściu tym przyjmuje się założenie, że niemetryczny, jakościowy wskaźnik binarny lub politomiczny jako zmienna obserwowalna (manifest variable) jest jedynie niedoskonałym przybliżeniem miernika ilościowego danej własności mającej rozkład normalny. Wartość surowa danego wskaźnika jest transformowana na wartość metryczną pomiarowego wskaźnika ukrytego (latent response variable), który stanowi następnie właściwy wskaźnik mierzonej cechy ukrytej (latent variable), np. postawy. Współczynniki korelacji między wartościami transformowanymi dla wskaźników binarnych noszą nazwę korelacji tetrachorycznych, a dla wskaźników porządkowych korelacji polichorycznych. W przypadku wskaźników binarnych relacja między wskaźnikami surowymi a transformowanymi jest dana wzorem (1): 1,dla y* y 0, dla y* (1) Jak wynika ze wzoru (1), jeżeli respondenci na skali wskazują 1 ( tak ), to ich wartość na ukrytej zmiennej pomiarowej jest wyższa od wartości progowej (proporcji odpowiedzi po transformacji probit). Jeżeli natomiast wskazują 0 ( nie ), to wartość ta jest mniejsza lub równa wartości progowej (wartość progowa pełni rolę średniej dla danych metrycznych). Zasada ta może być rozszerzona na wskaźniki politomiczne (np. w skali 1-5) i wówczas ma ona postać: y c, gdy c y (2) c 1 Copyright StatSoft Polska 2014, info@danewiedzasukces.pl 9
6 W efekcie dla n kategorialnej skali ocen jest zawsze n-1 wartości progowych (dla danych binarnych jest to jedna wartość). Rys. 1 i 2 przedstawiają macierze korelacji tetrachorycznych (poprawnej) i korelacji Pearsona (niepoprawnej) dla tego samego zbioru zmiennych. Rys. 1. Korelacje tetrachoryczne. Rys. 2. Korelacje Pearsona. 10 Copyright StatSoft Polska 2014, info@danewiedzasukces.pl
7 Przedstawione na rys. 2 współczynniki korelacji Pearsona są generalnie niższe od korelacji tetrachorycznych (efekt tłumienia związku). W macierzy korelacji tetrachorycznych elementy w wierszu Means oznaczają wartości progowe (tresholds). Wariancje zmiennych są ustalone na poziomie jedności. Macierz korelacji tetrachorycznych może stanowić dane wejściowe do dalszych analiz z wykorzystaniem binarnych wskaźników cech ukrytych 2. Zmienne ukryte w badaniach społecznych Zmienne ukryte stanowią kluczowe pojęcie w modelowaniu zjawisk społecznych. Modele ze zmiennymi ukrytymi są jednym z podstawowych typów modeli w psychologii, socjologii i badaniach marketingowych. Mogą one dotyczyć zarówno cech ukrytych, czyli nieobserwowalnych dyspozycji i cech badanych jednostek (wiedza, kompetencje, zdolności itp.), jak i konstruktów badacza związanych z przyjmowaną teorią (status społeczny, alienacja, dysonans pozakupowy itp.). Z punktu widzenia statystycznego zmienne ukryte można definiować jako zmienne losowe, które nie mają empirycznych realizacji z próby i których rozkłady wynikają z założeń teoretycznych badacza. Z punktu widzenia ich miejsca w modelu pomiarowym są to zmienne w modelach, w których liczba zmiennych niezależnych jest większa niż liczba zmiennych obserwowalnych. Są to również zmienne w systemie równań, jeżeli nie można wykonać takiego przekształcenia równania, że wyrażamy taką zmienną jako wyłącznie funkcję zmiennych obserwowalnych (wskaźników). Najogólniej można wyodrębnić trzy podstawowe podejścia do definiowania i pomiaru zmiennej ukrytej. W pierwszym klasycznym ujęciu zmienna ukryta jest identyfikowana jako wariancja wspólna co najmniej trzech wskaźników mających podobne korelacje 2 Przedstawiona procedura uzyskiwania pomiarowych zmiennych ukrytych (y*) dotyczy tzw. parametryzacji probitowej. Do innych typów parametryzacji należy logitowa (logistyczny rozkład reszt) i typu log-log (rozkład Gumbela reszt w modelu). Copyright StatSoft Polska 2014, info@danewiedzasukces.pl 11
8 i wartości średnie (lub progowe). Są to tzw. równoległe wskaźniki refleksywne (odzwierciedlające ukrytą własność mierzoną). Do tego typu wskaźników należą np. pozycje (stwierdzenia) w skali Likerta, które powinny cechować się wysoką wzajemną korelacją o podobnej sile i kierunku. Modelem pomiarowym tego typu zmiennej ukrytej jest konfirmacyjna analiza czynnikowa: y, (3) gdzie: y wskaźnik (zmienna obserwowalna), ładunek czynnikowy, zmienna ukryta (oszacowana wariancja wspólna), błąd pomiaru (reszta w modelu pomiarowym). W modelu tym liczba zmiennych niezależnych (3) jest większa od liczby zmiennych obserwowalnych (1) oraz żadne przekształcenie nie prowadzi do wyrażenia zmiennej jako liniowej kombinacji zmiennych obserwowalnych (ponieważ jest również zmienną ukrytą w modelu). Model ten jest podstawowym modelem pomiaru w badaniach społecznych. W drugim podejściu zmienna ukryta jest mierzona również za pomocą refleksywnych, lecz skumulowanych wskaźników (najczęściej binarnych). Tego rodzaju wskaźniki stanowią pozycję skali Guttmana, zadania mierzące kompetencje lub zdolności, fakt posiadania określonych dóbr jako wskaźniki statusu. Korelacja między tego typu skumulowanymi pozycjami cechuje się wzorem simplex po uporządkowaniu pozycji od najtrudniejszej (o niskim prawdopodobieństwie zgody) do najłatwiejszej (o wysokim prawdopodobieństwie zgody) sąsiednie pozycje korelują silniej niż skrajne, których korelacje mogą być nawet ujemne (wzór circumplex). Modelem pomiarowym 12 Copyright StatSoft Polska 2014, info@danewiedzasukces.pl
9 tego typu zmiennej ukrytej jest konfirmacyjna analiza czynnikowa dla wskaźników binarnych oparta na teorii reakcji na pozycje skalowe (IRT): p( y) ln 1 p( y) (4) W modelu tym logarytm szansy (logit) jest funkcją wartości progowych ( ), ładunków czynnikowych ( ) i zmiennej ukrytej (. Ten rodzaj parametryzacji (logitowa) jest podstawą modeli pomiaru w teorii IRT, w której prawdopodobieństwo zgody z pozycją jest funkcją poziomu trudności pozycji związanej z wartością progową ( ) i jej mocy dyskryminacyjnej mierzonej wysokością ładunków czynnikowych ( ). Ten rodzaj zmiennych ukrytych jest popularny w edukacyjnych badaniach społecznych (analiza kompetencji uczniów) i badaniach marketingowych (ocena efektów komunikacyjnych). Trzeci typ zmiennych ukrytych to zmienne ukryte ze wskaźnikami formatywnymi. Zmienne ukryte są traktowane jako liniowe kombinacje wskaźników uzupełnione o część niewyjaśnionej wariancji zmiennych ukrytych przez wskaźniki (zakłócenia w modelu). y (5) Bardzo podobnym do formatywnych zmiennych ukrytych typem zmiennych są składowe (composites), znane z analizy głównych składowych, które traktowane są jako wyłącznie liniowa kombinacja wskaźników (bez uwzględnienia reszt w modelu pomiaru): y. Ten typ zmiennych ukrytych jest popularny zarówno w socjologii (np. status społeczny jako kombinacja dochodu, wykształcenia i profesji), jak i marketingu (siła nabywcza rynku jako kombinacja liczby ludności, ich dochodów i intensywności sieci dystrybucji). Copyright StatSoft Polska 2014, info@danewiedzasukces.pl 13
10 Konfirmacyjna analiza czynnikowa ze wskaźnikami niemetrycznymi Ogólny model pomiarowy oparty na konfirmacyjnej analizie czynnikowej ze wskaźnikami niemetrycznymi i kowariantami można zapisać w następujący sposób: y* Κx (6) W modelu tym pomiarowa zmienna ukryta jest funkcją wartości progowej, ładunku czynnikowego, kowarianty (zmiennej kontekstowej) i błędu pomiaru. Po obliczeniu macierzy korelacji tetrachorycznych, macierz ta, pełniąca rolę danych wejściowych, jest wprowadzana do modelu konfirmacyjnej analizy czynnikowej. Wprawdzie podstawową metodą estymacji modelu czynnikowego jest metoda największej wiarygodności, jednakże w przypadku danych niemetrycznych wykorzystywana jest metoda (diagonalnie) ważonych najmniejszych kwadratów. Oceny parametrów estymowanego modelu dla macierzy z rys. 1 są przedstawione na rys. 3. Rys. 3. Oceny parametrów modelu pomiarowego. 14 Copyright StatSoft Polska 2014, info@danewiedzasukces.pl
11 Wynik otrzymany w programie STATISTICA (rys. 3) przedstawia ładunki czynnikowe dla modelu pomiarowego zaufania transakcyjnego (ZT) i zachowań etycznych (ZE). Ładunki czynnikowe wskazują na moc dyskryminacyjną pozycji skali i korelację z ukrytymi wymiarami zaufania, natomiast parametry progów z rys. 1 wskazują na poziom trudności poszczególnych binarnych wskaźników. W analizowanym przypadku pozycja p6.1 jest najłatwiejsza (cechuje się najniższą wartością progową i najwyższym prawdopodobieństwem zgody z pozycją skali), a pozycja p6.10 jest najtrudniejsza dla respondentów (ma najwyższą wartość progową i najniższe prawdopodobieństwo zgody). Czynniki sytuacyjne w modelach zjawisk społecznych W badaniach społecznych zmienne ukryte mogą reprezentować dwie klasy nieobserwowalnych własności respondentów. Mogą to być względnie trwałe cechy ukryte (latent traits) i kategorie teoretyczne badacza (postawy, preferencje, wartości, pozycje społeczne itp.) lub chwilowe, nietrwałe i sytuacyjnie określone stany, w których znajduje się jednostka w chwili pomiaru (latent states), takie jak odczucie satysfakcji, nastrój niepokoju, lęku, szczęścia itp. Są to względnie zmienne stany emocjonalne, wynikające z czynników sytuacyjnych i interakcji międzyludzkich w danej chwili. Analiza stanów ukrytych wymaga zastosowania danych wzdłużnych (panelowych), które coraz częściej występują w badaniach społecznych. Modelowanie tego typu danych musi uwzględniać ich dynamiczny charakter, a do tego typu modeli należą np. modele krzywych rozwojowych (latent growth curves) i modele ukrytych łańcuchów Markowa (hidden Markov models). Modele stanów-cech (latent state-trait models), należące do rodziny ukrytych łańcuchów Markowa, są przykładem zastosowania konfirmacyjnej analizy czynnikowej do danych panelowych w celu pomiaru zarówno względnie trwałej cechy ukrytej, jak i zmieniających się w czasie ukrytych stanów. Celem modelu stanów-cech jest dekompozycja całkowitej wariancji na jej część związaną z trwałymi różnicami międzyosobowymi związanymi ze spójnymi i stabilnymi Copyright StatSoft Polska 2014, info@danewiedzasukces.pl 15
12 cechami osoby (T) oraz część proporcji wyjaśnianej przez specyficzne (S) i sytuacyjne różnice międzyosobowe (specyficzność sytuacyjna): y ik T S ik ik ik ik (7) Stabilne cechy ukryte są niezależne od sytuacji badania, a ich zmiany w czasie są modelowane za pomocą modeli rozwojowych (latent growth curves). Stany ukryte stanowią czasowe i niestabilne odchylenia od poziomów mierzonych cech ukrytych. Im wyższy jest wskaźnik spójności, tym silniej głównym źródłem zmienności jest stabilna ukryta cecha jednostki. Im wyższy jest wskaźnik specyficzności, tym silniej głównym źródłem zmienności są czynniki sytuacyjne. Struktura modelu składającego się z jednej cechy i dwóch stanów mierzonych w dwóch okresach (powtarzane pomiary) jest przedstawiona na rys y S1 2 y T 3 4 y S2 y Rys. 4. Model stanów-cech. 16 Copyright StatSoft Polska 2014, info@danewiedzasukces.pl
13 Z punktu widzenia założeń modelu stany ukryte są niezależne od cechy ukrytej, ładunki czynnikowe i wyrazy wolne są ustalone jako równe w przekroju stanów (inwariancja pomiaru) oraz wariancje błędu są ustalone jako równe w przekroju stanów, za wyjątkiem stanu pierwszego (efekt sokratejski wyższa wariancja błędu w pierwszej sytuacji badania niż w kolejnych falach). Oceny parametrów estymowanego modelu stanów-cech są przedstawione na rys. 5. Model dotyczy analizy postrzeganej satysfakcji z usługi naprawczej stacji obsługi samochodów w dwóch falach pomiaru: 1) po etapie przywitania i diagnozowania problemu oraz 2) po uregulowaniu płatności i podczas odbioru naprawionego samochodu. Postrzegana jakość procesu usługowego (PQ) mierzona jest za pomocą dwóch wskaźników w dwóch okresach (PQ11, PQ21, PQ12, PQ22), zmienna zależna (jakość postrzegana-satysfakcja z efektu obsługi) jest mierzona za pomocą trzech wskaźników w ostatniej fazie badań (S1, S2, S3). Rys. 5. Wyniki estymacji modelu stanów-cech (część pomiarowa). Copyright StatSoft Polska 2014, info@danewiedzasukces.pl 17
14 Rys. 5 przedstawia strukturę ładunków czynnikowych dla stanów PQ1 i PQ2 oraz cechy PQ postrzeganej jakości usługi. Odpowiednie ładunki w przekroju stanów są ustalone jako równe. Ze struktury ładunków wynika, że postrzegana jakość usługi traktowana jako cecha ukryta charakteryzuje się niespójną strukturą ładunków (dla wskaźników PQ12 i PQ22 są one ujemne), co pośrednio wskazuje, że wskaźnik specyficzności może dominować na wskaźnikiem spójności pomiaru. Stąd postrzegana jakość jest rozumiana bardziej jako stan niż cecha ukryta. Część strukturalna modelu prezentuje wpływ obu stanów oraz cechy potrzeganej jakości procesu usługi na ogólną satysfakcję z efektu usługi. Rys. 6. Wyniki dla części strukturalnej modelu. Z rys. 6 wynika, że szczególnie pierwsza faza kontaktu (recepcja i diagnoza problemu) ma wpływ na poziom satysfakcji z usługi. Zauważalny jest również dodatni wływu obu stanów postrzeganej jakości procesu. Wpływ cech postrzeganej jakości procesu na jakość efektu jest natomiast ujemny. Modele ukrytych stanów-cech mają duże znaczenie w modelowaniu zjawisk dynamicznych. Pozwalają one na identyfikację wpływu niestabilnych czynników sytuacyjnych na zachowanie jednostek. 18 Copyright StatSoft Polska 2014, info@danewiedzasukces.pl
15 Modelowanie w układach hierarchicznych Zachowania ludzi zawsze mają miejsce w określonych układach instytucjonalnych mających często charakter hierarchiczny. Przykładem tego typu zachowań są zachowania członków rodziny, uczniów w klasach szkolnych, pracowników w przedsiębiorstwach, pacjentów w szpitalach itp. Mierzone własności jednostek zależą wówczas nie tylko od ich innych własnych cech lub czynników, ale również od cech kształtujących społeczny kontekst ich zachowań (np. cech gospodarstwa domowego, szkoły, przedsiębiorstwa czy szpitala). W najprostszym przypadku struktura regresyjnego modelu wielopoziomowego jest przedstawiona w równaniach (8) (11). Pierwsze równanie regresji określa zależność między zmienną zależną (y) a zmienną niezależną na poziomie indywidualnych obserwacji pierwszego poziomu: y ig b0 g b1 gxig rig (8) gdzie: y ig wartość zmiennej zależnej dla obserwacji i w jednostce II poziomu g, x ig wartość zmiennej niezależnej dla obserwacji i w jednostce II poziomu g, b 0g wartość wyrazu wolnego w jednostkach II poziomu g, b 1g współczynnik kierunkowy funkcji regresji, r ig reszta modelu. Zarówno wartości średnie zmiennej zależnej, jak i relacje między nimi mogą się zmieniać w przekroju jednostek II poziomu. Zmienność ta może być wywoływana różnymi zmiennymi charakteryzującymi II poziom. Wyrazy wolne i współczynniki kierunkowe są więc traktowane jako zmienne losowe, wyjaśniane jako funkcja zmiennych wyższego poziomu: Copyright StatSoft Polska 2014, info@danewiedzasukces.pl 19
16 b0 g c00 c01wg u0g, (9) b1 g c`10 c11wg u1 g (10) gdzie: w g zmienna objaśniająca II poziomu, c 00 średnia wyrazów wolnych w przekroju jednostek II poziomu, c 10 średnia współczynników kierunkowych w przekroju II poziomu, c 01 współczynnik kierunkowy funkcji regresji II poziomu wyjaśniający zmienność wyrazów wolnych, c 11 współczynnik kierunkowy funkcji regresji II poziomu wyjaśniający zmienność współczynników kierunkowych, u 0g, u 1g reszty w modelu. Ostateczny model ma postać: y ig c00 c01wg u0g c10xig c11wg xig u1 gxig rig (11) Model wielopoziomowy wyraża zmienną zależną z poziomu indywidualnego jako funkcję zmiennej niezależnej z poziomu indywidualnego (x ig ), zmiennej niezależnej z poziomu grupowego (w g ) oraz międzypoziomowej interakcji między zmiennymi (x ig, w g ). W estymacji wielopoziomowych modeli czynnikowych i strukturalnych ze zmiennymi ukrytymi (ze wskaźnikami metrycznymi i kategorialnymi) wykorzystuje się zasadę dekompozycji macierzy kowariancji na macierz wewnątrzklasową i zewnątrzklasową. Wynika ona z dekompozycji całkowitej zmienności obserwacji y ig respondenta i znajdującego się w klasie (grupie) g na zmienność międzygrupową (międzyskupiskową y B ) 20 Copyright StatSoft Polska 2014, info@danewiedzasukces.pl
17 oraz zmienność wewnątrzgrupową (wewnątrzskupiskową y w = y ig - y g ). Obie te składowe są wzajemnie ortogonalne i spełniają warunek addytywności. YT = YB + YW (12) Ten rodzaj dekompozycji jest wykorzystywany do obliczenia międzygrupowej macierzy kowariancji (macierzy kowariancji zdezagregowanych średnich grupowych) S B oraz wewnątrzgrupowej macierzy kowariancji (macierzy kowariancji odchyleń indywidualnych obserwacji od odpowiednich średnich grupowych) S W. Macierze te są również addytywne i ortogonalne: ST = SB + SW (13) Program STATISTICA nie umożliwia zastosowania klasycznej procedury modelowania wielopoziomowego. W budowie modelu zastosowano podejście uproszczone (Goldsteina), w którym na podstawie oszacowanych macierzy kowariancji wewnątrzklasowej i międzyklasowej zbudowano odrębne modele czynnikowe (estymowane jednocześnie). Postać danych wejściowych jest przedstawiona na rys. 7. W macierzy składanej pierwsza macierz jest macierzą wewnętrzną kowariancji (odchyleń od średnich grupowych), a druga macierzą zewnętrzną (zmienności średnich grupowych). Copyright StatSoft Polska 2014, info@danewiedzasukces.pl 21
18 Rys.7. Dane wejściowe do modelu wielopoziomowego. Na rys. 8 (model wewnętrzny) i 9 (model zewnętrzny) przedstawiona jest wielopoziomowa konfirmacyjna analiza czynnikowa wymiarów zaufania transakcyjnego i zachowań etycznych w kanałach dystrybucji. Pozycje p61, p62 p64 dotyczą zaufania transakcyjnego, a pozycje p63 p65 i p66 zachowań etycznych. Analiza wstępna jakości modeli na podstawie kryterium Akaike pozwoliła na wybór dwuczynnikowego modelu wewnętrznego i dwuczynnikowego zewnętrznego jako modelu najlepiej dopasowanego do danych. 22 Copyright StatSoft Polska 2014, info@danewiedzasukces.pl
19 Rys. 8. Model wewnętrzny. Struktury czynnikowe na obu poziomach są zbliżone (z ładunkami czynnikowymi wyższymi jednak na poziomie wewnętrznym, co wskazuje na wyższą rzetelność pomiaru zaufania na tym poziomie). Należy zwrócić uwagę na przeciwne znaki współczynników kowariancji na obu poziomach (dodatnia kowariancja na poziomie wewnętrznym i ujemna na poziomie zewnętrznym). Tego typu sytuacja wskazuje na tzw. paradoks Simpsona na poziomie indywidualnym wzrost zaufania transakcyjnego Copyright StatSoft Polska 2014, info@danewiedzasukces.pl 23
20 prowadzi do wzrostu zachowań etycznych a na poziomie gospodarstwa domowego zjawiska te są przeciwstawne 3. Rys. 9. Model zewnętrzny. 3 Paradoks ten występuje także w wielu innych przypadkach, np. na poziomie społeczeństwa wzrost intensywności ćwiczeń fizycznych prowadzić może do spadku zawałów serca, ale na poziomie indywidualnym relacja między intensywnością ćwiczeń a prawdopodobieństwem zawału może być dodatnia. 24 Copyright StatSoft Polska 2014, info@danewiedzasukces.pl
21 Podsumowanie Modelowanie zjawisk społecznych jest bardzo rozległym obszarem analiz i nie sposób przedstawić wszystkich nurtów i kierunków jego rozwoju. Wydaje się jednak, że do podstawowych cech modeli wynikających ze specyfiki danych i natury zjawisk należą: kategorialny charakter wskaźników, uniemożliwiający często wykorzystywanie metod właściwych dla danych metrycznych, zmienne ukryte określające nieobserwowalne cechy respondentów i koncepcyjną naturę mierzonych zmiennych oraz dynamiczny i wielopoziomowy charakter zjawisk. Zastosowanie odpowiednich narzędzi analitycznych pozwala jednak na przełamanie przynajmniej niektórych ograniczeń i trafny opis, wyjaśnianie i przewidywanie zjawisk społecznych. Literatura 1. Bollen, K., A., Latent Variables in Psychology and the Social Sciences, Annual Review of Psychology, 2002/53, s Eid, M., A Closer Look at the Measurement of Change: Integrating Latent State- Trait Models into the General Framework of Latent Mixed Markov Modeling, Methods of Psychological Research Online, Special Issue, 2002, Muthen, B., Latent Variable Modeling with Multilevel and Longitudinal Data, w: Raftery A., red. Sociological Methodology, Blackwell pub. Boston Sagan, A., Zmienne ukryte w badaniach marketingowych, UEK Kraków Copyright StatSoft Polska 2014, info@danewiedzasukces.pl 25
MODEL STRUKTURALNY RELACJI MIĘDZY SATYSFAKCJĄ
MODEL STRUKTURALNY RELACJI MIĘDZY SATYSFAKCJĄ I LOJALNOŚCIĄ WOBEC MARKI Adam Sagan Akademia Ekonomiczna w Krakowie, Katedra Analizy Rynku i Badań Marketingowych Wstęp Modelowanie strukturalne ma wielorakie
Bardziej szczegółowoSpis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Bardziej szczegółowoWprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
Bardziej szczegółowoStatystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Bardziej szczegółowo15. PODSUMOWANIE ZAJĘĆ
15. PODSUMOWANIE ZAJĘĆ Efekty kształcenia: wiedza, umiejętności, kompetencje społeczne Przedmiotowe efekty kształcenia Pytania i zagadnienia egzaminacyjne EFEKTY KSZTAŁCENIA WIEDZA Wykazuje się gruntowną
Bardziej szczegółowoSzczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Bardziej szczegółowoSzczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Bardziej szczegółowoStatystyka i Analiza Danych
Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania wybranych technik regresyjnych do modelowania współzależności zjawisk Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki
Bardziej szczegółowoAnaliza współzależności dwóch cech I
Analiza współzależności dwóch cech I Współzależność dwóch cech W tym rozdziale pokażemy metody stosowane dla potrzeb wykrywania zależności lub współzależności między dwiema cechami. W celu wykrycia tych
Bardziej szczegółowoRegresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna
Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować
Bardziej szczegółowoZmienne zależne i niezależne
Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }
Bardziej szczegółowoMODEL POMIAROWY SATYSFAKCJI I LOJALNOŚCI
MODEL POMIAROWY SATYSFAKCJI I LOJALNOŚCI Adam Sagan Akademia Ekonomiczna w Krakowie, Katedra Analizy Rynku i Badań Marketingowych Wstęp Zaletą stosowania konfirmacyjnej analizy czynnikowej (CFA) w porównaniu
Bardziej szczegółowo5. WNIOSKOWANIE PSYCHOMETRYCZNE
5. WNIOSKOWANIE PSYCHOMETRYCZNE Model klasyczny Gulliksena Wynik otrzymany i prawdziwy Błąd pomiaru Rzetelność pomiaru testem Standardowy błąd pomiaru Błąd estymacji wyniku prawdziwego Teoria Odpowiadania
Bardziej szczegółowoEkonometria. Modelowanie zmiennej jakościowej. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Modelowanie zmiennej jakościowej Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 1 / 25 Zmienna jakościowa Zmienna ilościowa może zostać zmierzona
Bardziej szczegółowoAnaliza składowych głównych. Wprowadzenie
Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 1. Binarne zmienne zależne 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników 3. Probit a) Interpretacja współczynników b) Miary dopasowania 4.
Bardziej szczegółowoElementy statystyki wielowymiarowej
Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Elementy statystyki wielowymiarowej 1.1 Kowariancja i współczynnik korelacji 1.2 Macierz kowariancji 1.3 Dwumianowy rozkład normalny 1.4 Analiza składowych
Bardziej szczegółowoStanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12
Stanisław Cichocki Natalia Nehrebecka Zajęcia 11-12 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje nietypowe i błędne 4. Współliniowość - Mamy 2 modele: y X u 1 1 (1) y X X 1 1 2 2 (2) - Potencjalnie
Bardziej szczegółowoMODELE LINIOWE. Dr Wioleta Drobik
MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą
Bardziej szczegółowoStanisław Cichocki. Natalia Neherebecka. Zajęcia 15-17
Stanisław Cichocki Natalia Neherebecka Zajęcia 15-17 1 1. Binarne zmienne zależne 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników 3. Probit a) Interpretacja współczynników b) Miary
Bardziej szczegółowoWłasności statystyczne regresji liniowej. Wykład 4
Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności
Bardziej szczegółowoGraficzna prezentacja danych statystycznych
Szkolenie dla pracowników Urzędu Statystycznego nt. Wybrane metody statystyczne w analizach makroekonomicznych Katowice, 12 i 26 czerwca 2014 r. Dopasowanie narzędzia do typu zmiennej Dobór narzędzia do
Bardziej szczegółowoPrzykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku
Przykład 2 Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Sondaż sieciowy analiza wyników badania sondażowego dotyczącego motywacji w drodze do sukcesu Cel badania: uzyskanie
Bardziej szczegółowoMikroekonometria 14. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 14 Mikołaj Czajkowski Wiktor Budziński Symulacje Analogicznie jak w przypadku ciągłej zmiennej zależnej można wykorzystać metody Monte Carlo do analizy różnego rodzaju problemów w modelach
Bardziej szczegółowoWprowadzenie (1) Przedmiotem analizy czynnikowej jest badanie wewnętrznych zależności w zbiorze zmiennych. Jest to modelowanie niejawne. Oprócz zmienn
Analiza czynnikowa Wprowadzenie (1) Przedmiotem analizy czynnikowej jest badanie wewnętrznych zależności w zbiorze zmiennych. Jest to modelowanie niejawne. Oprócz zmiennych, które są bezpośrednio obserwowalne
Bardziej szczegółowoPDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
Bardziej szczegółowo3. Modele tendencji czasowej w prognozowaniu
II Modele tendencji czasowej w prognozowaniu 1 Składniki szeregu czasowego W teorii szeregów czasowych wyróżnia się zwykle następujące składowe szeregu czasowego: a) składowa systematyczna; b) składowa
Bardziej szczegółowoStatystyka SYLABUS A. Informacje ogólne
Statystyka SYLABUS A. Informacje ogólne Elementy składowe sylabusu Nazwa jednostki prowadzącej kierunek Nazwa kierunku studiów Poziom kształcenia Profil studiów Forma studiów Kod Język Rodzaj Dziedzina
Bardziej szczegółowoRecenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Redakcja i korekta Bogdan Baran Projekt graficzny okładki Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2011 ISBN
Bardziej szczegółowoREGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji
Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji
Bardziej szczegółowoRozdział 8. Regresja. Definiowanie modelu
Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność
Bardziej szczegółowoWSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno
WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:
Bardziej szczegółowoAnaliza regresji - weryfikacja założeń
Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.
Bardziej szczegółowoEkonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Wprowadzenie do modelowania ekonometrycznego Estymator Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Wykład 1 Estymator 1 / 16 Agenda 1 Literatura Zaliczenie przedmiotu 2 Model
Bardziej szczegółowoWprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe
Wprowadzenie do teorii ekonometrii Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Zajęcia Wykład Laboratorium komputerowe 2 Zaliczenie EGZAMIN (50%) Na egzaminie obowiązują wszystkie informacje
Bardziej szczegółowoSTATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss
Bardziej szczegółowoKsięgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice
Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice Przedmowa do wydania polskiego Przedmowa CZĘŚĆ I. PODSTAWY STATYSTYKI Rozdział 1 Podstawowe pojęcia statystyki
Bardziej szczegółowoSpis treści 3 SPIS TREŚCI
Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe
Bardziej szczegółowoMikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 12 Mikołaj Czajkowski Wiktor Budziński Dane panelowe Co jeśli mamy do dyspozycji dane panelowe? Kilka obserwacji od tych samych respondentów, w różnych punktach czasu (np. ankieta realizowana
Bardziej szczegółowoAnaliza współzależności zjawisk
Analiza współzależności zjawisk Informacje ogólne Jednostki tworzące zbiorowość statystyczną charakteryzowane są zazwyczaj za pomocą wielu cech zmiennych, które nierzadko pozostają ze sobą w pewnym związku.
Bardziej szczegółowo10. Podstawowe wskaźniki psychometryczne
10. Podstawowe wskaźniki psychometryczne q analiza własności pozycji testowych q metody szacowania mocy dyskryminacyjnej q stronniczość pozycji testowych q własności pozycji testowych a kształt rozkładu
Bardziej szczegółowoRecenzenci Stefan Mynarski, Waldemar Tarczyński. Redaktor Wydawnictwa Anna Grzybowska. Redaktor techniczny Barbara Łopusiewicz. Korektor Barbara Cibis
Komitet Redakcyjny Andrzej Matysiak (przewodniczący), Tadeusz Borys, Andrzej Gospodarowicz, Jan Lichtarski, Adam Nowicki, Walenty Ostasiewicz, Zdzisław Pisz, Teresa Znamierowska Recenzenci Stefan Mynarski,
Bardziej szczegółowoAnaliza współzależności zjawisk. dr Marta Kuc-Czarnecka
Analiza współzależności zjawisk dr Marta Kuc-Czarnecka Wprowadzenie Prawidłowości statystyczne mają swoje przyczyny, w związku z tym dla poznania całokształtu badanego zjawiska potrzebna jest analiza z
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników
Bardziej szczegółowoparametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,
诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów
Bardziej szczegółowoStatystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
Bardziej szczegółowoANALIZA CZYNNIKOWA Przykład 1
ANALIZA CZYNNIKOWA... stanowi zespół metod i procedur statystycznych pozwalających na badanie wzajemnych relacji między dużą liczbą zmiennych i wykrywanie ukrytych uwarunkowań, ktore wyjaśniają ich występowanie.
Bardziej szczegółowoOpis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA
Opis zakładanych efektów kształcenia na studiach podyplomowych Nazwa studiów: BIOSTATYSTYKA PRAKTYCZNE ASPEKTY STATYSTYKI W BADANIACH MEDYCZNYCH Typ studiów: doskonalące Symbol Efekty kształcenia dla studiów
Bardziej szczegółowoAnaliza korespondencji
Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy
Bardziej szczegółowoMikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 13 Mikołaj Czajkowski Wiktor Budziński Endogeniczność regresja liniowa W regresji liniowej estymujemy następujące równanie: i i i Metoda Najmniejszych Kwadratów zakłada, że wszystkie zmienne
Bardziej szczegółowoBadania eksperymentalne
Badania eksperymentalne Analiza CONJOINT mgr Agnieszka Zięba Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa Najpopularniejsze sposoby oceny wyników eksperymentu w schematach
Bardziej szczegółowoZastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego. Łukasz Kończyk WMS AGH
Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego Łukasz Kończyk WMS AGH Plan prezentacji Model regresji liniowej Uogólniony model liniowy (GLM) Ryzyko ubezpieczeniowe Przykład
Bardziej szczegółowoK wartość kapitału zaangażowanego w proces produkcji, w tys. jp.
Sprawdzian 2. Zadanie 1. Za pomocą KMNK oszacowano następującą funkcję produkcji: Gdzie: P wartość produkcji, w tys. jp (jednostek pieniężnych) K wartość kapitału zaangażowanego w proces produkcji, w tys.
Bardziej szczegółowoRegresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).
Statystyka i opracowanie danych Ćwiczenia 12 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA WIELORAKA Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych
Bardziej szczegółowoStatystyka opisowa. Wykład V. Regresja liniowa wieloraka
Statystyka opisowa. Wykład V. e-mail:e.kozlovski@pollub.pl Spis treści 1 Prosta regresji cechy Y względem cech X 1,..., X k. 2 3 Wyznaczamy zależność cechy Y od cech X 1, X 2,..., X k postaci Y = α 0 +
Bardziej szczegółowoKorelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego
Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy
Bardziej szczegółowoMikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 3 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.hedonic.dta przygotuj model oszacowujący wartość kosztów zewnętrznych rolnictwa 1. Przeprowadź regresję objaśniającą
Bardziej szczegółowoRecenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Redakcja i korekta Bogdan Baran Projekt graficzny okładki Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2011 ISBN
Bardziej szczegółowoProjekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski
Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem
Bardziej szczegółowoMetody Ilościowe w Socjologii
Metody Ilościowe w Socjologii wykład 2 i 3 EKONOMETRIA dr inż. Maciej Wolny AGENDA I. Ekonometria podstawowe definicje II. Etapy budowy modelu ekonometrycznego III. Wybrane metody doboru zmiennych do modelu
Bardziej szczegółowoAdam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska
Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska Anna Stankiewicz Izabela Słomska Wstęp- statystyka w politologii Rzadkie stosowanie narzędzi statystycznych Pisma Karla Poppera
Bardziej szczegółowoPsychometria PLAN NAJBLIŻSZYCH WYKŁADÓW. Co wyniki testu mówią nam o samym teście? A. Rzetelność pomiaru testem. TEN SLAJD JUŻ ZNAMY
definicja rzetelności błąd pomiaru: systematyczny i losowy Psychometria Co wyniki testu mówią nam o samym teście? A. Rzetelność pomiaru testem. rozkład X + błąd losowy rozkład X rozkład X + błąd systematyczny
Bardziej szczegółowoTablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Bardziej szczegółowoZadanie 1. Za pomocą analizy rzetelności skali i wspólczynnika Alfa- Cronbacha ustalić, czy pytania ankiety stanowią jednorodny zbiór.
L a b o r a t o r i u m S P S S S t r o n a 1 W zbiorze Pytania zamieszczono odpowiedzi 25 opiekunów dzieci w wieku 8. lat na następujące pytania 1 : P1. Dziecko nie reaguje na bieżące uwagi opiekuna gdy
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne
Bardziej szczegółowoWERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno
WERYFIKACJA MODELI MODELE LINIOWE Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno ANALIZA KORELACJI LINIOWEJ to NIE JEST badanie związku przyczynowo-skutkowego, Badanie współwystępowania cech (czy istnieje
Bardziej szczegółowoStatystyka i Analiza Danych
Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki -
Bardziej szczegółowo1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.
Zadanie 1 Niech y t ma rozkład logarytmiczno normalny o funkcji gęstości postaci [ ] 1 f (y t ) = y exp (ln y t β ln x t ) 2 t 2πσ 2 2σ 2 Zakładamy, że x t jest nielosowe a y t są nieskorelowane w czasie.
Bardziej szczegółowoWspółczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ
Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,
Bardziej szczegółowoPrzedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii
SPIS TREŚCI Przedmowa... 11 Wykaz symboli... 15 Litery alfabetu greckiego wykorzystywane w podręczniku... 15 Symbole wykorzystywane w zagadnieniach teorii mnogości (rachunku zbiorów)... 16 Symbole stosowane
Bardziej szczegółowoElementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa
Spis treści Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Romuald Kotowski Katedra Informatyki Stosowanej PJWSTK 2009 Spis treści Spis treści 1 Wstęp Bardzo często interesujący
Bardziej szczegółowoZależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),
Zależność przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna), funkcyjna stochastyczna Korelacja brak korelacji korelacja krzywoliniowa korelacja dodatnia korelacja ujemna Szereg korelacyjny numer
Bardziej szczegółowoZawansowane modele wyborów dyskretnych
Zawansowane modele wyborów dyskretnych Jerzy Mycielski Uniwersytet Warszawski grudzien 2013 Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 1 / 16 Model efektów
Bardziej szczegółowo5. Model sezonowości i autoregresji zmiennej prognozowanej
5. Model sezonowości i autoregresji zmiennej prognozowanej 1. Model Sezonowości kwartalnej i autoregresji zmiennej prognozowanej (rząd istotnej autokorelacji K = 1) Szacowana postać: y = c Q + ρ y, t =
Bardziej szczegółowoSYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia
Bardziej szczegółowoRegresja i Korelacja
Regresja i Korelacja Regresja i Korelacja W przyrodzie często obserwujemy związek między kilkoma cechami, np.: drzewa grubsze są z reguły wyższe, drewno iglaste o węższych słojach ma większą gęstość, impregnowane
Bardziej szczegółowoW1. Wprowadzenie. Statystyka opisowa
W1. Wprowadzenie. Statystyka opisowa dr hab. Jerzy Nakielski Zakład Biofizyki i Morfogenezy Roślin Plan wykładu: 1. O co chodzi w statystyce 2. Etapy badania statystycznego 3. Zmienna losowa, rozkład
Bardziej szczegółowoZadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.
tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1
Bardziej szczegółowoSTATYSTYKA I DOŚWIADCZALNICTWO Wykład 5
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y
Bardziej szczegółowo1. TESTY PSYCHOLOGICZNE
1. TESTY PSYCHOLOGICZNE 1. pojęcie testu psychologicznego 2. zastosowanie 3. podstawowe wymogi (standaryzacja, obiektywność, rzetelność, trafność, normalizacja) 4. cecha psychologiczna w ujęciu psychologicznym
Bardziej szczegółowoWykład 10 Skalowanie wielowymiarowe
Wykład 10 Skalowanie wielowymiarowe Wrocław, 30.05.2018r Skalowanie wielowymiarowe (Multidimensional Scaling (MDS)) Główne cele MDS: przedstawienie struktury badanych obiektów przez określenie treści wymiarów
Bardziej szczegółowoĆwiczenie: Wybrane zagadnienia z korelacji i regresji.
Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)
Bardziej szczegółowoStatystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34
Statystyka Wykład 9 Magdalena Alama-Bućko 24 kwietnia 2017 Magdalena Alama-Bućko Statystyka 24 kwietnia 2017 1 / 34 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne
Bardziej szczegółowoModel 1: Estymacja KMNK z wykorzystaniem 4877 obserwacji Zmienna zależna: y
Zadanie 1 Rozpatrujemy próbę 4877 pracowników fizycznych, którzy stracili prace w USA miedzy rokiem 1982 i 1991. Nie wszyscy bezrobotni, którym przysługuje świadczenie z tytułu ubezpieczenia od utraty
Bardziej szczegółowoRozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów
Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,
Bardziej szczegółowoModele zapisane w przestrzeni stanów
Modele zapisane w przestrzeni stanów Modele Przestrzeni Stanów (State Space Models) sa to modele, w których część parametrów jest nieobserwowalna i losowa. Zachowanie wielowymiarowej zmiennej y t zależy
Bardziej szczegółowoZasady rzetelnego pomiaru efektywności transferu wiedzy w e-learningu akademickim
Zasady rzetelnego pomiaru efektywności transferu wiedzy w e-learningu akademickim Wojciech BIZON Wydział Ekonomiczny Uniwersytet Gdański 1 Problem w długim horyzoncie czasowym do rozwiązania: w jaki sposób
Bardziej szczegółowoANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH
ANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH - Adrian Gorgosz - Paulina Tupalska ANALIZA WIELOPOZIOMOWA (AW) Multilevel Analysis Obecna od lat 80. Popularna i coraz częściej stosowana
Bardziej szczegółowoZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA. dr inż. Aleksander Astel
ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA dr inż. Aleksander Astel Gdańsk, 22.12.2004 CHEMOMETRIA dziedzina nauki i techniki zajmująca się wydobywaniem użytecznej informacji z wielowymiarowych
Bardziej szczegółowoStanisław Cichocki Natalia Nehrebecka. Zajęcia 8
Stanisław Cichocki Natalia Nehrebecka Zajęcia 8 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów
Bardziej szczegółowoKARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4
KARTA KURSU (do zastosowania w roku ak. 2015/16) Nazwa Statystyka 1 Nazwa w j. ang. Statistics 1 Kod Punktacja ECTS* 4 Koordynator Dr hab. Tadeusz Sozański (koordynator, wykłady) Dr Paweł Walawender (ćwiczenia)
Bardziej szczegółowoEkonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Wykład 4 Prognozowanie, stabilność 1 / 17 Agenda
Bardziej szczegółowoANALIZA DYNAMIKI DOCHODU KRAJOWEGO BRUTTO
ANALIZA DYNAMIKI DOCHODU KRAJOWEGO BRUTTO Wprowadzenie Zmienność koniunktury gospodarczej jest kształtowana przez wiele różnych czynników ekonomicznych i pozaekonomicznych. Znajomość zmienności poszczególnych
Bardziej szczegółowowykorzystywane podczas zajęć wykład, ćwiczenia, Konwersatorium
Nazwa przedmiotu Budowanie teorii. Kryzys w psychologii. Prerejestracja. Moc statystyczna. Analiza mocy statystycznej w programie G*Power Wprowadzenie do R warsztat Forma zajęć (np. wykład, ćwiczenia,
Bardziej szczegółowoX WYKŁAD STATYSTYKA. 14/05/2014 B8 sala 0.10B Godz. 15:15
X WYKŁAD STATYSTYKA 14/05/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 10 ANALIZA KORELACJI Korelacja 1. Współczynnik korelacji 2. Kowariancja 3. Współczynnik korelacji liniowej definicja 4. Estymacja współczynnika
Bardziej szczegółowoPodstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak
Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak Autor prezentuje spójny obraz najczęściej stosowanych metod statystycznych, dodatkowo omawiając takie
Bardziej szczegółowoEtapy modelowania ekonometrycznego
Etapy modelowania ekonometrycznego jest podstawowym narzędziem badawczym, jakim posługuje się ekonometria. Stanowi on matematyczno-statystyczną formę zapisu prawidłowości statystycznej w zakresie rozkładu,
Bardziej szczegółowoStanisław Cichocki. Natalia Neherbecka. Zajęcia 13
Stanisław Cichocki Natalia Neherbecka Zajęcia 13 1 1. Kryteria informacyjne 2. Testowanie autokorelacji 3. Modele dynamiczne: modele o rozłożonych opóźnieniach (DL) modele autoregresyjne o rozłożonych
Bardziej szczegółowo