ANALIZA WIELOPOZIOMOWA Z WYKORZYSTANIEM DANYCH SYMBOLICZNYCH MULTILEVEL ANALYSIS WITH APPLICATION OF SYMBOLIC DATA
|
|
- Artur Wieczorek
- 8 lat temu
- Przeglądów:
Transkrypt
1 PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU nr 07 RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS nr Taksonomia 6 ISSN Klasyfikacja i analiza danych teoria i zastosowania e-issn Adam Sagan Uniwersytet Ekonomiczny w Krakowie adam.sagan@uek.krakow.pl Marcin Pełka Uniwersytet Ekonomiczny we Wrocławiu marcin.pelka@ue.wroc.pl ANALIZA WIELOPOZIOMOWA Z WYKORZYSTANIEM DANYCH SYMBOLICZNYCH MULTILEVEL ANALYSIS WITH APPLICATION OF SYMBOLIC DATA DOI: /pn Streszczenie: W artykule zaproponowano zastosowanie analizy danych symbolicznych w analizie danych wielopoziomowych. Podejście wielopoziomowe pozwala na uwzględnienie heterogeniczności populacji oraz przynależności respondentów do hierarchicznych układów funkcjonalnych. Celem artykułu jest budowa i estymacja wielopoziomowych modeli regresyjnych z wykorzystaniem danych symbolicznych na przykładzie danych o inwestycjach gospodarstw domowych w Polsce. W części empirycznej przedstawiono wyniki autorskich badań na podstawie ogólnopolskich badań ankietowych. Przeprowadzone analizy pozwoliły na zbadanie wpływu wieku respondenta wieku najmłodszego dziecka oraz wieku decydenta na podejmowane decyzje inwestycyjne. Wyniki te wskazują także że analiza danych symbolicznych może znaleźć zastosowanie w badaniach wielopoziomowych a jej zastosowanie pozwala na szerszy opis obiektów zarówno na poziomie indywidualnym oraz grupowym. Słowa kluczowe: analiza danych symbolicznych analiza wielopoziomowa dane symboliczne interwałowe. Summary: The paper proposes the application of symbolic data analysis in the context of multilevel analysis. Multilevel analysis allows for taking into account heterogeneity of the data and the fact that respondents may be nested in many different functional elements. The main aim of the paper is the estimation of multilevel regression models for investment strategies in Polish households. The empirical part shows the results of the research for Polish households. The results suggest that symbolic data analysis may be a useful tool for multilevel analysis of data. It allows for describing objects in more detailed way both at individual and aggregate level. Keywords: multilevel analysis symbolic data analysis symbolic interval-valued data.
2 Analiza wielopoziomowa z wykorzystaniem danych symbolicznych Wstęp We współczesnych badaniach społecznych i marketingowych coraz większe znaczenie mają analizy pozwalające na uwzględnienie heterogeniczności populacji wynikającej z przyjętego schematu losowania próby oraz przynależności respondentów do hierarchicznych układów instytucjonalnych. Z tego punktu widzenia uzyskiwane dane mają często charakter zagnieżdżony. Przykładem jest zespołowy dobór próby i prowadzenie badań w układach instytucjonalnych (pracownicy w przedsiębiorstwach pacjenci w szpitalach uczniowie w klasach itp.). Z drugiej strony dane uzyskiwane w badaniach ankietowych są analizowane w postaci zmiennych z interwałami wielowariantowych lub nominalnych które mogą być przedmiotem agregacji na wyższym poziomie uogólnienia. Dane tego typu są przedmiotem analiz głównie w zakresie analizy wielopoziomowej niemniej jednak w zakresie analizy danych symbolicznych opracowano modele i metody analizowania danych na poziomie indywidualnym oraz zagregowanym co może stanowić użyteczne narzędzie w zakresie analiz wielopoziomowych. Celem artykułu jest budowa i estymacja wielopoziomowych modeli regresyjnych z wykorzystaniem danych symbolicznych na przykładzie danych o inwestycjach gospodarstw domowych w Polsce. Są one zbudowane na podstawie wyników ogólnopolskich badań ankietowych. Analiza danych symbolicznych doczekała się zastosowań w wielu metodach wielowymiarowych jednak wykorzystanie ich w modelowaniu wielopoziomowym stanowi ciągle istotne pole dalszych poszukiwań.. Założenia modeli wielopoziomowych Modele wielopoziomowe stanowią szeroki nurt analiz regresyjnych z wykorzystaniem prób złożonych. Modele te w zależności od obszaru zastosowania znane są w literaturze również jako hierarchiczne modele liniowe (HLM) modele z losowymi współczynnikami regresji (RCM) analiza kontekstowa liniowe modele mieszane (LMEM) czy modele z efektami mieszanymi (MEM) (zob. m.in. [Bryk Raudenbush 199; Hox 010; Goldstein 1995]). Warunkiem zastosowania modeli wielopoziomowych jest zagnieżdżony charakter danych w którym losowane są z populacji jednostki zarówno z pierwszego jak i z drugiego poziomu losowania. Przykładem tego typu analiz są analizy osiągnięć uczniów w klasach szkolnych firm w sektorach głosowań wyborców w okręgach wyborczych zadowolenia pacjentów w szpitalach czy kolejne powtarzane pomiary w badaniach panelowych. W przypadku danych tego typu nie można mówić o niezależności obserwacji Wynika to z zagnieżdżenia elementów niższych poziomów w elementach wyższego poziomu np. uczniów w klasach oraz z zależności jednostek z niższego poziomu od charakterystyk poziomu wyższego (np. wpływu charakterystyk nauczyciela na po-
3 176 Adam Sagan Marcin Pełka ziom osiągnięć uczniów w danej klasie). W powtarzalnych badaniach panelowych niezależność obserwacji jest łamana poprzez występowanie efektów halo (sugerowanie się odpowiedziami z poprzednich fal badań). Prowadzić to może do obciążonych (biased) błędów standardowych oszacowań parametrów. Ze względu na możliwe zróżnicowanie parametrów modelu w przekroju grup model wielopoziomowy składa się z co najmniej dwóch poziomów. Na pierwszym poziomie analizy zmienne z poziomu indywidualnego są wyjaśniane przez predyktory z tego samego poziomu: y X X ij = β 0 j + β1 j 1ij + β j 1ij + ij (1) gdzie: y ij zmienna zależna w przekroju respondenta i należącego do klasy j; X 1ij pierwsza zmienna niezależna w przekroju respondenta i należącego do klasy j; X ij druga zmienna niezależna w przekroju respondenta i należącego do klasy j; ε ij reszta w modelu. Symbole 0j 1j i j przy wyrazach wolnych i współczynnikach nachyleń oznaczają że są one zmiennymi losowymi o rozkładzie normalnym w przekroju klas j. Na drugim poziomie analizy są one wyjaśniane przez odpowiednie predyktory z wyższego poziomu (grupowego): β = γ + γ W + u β = γ + γ W + u β = γ + γ W + u 0 j j oj 1 j j 1 j j j j gdzie: β kj zmienne zależne w przekroju klas j W kj predyktory z poziomu zespołowego u kij reszty w modelach II poziomu. Łącząc oba poziomy analizy można otrzymać formę zredukowaną równania wielopoziomowego: y = γ + γ W + γ X + γ X W + γ X + ij j 10 1ij 11 1ij 1 j 0 ij γ1xijw1 j u0 j u1 j Xij u j X ij εij Z punktu widzenia dekompozycji efektów wewnątrzklasowych I międzyklasowych zmienne z poziomu 1 mogą być ujmowane jako suma dwóch składowych: 1) komponentu wewnątrzklasowego (odchyleń indywidualnych obserwacji od średniej grupowej y yˆ ) i ) komponentu międzyklasowego (różnic między średnimi grupowymi ij j y j ˆ ). Stąd całkowita kowariancja zmiennych Σ T może być dekomponowana na macierz kowariancji międzyklasowej Σ B oraz kowariancji wewnątrzklasowej Σ W tak że Σ T Σ B + Σ W. Własność ta jest podstawą szacowania równań strukturalnych dla modeli wielopoziomowych. ε () (3)
4 Analiza wielopoziomowa z wykorzystaniem danych symbolicznych 177 Wyróżnić można wiele podejść do szacowania modeli wielopoziomowych. Do najważniejszych należą dwuetapowe podejście Muthéna MUML [Muthén ] dwuetapowa bezpośrednia estymacja Goldsteina [1995] dwuetapowa metoda Chou Bentlera i Pentza [1998] metoda GLAMM Skrondala i Rabe-Hesketh [004] metoda Raudenbusha (zob. np. [Paterson Goldstein 1991]) metoda Ansari i Jedidi [000] metoda Asparouhova i Muthéna [009]. Podejście wielopoziomowe pociąga za sobą występowanie indywidualnego i grupowego poziomu analizy. Ten rodzaj modeli jest szczególnie istotny dla danych symbolicznych cechujących się podobnym układem zależności. 3. Dane symboliczne jako specyficzny rodzaj danych wielopoziomowych Obiekty symboliczne w przeciwieństwie do obiektów w ujęciu klasycznym mogą być opisywane przez następujące rodzaje zmiennych [Bock Diday (red.) 000 s. 3; Billard Diday 006 s. 7 30; Dudek 013 s ; Diday Noirhomme- -Fraiture 008 s ]: zmienne nominalne porządkowe przedziałowe oraz ilorazowe zmienne interwałowe czyli przedziały liczbowe zmienne wielowariantowe czyli listy kategorii lub wartości zmienne wielowariantowe z wagami czyli listy kategorii z wagami zmienne histogramowe czyli listy wartości z wagami. Więcej o obiektach i zmiennych symbolicznych sposobach otrzymywania zmiennych symbolicznych z baz danych różnicach i podobieństwach między obiektami symbolicznymi a klasycznymi piszą m.in.: [Bock Diday (red.) 000 s. 8; Dudek 013 s. 4 43; 004; Billard Diday 006 s. 7 66; Noirhomme- -Fraiture Brito 011; Diday Noirhomme-Fraiture 008 s. 3 30]. W analizie danych symbolicznych mamy do czynienia z dwoma głównymi typami obiektów obiektami symbolicznymi pierwszego rzędu i obiektami symbolicznymi drugiego rzędu które mogą być traktowane jako specyficzny rodzaj danych wielopoziomowych. Obiekty symboliczne pierwszego rzędu (first-order objects single individuals) są to pojedyncze obiekty w sensie klasycznym respondent A produkt T firma X itp. z tym że są one opisywane przez zmienne symboliczne. Obiekty te reprezentują poziom indywidualny w sensie analizy wielopoziomowej. Zmienne symboliczne opisujące te obiekty otrzymuje się albo bezpośrednio z wykorzystaniem kwestionariusza ankiety (gdzie odpowiedzi mają charakter zmiennych symbolicznych) albo z wykorzystaniem danych klasycznych i dokonując ich agregacji z wykorzystaniem informacji o czasie (temporal aggregation) [Noirhomme- -Fraiture Brito 011 s. 158]. Dane klasyczne będące podstawą tego typu agregacji zawarto w tab. 1 a wynik agregacji (obiekty symboliczne pierwszego rzędu dane indywidualne) w tab..
5 178 Adam Sagan Marcin Pełka Tabela 1. Dane klasyczne będące podstawą agregacji Id klienta Wydana kwota Zakupione produkty Kata płatnicza Miejsce zamieszkania napoje Visa Wrocław elektronika Mastercard Wrocław ubrania Visa Wrocław żywność Visa Wałbrzych elektronika Visa Wrocław ubrania Electron Wałbrzych napoje Visa Wrocław Tabela. Obiekty symboliczne (dane indywidualne) agregacja danych z uwzględnieniem informacji o czasie (temporal aggregation) Id klienta Wydana kwota Zakupione produkty Kata płatnicza Miejsce zamieszkania 001 < > {napoje (/3); elektronika (1/3)} {Visa Mastercard} Wrocław 00 <00 500> {ubrania (1/); elektronika (1/)} {Visa} Wrocław 003 <50 450> {żywność (1/); ubrania (1/)} {Visa Electron} Wałbrzych Obiekty symboliczne drugiego rzędu (second-order objects super-individuals aggregate objects) są to mniej lub bardziej homogeniczne klasy grupy obiektów w sensie klasycznym lub obiektów symbolicznych pierwszego rzędu. Obiekty te reprezentują poziom zagregowany w sensie analizy wielopoziomowej. Obiekty symboliczne drugiego rzędu są najczęściej wynikiem agregacji danych z uwzględnieniem innych czynników niż czas (contemporary aggregation) [Noirhomme-Fraiture Brito 011 s. 158]. W tabeli 3 zawarto dane klasyczne na podstawie których w tab. 4 i 5 zawarto dane symboliczne drugiego rzędu. Tabela 3. Dane klasyczne będące podstawą agregacji Id respondenta Miejsce zamieszkania Id gospodarstwa domowego Zarobki Czas spędzony na dojazd do pracy Wydatki na żywność 1 Wałbrzych Wałbrzych Wrocław Wrocław Wałbrzych Wałbrzych
6 Analiza wielopoziomowa z wykorzystaniem danych symbolicznych 179 Tabela 4. Obiekty symboliczne drugiego rzędu poziom gospodarstwa domowego Id gospodarstwa domowego Zarobki Czas spędzony na dojazd do pracy Wydatki na żywność 001 < > <15 0> < > 00 < > <10 15> <50 380> 003 < > <5 45> < > Tabela 5. Obiekty symboliczne drugiego rzędu poziom miasta Miasto Zarobki Czas spędzony na dojazd do pracy Wydatki na żywność Wałbrzych < > <10 45> < > Wrocław < > <10 15> <50 380> 4. Korelacje kowariancje i regresja liniowa danych symbolicznych interwałowych W analizie wielopoziomowej możliwe jest wykorzystanie korelacji kowariancji i regresji liniowej dlatego konieczne jest zdefiniowanie tych miar na potrzeby danych symbolicznych interwałowych które mają postać przedziału liczbowego o krańcach [a u b u ] gdzie u numer obiektu symbolicznego. Średnia dla całej próby w przypadku zmiennych symbolicznych interwałowych wraża się wzorem [Billard Diday 006 s. 79]: 1 Z = b + a ( u u) (4) m u E gdzie: m liczba zmiennych b u a u górny (dolny) kraniec zmiennej symbolicznej u numer obiektu symbolicznego E zbiór obiektów symbolicznych. Wariancja dla całej próby obiektów symbolicznych wyraża się wzorem [Billard Diday 006 s. 80]: gdzie oznaczenia jak we wzorze 4. 1 S = b a 4m + u E ( u u) (5) Korelacja pomiędzy dwiema zmiennymi symbolicznymi interwałowymi Z 1 Z wyraża się wzorem [Billard Diday 006 s. 13]:
7 180 Adam Sagan Marcin Pełka gdzie: ( ) Z 1 Z ( 1 ) ( 1 ) Z1 Z r Z Z = Cov Z Z S S (6) Cov Cov(Z 1 Z ) kowariancje pomiędzy zmiennymi Z 1 Z ; S Z S 1 Z wariancje pomiędzy zmiennymi Z 1 Z. Kowariancje pomiędzy zmiennymi Z 1 Z wyznaczane są zgodnie ze wzorem [Billard Diday 006 s. 13]: 1 Cov Z Z = G G Q Q (7) ( ) [ ] m u E ( ) ( )( ) ( ) j uj j uj j uj j uj j Q = a Z + a Z b Z + b Z (8) 1 dla Zuj Z j G j = 1 dla Zuj > Z j (9) gdzie: j = 1 numer obiektu symbolicznego pozostałe oznaczania jak we wzorach (4) oraz (5). W przypadku regresji liniowej danych symbolicznych interwałowych stosowany jest standardowy model najmniejszych kwadratów (zob. np. [Pełka 014]) w którym elementy macierzy X oraz Y w równaniu: ( ) 1 ˆ T T b= XX Xy (10) są zastępowane albo przez środki przedziałów liczbowych (metoda środków) albo przez środki i promienie tychże przedziałów liczbowych (metoda środków i promieni). W części empirycznej artykułu zastosowana zostanie wyłącznie metoda środków (center method) gdzie wzór (10) przestawia się następująco [Lima-Neto de Carvalho 008 s s ; Billard Diday 006 s ; Diday Noirhomme-Fraiture 008 s ]: (( ) ( )) T 1 ( ) ˆ c c c T c b= X X X y (11) gdzie: X c macierz środków zmiennych objaśniających y c macierz środków zmiennej objaśnianej. Oszacowane wartości teoretyczne zmiennej objaśnianej oblicza się odrębnie dla krańców dolnych (oznaczanych indeksem L) i górnych (oznaczanych indeksem U) tej zmiennej zgodnie ze wzorem: yˆ T ( ) ˆ T X b oraz yˆ ( X ) bˆ. = (1) L L U = U
8 Analiza wielopoziomowa z wykorzystaniem danych symbolicznych 181 Więcej o regresji liniowej danych symbolicznych interwałowych piszą m.in.: E.A. Lima-Neto i F.A.T. de Carvalho [ ] L. Billard i E. Diday [006] E. Diday i M. Noirhomme-Fraiture [008] oraz M. Pełka [014]. 5. Wyniki badań empirycznych Oszacowanie modeli wielopoziomowych na podstawie danych empirycznych zostało dokonane na ogólnopolskiej próbie 1100 respondentów z 440 gospodarstw domowych 1. Badania zostały przeprowadzone w 01 r. za pomocą standaryzowanego wywiadu kwestionariuszowego przeprowadzonego wśród członków gospodarstwa domowego (ojca matki i najstarszego dziecka powyżej 16. roku życia obecnego w domu). Celem badania była identyfikacja preferencji i wartości gospodarstw domowych w obszarze kierunków alokacji zasobów na konsumpcję oszczędzanie i inwestowanie. Jednym ze szczegółowych celów badania była ocena preferencji inwestycji w depozyty bankowe i inne instrumenty finansowe (akcje obligacje). W analizie wykorzystano wielopoziomowy model regresji liniowej danych symbolicznych interwałowych gdzie zmienną zależną jest wielkość inwestycji w depozyty bankowe i inne instrumenty finansowe (y zmienna symboliczna interwałowa) a zmiennymi niezależnymi są wiek respondenta (x 1 ) wiek najmłodszego dziecka w gospodarstwie domowym (x ) oraz wiek decydenta (x 3 ). Współczynnik ścieżkowy w przypadku modelu indywidualnego dla wieku respondenta w przekroju całej próby (y w zależności od x 1 ) wyniósł 0011 a wyraz wolny Współczynnik dopasowania R L wyniósł 065 a RU wyniósł 068. Oznacza to że wiek respondenta w niewielkim stopniu wpływa na podejmowane inwestycje (osoby starsze wiekiem skłonne są do podejmowania większych inwestycji niż osoby młodsze). W przypadku dla modelu na poziomie zagregowanym w przekroju całej próby gdzie zbudowano jeden model regresji dla wszystkich zmiennych współczynniki ścieżkowe (y w zależności od zmiennych x 1 x x 3 ) wyniosły odpowiednio oraz 0048 a wyraz wolny Współczynnik dopasowania R L wyniósł 061 a RU wyniósł 060. Wyniki te sugerują że wraz z rosnącym wiekiem (ceteris paribus) respondenci są mniej skłonni do inwestowania w instrumenty finansowe 1 Badania prowadzone były na reprezentatywnej próbie gospodarstw domowych w Polsce (w jego ramach ankietowani byli rodzice i najstarsze dziecko). Badanie dotyczyło wartości i preferencji członków gospodarstw domowych w zakresie konsumpcji oszczędzania i inwestowania. Obszerniej badanie to opisuje publikacja A. Sagan [(red.) 014]. L R oraz R U są współczynnikami dopasowania modelu do danych gdzie R L oznacza dopasowanie dla krańców dolnych a R U dopasowanie dla krańców górnych zmiennej symbolicznej interwałowej.
9 18 Adam Sagan Marcin Pełka natomiast zarówno wraz z rosnącym wiekiem najmłodszego dziecka (ceteris paribus) respondenci są bardziej skłonni do podejmowania tego typu inwestycji. Podobny wpływ na decyzje o inwestycjach ma tu wiek decydenta którego oszacowany parametr ma największą wartość. Dla poziomu zagregowanego zbudowano także trzy indywidualne modele jeden dla każdej ze zmiennych niezależnych wyniki zestawiono w tab. 6. Tabela 6. Wyniki estymacji dla trzech różnych modeli Współczynnik ścieżkowy Wielkość współczynnika ścieżkowego Wyraz wolny y = a 1 + b 1 x 1 b 1 = 0003 a 1 = 1 y = a + b x b = a = y = a 3 + b 3 x 3 b 3 = a 3 = Z tabeli 6 wynika że w przypadku budowy różnych modeli wpływ poszczególnych zmiennych mimo że szacowany osobno jest zbliżony do ich wpływu w modelu uwzględniającym wszystkie zmienne. Modele zawarte w tab. 6 miały niewielkie wartości dopasowania do danych. W badaniach podjęto także próbę połączenia danych z poziomu indywidualnego oraz poziomu gospodarstw domowych (zmienne x 1 oraz x ) i oszacowano parametry modeli regresji w ramach każdego gospodarstwa domowego (419 odrębnych modeli). Niestety z powodu niewielkiej liczebności osób w gospodarstwach domowych niemożliwe okazało się oszacowanie parametrów związanych ze zmienną x (wiek najmłodszego dziecka w gospodarstwie domowym). Oszacowania parametrów dla wybranych obserwacji są następujące: yˆ = x1 yˆ 6 = x1 yˆ 15 = x1 yˆ 418 = x1 yˆ = x W przypadku tych modeli dopasowanie do danych było bardzo niewielkie z uwagi na brak uwzględnienia w modelu zmiennej x. Wyniki te mimo braku możliwości oszacowania parametrów dla drugiej zmiennej pozwalają w pewnym (choć ograniczonym stopniu) poznać wpływ wieku respondenta na podejmowane decyzje w ramach każdego z gospodarstw domowych. Wyniki wskazują że wraz z wiekiem respondenta znaczna część gospodarstw domowych jest mniej skłonna do podejmowania ryzyka inwestycyjnego.
10 Analiza wielopoziomowa z wykorzystaniem danych symbolicznych Podsumowanie Dane symboliczne mogą być traktowane jako pewien rodzaj danych wielopoziomowych. Dane tego typu pozwalają na opisywanie obiektów na poziomie indywidualnym oraz zagregowanym. W analizie danych symbolicznych obiekty mogą być opisywane w bardziej złożony sposób z wykorzystaniem różnego typu zmiennych symbolicznych interwałowych wielowariantowych histogramowych itd. Niemniej jednak taki opis danych wymaga zastosowania odpowiednich metod i narzędzi. Dla różnych typów zmiennych symbolicznych literatura przedmiotu zaproponowała różne rozwiązania w zakresie obliczania macierzy korelacji kowariancji średnich oraz wariancji Dane symboliczne mogą zostać zastosowane w regresji liniowej danych symbolicznych. Pozwala to na analizowanie zależności na poziomie indywidualnym i zagregowanym. Autorzy zaprezentowali w jaki sposób dane symboliczne mogą być analizowane w kontekście analiz wielopoziomowych oraz zaproponowali trzy różne rozwiązania model dla danych zagregowanych model dla danych indywidualnych a także model łączący dane indywidualne i zagregowane. Wadą proponowanego podejścia jest to że nie jest to pełny model wielopoziomowy którego budowa pozostaje zagadnieniem otwartym. Do innych ograniczeń można zaliczyć ograniczenia związane z regresją liniową danych symbolicznych m.in. brak możliwości weryfikacji założeń modelu liniowego oraz brak rozwiązań w zakresie estymacji modeli dla danych symbolicznych różnych typów. Literatura Ansari A. Jedidi K. 000 Bayesian factor analysis for multilevel binary observations Psychometrika vol. 65 no. 4 s Asparouhov T. Muthén B. 009 Exploratory structural equation modeling Structural Equation Modeling vol. 16 no. 3 s Billard L. Diday E. 006 Symbolic Data Analysis. Conceptual Statistics and Data Mining John Wiley & Sons Chichester. Bock H.-H. Diday E. (red.) 000 Analysis of Symbolic Data. Explanatory Methods for Extracting Statistical Information from Complex Data Springer-Verlag Berlin Heidelberg. Bryk A.S. Raudenbush S.W. 199 Hierarchical Linear Models: Applications and Data Analysis Methods Sage Publications Thousand Oaks. Chou C.P. Bentler P.M. Pentz M.A Comparisons of two statistical approaches to study growth curves: The multilevel model and the latent curve analysis Structural Equation Modeling vol. 5 no. 3 s Diday E. Noirhomme-Fraiture M. 008 Symbolic Data Analysis. Conceptual Statistics and Data Mining Wiley Chichester. Dudek A. 013 Metody analizy danych symbolicznych w badaniach ekonomicznych Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu Wrocław. Goldstein H Multilevel Statistical Models Edward Arnold New York.
11 184 Adam Sagan Marcin Pełka Hox J.J. 010 Multilevel Analysis: Technique and Applications Routledge New York. Lima-Neto E.A. de Carvalho F.A.T. 008 Centre and range method to fitting a linear regression model on symbolic interval data Computational Statistics and Data Analysis vol. 5 no. 1 s Lima-Neto E.A. de Carvalho F.A.T. 010 Constrained linear regression models for symbolic interval-valued variables Computational Statistics and Data Analysis vol. 54 s Muthén B Latent variable modeling in heterogeneous populations Psychometrika vol. 54 no. 4 s Muthén B Multilevel covariance structure analysis Sociological Methods & Research vol. no. 3 s Noirhomme-Fraiture M. Brito P. 011 Far Beyond the Classical Data Models: Symbolic Data Analysis Statistical Analysis and Data Mining vol. 4 no. s Pełka M. 014 Podejście wielomodelowe w regresji danych symbolicznych interwałowych Ekonometria 4 (46) s Paterson L. Goldstein H New statistical methods for analysing social structures: An introduction to multilevel models British Educational Research Journal vol. 17 no. 4 s Sagan A. (red.) 014 Values and Preferences in Income Allocation of Polish Households Fundacja Uniwersytetu Ekonomicznego w Krakowie Kraków. Skrondal A. Rabe-Hesketh S. 004 Generalized Latent Variable Modeling: Multilevel Longtidual and Structural Equation Models Chapman & Hall Boca Raton.
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 426 Taksonomia 26 Klasyfikacja i analiza danych teoria i zastosowania Wydawnictwo Uniwersytetu
PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS
PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS nr 507 2018 Taksonomia 30 ISSN 1899-3192 Klasyfikacja i analiza danych teoria i zastosowania e-issn
Podejścia w skalowaniu wielowymiarowym obiektów symbolicznych
Marcin Pełka Uniwersytet Ekonomiczny we Wrocławiu Katedra Ekonometrii i Informatyki Podejścia w skalowaniu wielowymiarowym obiektów symbolicznych 1. Wprowadzenie Metody skalowania wielowymiarowego obiektów
METODY SKALOWANIA WIELOWYMIAROWEGO OBIEKTÓW SYMBOLICZNYCH
Marcin Pełka Akademia Ekonomiczna we Wrocławiu METODY SKALOWANIA WIELOWYMIAROWEGO OBIEKTÓW SYMBOLICZNYCH 1. Wprowadzenie Metody skalowania wielowymiarowego obiektów symbolicznych, podobnie jak w przypadku
MODEL STRUKTURALNY RELACJI MIĘDZY SATYSFAKCJĄ
MODEL STRUKTURALNY RELACJI MIĘDZY SATYSFAKCJĄ I LOJALNOŚCIĄ WOBEC MARKI Adam Sagan Akademia Ekonomiczna w Krakowie, Katedra Analizy Rynku i Badań Marketingowych Wstęp Modelowanie strukturalne ma wielorakie
Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).
Statystyka i opracowanie danych Ćwiczenia 12 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA WIELORAKA Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych
Rozdział 8. Regresja. Definiowanie modelu
Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność
Metody Ilościowe w Socjologii
Metody Ilościowe w Socjologii wykład 2 i 3 EKONOMETRIA dr inż. Maciej Wolny AGENDA I. Ekonometria podstawowe definicje II. Etapy budowy modelu ekonometrycznego III. Wybrane metody doboru zmiennych do modelu
Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna
Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować
Badania eksperymentalne
Badania eksperymentalne Analiza CONJOINT mgr Agnieszka Zięba Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa Najpopularniejsze sposoby oceny wyników eksperymentu w schematach
ANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH
ANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH - Adrian Gorgosz - Paulina Tupalska ANALIZA WIELOPOZIOMOWA (AW) Multilevel Analysis Obecna od lat 80. Popularna i coraz częściej stosowana
EKONOMETRIA ECONOMETRICS 4(46) 2014
EKONOMERIA ECONOMERICS 4(46) 014 Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu Wrocław 014 Redaktor Wydawnictwa: Aleksandra Śliwka Redaktor techniczny: Barbara Łopusiewicz Korektor: Barbara Cibis
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Wprowadzenie do modelowania ekonometrycznego Estymator Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Wykład 1 Estymator 1 / 16 Agenda 1 Literatura Zaliczenie przedmiotu 2 Model
Stosowana Analiza Regresji
Model jako : Stosowana Analiza Regresji Wykład XI 21 Grudnia 2011 1 / 11 Analiza kowariancji Model jako : Oprócz czynnika o wartościach nominalnych chcemy uwzględnić wpływ predyktora o wartościach ilościowych
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów regresji z wykorzystaniem metody bootstrap. Wrocław, 22.03.2017r Wybór najlepszej procedury - podsumowanie Co nas interesuje przed przeprowadzeniem
Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:
Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007
Modele regresji wielorakiej - dobór zmiennych, szacowanie Paweł Cibis pawel@cibis.pl 1 kwietnia 2007 1 Współczynnik zmienności Współczynnik zmienności wzory Współczynnik zmienności funkcje 2 Korelacja
PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR. Wojciech Zieliński
PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR Wojciech Zieliński Katedra Ekonometrii i Statystyki SGGW Nowoursynowska 159, PL-02-767 Warszawa wojtek.zielinski@statystyka.info
Statystyka opisowa. Wykład V. Regresja liniowa wieloraka
Statystyka opisowa. Wykład V. e-mail:e.kozlovski@pollub.pl Spis treści 1 Prosta regresji cechy Y względem cech X 1,..., X k. 2 3 Wyznaczamy zależność cechy Y od cech X 1, X 2,..., X k postaci Y = α 0 +
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y
Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe
Wprowadzenie do teorii ekonometrii Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Zajęcia Wykład Laboratorium komputerowe 2 Zaliczenie EGZAMIN (50%) Na egzaminie obowiązują wszystkie informacje
Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),
Zależność przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna), funkcyjna stochastyczna Korelacja brak korelacji korelacja krzywoliniowa korelacja dodatnia korelacja ujemna Szereg korelacyjny numer
REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji
Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji
STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2
STATYSTYKA Rafał Kucharski Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2 Zależność przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna), funkcyjna stochastyczna
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA Powtórka Powtórki Kowiariancja cov xy lub c xy - kierunek zależności Współczynnik korelacji liniowej Pearsona r siła liniowej zależności Istotność
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Redakcja i korekta Bogdan Baran Projekt graficzny okładki Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2011 ISBN
1 Estymacja przedziałowa
1 Estymacja przedziałowa 1. PRZEDZIAŁY UFNOŚCI DLA ŚREDNIEJ (a) MODEL I Badana cecha ma rozkład normalny N(µ, σ) o nieznanym parametrze µ i znanym σ. Przedział ufności: [ ( µ x u 1 α ) ( σn ; x + u 1 α
Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014
Estymacja przedziałowa - przedziały ufności dla średnich Wrocław, 5 grudnia 2014 Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja Przedziałem ufności dla paramertu
KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona
KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y 2. Współczynnik korelacji Pearsona 3. Siła i kierunek związku między zmiennymi 4. Korelacja ma sens, tylko wtedy, gdy związek między zmiennymi
strona 1 / 12 Autor: Walesiak Marek Publikacje:
Autor: Walesiak Marek Publikacje: 1. Autorzy rozdziału: Borys Tadeusz; Strahl Danuta; Walesiak Marek Tytuł rozdziału: Wkład ośrodka wrocławskiego w rozwój teorii i zastosowań metod taksonomicznych, s.
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Redakcja i korekta Bogdan Baran Projekt graficzny okładki Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2011 ISBN
Stanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 2 3 1. Wprowadzenie do danych panelowych a) Charakterystyka danych panelowych b) Zalety i ograniczenia 2. Modele ekonometryczne danych panelowych a) Model efektów
KORELACJE I REGRESJA LINIOWA
KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem
Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn
Wykład 10 Estymacja przedziałowa - przedziały ufności dla średniej Wrocław, 21 grudnia 2016r Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja 10.1 Przedziałem
Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii
SPIS TREŚCI Przedmowa... 11 Wykaz symboli... 15 Litery alfabetu greckiego wykorzystywane w podręczniku... 15 Symbole wykorzystywane w zagadnieniach teorii mnogości (rachunku zbiorów)... 16 Symbole stosowane
Wprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
EKONOMETRIA. Prof. dr hab. Eugeniusz Gatnar.
EKONOMETRIA Prof. dr hab. Eugeniusz Gatnar egatnar@mail.wz.uw.edu.pl Sprawy organizacyjne Wykłady - prezentacja zagadnień dotyczących: budowy i weryfikacji modelu ekonometrycznego, doboru zmiennych, estymacji
1.1 Klasyczny Model Regresji Liniowej
1.1 Klasyczny Model Regresji Liniowej Klasyczny model Regresji Liniowej jest bardzo użytecznym narzędziem służącym do analizy danych empirycznych. Analiza regresji zajmuje się opisem zależności między
WYKŁAD 5 TEORIA ESTYMACJI II
WYKŁAD 5 TEORIA ESTYMACJI II Teoria estymacji (wyznaczanie przedziałów ufności, błąd badania statystycznego, poziom ufności, minimalna liczba pomiarów). PRÓBA Próba powinna być reprezentacyjna tj. jak
Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22
Spis treści Przedmowa do wydania pierwszego.... 11 Przedmowa do wydania drugiego.... 15 Wykaz symboli.... 17 Litery alfabetu greckiego wykorzystywane w podręczniku.... 17 Symbole wykorzystywane w zagadnieniach
Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.
tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne
Regresja i Korelacja
Regresja i Korelacja Regresja i Korelacja W przyrodzie często obserwujemy związek między kilkoma cechami, np.: drzewa grubsze są z reguły wyższe, drewno iglaste o węższych słojach ma większą gęstość, impregnowane
Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 3 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.hedonic.dta przygotuj model oszacowujący wartość kosztów zewnętrznych rolnictwa 1. Przeprowadź regresję objaśniającą
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych
Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych 3.1. Estymacja parametrów i ocena dopasowania modeli z jedną zmienną 23. Właściciel komisu w celu zbadania
PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
Natalia Neherbecka. 11 czerwca 2010
Natalia Neherbecka 11 czerwca 2010 1 1. Konsekwencje heteroskedastyczności i autokorelacji 2. Uogólniona MNK 3. Stosowalna Uogólniona MNK 4. Odporne macierze wariancji i kowariancji b 2 1. Konsekwencje
Pobieranie prób i rozkład z próby
Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.
t y x y'y x'x y'x x-x śr (x-x śr)^2
Na podstawie:w.samuelson, S.Marks Ekonomia menedżerska Zadanie 1 W przedsiębiorstwie toczy się dyskusja na temat wpływu reklamy na wielkość. Dział marketingu uważa, że reklama daje wysoce pozytywne efekty,
strona 1 / 11 Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje:
Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje: 1. Autorzy rozdziału: Borys Tadeusz; Strahl Danuta; Walesiak Marek Tytuł rozdziału: Wkład ośrodka wrocławskiego w rozwój teorii
Stosowana Analiza Regresji
prostej Stosowana Wykład I 5 Października 2011 1 / 29 prostej Przykład Dane trees - wyniki pomiarów objętości (Volume), średnicy (Girth) i wysokości (Height) pni drzew. Interesuje nas zależność (o ile
Definicja danych panelowych Typy danych panelowych Modele dla danych panelowych. Dane panelowe. Część 1. Dane panelowe
Część 1 to dane, które jednocześnie posiadają cechy danych przekrojowych i szeregów czasowych to dane, które jednocześnie posiadają cechy danych przekrojowych i szeregów czasowych Czyli obserwujemy te
Estymacja punktowa i przedziałowa
Temat: Estymacja punktowa i przedziałowa Kody znaków: żółte wyróżnienie nowe pojęcie czerwony uwaga kursywa komentarz 1 Zagadnienia 1. Statystyczny opis próby. Idea estymacji punktowej pojęcie estymatora
Metody statystyczne wykorzystywane w szacowaniu trzyletnich wskaźników egzaminacyjnych
Artur Pokropek 1 Instytut Filozofii i Socjologii Polskiej Akademii Nauk Metody statystyczne wykorzystywane w szacowaniu trzyletnich wskaźników egzaminacyjnych Wstęp Trzyletni wskaźnik egzaminacyjny publikowany
Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Wykład 4 Prognozowanie, stabilność 1 / 17 Agenda
Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007
, transformacja liniowa i estymacja modelu KMNK Paweł Cibis pawel@cibis.pl 9 marca 2007 1 Miary dopasowania modelu do danych empirycznych Współczynnik determinacji Współczynnik zbieżności Skorygowany R
Modele wielorównaniowe (forma strukturalna)
Modele wielorównaniowe (forma strukturalna) Formę strukturalna modelu o G równaniach AY t = BX t + u t, gdzie Y t = [y 1t,..., y Gt ] X t = [x 1t,..., x Kt ] u t = [u 1t,..., u Gt ] E (u t ) = 0 Var (u
REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO. Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój
1 REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój 2 DOTYCHCZASOWE MODELE Regresja liniowa o postaci: y
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa
Spis treści Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Romuald Kotowski Katedra Informatyki Stosowanej PJWSTK 2009 Spis treści Spis treści 1 Wstęp Bardzo często interesujący
Monte Carlo, bootstrap, jacknife
Monte Carlo, bootstrap, jacknife Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej: http://www.ssc.wisc.edu/~bhansen/econometrics/ Monte Carlo: rozdział 8.8, 8.9 Bootstrap: rozdział
Statystyka i Analiza Danych
Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania wybranych technik regresyjnych do modelowania współzależności zjawisk Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki
Właściwości testu Jarque-Bera gdy w danych występuje obserwacja nietypowa.
Właściwości testu Jarque-Bera gdy w danych występuje obserwacja nietypowa. Paweł Strawiński Uniwersytet Warszawski Wydział Nauk Ekonomicznych 16 stycznia 2006 Streszczenie W artykule analizowane są właściwości
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Redakcja i korekta Bogdan Baran Projekt graficzny okładki Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2011 ISBN
Symscal: metoda skalowania wielowymiarowego obiektów symbolicznych
Andrzej Dudek, Marcin Pełka Akademia Ekonomiczna we Wrocławiu Symscal: metoda skalowania wielowymiarowego obiektów symbolicznych 1. Wprowadzenie Ideą skalowania wielowymiarowego obiektów symbolicznych
PODEJŚCIE WIELOMODELOWE ANALIZY DANYCH SYMBOLICZNYCH W OCENIE POZYCJI PRODUKTÓW NA RYNKU
EKONOMETRIA ECONOMETRICS 2(40) 2013 ISSN 1507-3866 Marcin Pełka Uniwersytet Ekonomiczny we Wrocławiu PODEJŚCIE WIELOMODELOWE ANALIZY DANYCH SYMBOLICZNYCH W OCENIE POZYCJI PRODUKTÓW NA RYNKU Streszczenie:
MODELE LINIOWE. Dr Wioleta Drobik
MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą
JEDNORÓWNANIOWY LINIOWY MODEL EKONOMETRYCZNY
JEDNORÓWNANIOWY LINIOWY MODEL EKONOMETRYCZNY Będziemy zapisywać wektory w postaci (,, ) albo traktując go jak macierz jednokolumnową (dzięki temu nie będzie kontrowersji przy transponowaniu wektora ) Model
Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ
Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,
ANALIZA ZDOLNOŚCI PROCESU O ZALEŻNYCH CHARAKTERYSTYKACH
Małgorzata Szerszunowicz Uniwersytet Ekonomiczny w Katowicach ANALIZA ZDOLNOŚCI PROCESU O ZALEŻNYCH CHARAKTERYSTYKACH Wprowadzenie Statystyczna kontrola jakości ma na celu doskonalenie procesu produkcyjnego
Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1
Zadanie 1 a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 b) W naszym przypadku populacja są inżynierowie w Tajlandii. Czy można jednak przypuszczać, że na zarobki kobiet-inżynierów
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
WYKŁAD 8 ANALIZA REGRESJI
WYKŁAD 8 ANALIZA REGRESJI Regresja 1. Metoda najmniejszych kwadratów-regresja prostoliniowa 2. Regresja krzywoliniowa 3. Estymacja liniowej funkcji regresji 4. Testy istotności współczynnika regresji liniowej
ANALIZA DYNAMIKI DOCHODU KRAJOWEGO BRUTTO
ANALIZA DYNAMIKI DOCHODU KRAJOWEGO BRUTTO Wprowadzenie Zmienność koniunktury gospodarczej jest kształtowana przez wiele różnych czynników ekonomicznych i pozaekonomicznych. Znajomość zmienności poszczególnych
Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla
Bogumiła Koprowska Elżbieta Kukla 1 Wstęp Czym są efekty losowe? Przykłady Model mieszany 2 Estymacja Jednokierunkowa klasyfikacja (ANOVA) Metoda największej wiarogodności (ML) Metoda największej wiarogodności
Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.
imię, nazwisko, nr indeksu: Ekonometria egzamin 01/02/2019 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.
Wiadomości ogólne o ekonometrii
Wiadomości ogólne o ekonometrii Materiały zostały przygotowane w oparciu o podręcznik Ekonometria Wybrane Zagadnienia, którego autorami są: Bolesław Borkowski, Hanna Dudek oraz Wiesław Szczęsny. Ekonometria
Nieliniowe. Liniowe. Nieliniowe. Liniowe. względem parametrów. Linearyzowane. sensu stricto
Ekonometria jak dorać funkcję? Przykłady użyte w materiałach opracowano w większości na azie danych ze skryptu B.Guzik, W.Jurek Podstawowe metody ekonometrii (wyd. AE Poznań 3) W doorze postaci funkcji
ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA
ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA Jan Mielniczuk Wisła, grudzień 2009 PLAN Błędy predykcji i ich podstawowe estymatory Estymacja błędu predykcji w modelu liniowym. Funkcje kryterialne Własności
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne
Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14
Statystyka #6 Analiza wariancji Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2015/2016 1 / 14 Analiza wariancji 2 / 14 Analiza wariancji Analiza wariancji jest techniką badania wyników,
Zróżnicowanie poziomu ubóstwa w Polsce z uwzględnieniem płci
Zróżnicowanie poziomu ubóstwa w Polsce z uwzględnieniem płci Łukasz Wawrowski Katedra Statystyki Uniwersytet Ekonomiczny w Poznaniu Zróżnicowanie poziomu ubóstwa w Polsce z uwzględnieniem płci 2 / 23 Plan
Oszacowanie i rozkład t
Oszacowanie i rozkład t Marcin Zajenkowski Marcin Zajenkowski () Oszacowanie i rozkład t 1 / 31 Oszacowanie 1 Na podstawie danych z próby szacuje się wiele wartości w populacji, np.: jakie jest poparcie
Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski
Narzędzia statystyczne i ekonometryczne Wykład 1 dr Paweł Baranowski Informacje organizacyjne Wydział Ek-Soc, pok. B-109 pawel@baranowski.edu.pl Strona: baranowski.edu.pl (w tym materiały) Konsultacje:
Etapy modelowania ekonometrycznego
Etapy modelowania ekonometrycznego jest podstawowym narzędziem badawczym, jakim posługuje się ekonometria. Stanowi on matematyczno-statystyczną formę zapisu prawidłowości statystycznej w zakresie rozkładu,
Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści
Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, 2018 Spis treści Przedmowa 13 O Autorach 15 Przedmowa od Tłumacza 17 1. Wprowadzenie i statystyka opisowa 19 1.1.
( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:
ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Ćwiczenia IV
Ćwiczenia IV - 17.10.2007 1. Spośród podanych macierzy X wskaż te, których nie można wykorzystać do estymacji MNK parametrów modelu ekonometrycznego postaci y = β 0 + β 1 x 1 + β 2 x 2 + ε 2. Na podstawie
Kolokwium ze statystyki matematycznej
Kolokwium ze statystyki matematycznej 28.05.2011 Zadanie 1 Niech X będzie zmienną losową z rozkładu o gęstości dla, gdzie 0 jest nieznanym parametrem. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę
WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno
WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być: