PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
|
|
- Bronisław Cichoń
- 7 lat temu
- Przeglądów:
Transkrypt
1 PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 328 Taksonomia 23 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof Jajuga, Marek Walesiak Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu Wrocław 2014
2 Redaktor Wydawnictwa: Barbara Majewska Redaktor techniczny: Barbara Łopusiewicz Korektor: Barbara Cibis Łamanie: Beata Mazur Projekt okładki: Beata Dębska Publikacja jest dostępna w Internecie na stronach: w Dolnośląskiej Bibliotece Cyfrowej The Central and Eastern European Online Library a także w adnotowanej bibliografii zagadnień ekonomicznych BazEkon Informacje o naborze artykułów i zasadach recenzowania znajdują się na stronie internetowej Wydawnictwa Tytuł dofinansowany ze środków Narodowego Banku Polskiego oraz ze środków Sekcji Klasyfikacji i Analizy Danych PTS Kopiowanie i powielanie w jakiejkolwiek formie wymaga pisemnej zgody Wydawcy Copyright by Uniwersytet Ekonomiczny we Wrocławiu Wrocław 2014 ISSN (Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu) ISSN (Taksonomia) Wersja pierwotna: publikacja drukowana Druk: Drukarnia TOTEM
3 Spis treści Wstęp Małgorzata Rószkiewicz, Wykorzystanie metaanalizy w budowaniu modelu pomiarowego w przypadku braku niezmienniczości zasad pomiaru na przykładzie pomiaru zadowolenia z życia Elżbieta Sobczak, Harmonijność inteligentnego rozwoju regionów Unii Europejskiej Ewa Roszkowska, Renata Karwowska, Analiza porównawcza województw Polski ze względu na poziom zrównoważonego rozwoju w roku Tadeusz Kufel, Magdalena Osińska, Marcin Błażejowski, Paweł Kufel, Analiza porównawcza wybranych filtrów w analizie synchronizacji cyklu koniunkturalnego Marcin Salamaga, Próba konstrukcji tablic wymierania scenicznego spektakli operowych na przykładzie Metropolitan Opera Iwona Foryś, Wykorzystanie analizy dyskryminacyjnej do typowania rynków podobnych w procesie wyceny nieruchomości niemieszkalnych Jerzy Korzeniewski, Selekcja zmiennych w klasyfikacji propozycja algorytmu Sabina Denkowska, Testowanie wielokrotne przy weryfikacji wieloczynnikowych modeli proporcjonalnego hazardu Coxa Ewa Chodakowska, Teoria równań strukturalnych w klasyfikacji zmiennych jawnych i ukrytych według charakteru ich wzajemnych oddziaływań Iwona Konarzewska, Model PCA dla rynku akcji studium przypadku Katarzyna Wójcik, Janusz Tuchowski, Dobór optymalnego zestawu słów istotnych w opiniach konsumentów na potrzeby ich automatycznej analizy 106 Aleksandra Łuczak, Zastosowanie metody AHP-LP do oceny ważności determinant rozwoju społeczno-gospodarczego w jednostkach administracyjnych Aleksandra Witkowska, Marek Witkowski, Klasyfikacja pozycyjna banków spółdzielczych według stanu ich kondycji finansowej w ujęciu dynamicznym Adam Depta, Zastosowanie analizy korespondencji do oceny jakości życia ludności na podstawie kwestionariusza SF-36v Marek Lubicz, Maciej Zięba, Konrad Pawełczyk, Adam Rzechonek, Marek Marciniak, Jerzy Kołodziej, Indukcja reguł dla danych niekompletnych i niezbalansowanych: modele klasyfikatorów i próba ich zastosowania do predykcji ryzyka operacyjnego w torakochirurgii
4 6 Spis treści Małgorzata Misztal, Wybrane metody oceny jakości klasyfikatorów przegląd i przykłady zastosowań Anna M. Olszewska, Wykorzystanie wybranych metod taksonomicznych do oceny potencjału innowacyjnego województw Iwona Bąk, Porównanie jakości grupowań powiatów województwa zachodniopomorskiego pod względem atrakcyjności turystycznej Agnieszka Kozera, Joanna Stanisławska, Romana Głowicka-Wołoszyn, Segmentacja gospodarstw domowych według wydatków na turystykę zorganizowaną Agnieszka Wałęga, Podejście syntetyczne w analizie spójności ekonomicznej gospodarstw domowych Joanna Banaś, Małgorzata Machowska-Szewczyk, Bożena Mroczek, Zastosowanie analizy korespondencji do badania wpływu elektrowni wiatrowych na jakość życia ludności Joanna Banaś, Krzysztof Małecki, Klasyfikacja punktów pomiarów ankietowych kierowców na granicy Szczecina z wykorzystaniem zmiennych symbolicznych Aneta Becker, Wykorzystanie informacji granularnej w analizie wymagań rynku pracy Katarzyna Cheba, Joanna Hołub-Iwan, Wykorzystanie analizy korespondencji w segmentacji rynku usług medycznych Adam Depta, Iwona Staniec, Identyfikacja czynników decydujących o jakości życia studentów łódzkich uczelni Katarzyna Dębkowska, Jarosław Kilon, Reguły asocjacyjne w analizie wyników badań metodą Delphi Anna Domagała, O wykorzystaniu analizy głównych składowych w metodzie Data Envelopment Analysis Alicja Grześkowiak, Analiza wykluczenia cyfrowego w Polsce w ujęciu indywidualnym i regionalnym Anna M. Olszewska, Anna Gryko-Nikitin, Pomiar postrzegania jakości kształcenia uczelni wyższej na danych porządkowych z wykorzystaniem środowiska R Karolina Paradysz, Hierarchiczna metoda grupowania powiatów jako podejście benchmarkowe w ocenie bezrobocia według BAEL-u w wybranych typach małych obszarów Radosław Pietrzyk, Porównanie metod pomiaru efektywności zarządzania portfelami funduszy inwestycyjnych Agnieszka Przedborska, Małgorzata Misztal, Wybrane metody statystyki wielowymiarowej w ocenie skuteczności terapeutycznej głębokiej stymulacji elektromagnetycznej u pacjentów z chorobą zwyrodnieniową stawów
5 7 Spis treści Wojciech Roszka, Marcin Szymkowiak, Podejście kalibracyjne w statystycznej integracji danych Iwona Skrodzka, Zastosowanie wybranych metod klasyfikacji do analizy kapitału ludzkiego krajów Unii Europejskiej Agnieszka Stanimir, Wielowymiarowa analiza czynników sprzyjających włączeniu społecznemu Dorota Strózik, Tomasz Strózik, Przestrzenne zróżnicowanie poziomu życia w województwie wielkopolskim Izabela Szamrej-Baran, Identyfikacja przyczyn ubóstwa energetycznego w Polsce przy wykorzystaniu modelowania miękkiego Janusz Tuchowski, Katarzyna Wójcik, Klasyfikacja obiektów w systemie Krajowych Ram Kwalifikacji opisanych za pomocą ontologii Aleksandra Matuszewska-Janica, Grupowanie krajów Unii Europejskiej ze względu na poziom feminizacji sektorów gospodarczych Monika Rozkrut, Dominik Rozkrut, Identyfikacja strategii innowacyjnych przedsiębiorstw usługowych w Polsce Summaries Małgorzata Rószkiewicz, The use of meta-analysis in building the measurement model in case of the absence of measurement invariance on the example of measuring of life satisfaction Elżbieta Sobczak, Harmonious smart growth of European Union regions Ewa Roszkowska, Renata Karwowska, The comparative analysis of Polish voivodeships with respect to sustainable development in Tadeusz Kufel, Magdalena Osińska, Marcin Błażejowski, Paweł Kufel, Comparative analysis of chosen filters in business cycles analysis Marcin Salamaga, The attempt of construction of the life tables for opera works on the example of the Metropolitan Opera Iwona Foryś, Using discriminant analysis to select similar markets in nonresidential property valuation process Jerzy Korzeniewski, Variable selection in classification algorithm proposal Sabina Denkowska, Multiple testing in the verification process of multifactorial Cox proportional hazards models Ewa Chodakowska, The theory of structural equations modelling in the classification of observed variables and latent constructs according to the character of their relationship Iwona Konarzewska, Modelling stock market by PCA factor model case study
6 8 Spis treści Katarzyna Wójcik. Janusz Tuchowski, Selection of the optimal set of relevant words in consumers opinions in the context of the opinion mining Aleksandra Łuczak, Application of AHP-LP to the evaluation of importance of determinants of socio-economic development in the administrative units Aleksandra Witkowska, Marek Witkowski, A dynamic approach to the ranking of cooperative banks by their financial condition Adam Depta, Application of correspondence analysis for the measurement of quality of life questionnaire SF-36v2 based research Marek Lubicz, Maciej Zięba, Konrad Pawełczyk, Adam Rzechonek, Marek Marciniak, Jerzy Kołodziej, Classification rules extraction for missing and imbalance data: models of classifiers and initial results in the rules-based thoracic surgery risk prediction Małgorzata Misztal, Selected methods for assessing the performance of classifiers an overview and examples of applications Anna M. Olszewska, The application of selected quantitative methods to the evaluation of voivodeship innovation level potential Iwona Bąk, The comparison of the quality of groupings of poviats of West Pomeranian Voivodeship in terms of tourism attractiveness Agnieszka Kozera, Joanna Stanisławska, Romana Głowicka-Wołoszyn, Household segmentation with respect to the expenditure on organized tourism Agnieszka Wałęga, Synthetic approach in the analysis of economic coherence of households Joanna Banaś, Małgorzata Machowska-Szewczyk, Bożena Mroczek, Using the correspondence analysis to examine the impact of wind turbines on the quality of life Joanna Banaś, Krzysztof Małecki, Classification of measurement survey points of drivers on the boundary of Szczecin using symbolic variables Aneta Becker, The use granular information in the analysis of the requirements of the labor market Katarzyna Cheba, Joanna Hołub-Iwan, The application of the correspondence analysis of patients segmentation on the medical service market Adam Depta, Iwona Staniec, Identification of the factors that determine the quality of students life at universities in Lodz Katarzyna Dębkowska, Jarosław Kilon, Association rules in the analysis of research results the Delphi method Anna Domagała, About using Principal Component Analysis in Data Envelopment Analysis Alicja Grześkowiak, Analysis of the digital divide in Poland at the individual and regional level
7 9 Spis treści Anna M. Olszewska, Anna Gryko-Nikitin, Assessment of perception of quality of teaching at an institution of higher learning based on the ordinal data with the utilization of R environment Karolina Paradysz, The hierarchical method of grouping poviats as a benchmark approach in the assessment of unemployment by BAEL in selected types of small areas Radosław Pietrzyk, Comparison of methods of measuring the performance of investment funds portfolios Agnieszka Przedborska, Małgorzata Misztal, Selected multivariate statistical analysis methods in the evaluation of efficacy of deep electromagnetic stimulation in patients with degenerative joint disease Wojciech Roszka, Marcin Szymkowiak, A calibration approach in statistical data integration Iwona Skrodzka, Application of some methods of classification to the analysis of human capital in the European Union Agnieszka Stanimir, Multivariate analysis of social inclusion factors Dorota Strózik, Tomasz Strózik, Spatial differentiation of the standard of living in Great Poland Voivodeship Izabela Szamrej-Baran, Identification of fuel poverty causes in Poland using soft modelling Janusz Tuchowski, Katarzyna Wójcik, Classification of objects in the National Classification Framework described by the ontology Aleksandra Matuszewska-Janica, Clustering of European Union states taking into consideration the levels of feminization of economic sectors Monika Rozkrut, Dominik Rozkrut, Identification of service sector innovation strategies in Poland
8 PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU nr 207 RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS nr Taksonomia 23 ISSN Klasyfikacja i analiza danych teoria i zastosowania Ewa Chodakowska Politechnika Białostocka TEORIA RÓWNAŃ STRUKTURALNYCH W KLASYFIKACJI ZMIENNYCH JAWNYCH I UKRYTYCH WEDŁUG CHARAKTERU ICH WZAJEMNYCH ODDZIAŁYWAŃ Streszczenie: Artykuł przedstawia próbę analizy i klasyfikacji zmiennych determinujących efektywność uczenia w wybranych szkołach gimnazjalnych w Polsce. Za pomocą SEM dokonano weryfikacji hipotetycznych relacji między zmiennymi opisującymi wyniki egzaminacyjne a wybranymi charakterystykami szkoły oraz jej uczniów. Na efektywność w badanych szkołach bezpośrednio oddziałuje tylko czynnik otoczenia reprezentowany przez wybrane charakterystyki uczniów. Czynnik szkolny reprezentujący warunki nauczania bezpośrednio nie wpływa na wyniki egzaminacyjne, ale jest skorelowany z czynnikiem otoczenia. Słowa kluczowe: SEM, CFA, klasyfikacja, efektywność nauczania. 1. Wstęp Model równań strukturalnych (SEM structural equation model) jest bardzo ogólnym modelem statystycznej analizy danych. Regresję, analizę czynnikową czy metodę ANOVA można traktować jako szczególne przypadki SEM [Garson 2012, s. 13]. SEM jest popularnym narzędziem analizy danych, szczególnie w naukach społecznych. Na świecie z powodzeniem stosowany jest w obszarze edukacji do określenia determinantów osiągnięć szkolnych [Dufur i in. 2013; Rosandera i in. 2011] czy akademickich [McKenzie i Gow 2004; Kyoung i in. 2013]. W artykule za pomocą SEM podjęto próbę analizy i klasyfikacji zmiennych determinujących efektywność uczenia w wybranych szkołach gimnazjalnych w Polsce. Na podstawie danych empirycznych pochodzących z białostockich gimnazjów za pomocą SEM zweryfikowano powstałe na bazie rozważań teoretycznych hipotetyczne relacje między zmiennymi opisującymi wyniki egzaminacyjne a wybranymi charakterystykami szkoły oraz jej uczniów.
9 86 Ewa Chodakowska 2. Modele równań strukturalnych SEM pozwala na specyfikację i test liniowej relacji między zmiennymi obserwowanymi i ukrytymi. Ogólny model SEM składa się z podmodelu strukturalnego oraz podmodelu pomiarowego [Sagan 2003b, s. 87]. Podmodel strukturalny (1) określa wzajemne relacje strukturalne między zmiennymi ukrytymi [Konarski 2009, s. 250]: η = Βη + Γξ + ζ. (1) Podmodel pomiarowy (2), (3) pozwala na konstrukcję czynników ukrytych oraz na określenie wielkości błędu pomiarowego [Konarski 2009, s. 248; Sagan 2003a, s. 84]: x = Λ x ξ + δ, (2) y = Λ y η + ε. (3) Oznaczenia: η endogeniczne czynniki ukryte (m 1), ξ egzogeniczne czynniki ukryte (n 1), ζ reszty modelu (m 1), y endogeniczne zmienne obserwowane dla η (p 1), x egzogeniczne zmienne obserwowane dla ξ (q 1), ε błąd pomiarowy w y (p 1), δ błąd pomiarowy w x (q 1), B współczynniki strukturalne η na η (m m), Γ współczynniki strukturalne ξ na η (m n), Λ y ładunki czynnikowe η w y (p m), Λ x ładunki czynnikowe ξ w x (q n). Założenia: E(ε) = E(δ) = E(ζ) = E(ξ) = E(η) = 0; (I Β) 1 istnieje; ζ nie jest skorelowane z ξ; ε nie jest skorelowane z δ, ξ, ζ, η; δ nie jest skorelowane z ξ, ζ, η, ε. Szacowanie parametrów modelu polega na takim ich dobraniu, aby teoretyczna macierz kowariancji w maksymalny sposób reprodukowała zaobserwowaną macierz kowariancji [Konarski 2009, s. 287]: Oznaczenia: = (θ). (4) macierz kowariancji obserwowanych p zmiennych endogenicznych i q zmiennych egzogenicznych [(p + q) (p + q)], (θ) macierz kowariancji jako funkcja parametrów modelu. Opracowanie modelu jest procesem iteracyjnym. Analizę za pomocą SEM rozpoczyna się od specyfikacji modelu najczęściej w formie wykresu ścieżkowego,
10 Teoria równań strukturalnych w klasyfikacji zmiennych jawnych i ukrytych 87 który jest następnie wyrażony za pomocą równań strukturalnych. W kolejnym kroku należy oszacować parametry SEM. Następnym etapem jest ocena jakości postulowanego modelu na podstawie dwóch kryteriów: relatywnie małego składnika losowego bez struktury relacyjnej oraz małych różnic między oszacowaną a zaobserwowaną macierzą kowariancji [Konarski 2009, s. 65]. Nie ma jednej uniwersalnej normy dopasowania modelu. Zaleca się oparcie oceny na więcej niż jednej mierze dopasowania [Konarski 2009, s. 373]. Ostatni etap to respecyfikacja modelu, jeżeli postulowany model jest nieadekwatny [Konarski 2009, s. 60]. 3. Analiza W artykule podjęto próbę zweryfikowania wpływu czynników szkolnych oraz środowiskowych na efektywność uczenia w danej szkole mierzoną jako przyrost wiedzy jej uczniów w stosunku do poprzedniego etapu edukacyjnego y [%]. Bezwzględne wyniki nauczania określane są przede wszystkim wynikami osiągniętymi na poprzednim etapie nauczania [Chodakowska 2009]. Gdyby przyjąć założenie, że wszystkie szkoły uczą jednakowo dobrze swoich uczniów, to czynniki społeczne i indywidualne cechy ucznia, ujęte pośrednio w jego osiągnięciach szkolnych na poprzednim etapie nauczania, precyzyjnie definiowałyby wyniki na kolejnym szczeblu edukacji. Inaczej mówiąc, zmiana poziomu wiedzy uczniów powinna być w każdej szkole prawie identyczna, a tak nie jest. W badaniu empirycznym wykorzystano wyniki uczniów wszystkich trzydziestu białostockich gimnazjów z 2005 r., pochodzące z OKE w Łomży oraz z Kuratorium Oświaty w Białymstoku. Budując model, założono a priori, że najwyższy przyrost wiedzy powinna uzyskać sprzyjająca szkoła działająca w sprzyjającym otoczeniu. Przyjęto, że sprzyjające otoczenie to uczniowie niesprawiający zasadniczych problemów wychowawczych, nieopuszczający bezzasadnie zajęć, chętnie uczestniczący w różnorodnych zajęciach pozalekcyjnych, pochodzący z rodzin, których stać na współfinansowanie dodatkowych zajęć. Sprzyjająca szkoła to szkoła z indywidualnym podejściem do ucznia, kameralna, z nielicznymi oddziałami, świetnie wyposażona, organizująca dla swoich uczniów wiele zajęć pozalekcyjnych. W tym celu skonstruowano dwie zmienne ukryte: otoczenie (ξ 1 ) i szkołę (ξ 2 ), które reprezentowane były przez 8 obserwowanych standaryzowanych zmiennych egzogenicznych: x 1 liczba uczniów korzystających z posiłków refundowanych na liczbę uczniów ogółem, x 2 liczba uczniów powtarzających klasę na liczbę uczniów ogółem, x 3 liczba uczniów, którzy opuścili więcej niż 30% zajęć nieusprawiedliwionych, na liczbę uczniów ogółem, x 4 liczba uczniów w szkole, x 5 średnia liczba uczniów w oddziale, x 6 liczba komputerów do użytku uczniów na liczbę uczniów ogółem,
11 88 Ewa Chodakowska x 7 liczba woluminów w bibliotece na liczbę uczniów ogółem, x 8 liczba uczniów placówki uczestniczących w zajęciach pozalekcyjnych na liczbę uczniów ogółem. Klasyczny model SEM zakłada łączną normalność rozkładu zmiennych obserwowanych. W celu spełnienia tego postulatu do analizowanych danych wykorzystano transformacje potęgowe Boxa-Coxa. Do celów określenia wpływu czynników środowiskowych i szkolnych zaproponowano model SEM ze zmiennymi ukrytymi przedstawiony na rysunku 1. W podmodelu strukturalnym występuje jedna zmienna obserwowana przyrost wiedzy (y) i dwie nieobserwowane: otoczenie (ξ 1 ) i szkoła (ξ 2 ). Część pomiarową modelu reprezentuje model konfirmacyjnej analizy czynnikowej (CFA) dla ośmiu wskaźników zwrotnych (x 1, x 2,..., x 8 ) dla czynników ukrytych. Ponieważ zmienne ukryte nie wyjaśniają całej zmienności swoich wskaźników cząstkowych przy każ- Rys. 1. Model SEM Źródło: opracowanie własne. Tabela 1. Oszacowania wybranego modelu SEM Ścieżka Współczynniki standaryzowane Współczynniki niestandaryzowane SE CR P Zmienne Procent wyjaśnianej wariancji x 1 ξ 1,829 5,308 1,362 3,896 <0,001 x 1,687 x 2 ξ 1,822 1,000 x 2,675 x 3 ξ 1,593,938,309 3,040,002 x 3,351 x 8 ξ 1 -,307 -,448,274-1,631,103 x 4 ξ 2 -,812-7,031 1,081-6,506 <0,001 x 4,659 x 5 ξ 2 -,854-25,416 3,464-7,337 <0,001 x 5,730 x 6 ξ 2,973 1,000 x 6,948 x 7 ξ 2,714 2,760,547 5,041 <0,001 x 7,510 x 8 ξ 2,343,676,338 2,002,045 x 8,212 y ξ 1 -,463-2,770 1,132-2,447,014 y ξ 2,289 2,340 1,328 1,763,078 y,298 Źródło: opracowanie własne za pomocą programu AMOS SPSS, estymator ML.
12 Teoria równań strukturalnych w klasyfikacji zmiennych jawnych i ukrytych 89 dym z nich dodano odrębny składnik losowy δ. Czynnik otoczenia opisują: x 1, x 2, x 3, x 8, czynnik szkolny reprezentują: x 4, x 5, x 6, x 7, oraz ponownie x 8 jako zmienna, której wartość zależy zarówno od zaangażowania szkoły, jak i uczniów. Warto podkreślić, że duże wartości zmiennych: x 1, x 2, x 3 oraz x 4, x 5 wskazują na niesprzyjające warunki działania. W tabeli 1 zamieszczono oszacowania parametrów wybranego modelu SEM otrzymane metodą największej wiarygodności. Wartości bezwzględne standaryzowanych szacunków parametrów przekraczają 0,7 dla zmiennych x 1, x 2, x 4, x 5, x 6, x 7, dla zmiennej x 3 przekraczają 0,5, jedynie dla x 8 są mniejsze. Procent wyjaśnianej wariancji dla x 3 i x 8 nie przekracza pożądanej wartości 0,5. Prawdopodobieństwo testowe większe od 0,05 współczynnika ścieżkowego x 8 ξ 1 wskazuje na brak podstaw do odrzucenia hipotezy zerowej o nieistotności tego parametru. Zaskakująco nieistotny okazał się też wpływ zmiennej ukrytej ξ 2 (szkoły) na przyrost wiedzy jej uczniów. Można spróbować zupełnie odrzucić tę zależność jednak biorąc pod uwagę teorię, byłoby to co najmniej dyskusyjnie. Sformułowany model opisujący przyrost wiedzy uczniów szkoły jako funkcję czynników otoczenia i szkolnych nie znalazł potwierdzenia w empirycznych danych. Bazując na wskazaniach indeksów modyfikacji, dokonano zmian w pierwotnym modelu. Wprowadzono zależność kowariancyjną pomiędzy konstruktami ukrytymi, a także zależność regresyjną pomiędzy zmiennymi x 3 i x 8. Zmodyfikowany model przedstawiono na rysunku 2. Rys. 2. Model SEM zmodyfikowany Źródło: opracowanie własne. Oszacowania zmodyfikowanego modelu SEM zamieszczono w tabeli 2. W modelu tym wszystkie współczynniki ścieżkowe są statystycznie istotne. Warto podkreślić, że dla danego procesu można określić bardzo wiele alternatywnych modeli teoretycznych z różnymi wzorcami relacji. Co więcej, dla prawie każdego procesu można zdefiniować modele ekwiwalentne, które generują takie same wartości statystyk ogólnego dopasowania, ale reprezentują substantywnie inne teorie [Konarski 2009, s. 405]. Teoria badanego procesu musi rozstrzygać,
13 90 Ewa Chodakowska Tabela 2. Oszacowania zmodyfikowanego wybranego modelu SEM Ścieżka Współczynniki standaryzowane Współczynniki niestandaryzowane SE CR P Zmienne Procent wyjaśnianej wariancji x 1 ξ 1,796 4,852 1,082 4,486 <0,001 x 1,634 x 2 ξ 1,864 1,000 x 2,747 x 3 ξ 1,334,498,239 2,083,037 x 3,502 x 3 x 8 -,520 -,530,146-3,621 <0,001 x 4 ξ 2 -,818-7,139 1,075-6,644 <0,001 x 4,669 x 5 ξ 2 -,861-25,815 3,424-7,539 <0,001 x 5,741 x 6 ξ 2,966 1,000 x 6,933 x 7 ξ 2,714 2,779,552 5,034 <0,001 x 7,509 x 8 ξ 2,499 1,046,352 2,970,003 x 8,249 y ξ 1 -,629-3,832 1,109-3,454 <0,001 y,396 Źródło: opracowanie własne za pomocą programu AMOS SPSS, estymator ML. który z alternatywnych modeli jest najbardziej spójny [Konarski 2009, s. 17]. Model doskonale dopasowany, ale niepasujący do teorii, jest właściwie gorszy niż model dopasowany na granicy akceptowalności, ale zgodny z teorią [Bedyńska, Książek 2012, s. 182]. Uwzględniając powyższe, postanowiono przeprowadzić formalną ocenę jakości oryginalnego modelu i zmodyfikowanego. Test dopasowania modelu opiera się na wartości funkcji rozbieżności (FMIN) pomiędzy obserwowaną, a wynikającą z modelu macierzą kowariancji. Na bazie funkcji rozbieżności opracowano liczne mierniki dopasowania [Konarski 2009, s. 328]. Statystyka testowa ogólnego dopasowania modelu (CMIN) ma asymptotycznie rozkład χ 2. Jeżeli jej wartość przekracza wartość krytyczną hipotezę H 0, mówiącą, że model jest doskonale dopasowany do danych można odrzucić. Wartość CMIN zależy od wielkości próby (gdy próba jest zbyt mała, a taka jest analizowana w przykładzie, statystyka może niesłusznie nie dawać podstaw do odrzucenia H 0 ) [Garson 2012, s ]. Prostą korektą złożoności jest podzielenie wartości CMIN przez liczbę stopni swobody DF i odrzucenie modelu, gdy stosunek ten przekracza 2 lub mniej restrykcyjnie nawet 10 [Bedyńska, Książek 2012, s. 184]. Wartość FMIN oraz statystyki CMIN modelu pierwotnego (model 1) oraz zmodyfikowanego (model 2) zamieszono w tabeli 3. Warto podkreślić, że w obu modelach każda z tych miar jest bliższa mierze modelu nasyconego niż modelu niezależności. W tabeli 4 przedstawiono wybrane miary bezwzględnego oraz relatywnego dopasowania. Miary bezwzględnego dopasowania modelu informują, o ile testowany model jest lepszy od modelu niezależności. GFI (goodness of fit index) i skorygowany AGFI (adjusted goodness of fit index) inspirowane są analogią do współ-
14 Teoria równań strukturalnych w klasyfikacji zmiennych jawnych i ukrytych 91 Tabela 3. Statystyki testowe ogólnego dopasowania modeli SEM Model FMIN CMIN DF P CMIN/DF Model 1 1,394 40,42 25,026 1,62 Model 2,637 18,46 25,822,74 Nasycony,000,00 0 Niezależności 5, ,48 36,000 4,79 Źródło: opracowanie własne za pomocą programu AMOS SPSS. czynnika determinacji R 2 i mierzą proporcję wariancji w empirycznej macierzy kowariancji, która została wyjaśniona przez model. Wartości indeksów powinny znajdować się pomiędzy 0 a 1. Bliskie 0 oznaczają kompletny brak dopasowania, bliskie 1 wskazują na bardzo dobre dopasowanie. Wartość co najmniej 0,9 jest dolną granicą akceptacji modelu [Konarski 2009, s. 346]. Zaproponowany model 1 wyjaśnia tylko 79% zmienności macierzy kowariancji, model 2 nieco ponad 88%. Natomiast wartość AGFI nie przekracza nawet 0,7 (model 1) lub 0,8 (model 2). Miary relatywnego dopasowania wskazują z kolei na adekwatność modelu w odniesieniu do modelu niezależności. NFI (normed fit index), RFI (relative fit index), IFI (incremental fit index), CFI (comparative fit index) także przeważnie przyjmują wartości z przedziału <0, 1>. Przyjmuje się, że minimalną wartość NFI, RFI, IFI i CFI uprawniającą do akceptacji modelu jest 0,9 [Bedyńska, Książek 2012, s. 187]. Tylko w wypadku modelu 2 miary te są akceptowalne lub bliskie progu akceptowalności. Tabela 4. Miary bezwzględnego i relatywnego dopasowania Model Miary bezwzględnego dopasowania Miary relatywnego dopasowania Model GFI AGFI NFI RFI IFI CFI Model 1,790,622,766,663,895,887 Model 2,886,795,893,846 1,044 1,000 Nasycony 1,000 1,000 1,000 1,000 Niezależności,329,161,000,000,000,000 Źródło: opracowanie własne za pomocą programu AMOS SPSS. Podsumowując, wśród analizowanych mierników prawie wszystkie nakazują model 1 odrzucić. Model 2 jest do zaakceptowania, ale nie można powiedzieć, że jest idealny. W jego przypadku większość miar, dla których są przyjęte normy interpretacji, jeżeli nie sięga 0,9, to przynajmniej przekracza 0,8. Pierwotnie wyodrębnione determinanty przyrostu wiedzy: szkoła i otoczenie okazały się powiązane między sobą. Współczynnik korelacji pomiędzy szkołą (ξ 2 ) a otoczeniem (ξ 1 ) wynosi 0,691. W modelu 2 na osiągnięty przez szkołę przyrost wiedzy bezpośredni wpływ ma tylko otocznie. Wyższa ocena niesprzyjającego otoczenia o 1 odchyle-
15 92 Ewa Chodakowska nie standardowe przekłada się na spadek przyrostu wiedzy o 0,629 odchylenia standardowego. Wszystkie analizowane zmienne wyjaśnią ponad 39% zmienności przyrostu wiedzy uczniów. 4. Podsumowanie SEM jest bardzo uniwersalnym narzędziem analizy i testowania hipotetycznych zależności liniowych pomiędzy zmiennymi obserwowanymi i/lub ukrytymi [Bedyńska, Książek 2012, s. 198]. Komputerowe pakiety statystyczne, pozwalające na wygodne rysowanie wykresów ścieżkowych, sprawiają wrażenie, że SEM jest techniką niewymagającą ani refleksji, ani wiedzy statystycznej. Stosowanie SEM zmusza jednak do określenia, chociażby w minimalnym stopniu, mechanizmu przyczynowego, który leży u podłoża zaobserwowanych korelacji między zmiennymi obserwowanymi [Konarski 2009, s. 15]. Wymaga też dużych prób danych, a większość metod estymacji parametrów wielowymiarowego rozkładu normalnego. W artykule przedstawiono wyniki testowania dopuszczalności hipotezy o przyczynowym związku między przyrostem wiedzy a wybranymi wskaźnikami otoczenia szkoły i samej szkoły. Pierwotny prosty model zależności, klasyfikujący obserwowane wskaźniki, nie przeszedł formalnej oceny jakości. Dużo lepiej wykonuje swoje zadanie model zmodyfikowany na podstawie indeksów modyfikacji. W zaakceptowanym modelu na przyrost wiedzy ma wpływ tylko czynnik otoczenia mierzony wskaźnikiem liczby uczniów korzystających z posiłków refundowanych (x 1 ), wskaźnikiem liczby uczniów powtarzających klasę (x 2 ) oraz wskaźnikiem liczby uczniów, którzy opuścili więcej niż 30% zajęć bez usprawiedliwienia (x 3 ). Czynnik szkolny reprezentowany przez: liczbę uczniów w szkole (x 4 ), średnią liczba uczniów w oddziale(x 5 ), liczbę komputerów do użytku uczniów na liczbę uczniów ogółem (x 6 ), liczbę woluminów w bibliotece na liczbę uczniów ogółem (x 7 ) oraz liczbę uczniów placówki uczestniczących w zajęciach pozalekcyjnych na liczbę uczniów ogółem (x 8 ) jest skorelowany z czynnikiem otoczenia. Dodatkowo istnieje ujemna zależność między absencją (x 3 ) a udziałem w zajęciach pozalekcyjnych (x 8 ). Autorka ma świadomość niepełności wykonanej analizy i związanych z tym problemów z generalizacją otrzymanych wyników. Przede wszystkim ocena została przeprowadzona na podstawie nielicznego, zagregowanego dla szkół zbioru danych. Ze względu na fakt, że jak wykazano efektywność nauczania determinuje przede wszystkim otoczenie, dużo właściwsza byłaby analiza i uwzględnienie w modelu SEM informacji o statusie materialnym czy ewentualnych problemach poszczególnych uczniów. Jednak dane takie, klasyfikowane jako wrażliwe, są niełatwe do pozyskania, a ich wykorzystanie limitowane prawnie.
16 Teoria równań strukturalnych w klasyfikacji zmiennych jawnych i ukrytych 93 Literatura Bedyńska S., Książek M. (2012), Statystyczny drogowskaz 3. Praktyczny przewodnik wykorzystania modeli regresji raz równań strukturalnych, Wydawnictwo Akademickie Sedno, Warszawa. Chodakowska E. (2009), Przykłady zastosowań metody Data Envelopment Analysis w badaniu efektywności podmiotów sektora edukacji, Problemy Zarządzania, vol. 7, nr 4, s Dufur M.J., Parcel T.L., Troutman K.P. (2013), Does capital at home matter more than capital at school? Social capital effects on academic achievement, Research in Social Stratification and Mobility, vol. 31, s Garson D. (2012), Structural Equation Modeling, Statistical Associates Publishers, Asheboro, NC. Konarski R. (2009), Modele równań strukturalnych. Teoria i praktyka, Wydawnictwo Naukowe PWN, Warszawa. Kyoung Ro H., Terenzini P.T., Yin A.C. (2013), Between-College Effects on Students Reconsidered, Research in Higher Education, vol. 54, no. 3, s McKenzie K., Gow K. (2004), Exploring the first year academic achievement of school leavers and mature-age students through structural equation modeling, Learning and Individual Differences, vol. 14, no. 2, s Rosandera P., Bäckströma M., Stenbergb G. (2011), Personality traits and general intelligence as predictors of academic performance: A structural equation modelling approach, Learning and Individual Differences, vol. 21, no. 5, s Sagan A. (2003a), Model pomiarowy satysfakcji i lojalności, [w:] Analiza satysfakcji i lojalności klientów, StatSoft Polska, Warszawa-Kraków, s Sagan A. (2003b), Model strukturalny relacji między satysfakcją i lojalnością wobec marki, [w:] Analiza satysfakcji i lojalności klientów, StatSoft Polska, Warszawa-Kraków, s THE THEORY OF STRUCTURAL EQUATIONS MODELLING IN THE CLASSIFICATION OF OBSERVED VARIABLES AND LATENT CONSTRUCTS ACCORDING TO THE CHARACTER OF THEIR RELATIONSHIP Summary: This paper presents an attempt of analysis and classification of variables that determine the effectiveness of teaching in selected secondary schools in Poland. Using SEM hypothetical relationships between variables describing the exam results and selected features of schools and its students were verified. The effectiveness of the schools in the survey was affected directly only by the environmental factor represented by selected characteristics of students. The school's factor represented by teaching conditions had no direct impact on the schools effectiveness, but was correlated with the environmental factor. Keywords: SEM, CFA, classification, effectiveness of education.
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 328 Taksonomia 23 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 328 Taksonomia 23 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 328 Taksonomia 23 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 328 Taksonomia 23 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 328 Taksonomia 23 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 328 Taksonomia 23 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 328 Taksonomia 23 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 328 Taksonomia 23 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 328 Taksonomia 23 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 328 Taksonomia 23 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 328 Taksonomia 23 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
Recenzenci Stefan Mynarski, Waldemar Tarczyński. Redaktor Wydawnictwa Anna Grzybowska. Redaktor techniczny Barbara Łopusiewicz. Korektor Barbara Cibis
Komitet Redakcyjny Andrzej Matysiak (przewodniczący), Tadeusz Borys, Andrzej Gospodarowicz, Jan Lichtarski, Adam Nowicki, Walenty Ostasiewicz, Zdzisław Pisz, Teresa Znamierowska Recenzenci Stefan Mynarski,
MODEL STRUKTURALNY RELACJI MIĘDZY SATYSFAKCJĄ
MODEL STRUKTURALNY RELACJI MIĘDZY SATYSFAKCJĄ I LOJALNOŚCIĄ WOBEC MARKI Adam Sagan Akademia Ekonomiczna w Krakowie, Katedra Analizy Rynku i Badań Marketingowych Wstęp Modelowanie strukturalne ma wielorakie
strona 1 / 11 Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje:
Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje: 1. Autorzy rozdziału: Borys Tadeusz; Strahl Danuta; Walesiak Marek Tytuł rozdziału: Wkład ośrodka wrocławskiego w rozwój teorii
strona 1 / 12 Autor: Walesiak Marek Publikacje:
Autor: Walesiak Marek Publikacje: 1. Autorzy rozdziału: Borys Tadeusz; Strahl Danuta; Walesiak Marek Tytuł rozdziału: Wkład ośrodka wrocławskiego w rozwój teorii i zastosowań metod taksonomicznych, s.
Taksonomia 23.Oas\ğkaFMa i anaoi]a Gan\FK ļ WHoUia i ]aswosozania
Taksonomia 23 as ka a i ana i a an o ia i as oso ania RADA NAUKOWA Daniel Baier (Brandenburgische Technische Universität Cottbus, Niemcy) An r e B k a or a a Teresa Domi er a or a a a le a Dan a Kis erska
Ekonometria. Zastosowania Metod Ilościowych 30/2011
Wroclaw Univesity of Economics From the SelectedWorks of Józef Z. Dziechciarz 2011 Ekonometria. Zastosowania Metod Ilościowych 30/2011 Jozef Z. Dziechciarz, Wroclaw Univesity of Economics Available at:
BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI
14 BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI 14.1 WSTĘP Ogólne wymagania prawne dotyczące przy pracy określają m.in. przepisy
Ekonometria. Zajęcia
Ekonometria Zajęcia 16.05.2018 Wstęp hipoteza itp. Model gęstości zaludnienia ( model gradientu gęstości ) zakłada, że gęstość zaludnienia zależy od odległości od okręgu centralnego: y t = Ae βx t (1)
MODELE LINIOWE. Dr Wioleta Drobik
MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
IMPLEMENTATION AND APLICATION ASPECTS OF SUSTAINABLE DEVELOPMENT. Scientific monograph edited by Edyta Sidorczuk Pietraszko
IMPLEMENTATION AND APLICATION ASPECTS OF SUSTAINABLE DEVELOPMENT Scientific monograph edited by Edyta Sidorczuk Pietraszko SPIS TREŚCI WSTĘP Edyta Sidorczuk Pietraszko... 9 Rozdział 1. Metody pomiaru zrównoważonego
Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski
Narzędzia statystyczne i ekonometryczne Wykład 1 dr Paweł Baranowski Informacje organizacyjne Wydział Ek-Soc, pok. B-109 pawel@baranowski.edu.pl Strona: baranowski.edu.pl (w tym materiały) Konsultacje:
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Ekonometria. Zastosowania metod ilościowych 18/2007
Wroclaw Univesity of Economics From the SelectedWorks of Józef Z. Dziechciarz 2007 Ekonometria. Zastosowania metod ilościowych 18/2007 Jozef Z. Dziechciarz, Wroclaw Univesity of Economics Available at:
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
MODEL POMIAROWY SATYSFAKCJI I LOJALNOŚCI
MODEL POMIAROWY SATYSFAKCJI I LOJALNOŚCI Adam Sagan Akademia Ekonomiczna w Krakowie, Katedra Analizy Rynku i Badań Marketingowych Wstęp Zaletą stosowania konfirmacyjnej analizy czynnikowej (CFA) w porównaniu
Próba wykorzystania podejścia wielomodelowego w klasyfikacji jednostek samorządowych
Jacek Batóg Uniwersytet Szczeciński Próba wykorzystania podejścia wielomodelowego w klasyfikacji jednostek samorządowych Agregacja wyników uzyskiwanych w odrębnych badaniach, często również przy pomocy
TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.
TEST STATYSTYCZNY Testem statystycznym nazywamy regułę postępowania rozstrzygająca, przy jakich wynikach z próby hipotezę sprawdzaną H 0 należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia.
Metody Ilościowe w Socjologii
Metody Ilościowe w Socjologii wykład 2 i 3 EKONOMETRIA dr inż. Maciej Wolny AGENDA I. Ekonometria podstawowe definicje II. Etapy budowy modelu ekonometrycznego III. Wybrane metody doboru zmiennych do modelu
Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.
Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ
WYKORZYSTANIE ANALIZY WIELOGRUPOWEJ DO PORÓWNANIA RYNKU PRACY W REGIONACH
PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS nr 33 0 Problemy rozwoju regionalnego i lokalnego ISSN 899-39 Małgorzata Sej-Kolasa Mirosława Sztemberg-Lewandowska
WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno
WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA
Opis zakładanych efektów kształcenia na studiach podyplomowych Nazwa studiów: BIOSTATYSTYKA PRAKTYCZNE ASPEKTY STATYSTYKI W BADANIACH MEDYCZNYCH Typ studiów: doskonalące Symbol Efekty kształcenia dla studiów
Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.
tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1
ŚLĄSKI PRZEGLĄD STATYSTYCZNY
Polskie Towarzystwo Statystyczne Oddział we Wrocławiu ŚLĄSKI Silesian Statistical Review Nr 8 (14) Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu Wrocław 2o10 RADA PROGRAMOWA Walenty Ostasiewicz (przewodniczący),
Elementy statystyki wielowymiarowej
Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Elementy statystyki wielowymiarowej 1.1 Kowariancja i współczynnik korelacji 1.2 Macierz kowariancji 1.3 Dwumianowy rozkład normalny 1.4 Analiza składowych
Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym
Wiesława MALSKA Politechnika Rzeszowska, Polska Anna KOZIOROWSKA Uniwersytet Rzeszowski, Polska Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym Wstęp Wnioskowanie statystyczne
Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;
LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny
Jak sprawdzić normalność rozkładu w teście dla prób zależnych?
Jak sprawdzić normalność rozkładu w teście dla prób zależnych? W pliku zalezne_10.sta znajdują się dwie zmienne: czasu biegu przed rozpoczęciem cyklu treningowego (zmienna 1) oraz czasu biegu po zakończeniu
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Redakcja i korekta Bogdan Baran Projekt graficzny okładki Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2011 ISBN
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 328 Taksonomia 23 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji
Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Stanisław Cichocki. Natalia Nehrebecka. Wykład 9
Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności
Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2017/2018
Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2017/2018 Nr indeksu... Imię i Nazwisko... Nr grupy ćwiczeniowej... Imię i Nazwisko prowadzącego... 1. Specyfikacja modelu
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Spis treści. Wstęp... 9
Spis treści Wstęp.............................................................. 9 Małgorzata Rószkiewicz, Wizualizacja danych nominalnych oraz różnego typu danych porządkowych w procedurze skalowania optymalnego...
Maciej Zastempowski. Uwarunkowania budowy potencja u innowacyjnego polskich ma ych i rednich przedsi biorstw
Maciej Zastempowski Uwarunkowania budowy potencja u innowacyjnego polskich ma ych i rednich przedsi biorstw Wstęp... 13 Rozdział 1. Sektor małych i średnich przedsiębiorstw... 21 1.1. Kontrowersje wokół
Spis treści 3 SPIS TREŚCI
Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe
Testowanie hipotez statystycznych
9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :
Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2014/2015
Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2014/2015 Nr indeksu... Imię i Nazwisko... Nr grupy ćwiczeniowej... Imię i Nazwisko prowadzącego... 1. Specyfikacja modelu
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Instrumenty i efekty wsparcia Unii Europejskiej dla regionalnego rozwoju obszarów wiejskich w Polsce
Katarzyna Zawalińska Instrumenty i efekty wsparcia Unii Europejskiej dla regionalnego rozwoju obszarów wiejskich w Polsce Instytut Rozwoju Wsi i Rolnictwa Polskiej Akademii Nauk Warszawa 2009 SPIS TREŚCI
Zadania ze statystyki cz.8. Zadanie 1.
Zadania ze statystyki cz.8. Zadanie 1. Wykonano pewien eksperyment skuteczności działania pewnej reklamy na zmianę postawy. Wylosowano 10 osobową próbę studentów, których poproszono o ocenę pewnego produktu,
Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa
Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie
Testowanie hipotez statystycznych. Wnioskowanie statystyczne
Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy
Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.
Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w
Wprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0
Nazwa przedmiotu: Kierunek: Matematyka - Statystyka matematyczna Mathematical statistics Inżynieria materiałowa Materials Engineering Rodzaj przedmiotu: Poziom studiów: forma studiów: obowiązkowy studia
Kolokwium ze statystyki matematycznej
Kolokwium ze statystyki matematycznej 28.05.2011 Zadanie 1 Niech X będzie zmienną losową z rozkładu o gęstości dla, gdzie 0 jest nieznanym parametrem. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę
WYKAZ PRAC PUBLIKOWANYCH
Dr hab. Andrzej Bąk Prof. nadzw. AE WYKAZ PRAC PUBLIKOWANYCH I. Publikacje zwarte I.1. KsiąŜki 1. Walesiak M., Bąk A. [1997], Realizacja badań marketingowych metodą conjoint analysis z wykorzystaniem pakietu
Rozdział 8. Regresja. Definiowanie modelu
Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność
STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów
STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów
weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)
PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
ANALIZA REGRESJI WIELOKROTNEJ. Zastosowanie statystyki w bioinżynierii Ćwiczenia 8
ANALIZA REGRESJI WIELOKROTNEJ Zastosowanie statystyki w bioinżynierii Ćwiczenia 8 ZADANIE 1A 1. Irysy: Sprawdź zależność długości płatków korony od ich szerokości Utwórz wykres punktowy Wyznacz współczynnik
2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona
Sprawdzanie założeń przyjętych o modelu (etap IIIC przyjętego schematu modelowania regresyjnego) 1. Szum 2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Redakcja i korekta Bogdan Baran Projekt graficzny okładki Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2011 ISBN
Analiza wybranych aspektów wyników egzaminu gimnazjalnego
Wroclaw Univesity of Economics From the SelectedWorks of Józef Z. Dziechciarz 2012 Analiza wybranych aspektów wyników egzaminu gimnazjalnego Jozef Z. Dziechciarz, Wroclaw Univesity of Economics Agnieszka
UNIA EUROPEJSKA PERSPEKTYWY SPOŁECZNO-EKONOMICZNE ROCZNIK NAUKOWY 2/2010
UNIA EUROPEJSKA PERSPEKTYWY SPOŁECZNO-EKONOMICZNE ROCZNIK NAUKOWY 2/2010 PRZYGOTOWANY PRZY WSPÓŁPRACY PUNKTU INFORMACYJNEGO KOMISJI EUROPEJSKIEJ EUROPE DIRECT INOWROCŁAW ORAZ WYDZIAŁU EKONOMICZNO-SPOŁECZNEGO
ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza
3. Modele tendencji czasowej w prognozowaniu
II Modele tendencji czasowej w prognozowaniu 1 Składniki szeregu czasowego W teorii szeregów czasowych wyróżnia się zwykle następujące składowe szeregu czasowego: a) składowa systematyczna; b) składowa
Przykład 1. (A. Łomnicki)
Plan wykładu: 1. Wariancje wewnątrz grup i między grupami do czego prowadzi ich ocena 2. Rozkład F 3. Analiza wariancji jako metoda badań założenia, etapy postępowania 4. Dwie klasyfikacje a dwa modele
FORECASTING THE DISTRIBUTION OF AMOUNT OF UNEMPLOYED BY THE REGIONS
FOLIA UNIVERSITATIS AGRICULTURAE STETINENSIS Folia Univ. Agric. Stetin. 007, Oeconomica 54 (47), 73 80 Mateusz GOC PROGNOZOWANIE ROZKŁADÓW LICZBY BEZROBOTNYCH WEDŁUG MIAST I POWIATÓW FORECASTING THE DISTRIBUTION
Własności statystyczne regresji liniowej. Wykład 4
Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności
parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,
诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów
LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej
LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;
POLITECHNIKA WARSZAWSKA. Wydział Zarządzania ROZPRAWA DOKTORSKA. mgr Marcin Chrząścik
POLITECHNIKA WARSZAWSKA Wydział Zarządzania ROZPRAWA DOKTORSKA mgr Marcin Chrząścik Model strategii promocji w zarządzaniu wizerunkiem regionu Warmii i Mazur Promotor dr hab. Jarosław S. Kardas, prof.
WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno
WERYFIKACJA MODELI MODELE LINIOWE Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno ANALIZA KORELACJI LINIOWEJ to NIE JEST badanie związku przyczynowo-skutkowego, Badanie współwystępowania cech (czy istnieje
Testowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
Wyniki analizy statystycznej opartej na metodzie modelowania miękkiego
Wyniki analizy statystycznej opartej na metodzie modelowania miękkiego Dorota Perło Uniwersytet w Białymstoku Wydział Ekonomii i Zarządzania Plan prezentacji. Założenia metodologiczne 2. Specyfikacja modelu
Podręcznik akademicki dofinansowany przez Ministra Nauki i Szkolnictwa Wyższego
Recenzenci: dr hab. Ryszard Cichocki, prof. UAM dr hab. Jarosław Górniak, prof. UJ Redaktor prowadzący: Agnieszka Szopińska Redakcja i korekta: Anna Kaniewska Projekt okładki: Katarzyna Juras Copyright
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
WYBRANE METODY ANALIZY DANYCH WZDŁUŻNYCH
PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU nr 207 RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS nr 327 2014 Taksonomia 22 ISSN 1899-3192 Klasyfikacja i analiza danych teoria i zastosowania
TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.
TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe
Zmienne zależne i niezależne
Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA Powtórka Powtórki Kowiariancja cov xy lub c xy - kierunek zależności Współczynnik korelacji liniowej Pearsona r siła liniowej zależności Istotność
Testowanie hipotez statystycznych
Testowanie hipotez statystycznych Wyk lad 8 Natalia Nehrebecka Stanis law Cichocki 29 listopada 2015 Plan zajeć 1 Rozk lad estymatora b Rozk lad sumy kwadratów reszt 2 Hipotezy proste - test t Badanie
EKONOMETRIA ECONOMETRICS 2(36) 2012
EKONOMETRIA ECONOMETRICS 2(36) 2012 Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu Wrocław 2012 Redaktor Wydawnictwa: Dorota Pitulec Redaktor techniczny: Barbara Łopusiewicz Korektor: Barbara Cibis
Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku
Przykład 2 Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Sondaż sieciowy analiza wyników badania sondażowego dotyczącego motywacji w drodze do sukcesu Cel badania: uzyskanie
PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści
Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, 2018 Spis treści Przedmowa 13 O Autorach 15 Przedmowa od Tłumacza 17 1. Wprowadzenie i statystyka opisowa 19 1.1.
Część 1. Podstawy kształtowania przewagi konkurencyjnej i konkurencyjności małych i średnich przedsiębiorstw... 13
Wstęp (Anna Adamik)... 11 Część 1. Podstawy kształtowania przewagi konkurencyjnej i konkurencyjności małych i średnich przedsiębiorstw... 13 Rozdział 1. Konkurencyjność i przewaga konkurencyjna MSP w teorii
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Redakcja i korekta Bogdan Baran Projekt graficzny okładki Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2011 ISBN
PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE
UNIWERSYTET WARMIŃSKO-MAZURSKI W OLSZTYNIE PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE http://matman.uwm.edu.pl/psi e-mail: psi@matman.uwm.edu.pl ul. Słoneczna 54 10-561