Analiza statystyczna rozkładów cech determinujących rozwój sektora kreatywnego w powiatach. Polska (na podstawie danych )

Wielkość: px
Rozpocząć pokaz od strony:

Download "Analiza statystyczna rozkładów cech determinujących rozwój sektora kreatywnego w powiatach. Polska (na podstawie danych 2009-2012)"

Transkrypt

1 Analiza statystyczna rozkładów cech determinujących rozwój sektora kreatywnego w powiatach. Polska (na podstawie danych ) Część I. Opis bazy danych. Podstawą analizy zmian były dane statystyczne pozyskane z GUS; baza REGON; stan na 31.12; lata Dane statystyczne wykorzystano do : 1.analizy struktury rozkładów (ocena zróżnicowania w układzie powiatowym) w dwóch populacjach jednostek obserwacji. Podział jednostek obserwacji został podyktowany niejednorodnością populacji wejściowej, powiaty ze względu na liczbę zarejestrowanych podmiotów sektora kreatywnego wykazywały bardzo silną niejednorodność wynikającą ze zróżnicowania wywołanego specyfiką ujęcia powiatowego zbioru danych. Determinanty warunkujące rozwój sektora kreatywnego np. dla powiatu augustowskiego są całkowicie odmienne niż dla powiatu miasta Kraków; 2.budowa modeli regresji liniowej w celu wyodrębnienia tych zmiennych, które w sposób statystycznie istotny wpływały na zmiany w sektorze kreatywnym (próba odpowiedzi na pytanie jakie cechy ekonomiczno-społeczne charakteryzujące powiat oraz z jaką siłą mogły wpływać na decyzje o podjęciu działalności gospodarczej w tym sektorze). Wybór zmiennych opierał się na merytorycznej analizie przypuszczalnej zależności logiczno-merytorycznej oraz posiadanych w Bazie Lokalnej GUS informacji statystycznych. W analizie uwzględniono następujące zmienne (zbiór potencjalnych cech): Zmienna zależna: liczba podmiotów sektora kreatywnego zarejestrowana w bazie REGON w powiatach Polski; stan na dzień w kolejnych latach , przy czym dane empiryczne dla zmiennej 11 dotyczyły tylko lat Zmienne niezależne: Zmienna 1.Dochody ogółem budżetu powiatu na 1 mieszkańca w zł Zmienna 2.Wydatki ogółem budżetu powiatu na 1 mieszkańca w zł Zmienna 3.Wydatki na oświatę i wychowanie budżetu powiatu na 1 mieszkańca w zł Zmienna 4.Wydatki na kulturę i ochronę dziedzictwa narodowego budżetu powiatu na 1 mieszkańca w zł 1

2 Zmienna 5.Ludność w powiecie; ogółem Zmienna 6. Ludność w powiecie w grupie wiekowej 15 19; ogółem Zmienna 7.Ludność w powiecie w grupie wiekowej 20 24; ogółem Zmienna 8.Ludność w powiecie w grupie wiekowej 25 29; ogółem Zmienne 9. Udział ludności wg ekonomicznych grup wieku w % ludności; ogółem ( dotyczy ludności w wieku produkcyjnym ) Zmienna 10. Bezrobocie zarejestrowane; ogółem Zmienna 11. Całkowita wartość projektów w ramach Narodowych Strategicznych Ram Odniesienia według programów operacyjnych i źródeł finansowania w zł/mieszkańca. Baza danych prezentowała rozkłady wymienionych zmiennych we wszystkich powiatach w Polsce: N=380 powiatów. Wycinek wybranej bazy danych, dla przykładowo 2009 i 2011 roku ilustrują tabele 1 oraz 2. Tabela 1. Wycinek arkusza danych,rok 2009 (część końcowa, powiaty o maksymalnej liczbie podmiotów) Tabela 2. Wycinek arkusza danych, rok 2011 (wykaz powiatów alfabetycznie) Wstępna analiza danych pozwoliła stwierdzić, że warianty zmiennej zależnej (liczba podmiotów sektora kreatywnego) w kolejnych latach nie wykazywały znaczących zmian w 2

3 kontekście wzrostu lub spadku. Można było zauważyć, iż liczba podmiotów sektora kreatywnego dla powiatu m.st.warszawa we wszystkich badanych latach kształtowała się na zdecydowanie wysokim poziomie, powodując b.silną asymetrię rozkładów zmiennej zależnej. Ponadto, we wszystkich badanych latach w powiecie miasto Wałbrzych w bazie danych lokalnych (380 powiatów) nie zanotowano w latach podjęcia działalności w sektorze kreatywnym (wartość zmiennej zależnej wynosiła zero- należy zatem przyjąć,że dla tego powiatu danych w bazie brak). Wykres 1 ilustruje graficznie rozkłady zmiennej zależnej w latach Można zauważyć, że w każdym roku badanego okresu występuje w postaci gwiazdki wartość ekstremalna, odnosząca się do Warszawy, wartość minimalna równa zero dotyczy powiatu m.wałbrzych. Wykres 1. Rozkłady zmiennej zależnej w kolejnych latach okresu ;(N=380) Źródło: opracowanie własne przy użyciu Statistica 10 PL. W pozostałych tabelach i wykresach źródło identyczne. Ponadto wyraźnie zaznaczyły się w postaci gwiazdek dane dotyczące kilku powiatów na prawach miejskich, np. m.gdynia; Poznań czy Kraków. Występowanie dwóch zdecydowanie różnych wariantów zmiennej (dla Warszawy oraz Wałbrzycha) skutkowało przyjęciem bardzo wysokich wartości liczbowych przez dwie miary opisowe struktury rozkładów zmiennej zależnej (liczba podmiotów sektora kreatywnego), a mianowicie współczynnika zmienności oraz asymetrii (skośności), por. tabela 3. 3

4 Tabela 3. Miary opisowe rozkładów zmiennej zależnej w latach Prowadzenie analizy statystycznej dla wszystkich powiatów w takiej sytuacji byłoby merytorycznie nieuzasadnione. Ze zbiorów usunięto zatem dane dla tych dwóch powiatów. Zmiany w strukturze rozkładów ilustrują: wykres 2 oraz dane w tabeli 4. Wykres 2. Ilustracja graficzna rozkładów zmiennej zależnej w kolejnych latach okresu ;N=378); bez Warszawy i Wałbrzycha. Kształt rozkładów wykazuje mniejszą asymetrię i zróżnicowanie, co potwierdza większą jednorodność zbioru po usunięciu dwóch ekstremalnych wartości szczególnie dla powiatu m.warszawa. Stanowi to merytoryczną podstawę do podziału zbioru wejściowego na dwie populacje. Pierwsza nie będzie uwzględniać powiatów m.warszawa oraz m. Wałbrzych (z powodu braku danych). 4

5 Tabela 4. Miary opisowe rozkładów zmiennej zależnej w latach (bez Warszawy i Wałbrzycha). Wartości współczynnika zmienności zdecydowanie - po eliminacji Warszawy i Wałbrzycha - zmniejszyły się, ale nadal wskazywały na b.silne zróżnicowanie w stosunku do średniej liczby podmiotów, przypadającej na jeden powiat (od 317 w 2009 roku do 311 w roku 2012). Poziom liczbowy średniej arytmetycznej był nadal silnie zawyżony przez te powiaty, w których liczba podmiotów w sektorze kreatywnym była najwyższa. W kolejnych latach badanego okresu były to np.: powiat m. Kraków ( 6046 podmiotów w 2009 roku; 6612 podmioty w roku 2012) oraz m.poznań (4791 w 2009 roku; 5242 podmioty w roku 2012). Taka sytuacja spowodowała, iż współczynnik asymetrii nadal był b.wysoki (znacznie przekraczał umownie przyjmowaną jako górną granicę liczbę 2). Oznaczało to konieczność posługiwania się tylko miarami pozycyjnymi, np. medianą zamiast zawyżonej średniej arytmetycznej. Decyzja o użyciu łatwiejszej i częściej spotykanej w opisach - średniej arytmetycznej liczby podmiotów dla ilustracji sytuacji w sektorze kreatywnym w takiej sytuacji powinna być obarczona silnym akcentowaniem, że jest to średnia bardzo zawyżona. Dla podkreślenia siły zróżnicowania powiatów w Polsce ze względu na liczbę podmiotów w sektorze kreatywnym trzeba przedstawić wartości minimalne. W każdym roku badanego okresu najmniejsza liczba podmiotów w sektorze kreatywnym występowała w powiatach suwalskim (24 podmioty w roku 2009 i 28 w 2012) oraz sejneńskim (26 w roku 2009; 24 podmiotów w 2012 roku). Zatem rozstęp między minimalną i maksymalną liczba podmiotów w sektorze kreatywnym w kolejnych latach okresu był stosunkowo najmniejszy (ok.6000 obiektów w roku 2009 ), natomiast zwiększył się do prawe 6600 w roku W takiej sytuacji zdecydowano przeprowadzić analizę statystyczną dla dwóch populacji, a mianowicie: - pierwszą stanowiły wszystkie powiaty z wyłączeniem Warszawy i Wałbrzycha (n=378); 5

6 - drugą stanowiły wszystkie powiaty z wyłączeniem (oprócz m.warszawy i m.wałbrzych) tych powiatów, w których liczba podmiotów w sektorze kreatywnym przekraczała Były to odpowiednio: 1. rok 2009: m.szczecin (2538 podmioty), powiat m.gdańsk (2587), m.łódź (3524), m.wrocław (4509),m.Poznań(4791) i m.kraków (6046); 2. rok 2010: powiat m.gdańsk (2694 podmioty), m.szczecin (2712), m.łódź (3798), m.wrocław (4814),m.Poznań(5017) i m.kraków (6562); 3. rok 2011: m.szczecin (2642 podmioty), powiat m.gdańsk (2689), m.łódź (3740), m.wrocław (5001),m.Poznań(5001) i m.kraków (6616); 4. rok 2012: m.szczecin (2551 podmioty), powiat m.gdańsk (2728), m.łódź (3867), m.wrocław (5116),m.Poznań(5242) i m.kraków (6612). W zbiorach tych pominięto oczywiście powiat m.warszawa oraz Wałbrzych. Druga populacja zawierała zatem 372 powiaty. Wykres 3 prezentuje rozkłady zmiennej zależnej dla drugiej populacji (N=372 powiaty). Rozkłady charakteryzuje nadal silna asymetria, jednak nie występują powiaty o zdecydowanie różnej od pozostałych liczbie podmiotów w sektorze kreatywnym. Wykres 3. Ilustracja graficzna rozkładów zmiennej zależnej w kolejnych latach okresu (populacja N=372) 6

7 Zdecydowanie niższą asymetrię rozkładów w populacji po usunięciu 8 powiatów odstających charakteryzują poziomy współczynnika asymetrii (por.tabl.5). Stanowi to większe uzasadnienie do użycia modelu regresji liniowej w celu wyodrębnienia determinant podejmowania działalności w sektorze kreatywnym. Tabela 5. Miary opisowe rozkładów zmiennej zależnej w latach (druga populacja;n=372). Populacja druga jest bardziej homogeniczna, występuje zdecydowanie mniejsze zróżnicowanie pomiędzy powiatami ze względu na liczbę podmiotów w sektorze kreatywnym. W takiej sytuacji wyróżnione determinanty mogą działać z podobną siłą oraz kierunkiem we wszystkich powiatach, co ma przede wszystkim znaczenie w trafności dokonywanych prognoz i budowy podobnych strategii. Część 2. Badanie korelacji pomiędzy zmiennymi. Występowanie silnej asymetrii rozkładów zmiennej przyjętej jako zależnej (liczba podmiotów sektora kreatywnego) powoduje odrzucenie hipotezy o zgodności rozkładu tej zmiennej z rozkładem normalnym, a jest to podstawowe założenie stosowania modelu regresji prostej w celu określenia determinant działalności gospodarczej w sektorze kreatywnym, charakteryzowanej liczba podmiotów podejmujących taką działalność w Polsce (ujecie powiatowe) w latach W celu potwierdzenia przypuszczenia, że taka sytuacja występuje w odniesieniu do przyjętej zmiennej zależnej użyto testu Shapiro-Wilka (SW-W) do weryfikacji hipotezy o normalności rozkładu liczby podmiotów w sektorze kreatywnym. Wykres 4 prezentuje przebieg rozkładów empirycznych oraz wartości testu SW-W i prawdopodobieństwa testowe p-value dla pierwszej populacji powiatów (N=378). 7

8 Wykres 4. Rozbieżność rozkładów zmiennej zależnej z rozkładem normalnym; (populacja pierwsza - bez Warszawy i Wałbrzycha) Wartość testu SW-W 0,36 oraz prawdopodobieństwa testowe p-value = 0,0000 powodują dla rozkładów zmiennej zależnej w każdym roku badanego okresu odrzucenie hipotezy o normalności rozkładów liczby podmiotów w sektorze kreatywnym. Decyzja została podjęta przy najczęściej przyjmowanym - poziomie istotności α = 0,05 i jest jednoznaczna, tzn. przy każdym innym α 0,10 nie może być zmieniona na odwrotną, bowiem p = 0,000. Budowa modelu liniowej regresji jest więc obarczona występowaniem silnej asymetrii rozkładów zmiennej zależnej w kolejnych latach Model ten, że względu na łatwość interpretacji otrzymanych wyników może być użyty, ale interpretacja musi odbywać się z ostrożnością w formułowaniu końcowych wniosków. W odniesieniu do drugiej populacji powiatów (N=372) rozbieżność rozkładów empirycznych z rozkładem normalnym prezentuje wykres 5. 8

9 Wykres 5. Rozbieżność rozkładów zmiennej zależnej z rozkładem normalnym; (populacja druga; N=372 powiaty) Zgodnie z procedurą weryfikacji hipotezy o normalności również i w przypadku drugiej populacji powiatów należy odrzucić hipotezę zerową o zgodności, jednak poziom testu Shapiro-Wilka w tym przypadku podwoił się w stosunku do rozkładów w populacji pierwszej, co sygnalizuje zdecydowanie większe, aczkolwiek jeszcze nie wystarczające podobieństwo przebiegu zgodnego z rozkładem normalnym (symetrycznym). Przed przystąpieniem do budowy modelu konieczna jest ponadto ocena siły korelacji pomiędzy zmiennymi. Ocena ta powinna udokumentować wykluczenie z początkowego, potencjalnego zbioru zmiennych niezależnych zmiennych, które wykazują silne skorelowanie z innymi zmiennymi. Pozostawienie w modelu zmiennych niezależnych silnie skorelowanych ze sobą oddziałuje negatywnie na trafność wyodrębnienia trafnych determinant. W odniesieniu do rozkładów zmiennych objaśniających (niezależnych zwanych regresantami) w dwóch populacji podmiotów sektora kreatywnego asymetria ich rozkładów może być oceniona jako umiarkowana, przy czym dla zdecydowanej większości współczynniki asymetrii są niższe w przypadku drugiej populacji. 9

10 Tabela 6. Miary opisowe dla poszczególnych zmiennych niezależnych w 2009 roku ; populacja pierwsza (N=378) Tabela 7. Miary opisowe dla poszczególnych zmiennych niezależnych w 2009 roku; populacja druga (N=372) Należy zauważyć, że zróżnicowanie w ujęciu powiatów rozkładu zmiennej 9 (udział ludności wg ekonomicznych grup wieku w % ludności; ogółem; dotyczy ludności w wieku produkcyjnym) jest b.niskie, na co wskazuje poziom współczynnika zmienności < 10% i to w odniesieniu do obu populacji. W związku z tym zmienna 9 powinna być usunięta ze zbioru potencjalnych zmiennych już na tym etapie. Należy dodać, uprzedzając analizę dla pozostałych trzech lat, że sytuacja ta występowała w każdym roku. Aby zbadać siłę korelacji pomiędzy zmiennymi w celu eliminacji tych zmiennych objaśniających, które są silnie ze sobą skorelowane wybrano współczynnik korelacji liniowej Pearsona. W związku z dość silną asymetrią oraz rozbieżność z rozkładem normalnym rozważano użycie współczynnika korelacji rang Spearmana, gdyż pomimo usunięcia danych dla Warszawy i Wałbrzycha ( populacja pierwsza) oraz powiatów, w których liczba podmiotów sektora kreatywnego przekraczała 2000 (populacja druga) współczynniki asymetrii były dosyć stosunkowo wysokie. Jednak liczebność obu populacji jest tak duża, że brak jest uzasadnienia dla stosowania współczynnika rang Spearmana, który może zastąpić współczynnik Pearsona dla zdecydowanie małych liczebnie zbiorów danych. 10

11 Ponadto należy zauważyć, że zastępowania wartości liczbowych rzeczywistych rangami uodparnia na asymetrię rozkładu ale również wiąże się to z utratą informacji, spowodowaną przejściem na skalę słabszą. Przed analizą korelacji wysunąć można hipotezę, że będzie ona przynosić podobne wyniki dla kolejnych lat okresu , bowiem podobieństwo rozkładów zarówno zmiennej zależnej, jak i wybranych potencjalnych zmiennych objaśniających, dokumentowane graficznie oraz za pomocą miar opisu struktury było mocno zauważalne. Zatem zmienne objaśniające (determinanty) w modelach regresji będą identyczne dla każdego roku z lat tabela 8. Poziomy liczbowe współczynnika korelacji Pearsona dla populacji pierwszej prezentuje Tabela 8. Współczynniki korelacji Pearsona 2009 (populacja pierwsza) Dokonując analizy poziomów współczynnika korelacji kolejnych zmiennych objaśniających ze zmienną zależną ( ważne dla decyzji są wartości wysokie, bliskie +/- 1,00) oraz poziomy współczynników zależności pomiędzy zmiennymi (wartości jak najmniejsze), a także wykorzystując fakt, iż pakiet komputerowy STATISTICA prezentuje w kolorze czarnym zależność statystycznie nieistotną należałoby zostawić w zbiorze przypuszczalnych determinant jako niezależne (objaśniające) w modelu regresji liniowej dla populacji pierwszej ( bez Warszawy i Wałbrzycha) następujące zmienne: Zmienna 2 - Wydatki ogółem budżetu powiatu w zł/na 1 mieszkańca, Zmienna 3 - Wydatki na oświatę i wychowanie budżetu powiatu w zł/na 1 mieszkańca, Zmienna 4 Wydatki na kulturę i ochronę dziedzictwa narodowego budżetu powiatu na 1 mieszkańca w zł/mieszkańca Zmienna 10 - Bezrobocie zarejestrowane; ogółem. Zmienne: 1 ( silnie skorelowana ze zmienną 2); zmienne 5; 6; 7; 8 (silnie skorelowane z innymi zmiennymi) zostały usunięte ze zbioru początkowego. 11

12 Tabela 9. Współczynniki korelacji liniowej Pearsona 2009 (populacja druga) W odniesieniu do populacji drugiej (o większej jednorodności, co prezentowały stosunkowo niskie współczynniki skośności) należałoby zostawić w zbiorze przypuszczalnych determinant następujące zmienne: nr.2; 3; 4; 10. Należy zauważyć, że zarówno zmienna 4 jak i 10 wykazały statystyczną nieistotność korelacji z kilkoma innymi zmiennymi objaśniającymi. Podobną analizę, będącą podstawą usuwania zmiennych potencjalnych w oparciu o współczynniki korelacji przeprowadzano każdorazowo poniżej w odniesieniu do wyników dla lat I tak w wyniku przeprowadzenia identycznej rozważań dla danych roku 2010 otrzymujemy: Tabela 10. Miary opisowe dla poszczególnych zmiennych niezależnych w 2010 roku ; populacja pierwsza (N=378) 12

13 Tabela 11. Miary opisowe dla poszczególnych zmiennych niezależnych w 2010 roku; populacja druga (N=372) Tabela 12. Współczynniki korelacji Pearsona 2010 (populacja pierwsza) Dokonując analizy siły korelacji ze zmienną zależną, siłę skorelowania z innymi cechami oraz biorąc pod uwagę zaznaczone kolorem czarnym statystycznie nieistotne poziomy należałoby zostawić następujące zmienne objaśniające w zbiorze cech diagnostycznych dla roku 2010 ( w populacji powiatów bez Warszawy i Wałbrzycha): 1 - dochody ogółem budżetu powiatu, 3 - wydatki na oświatę i wychowanie budżetu powiatu na 1 mieszkańca, 10- bezrobocie zarejestrowane ogółem. Zmienna 4 - wydatki na kulturę i ochronę dziedzictwa narodowego budżetu powiatu na 1 mieszkańca w zł/mieszkańca wykazała statystyczną nieistotność współzależności z kilkoma innymi zmiennymi objaśniającymi. W porównaniu z wynikami otrzymanymi dla danych roku 2009, tym razem należy w zbiorze zostawić zmienna 1, bowiem poziom liczbowy współczynnika korelacji jest wyższy dla zmiennej 1 (przy silnej korelacji miedzy zmienna 1 i 2). Otrzymane poziomy współczynnika korelacji Pearsona dla populacji drugiej zaprezentowano w tabeli 13: 13

14 Tabela 13. Współczynniki korelacji liniowej Pearsona 2010 (populacja druga) W zbiorze potencjalnych zmiennych w odniesieniu do populacji drugiej (2010) zostają następujące zmiennej objaśniające: nr. 1; 3; 10. Zmienna 4 wykazała nieistotność statystyczną zależności ze zmienną zależną. Zmienna 2 wykazała nieco słabszą siłę korelacji ze zmienną zależną. Poniżej zaprezentowano w tabelach procedurę dla roku 2011.Przypomnijmy,że nadal zmienna 9 ze względu na b. niskie zróżnicowanie powinna być usunięta (współczynnik zmienności < 10%). Tabela 14. Miary opisowe dla poszczególnych zmiennych w 2011 roku (populacja pierwsza) 14

15 Tabela 15. Miary opisowe dla poszczególnych zmiennych w 2011 roku (populacja druga) Tabela 16. Współczynniki korelacji Pearsona 2011 (populacja pierwsza) W zbiorze potencjalnych zmiennych w odniesieniu do populacji pierwszej (2011) zostają następujące zmiennej objaśniające: nr. 2; 3; 10; 11. Zmienna 4 wykazała nieistotność statystyczną zależności z kilku innymi zmiennymi. Tabela 17. Współczynniki korelacji liniowej Pearsona 2011 (populacja druga) Natomiast w zbiorze potencjalnych zmiennych w odniesieniu do populacji drugiej (2011) zostają następujące zmiennej objaśniające: nr. 1; 2; 3; 10; 11. Zmienna 4 wykazuje w tym przypadku statystycznie nieistotną zależność ze zmienną zależną. 15

16 Dla ostatniego roku badanego okresu, tzn. dla 2012 roku otrzymujemy w wyniku badania struktury rozkładów oraz oceny korelacji następujące wyniki, zamieszczone w tabelach 18-21: Tabela 18. Miary opisowe dla poszczególnych zmiennych w 2012 roku (populacja pierwsza) Tabela 19. Miary opisowe dla poszczególnych zmiennych w 2012 roku (populacja druga) Tabela 20. Współczynniki korelacji Pearsona 2012 (populacja pierwsza) 16

17 Tabela 21. Współczynniki korelacji Pearsona 2012 (populacja druga) W wyniku oszacowania siły i kierunku korelacji miedzy zmiennymi podjęto w oparciu o poziomy liczbowe i statystyczną istotność następujące decyzje odnośnie roku 2012: - w odniesieniu do populacji pierwszej w zbiorze zmiennych potencjalnych zostają zmienne: 2; 3; 4;10;11 - w odniesieniu do populacji drugiej 2;3;10;11. Zmienna 4 wykazała nieistotność statystyczną zależności korelacyjnej z kilku innymi zmiennymi. Podsumowując analizę korelacji należy zauważyć, że w zbiorach zmiennych objaśniających (przypuszczalnych determinant) znajdowały się, tak jak przypuszczano prawie identyczne dla kolejnych lat okresu zestawy zmiennych objasniających. Ostatecznie zdecydowano, że do modelu regresji jako zmienne diagnostyczne kwalifikują się zmienne: - nr.1 czyli dochody ogółem budżetu powiatu na 1 mieszkańca w zł -nr.2 wydatki budżetu powiatu na 1 mieszkańca w zł - nr.3 wydatki na oświatę i wychowanie budżetu powiatu na 1 mieszkańca w zł - nr.4 wydatki na oświatę i ochronę dziedzictwa narodowego budżetu powiatu na 1 mieszkańca w zł -nr.10 bezrobocie zarejestrowane; ogółem oraz dla lat 2011 i 2012 : nr.11. całkowita wartość projektów w ramach Narodowych Strategicznych Ram Odniesienia według programów operacyjnych i źródeł finansowania w zł/mieszkańca. 17

18 Część. 3 Modele liniowej regresji wielorakiej. W celu wyodrębnienia determinant działalności podmiotów gospodarczych w sektorze kreatywnym w ujęciu powiatowym w kolejnych latach okresu zbudowano modele dla dwóch wyróżnionych populacji przy wyżej wymienionym zestawie zmiennych objaśniających, wyłonionych w wyniku analizy zmienności rozkładów zmiennych objaśniających oraz analizy korelacji pomiędzy tymi zmiennymi. Każdorazowo zaprezentowano poniżej wartości parametrów przy kolejnych zmiennych objaśniających, oceniono ich statystyczną istotność, przeprowadzono analizę reszt (w tym zbadano zjawisko autokorelacji reszt za pomocą testu Durbina-Watsona). Wyznaczono współczynnik determinacji liniowej modelu w celu oceny własności diagnostycznych i prognostycznych. Algorytm modelu regresji dla n- elementowej populacji oraz k- zmiennych objaśniających badanej ma postać: yi = a1 x1i + a2 x2i ak xki + b + zi (1) przy czym : (Sa1) (Sa2) (Sak) (Sb) (Sz) ( t a α1, s ) ( t a α2, s ) ( t a αk, s ) ( t bb, s (pa1) (pa2) (pak) (pb) ) gdzie: yi; ak; b; Sak; Sz; t ak α, s ; t b α, s oraz pak i pb odpowiednio: realizacja zmiennej zależnej; współczynniki regresji; wyraz wolny; odchylenia standardowe przy parametrach funkcji regresji; odchylenie standardowe w rozkładzie składnika resztowego; statystyki z próby (test t- Studenta) oraz prawdopodobieństwa testowe, służące weryfikacji hipotez o statystycznej nieistotności parametrów liniowej funkcji regresji; i = 1,2,.,n. Wnioskom z oszacowań współczynników regresji w modelu towarzyszyć będzie analiza wariancji (w celu oceny łącznego wpływu determinant), prezentacja współczynników korelacji między zmiennymi objaśniającymi w modelu (w celu oceny interakcji tych zmiennych) oraz badanie zgodności składnika resztowego z rozkładem normalnym, a także wyniki weryfikacji hipotezy o braku autokorelacji w oparciu o test Durbina Watsona 1. Zestaw wymienionych procedur pozwoli na wyodrębnienie determinant, warunkujących rozkłady zmiennej zależnej oraz ocenę przydatności modelu z użyciem tych determinant dla celów prognostycznych. 1 Szczegółowe informacje dotyczące zagadnienia liniowej regresji wielorakiej można znaleźć w podręczniku A.Luszniewicza i T.Słaby. Statystyka z pakietem komputerowym STATISTICA PL. Teoria i zastosowania. Wyd.III zmienione. Wydawnictwo C.H.Beck,2008; s

19 Model liniowej regresji wielorakiej. Rok 2009 populacja pierwsza (bez Warszawy i Wałbrzycha) Wydruk 1. Parametry modelu regresji liniowej Wydruk 2.Analiza wariancji. Wydruk 3. Macierz współczynników interakcji Wykres 1. Badanie normalności rozkładu reszt 19

20 Wydruk 4. Badanie autokorelacji reszt Na podstawie zaprezentowanych powyżej w wydrukach 1-4 oraz wykresie 1 można stwierdzić, że w odniesieniu do danych z roku 2009 i populacji 378 powiatów (populacja pierwsza bez Warszawy i Wałbrzycha): - rzeczywisty i statystycznie istotny wpływ na zmienną zależną (liczba podmiotów sektora kreatywnego) miała zmienna 2 czyli wydatki budżetu powiatu na 1 mieszkańca w zł, zmienna 4 czyli wydatki na oświatę i ochronę dziedzictwa narodowego budżetu powiatu na 1 mieszkańca w zł (ale przy poziomie istotności 0,10) oraz zmienna 10 (wielkość bezrobocia zarejestrowanego). Uzupełnienie wyników modelu analizą współczynników interakcji pozwala zauważyć determinujacy wpływ na zmienną zależną zmiennej 4 (wydatki na oświatę i ochronę dziedzictwa narodowego budżetu powiatu na 1 mieszkańca w zł), natomiast bezrobocie nie wykazało statystycznie istotnej interacji z tymi dwiema determinantami. Można zatem uznać, że dwie zmienne nr.2 oraz 4 warunkowały (wpływały) na rozklady zmiennej zależnej w ujęciu powiatowym,czyli lczba podmiotów sektora kreatywnego była determinowana przez wydatki budżetu ogółem oraz wydatki na kulturę i ochronę dziedzictwa narodowego; - własności diagnostyczne modelu z tymi zmiennymi należy ocenic jako umiarkowane, bowiem współczynnik determinacji liniowej R 2 wynosi 45,5%, czyli niecała połowa zróżnicowania rozkładów liczby podmiotów sektora kreatywnego była wyjaśniona łacznie zmiennością rozkładów wydatków budżetów ogółem oraz wydatków na kulture i dziedzictwo narodowa na 1 mieszkańca; - łączny wpływ wyróżnionych został pozytywnie potwierdzony wynikami analizy wariancji (odrzucenie hipotezy o braku zależności regresyjnej); - na podytsawie analizy reszt oraz wystepowanie zjawiska autokorelacji reszt nie pozwalają na ocenę pozytywną kwalifikacji tego modelu dla celów prognostycznych. W odniesieniu do populacji drugiej, bardziej jednorodnej, o niższym w ujeciu powiatowym - zróżnicowaniu rozkładów zmiennych otrzymano wyniki prezentowane w wydrukach 5-8 oraz na wykresie 2: 20

21 Rok 2009 populacja druga (bez Warszawy i Wałbrzycha i 6 miast o najwyższej liczbie obiektów sektora kreatywnego), N=372 Wydruk 5. Parametry modelu liniowej regresji Wydruk 6.Analiza wariancji. Wykres 2. Badanie normalności reszt. Wydruk 7. Macierz współczynników interakcji 21

22 Wydruk 8. Badanie autokorelacji* *Optymalna wartość testu D-W wynosi 2. W odniesieniu do populacji drugiej mniej zróżnicowanej w modelu liniowej regresji ujawniła się siła działania oprócz zmiennej 2 i 10 również zmiennej 3 ( wydatki na oświatę i wychowanie budżetu powiatu na 1 mieszkańca),jednak model ten charakteryzuje się niższą 36,6% determinacją,zatem mniejsze zróznicowanie rozkładów w drugiej populacji nie przyniosło spodziewanego większego efektu diagnostycznego. Analiza wariancji potwierdza, że te trzy zmienne mają łączny wpływ na zmienną zależną (liczba podmiotów). Jednak badanie rozkładu reszt również i w tym przypadku nie pozwala na dokonywanie trafnych prognoz w oparciu o ten model. Dane dotyczące 2010 roku dostarczyły prawie identycznych wyników, wobec tego bez prezentacji wydruków i wykresów - można jedynie stwierdzić, że: - współczynnik determinacji dla modelu liniowej regresji w przypadku pierwszej populacji powiatów wyniósł 44%, dla drugiej 36%, co potwierdzało stosunkowo niska wartość diagnostyczna modeli; - w modelu pierwszym statystyczną istotność jako determinanty zróżnicowania wartości zmiennej zależnej wykazały zmienna 1 (dochody budżetów ogółem) oraz zmienna 10. Natomiast dla populacji drugiej tylko zmienna 4 ( wydatki na kulturę i ochronę dziedzictwa) okazała się statystycznie nieistotna, aczkolwiek w działaniu interakcyjnym wpływała łącznie na zmienna zależną ze zmiennymi 1,2 oraz 3; - analiza reszt nie potwierdziła walorów prognostycznych modeli dla obu populacji powiatów. W bazie danych dotyczących kolejnych dwu lat, tzn.2011 i 2012 pojawiła się nowa zmienna nr.11 (Całkowita wartość projektów w ramach Narodowych Strategicznych Ram Odniesienia według programów operacyjnych i źródeł finansowania w zł/mieszkańca), której znaczenie diagnostyczne wpływu na działalność sektora kreatywnego powinno być znaczące. 22

23 Poniżej w wydrukach 9-12 oraz na wykresie 3 dla roku 2011 (populacja pierwsza) oraz wydrukach i na wykresie 4 (populacja druga) zostaną zaprezentowane wyniki analizy modelowej liniowej regresji, wariancji i rozkładu reszt w celu wyłonienia statystycznie istotnych determinant (zmiennych objaśniających) w oparciu o dane 2011 i 2012 roku. Tak jak, poprzednio decyzje są podejmowane przy poziomie istotności α = 0,05, a jeżeli p < 0,05 zmienna objaśniająca (determinanta) jest uznawana za statystycznie istotnie warunkującą zróżnicowanie rozkładu zmiennej zależnej (w wydrukach decyzje pozytywne są w kolorze czerwonym). Zbiór zmiennych diagnostycznych, zastosowany do modelowania w oparciu o dane z lat , tzn do zmiennych nr. 1; 2 ;3; 4,wyodrębnionych dzięki analizie zróżnicowania rozkładów oraz korelacji między zmiennymi został powiększony o zatem zmienną 11.Jest to zmienna o charakterze ekonomicznym, odzwierciedlająca pomoc z budę tu państwa oraz programów unijnych, mogąca mieć statystycznie istotny wpływ na wzrost liczby podmiotów sektora kreatywnego. Wcześniejsza analiza korelacji pomiędzy potencjalnymi zmiennymi objaśniającymi (por. tabl.16 i 17) wskazywała na silna i dodatnia współzależność tej zmiennej ze zmienną, charakteryzującą liczbę podmiotów w sektorze kreatywnym w ujęciu powiatowym, przy czym ta zależność była znacznie silniejsza w populacji pierwszej bowiem współczynnik korelacji liniowej Pearsona wynosił 0,73 wobec 0,53 dla populacji drugiej (bez dużych powiatów na prawach miejskich). Analiza wpływu tej zmiennej została zaprezentowana w modelu regresji (por.wydruk 9 i 13) Rok 2011 populacja pierwsza Wydruk 9. Parametry modelu liniowej regresji 23

24 Wydruk 10. Analiza wariancji. Wykres 3. Badanie normalności reszt. Wydruk 11. Macierz współczynników interakcji Wydruk 12. Badanie autokorelacji Wprowadzenie do modelu regresji zmiennej nr. 11,prezentującej środki finansowe ( wartość projektów w ramach Narodowych Strategicznych Ram Odniesienia według programów operacyjnych i źródeł finansowania w zł/mieszkańca) znacznie poprawiło walory diagnostyczne, bowiem współczynnik determinacji liniowej dla populacji pierwszej wzrósł do 64%, natomiast w populacji drugiej do 45%. Oznaczało to większy łączny wpływ zmiennych 24

25 statystycznie istotnych, tzn. zmiennej nr.1 (dochody budżetów); wydatki ogółem oraz wartość projektów na wzrost liczby podmiotów sektora kreatywnego populacja druga Wydruk 13. Parametry modelu liniowej regresji Wydruk 14. Analiza wariancji. Wykres 4. Badanie normalności reszt. 25

26 Wydruk 15. Macierz współczynników interakcji Wydruk 16. Badanie autokorelacji Nieco mniejsze znaczenie wpływu zmiennej 11 (wartość projektów unijnych) można zaobserwować na podstawie danych dotyczących 2012 roku, współczynnik regresji przy tej zmiennej zmalał z poziomu średniego w skali powiatu z 0,280 mln zł/1 powiat w 2011 roku do 0,135 mln zł w 2012 roku ( w odniesieniu do pierwszej populacji) oraz z 0,119 mln zł do 0,048 mln zł ( populacja druga). Rok 2012 Populacja pierwsza Wydruk 17. Parametry modelu liniowej regresji 26

27 populacja druga Wydruk 18. Parametry modelu liniowej regresji Nadal wydatki ogółem wraz ze wartością projektów oraz w nieznacznym stopniu bezrobocie w znaczący sposób determinowały liczbę podmiotów sektora kreatywnego w 2012 roku, na co wskazuje współczynnik determinacji liniowej na poziomie 63% (populacja pierwsza) oraz 40% (populacja druga). Wioski końcowe. Budowa strategii w polityce gospodarczej, sprzyjającej stymulowaniu rozwoju przemysłów wymaga znajomości uwarunkowań jej realizacji. W odniesieniu do przemysłów kreatywnych determinanty rozwoju pochodzą z dwóch źródeł,a mianowicie kreatywności człowieka (w tym określonych zdolności typu artystycznego) oraz instrumentów ekonomicznych, których działanie jest niezależne od osób, które chcą prowadzić działalność gospodarczą w sektorze kreatywnym. Ważna dla strategii jest zaszłość historyczna, a konkretnie zróżnicowanie dotychczasowej bazy w ujęciu geograficznym i administracyjnym. Strategia opiera się zwyczajowo na diagnoza sytuacji w latach poprzednich. W niniejszym opracowaniu dysponowano bazą danych za lata w ujęciu 380 powiatów. W celach diagnostycznych przeprowadzono analizę struktury rozkładów zmiennej zależnej czyli liczby podmiotów sektora kreatywnego zarejestrowanych w bazie REGON w powiatach Polski; stan na dzień w kolejnych latach oraz 11 zmiennych niezależnych, przy czym dane empiryczne dla zmiennej 11 dotyczyły tylko lat Wybór zmiennych niezależnych podyktowany był względami merytorycznymi oraz danymi z Bazy Lokalnej GUS. Merytoryczna analiza, oparta na literaturze przedmiotu wskazywała na przypuszczalne cechy demograficzno- ekonomiczno- społeczne, mogące determinować rozwój sektora rozumiany jako pozytywny wpływ na wzrost liczby podmiotów prowadzących działalność w 27

28 sektorze przemysłów kreatywnych. Przyjęte do analizy zmienne niezależne ( potencjalne determinanty charakteryzowały sytuację ekonomiczną ( dochody i wydatki budżetu gmin), cechy demograficzne ludności zamieszkałej w powiatach Polski, społeczne (bezrobocie) oraz od 2011 roku wartość Pomocy zewnętrznej (projekty unijne). W pierwszym etapie zwanym czyszczeniem danych zauważono brak danych dla powiatu m.wałbrzych oraz zdecydowanie odmienną od pozostałych sytuację w powiecie m.warszawa. Był to sygnał do usunięcia tych dwóch przypadków z bazy danych (pozostałe dane w liczbie 378 powiatów stworzyły tzw. populację pierwszą). Konieczność takiego kroku potwierdziły b.wysokie współczynniki asymetrii dla rozkładów wszystkich zmiennych. Analiza struktury zmiennych dla pierwszej populacji wskazywała na nadal występującą silną asymetrie rozkładów, co zdecydowało o budowie drugiej populacji, bez 6 powiatów na prawach miejskich, w których liczba podmiotów sektora kreatywnego znacznie różniła się od pozostałych. W rezultacie otrzymano populację drugą o liczbie 372 powiatów, bardziej jednorodną (homogeniczną). Przypuszczano bowiem, iż silne zróżnicowanie powiatów ze względu na przyjęte cechy mogłoby w sposób istotnie negatywny wpłynąć na trafność diagnozy oraz walory prognostyczne modelu w wyniku wyłonienia się nieefektywnych determinant. Budowa modeli liniowej regresji wielorakiej w celu weryfikacji wartości informacyjnej determinant wymagała przeprowadzenia analizy zróżnicowania rozkładów zmiennych objaśniających względem badanych obiektów oraz ich skorelowania między sobą, co określi potencjał informacyjny. W wyniku analizy zróżnicowania usunięto zmienną informującą o udziale ludności według ekonomicznych grup wieku w % ludności ogółem, natomiast analiza korelacji wyeliminowała zmienne demograficzne, definiujące odsetek ludności w grupach wiekowych. Ostatecznie do modeli wprowadzono wyłącznie zmienne ekonomiczne, opisujące dochody, wydatki ogółem w tym wydatki na oświatę i kulturę. Statystycznie istotne, ale o b, niewielkim wpływie liczbowym było bezrobocie. Natomiast od 2011 roku diagnoza w oparciu o modele wzbogaciła się siłą determinacji zmienną o wpływie środków zewnętrznych (z budżetu państwa lub ze środków zagranicznych) na budżet gminy, tzn. z Narodowych Strategicznych Ram Odniesienia z Programu Operacyjnego Innowacyjna Gospodarka. Podsumowując wyniki analizy statystycznej, należy stwierdzić bardzo zróżnicowaną sytuację w ujęciu powiatów, co powoduje zalecenie ostrożności w posługiwaniu się średnią arytmetyczną w analizach, służących budowie projektów, która była każdorazowo w badanym okresie silnie zawyżona. Ponieważ trudno spodziewać się szybkiej likwidacji nierówności w skali powiatów, uwaga ta będzie słuszna przez przynajmniej kilka następnych lat. Zaleca się 28

29 zatem przeprowadzanie analiz w grupach powiatów lub miast znacznie bardziej jednorodnych ( podobnych ). W odniesieniu do wyodrębnienia determinant należy zauważyć, że statystycznie istotne znaczenie, aczkolwiek o niebyt dużej sile wpływu miały dotychczas (w latach ) wyłącznie te zmienne, które charakteryzują gospodarkę finansową gmin, dochody i wydatki budżetów oraz pomoc zewnętrzną. 29

30 Dodatek nr.1 Model regresji rok 2010 Populacja pierwsza Analiza wariancji 30

31 2010 populacja druga 31

32 Dodatek 2. Rok 2012 Populacja pierwsza Wydruk.1 Parametry modelu liniowej regresji Wydruk 2. Analiza wariancji. 32

33 Wykres 1. Badanie normalności reszt. Wydruk 3. Macierz współczynników interakcji 33

34 Wydruk 4. Badanie autokorelacji Rok 2012 populacja druga Wydruk 5. Parametry modelu liniowej regresji Wydruk 6. Analiza wariancji. 34

35 Wykres 2. Badanie normalności reszt. Wydruk 7. Macierz współczynników interakcji Wydruk 8. Badanie autokorelacji 35

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 Zadanie 1 a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 b) W naszym przypadku populacja są inżynierowie w Tajlandii. Czy można jednak przypuszczać, że na zarobki kobiet-inżynierów

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Analiza Współzależności

Analiza Współzależności Statystyka Opisowa z Demografią oraz Biostatystyka Analiza Współzależności Aleksander Denisiuk denisjuk@euh-e.edu.pl Elblaska Uczelnia Humanistyczno-Ekonomiczna ul. Lotnicza 2 82-300 Elblag oraz Biostatystyka

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)

Bardziej szczegółowo

ANALIZA KORELACJI Korelacja między zmiennymi X i Y jest miarą siły liniowego związku między tymi zmiennymi.

ANALIZA KORELACJI Korelacja między zmiennymi X i Y jest miarą siły liniowego związku między tymi zmiennymi. ANALIZA KORELACJI Większość zjawisk w otaczającym nas świecie występuje nie samotnie a w różnorodnych związkach. Odnosi się to również do zjawisk biologiczno-medycznych. O powiązaniach między nimi mówią

Bardziej szczegółowo

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem

Bardziej szczegółowo

Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna

Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna Badanie współzależności zmiennych Uwzględniając ilość zmiennych otrzymamy 4 odmiany zależności: Zmienna zależna jednowymiarowa oraz jedna

Bardziej szczegółowo

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć: Wprowadzenie Statystyka opisowa to dział statystyki zajmujący się metodami opisu danych statystycznych (np. środowiskowych) uzyskanych podczas badania statystycznego (np. badań terenowych, laboratoryjnych).

Bardziej szczegółowo

Etapy modelowania ekonometrycznego

Etapy modelowania ekonometrycznego Etapy modelowania ekonometrycznego jest podstawowym narzędziem badawczym, jakim posługuje się ekonometria. Stanowi on matematyczno-statystyczną formę zapisu prawidłowości statystycznej w zakresie rozkładu,

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp. Sprawdzian 2. Zadanie 1. Za pomocą KMNK oszacowano następującą funkcję produkcji: Gdzie: P wartość produkcji, w tys. jp (jednostek pieniężnych) K wartość kapitału zaangażowanego w proces produkcji, w tys.

Bardziej szczegółowo

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych 1 Laboratorium III: Testy statystyczne Spis treści Laboratorium III: Testy statystyczne... 1 Wiadomości ogólne... 2 1. Krótkie przypomnienie wiadomości na temat testów statystycznych... 2 1.1. Weryfikacja

Bardziej szczegółowo

4.2. Statystyczne opracowanie zebranego materiału

4.2. Statystyczne opracowanie zebranego materiału 4.2. Statystyczne opracowanie zebranego materiału Zebrany i pogrupowany materiał badawczy należy poddać analizie statystycznej w celu dokonania pełnej i szczegółowej charakterystyki interesujących badacza

Bardziej szczegółowo

Pojęcie korelacji. Korelacja (współzależność cech) określa wzajemne powiązania pomiędzy wybranymi zmiennymi.

Pojęcie korelacji. Korelacja (współzależność cech) określa wzajemne powiązania pomiędzy wybranymi zmiennymi. Pojęcie korelacji Korelacja (współzależność cech) określa wzajemne powiązania pomiędzy wybranymi zmiennymi. Charakteryzując korelację dwóch cech podajemy dwa czynniki: kierunek oraz siłę. Korelacyjne wykresy

Bardziej szczegółowo

Analiza Statystyczna

Analiza Statystyczna Lekcja 5. Strona 1 z 12 Analiza Statystyczna Do analizy statystycznej wykorzystać można wbudowany w MS Excel pakiet Analysis Toolpak. Jest on instalowany w programie Excel jako pakiet dodatkowy. Oznacza

Bardziej szczegółowo

Statystyka opisowa Opracował: dr hab. Eugeniusz Gatnar, prof. WSBiF

Statystyka opisowa Opracował: dr hab. Eugeniusz Gatnar, prof. WSBiF Statystyka opisowa Opracował: dr hab. Eugeniusz Gatnar, prof. WSBiF 120 I. Ogólne informacje o przedmiocie Cel przedmiotu: Opanowanie podstaw teoretycznych, poznanie przykładów zastosowań metod statystycznych.

Bardziej szczegółowo

Proces modelowania zjawiska handlu zagranicznego towarami

Proces modelowania zjawiska handlu zagranicznego towarami Załącznik nr 1 do raportu końcowego z wykonania pracy badawczej pt. Handel zagraniczny w województwach (NTS2) realizowanej przez Centrum Badań i Edukacji Statystycznej z siedzibą w Jachrance na podstawie

Bardziej szczegółowo

REGRESJA (postać liniowa funkcji) - ROZWIĄZANIA Komentarze kursywą, rozwiązania oraz treści zadań pismem prostym.

REGRESJA (postać liniowa funkcji) - ROZWIĄZANIA Komentarze kursywą, rozwiązania oraz treści zadań pismem prostym. REGRESJA (postać liniowa funkcji) - ROZWIĄZANIA Komentarze kursywą, rozwiązania oraz treści zadań pismem prostym. Zadanie 1 W celu ustalenia zależności między liczbą braków a wielkością produkcji części

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

Statystyka i Analiza Danych

Statystyka i Analiza Danych Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki -

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych

Bardziej szczegółowo

Spis treści. LaboratoriumV: Podstawy korelacji i regresji. Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych

Spis treści. LaboratoriumV: Podstawy korelacji i regresji. Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych 1 LaboratoriumV: Podstawy korelacji i regresji Spis treści Laboratorium V: Podstawy korelacji i regresji...1 Wiadomości ogólne...2 1. Wstęp teoretyczny....2 1.1 Korelacja....2 1.2 Funkcja regresji....5

Bardziej szczegółowo

Sposoby prezentacji problemów w statystyce

Sposoby prezentacji problemów w statystyce S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota Ekonometria ćwiczenia 3 Prowadzący: Sebastian Czarnota Strona - niezbędnik http://sebastianczarnota.com/sgh/ Normalność rozkładu składnika losowego Brak normalności rozkładu nie odbija się na jakości otrzymywanych

Bardziej szczegółowo

WSPOMAGANIE ANALIZY DANYCH ZA POMOCĄ NARZĘDZI STATISTICA

WSPOMAGANIE ANALIZY DANYCH ZA POMOCĄ NARZĘDZI STATISTICA WSPOMAGANIE ANALIZY DANYCH ZA POMOCĄ NARZĘDZI STATISTICA Janusz Wątroba i Grzegorz Harańczyk, StatSoft Polska Sp. z o.o. Zakres zastosowań analizy danych w różnych dziedzinach działalności biznesowej i

Bardziej szczegółowo

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy) Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy) Co na dzisiejszym wykładzie: definicje, sposoby wyznaczania i interpretacja STATYSTYK OPISOWYCH prezentacja

Bardziej szczegółowo

LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU

LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU Tomasz Demski, StatSoft Polska Sp. z o.o. Wprowadzenie Jednym z elementów walidacji metod pomiarowych jest sprawdzenie liniowości

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;

Bardziej szczegółowo

Co to jest analiza regresji?

Co to jest analiza regresji? Co to jest analiza regresji? Celem analizy regresji jest badanie związków pomiędzy wieloma zmiennymi niezależnymi (objaśniającymi) a zmienną zależną (objaśnianą), która musi mieć charakter liczbowy. W

Bardziej szczegółowo

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2012/2013

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2012/2013 Krakowska Akademia im. Andrzeja Frycza Modrzewskiego Karta przedmiotu obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 01/01 Wydział Prawa, Administracji i Stosunków Miedzynarodowych Kierunek

Bardziej szczegółowo

PROGNOZOWANIE PRZYCHODÓW ZE SPRZEDAŻY

PROGNOZOWANIE PRZYCHODÓW ZE SPRZEDAŻY Joanna Chrabołowska Joanicjusz Nazarko PROGNOZOWANIE PRZYCHODÓW ZE SPRZEDAŻY NA PRZYKŁADZIE PRZEDSIĘBIORSTWA HANDLOWEGO TYPU CASH & CARRY Wprowadzenie Wśród wielu prognoz szczególną rolę w zarządzaniu

Bardziej szczegółowo

Ćwiczenia 10. Analiza regresji. Część I.

Ćwiczenia 10. Analiza regresji. Część I. Ćwiczenia 10. Analiza regresji. Część I. Zadania obowiązkowe UWAGA! Elementy zadań oznaczone kolorem czerwonym należy przygotować lub wypełnić. Zadanie 10.1. (R/STATISTICA) Twoim zadaniem jest możliwie

Bardziej szczegółowo

O LICZBIE ABONENTÓW TELEFONII KOMÓRKOWEJ W POLSCE ZDANIEM TRZECH STATYSTYKÓW

O LICZBIE ABONENTÓW TELEFONII KOMÓRKOWEJ W POLSCE ZDANIEM TRZECH STATYSTYKÓW Rafał Czyżycki, Marcin Hundert, Rafał Klóska Wydział Zarządzania i Ekonomiki Usług Uniwersytet Szczeciński O LICZBIE ABONENTÓW TELEFONII KOMÓRKOWEJ W POLSCE ZDANIEM TRZECH STATYSTYKÓW Wprowadzenie Poruszana

Bardziej szczegółowo

Wielkość dziennego obrotu w tys. zł. (y) Liczba ekspedientek (x) 6 2 4 5,5 6,6

Wielkość dziennego obrotu w tys. zł. (y) Liczba ekspedientek (x) 6 2 4 5,5 6,6 Zad. 1. Zbadano wydajność odmiany pomidorów na 100 poletkach doświadczalnych. W wyniku przeliczeń otrzymano przeciętną wydajność na w tonach na hektar x=30 i s 2 x =7. Przyjmując, że rozkład plonów pomidora

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Dwuczynnikowa analiza wariancji (2-way

Bardziej szczegółowo

Test lewostronny dla hipotezy zerowej:

Test lewostronny dla hipotezy zerowej: Poznajemy testowanie hipotez statystycznych w środowisku R Zajęcia z dnia 11 maja 2011 roku Najpierw teoria TESTY ISTOTNOŚCI WARTOŚCI ŚREDNIEJ W POPULACJI GENERALNEJ gdy znana jest wariancja!!! Test prawostronny

Bardziej szczegółowo

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak Autor prezentuje spójny obraz najczęściej stosowanych metod statystycznych, dodatkowo omawiając takie

Bardziej szczegółowo

Publiczne Gimnazjum im. Jana Pawła II w Wilczej Woli ANALIZA EGZAMINU GIMNAZJALNEGO 2013 Z UWZGLĘDNIENIEM EWD

Publiczne Gimnazjum im. Jana Pawła II w Wilczej Woli ANALIZA EGZAMINU GIMNAZJALNEGO 2013 Z UWZGLĘDNIENIEM EWD Publiczne Gimnazjum im. Jana Pawła II w Wilczej Woli ANALIZA EGZAMINU GIMNAZJALNEGO 2013 Z UWZGLĘDNIENIEM EWD EDUKACYJNA WARTOŚĆ DODANA JAKO JEDNA Z MIAR JAKOŚCI NAUCZANIA Zasoby na wejściu Szkoła Jakość

Bardziej szczegółowo

Na podstawie danych dotyczacych rocznych wydatków na pizze oszacowano parametry poniższego modelu:

Na podstawie danych dotyczacych rocznych wydatków na pizze oszacowano parametry poniższego modelu: Zadanie 1. Oszacowano model ekonometryczny liczby narodzin dzieci (w tys.) w Polsce w latach 2000 2010 w zależnosci od średniego rocznego wynagrodzenia (w ujęciu realnym, PLN), stopy bezrobocia (w punktach

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Testowanie hipotez statystycznych Hipotezą statystyczną jest dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia

Bardziej szczegółowo

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Regresja wielokrotna Model dla zależności liniowej: Y=a+b 1 X 1 +b 2 X 2 +...+b n X n Cząstkowe współczynniki regresji wielokrotnej: b 1,..., b n Zmienne niezależne (przyczynowe): X 1,..., X n Zmienna

Bardziej szczegółowo

2008-03-18 wolne wolne 2008-03-25 wolne wolne

2008-03-18 wolne wolne 2008-03-25 wolne wolne PLAN SPOTKAŃ ĆWICZEŃ: Data Grupa 2a Grupa 4a Grupa 2b Grupa 4b 2008-02-19 Zajęcia 1 Zajęcia 1 2008-02-26 Zajęcia 1 Zajęcia 1 2008-03-04 Zajęcia 2 Zajęcia 2 2008-03-11 Zajęcia 2 Zajęcia 2 2008-03-18 wolne

Bardziej szczegółowo

1. Analiza wskaźnikowa... 3 1.1. Wskaźniki szczegółowe... 3 1.2. Wskaźniki syntetyczne... 53 1.2.1.

1. Analiza wskaźnikowa... 3 1.1. Wskaźniki szczegółowe... 3 1.2. Wskaźniki syntetyczne... 53 1.2.1. Spis treści 1. Analiza wskaźnikowa... 3 1.1. Wskaźniki szczegółowe... 3 1.2. Wskaźniki syntetyczne... 53 1.2.1. Zastosowana metodologia rangowania obiektów wielocechowych... 53 1.2.2. Potencjał innowacyjny

Bardziej szczegółowo

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl. wersja 20.01.2013/13:40

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl. wersja 20.01.2013/13:40 Statystyka dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl wersja 20.01.2013/13:40 Tematyka wykładów 1. Definicja statystyki 2. Populacja, próba 3. Skale pomiarowe 4. Miary położenia (klasyczne i pozycyjne)

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin. Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Zadania analityczne (1) Analiza przewiduje badanie podobieństw

Bardziej szczegółowo

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW ODRZUCANIE WYNIKÓW OJEDYNCZYCH OMIARÓW W praktyce pomiarowej zdarzają się sytuacje gdy jeden z pomiarów odstaje od pozostałych. Jeżeli wykorzystamy fakt, że wyniki pomiarów są zmienną losową opisywaną

Bardziej szczegółowo

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo

Bardziej szczegółowo

Raport Testy Trenerskie. Kadr Makroregionalnych Polskiego Związku Podnoszenia Ciężarów

Raport Testy Trenerskie. Kadr Makroregionalnych Polskiego Związku Podnoszenia Ciężarów Raport Testy Trenerskie Kadr Makroregionalnych Polskiego Związku Podnoszenia Ciężarów W trakcie zgrupowań Kadr Makroregionalnych Polskiego Związku Podnoszenia Ciężarów, poddano zawodników Testom Trenerskim.

Bardziej szczegółowo

MAZOWIECKI RYNEK PRACY LUTY 2014 R.

MAZOWIECKI RYNEK PRACY LUTY 2014 R. MAZOWIECKI RYNEK PRACY LUTY 2014 R. Na koniec lutego 2014 r. stopa bezrobocia na Mazowszu pozostała na poziomie sprzed miesiąca (11,4%). Jak wynika z informacji publikowanych przez GUS, przeciętne zatrudnienie

Bardziej szczegółowo

ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO STATYSTYCZNA ANALIZA ZMIAN LICZBY HOTELI W POLSCE W LATACH 1995-2004

ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO STATYSTYCZNA ANALIZA ZMIAN LICZBY HOTELI W POLSCE W LATACH 1995-2004 ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO NR 429 EKONOMICZNE PROBLEMY TURYSTYKI NR 7 2006 RAFAŁ CZYŻYCKI, MARCIN HUNDERT, RAFAŁ KLÓSKA STATYSTYCZNA ANALIZA ZMIAN LICZBY HOTELI W POLSCE W LATACH 1995-2004

Bardziej szczegółowo

Opis efektów kształcenia i sposobów ich weryfikacji

Opis efektów kształcenia i sposobów ich weryfikacji PROGRAM PRZEDMIOTU Nazwa przedmiotu WNIOSKOWANIE STATYSTYCZNE Rok akademicki / 26, semestr zimowy, grupy UE 1 Prof. zw. dr hab. Andrzej Luszniewicz Wymagania wstępne Studenci wnioskowania statystycznego

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY Liczebności i częstości Liczebność liczba osób/respondentów/badanych, którzy udzielili tej konkretnej odpowiedzi. Podawana w osobach. Częstość odsetek,

Bardziej szczegółowo

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski Narzędzia statystyczne i ekonometryczne Wykład 1 dr Paweł Baranowski Informacje organizacyjne Wydział Ek-Soc, pok. B-109 pawel@baranowski.edu.pl Strona: baranowski.edu.pl (w tym materiały) Konsultacje:

Bardziej szczegółowo

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej 7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach

Bardziej szczegółowo

Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej

Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej Paweł Cibis pawel@cibis.pl 23 lutego 2007 1 Regresja liniowa 2 wzory funkcje 3 Korelacja liniowa

Bardziej szczegółowo

Zakład Ubezpieczeń Społecznych Departament Statystyki i Prognoz Aktuarialnych

Zakład Ubezpieczeń Społecznych Departament Statystyki i Prognoz Aktuarialnych Zakład Ubezpieczeń Społecznych Departament Statystyki i Prognoz Aktuarialnych Struktura wysokości emerytur i rent wypłacanych przez ZUS po waloryzacji w marcu 2015 roku. Warszawa 2015 Opracowała: Ewa Karczewicz

Bardziej szczegółowo

1. Udział dochodów z działalności rolniczej w dochodach gospodarstw domowych z użytkownikiem gospodarstwa rolnego w 2002 r.

1. Udział dochodów z działalności rolniczej w dochodach gospodarstw domowych z użytkownikiem gospodarstwa rolnego w 2002 r. 1 UWAGI ANALITYCZNE 1. Udział dochodów z działalności rolniczej w dochodach gospodarstw domowych z użytkownikiem gospodarstwa rolnego w 2002 r. W maju 2002 r. w województwie łódzkim było 209,4 tys. gospodarstw

Bardziej szczegółowo

SPIS TREŚCI. Do Czytelnika... 7

SPIS TREŚCI. Do Czytelnika... 7 SPIS TREŚCI Do Czytelnika.................................................. 7 Rozdział I. Wprowadzenie do analizy statystycznej.............. 11 1.1. Informacje ogólne..........................................

Bardziej szczegółowo

Analysis of pension funds ranks in 2007-2011

Analysis of pension funds ranks in 2007-2011 MPRA Munich Personal RePEc Archive Analysis of pension funds ranks in 2007-2011 Rafa l Bu la University of Economics in Katowice 2014 Online at http://mpra.ub.uni-muenchen.de/59706/ MPRA Paper No. 59706,

Bardziej szczegółowo

kod nr w planie ECTS Przedmiot studiów PODSTAWY STATYSTYKI 7 2

kod nr w planie ECTS Przedmiot studiów PODSTAWY STATYSTYKI 7 2 kod nr w planie ECTS Przedmiot studiów PODSTAWY STATYSTYKI 7 2 Kierunek Turystyka i Rekreacja Poziom kształcenia II stopień Rok/Semestr 1/2 Typ przedmiotu (obowiązkowy/fakultatywny) obowiązkowy y/ ćwiczenia

Bardziej szczegółowo

STATYSTYCZNE OPRACOWANIE WYNIKÓW KONTROLI JAKOŚCI ROBÓT ZIEMNYCH

STATYSTYCZNE OPRACOWANIE WYNIKÓW KONTROLI JAKOŚCI ROBÓT ZIEMNYCH Dane bibliograiczne o artykule: http://mieczyslaw_polonski.users.sggw.pl/mppublikacje STATYSTYCZNE OPRACOWANIE WYNIKÓW KONTROLI JAKOŚCI ROBÓT ZIEMNYCH Mieczysław Połoński 1 1. Metodyka statystycznego opracowania

Bardziej szczegółowo

Joanna Muszyńska, Ewa Zdunek Uniwersytet Mikołaja Kopernika w Toruniu. Ekonometryczna analiza upadłości przedsiębiorstw w Polsce w latach 1990-2005

Joanna Muszyńska, Ewa Zdunek Uniwersytet Mikołaja Kopernika w Toruniu. Ekonometryczna analiza upadłości przedsiębiorstw w Polsce w latach 1990-2005 DYNAMICZNE MODELE EKONOMETRYCZNE X Ogólnopolskie Seminarium Naukowe, 4 6 września 2007 w Toruniu Katedra Ekonometrii i Statystyki, Uniwersytet Mikołaja Kopernika w Toruniu Uniwersytet Mikołaja Kopernika

Bardziej szczegółowo

Zadanie 2.Na III roku bankowości złożonym z 20 studentów i 10 studentek przeprowadzono test pisemny ze statystyki. Oto wyniki w obu podgrupach.

Zadanie 2.Na III roku bankowości złożonym z 20 studentów i 10 studentek przeprowadzono test pisemny ze statystyki. Oto wyniki w obu podgrupach. Zadanie 1.Wiadomo, że dominanta wagi tuczników jest umiejscowiona w przedziale [120 kg, 130 kg] i wynosi 122,5 kg. Znane są również liczebności przedziałów poprzedzającego i następnego po przedziale dominującym:

Bardziej szczegółowo

Sterowanie jakością badań i analiza statystyczna w laboratorium

Sterowanie jakością badań i analiza statystyczna w laboratorium Sterowanie jakością badań i analiza statystyczna w laboratorium CS-17 SJ CS-17 SJ to program wspomagający sterowanie jakością badań i walidację metod badawczych. Może działać niezależnie od innych składników

Bardziej szczegółowo

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie. SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:

Bardziej szczegółowo

I. OGÓLNE INFORMACJE PODSTAWOWE O PRZEDMIOCIE. Nie dotyczy. podstawowy i kierunkowy

I. OGÓLNE INFORMACJE PODSTAWOWE O PRZEDMIOCIE. Nie dotyczy. podstawowy i kierunkowy 1.1.1 Statystyka opisowa I. OGÓLNE INFORMACJE PODSTAWOWE O PRZEDMIOCIE STATYSTYKA OPISOWA Nazwa jednostki organizacyjnej prowadzącej kierunek: Kod przedmiotu: P6 Wydział Zamiejscowy w Ostrowie Wielkopolskim

Bardziej szczegółowo

MAZOWIECKI RYNEK PRACY I KWARTAŁ 2015 I KWARTAŁ 2015 NAJWAŻNIEJSZE INFORMACJE

MAZOWIECKI RYNEK PRACY I KWARTAŁ 2015 I KWARTAŁ 2015 NAJWAŻNIEJSZE INFORMACJE MAZOWIECKI RYNEK PRACY I KWARTAŁ 2015 I KWARTAŁ 2015 NAJWAŻNIEJSZE INFORMACJE Na Mazowszu nie pracowało 43,2% ludności w wieku 15 lat i więcej co oznacza poprawę sytuacji w ujęciu rocznym. W województwie

Bardziej szczegółowo

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007 Modele regresji wielorakiej - dobór zmiennych, szacowanie Paweł Cibis pawel@cibis.pl 1 kwietnia 2007 1 Współczynnik zmienności Współczynnik zmienności wzory Współczynnik zmienności funkcje 2 Korelacja

Bardziej szczegółowo

INFORMATYKA W SELEKCJI

INFORMATYKA W SELEKCJI INFORMATYKA W SELEKCJI INFORMATYKA W SELEKCJI - zagadnienia 1. Dane w pracy hodowlanej praca z dużym zbiorem danych (Excel) 2. Podstawy pracy z relacyjną bazą danych w programie MS Access 3. Systemy statystyczne

Bardziej szczegółowo

Analiza zależności liniowych

Analiza zależności liniowych Narzędzie do ustalenia, które zmienne są ważne dla Inwestora Analiza zależności liniowych Identyfikuje siłę i kierunek powiązania pomiędzy zmiennymi Umożliwia wybór zmiennych wpływających na giełdę Ustala

Bardziej szczegółowo

Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej.

Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej. Temat: WYKRYWANIE ODCHYLEO W DANYCH Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej. Przykładem Box Plot wygodną metodą

Bardziej szczegółowo

Metody statystyki medycznej stosowane w badaniach klinicznych

Metody statystyki medycznej stosowane w badaniach klinicznych Metody statystyki medycznej stosowane w badaniach klinicznych Statistics for clinical research & post-marketing surveillance część III Program szkolenia część III Model regresji liniowej Współczynnik korelacji

Bardziej szczegółowo

URZĄ D STATYSTYCZNY W BIAŁ YMSTOKU

URZĄ D STATYSTYCZNY W BIAŁ YMSTOKU URZĄ D STATYSTYCZNY W BIAŁ YMSTOKU Opracowania sygnalne Białystok, luty 2012 r. Tel. 85 749 77 00, fax 85 749 77 79 E-mail: SekretariatUSBST@stat.gov.pl Internet: www.stat.gov.pl/urzedy/bialystok Krajowy

Bardziej szczegółowo

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona Badanie zależności między cechami Obserwujemy dwie cechy: X oraz Y Obiekt (X, Y ) H 0 : Cechy X oraz Y są niezależne Próba: (X 1, Y 1 ),..., (X n, Y n ) Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności

Bardziej szczegółowo

Projekt zarządzania jakością wykorzystujący STATISTICA Data Miner przynosi w voestalpine roczne oszczędności w wysokości 800 000 EUR

Projekt zarządzania jakością wykorzystujący STATISTICA Data Miner przynosi w voestalpine roczne oszczędności w wysokości 800 000 EUR Projekt zarządzania jakością wykorzystujący STATISTICA Data Miner przynosi w voestalpine roczne oszczędności w wysokości 800 000 EUR Przemysł samochodowy stawia najwyższe wymagania jakościowe w stosunku

Bardziej szczegółowo

Analiza wariancji. dr Janusz Górczyński

Analiza wariancji. dr Janusz Górczyński Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik

Bardziej szczegółowo

Wytyczne do projektów

Wytyczne do projektów Wytyczne do projektów Prognozowanie i symulacje wszystkie rodzaje studiów Politechnika Śląska Wydział Organizacji i Zarządzania w Zabrzu rok akademicki 2012/13 Wytyczne do projektów Prognozowanie i symulacje

Bardziej szczegółowo

Ubóstwo ekonomiczne w Polsce w 2014 r. (na podstawie badania budżetów gospodarstw domowych)

Ubóstwo ekonomiczne w Polsce w 2014 r. (na podstawie badania budżetów gospodarstw domowych) 015 GŁÓWNY URZĄD STATYSTYCZNY Opracowanie sygnalne Warszawa, 9.06.2015 r. Ubóstwo ekonomiczne w Polsce w 2014 r. (na podstawie badania budżetów gospodarstw domowych) Jaki był zasięg ubóstwa ekonomicznego

Bardziej szczegółowo

Statystyczną ideę szacowania wskaźników EWD dobrze ilustrują dwa poniższe wykresy:

Statystyczną ideę szacowania wskaźników EWD dobrze ilustrują dwa poniższe wykresy: 1 Metoda EWD (edukacyjna wartość dodana) to zestaw technik statystycznych pozwalających zmierzyć wkład szkoły w wyniki nauczania. By można ją zastosować, potrzebujemy wyników przynajmniej dwóch pomiarów

Bardziej szczegółowo

Sprawozdanie z działalności Miejskiego Urzędu Pracy w Lublinie - I półrocze 2011 r. -

Sprawozdanie z działalności Miejskiego Urzędu Pracy w Lublinie - I półrocze 2011 r. - Miejski Urząd Pracy w Lublinie ul. Niecała 14, 20-080 Lublin www.mup.lublin.pl Sprawozdanie z działalności Miejskiego Urzędu Pracy w Lublinie - I półrocze 2011 r. - Lublin, wrzesień 2011 Spis treści 1.

Bardziej szczegółowo

URZĄD STATYSTYCZNY W KRAKOWIE

URZĄD STATYSTYCZNY W KRAKOWIE POLSKA URZĄD STATYSTYCZNY W KRAKOWIE 31-223 Kraków, ul. Kazimierza Wyki 3 e-mail:sekretariatuskrk@stat.gov.pl tel. 12 415 60 11 Internet: http://krakow.stat.gov.pl Informacja sygnalna Nr 13 Data opracowania

Bardziej szczegółowo

URZĄD STATYSTYCZNY W KRAKOWIE

URZĄD STATYSTYCZNY W KRAKOWIE URZĄD STATYSTYCZNY W KRAKOWIE 31-223 Kraków, ul. Kazimierza Wyki 3 e-mail:sekretariatuskrk@stat.gov.pl tel. 012 415 38 84 Internet: http://www.stat.gov.pl/krak Informacja sygnalna - Nr 19 Data opracowania

Bardziej szczegółowo

Główny Urząd Statystyczny

Główny Urząd Statystyczny Główny Urząd Statystyczny Urząd Statystyczny w Krakowie Opracowanie sygnalne Ośrodek Statystyki Kultury Kraków, wrzesień 2011 r. Wydatki na kulturę w 2010 r. Niniejsza informacja prezentuje wydatki poniesione

Bardziej szczegółowo

Statystyczne metody analizy danych

Statystyczne metody analizy danych Statystyczne metody analizy danych Statystyka opisowa Wykład I-III Agnieszka Nowak - Brzezińska Definicje Statystyka (ang.statistics) - to nauka zajmująca się zbieraniem, prezentowaniem i analizowaniem

Bardziej szczegółowo

Raport dla szkoły Z BADANIA PODŁUŻNEGO W SZKOŁACH PODSTAWOWYCH. Efektywność nauczania na I etapie edukacyjnym

Raport dla szkoły Z BADANIA PODŁUŻNEGO W SZKOŁACH PODSTAWOWYCH. Efektywność nauczania na I etapie edukacyjnym ͳ Raport dla szkoły Z BADANIA PODŁUŻNEGO W SZKOŁACH PODSTAWOWYCH Efektywność nauczania na I etapie edukacyjnym Dane szkoły Nr identyfikacyjny: Nazwa szkoły: Miejscowość: Adres: Instytut Badań Edukacyjnych

Bardziej szczegółowo

Przykład 1 ceny mieszkań

Przykład 1 ceny mieszkań Przykład ceny mieszkań Przykład ceny mieszkań Model ekonometryczny zaleŝności ceny mieszkań od metraŝu - naleŝy do klasy modeli nieliniowych. - weryfikację empiryczną modelu przeprowadzono na przykładzie

Bardziej szczegółowo

OTWARTE FUNDUSZE EMERYTALNE W POLSCE Struktura funduszy emerytalnych pod względem liczby członków oraz wielkości aktywów

OTWARTE FUNDUSZE EMERYTALNE W POLSCE Struktura funduszy emerytalnych pod względem liczby członków oraz wielkości aktywów OTWARTE FUNDUSZE EMERYTALNE W POLSCE Struktura funduszy emerytalnych pod względem liczby członków oraz wielkości aktywów Tomasz Gruszczyk Informatyka i Ekonometria I rok, nr indeksu: 156012 Sopot, styczeń

Bardziej szczegółowo

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Zadanie Zbadano satysfakcję z życia w skali 1 do 10 w dwóch grupach rodziców: a) Rodzice dzieci zdrowych oraz b) Rodzice dzieci z niepełnosprawnością

Bardziej szczegółowo

(x j x)(y j ȳ) r xy =

(x j x)(y j ȳ) r xy = KORELACJA. WSPÓŁCZYNNIKI KORELACJI Gdy w badaniu mamy kilka cech, często interesujemy się stopniem powiązania tych cech między sobą. Pod słowem korelacja rozumiemy współzależność. Mówimy np. o korelacji

Bardziej szczegółowo

Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu dla odczytu Australia Employment Change

Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu dla odczytu Australia Employment Change Raport 4/2015 Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu dla odczytu Australia Employment Change autor: Michał Osmoła INIME Instytut nauk informatycznych i matematycznych

Bardziej szczegółowo

MAZOWIECKI RYNEK PRACY IV KWARTAŁ 2014 IV KWARTAŁ 2014 NAJWAŻNIEJSZE INFORMACJE

MAZOWIECKI RYNEK PRACY IV KWARTAŁ 2014 IV KWARTAŁ 2014 NAJWAŻNIEJSZE INFORMACJE MAZOWIECKI RYNEK PRACY IV KWARTAŁ 2014 IV KWARTAŁ 2014 NAJWAŻNIEJSZE INFORMACJE Na Mazowszu nie pracowało 42,4% ludności w wieku 15 lat i więcej co oznacza poprawę sytuacji w ujęciu rocznym. W województwie

Bardziej szczegółowo

Metoda Johansena objaśnienia i przykłady

Metoda Johansena objaśnienia i przykłady Metoda Johansena objaśnienia i przykłady Model wektorowej autoregresji rzędu p, VAR(p), ma postad gdzie oznacza wektor zmiennych endogenicznych modelu. Model VAR jest stabilny, jeżeli dla, tzn. wielomian

Bardziej szczegółowo

Weryfikacja hipotez. Etap I. Formułowanie hipotezy zerowej H 0 oraz związanej z nią hipotezy alternatywnej H 1.

Weryfikacja hipotez. Etap I. Formułowanie hipotezy zerowej H 0 oraz związanej z nią hipotezy alternatywnej H 1. Weryfikacja hipotez Każde badanie naukowe rozpoczyna się od sformułowania problemu badawczego oraz najbardziej prawdopodobnego (na gruncie wiedzy badającego) ogólnego rozwiązania, czyli hipotezy badawczej.

Bardziej szczegółowo

ZASOBY MIESZKANIOWE W WOJEWÓDZTWIE MAŁOPOLSKIM W 2006 R.

ZASOBY MIESZKANIOWE W WOJEWÓDZTWIE MAŁOPOLSKIM W 2006 R. URZĄD STATYSTYCZNY W KRAKOWIE Informacja sygnalna Data opracowania - wrzesień 2007 r. Kontakt: e-mail:sekretariatuskrk@stat.gov.pl tel. 012 415 38 84 Internet: http://www.stat.gov.pl/urzedy/krak Nr 19

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo