Analiza współzależności zjawisk

Podobne dokumenty
Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Analiza Współzależności

Teoretyczne podstawy analizy indeksowej klasyfikacja indeksów, konstrukcja, zastosowanie

Statystyka. Wykład 7. Magdalena Alama-Bućko. 3 kwietnia Magdalena Alama-Bućko Statystyka 3 kwietnia / 36

Statystyka. Wykład 9. Magdalena Alama-Bućko. 7 maja Magdalena Alama-Bućko Statystyka 7 maja / 40

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38

Analiza współzależności dwóch cech I

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Rozdział 8. Regresja. Definiowanie modelu

Korelacja krzywoliniowa i współzależność cech niemierzalnych

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Statystyka. Wykład 10. Magdalena Alama-Bućko. 14 maja Magdalena Alama-Bućko Statystyka 14 maja / 31

Regresja i Korelacja

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

Na poprzednim wykładzie omówiliśmy podstawowe zagadnienia. związane z badaniem dynami zjawisk. Dzisiaj dokładniej zagłębimy

OTWARTE FUNDUSZE EMERYTALNE W POLSCE Struktura funduszy emerytalnych pod względem liczby członków oraz wielkości aktywów

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Wprowadzenie do analizy korelacji i regresji

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

PDF created with FinePrint pdffactory Pro trial version

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

JEDNORÓWNANIOWY LINIOWY MODEL EKONOMETRYCZNY

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007

KORELACJE I REGRESJA LINIOWA

3. Modele tendencji czasowej w prognozowaniu

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

Statystyka opisowa Opracował: dr hab. Eugeniusz Gatnar, prof. WSBiF

Analiza szeregów czasowych

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2015/2016

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 23 marca 2006

Analiza dynamiki zjawisk STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 28 września 2018

Analiza Zmian w czasie

WYŻSZA SZKOŁA MENEDŻERSKA W WARSZAWIE WYDZIAŁ ZARZĄDZANIA W CIECHANOWIE KARTA PRZEDMIOTU - SYLABUS

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Statystyka. Wykład 6. Magdalena Alama-Bućko. 9 kwietnia Magdalena Alama-Bućko Statystyka 9 kwietnia / 36

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

MODELE LINIOWE. Dr Wioleta Drobik

Statystyka. Wykład 11. Magdalena Alama-Bućko. 21 maja Magdalena Alama-Bućko Statystyka 21 maja / 31

Statystyka. Wykład 10. Magdalena Alama-Bućko. 15 maja Magdalena Alama-Bućko Statystyka 15 maja / 32

Wprowadzenie do technik analitycznych Metoda najmniejszych kwadratów

Wykład 7. Opis współzaleŝności zjawisk. 1. Wprowadzenie.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Statystyka. Wykład 11. Magdalena Alama-Bućko. 22 maja Magdalena Alama-Bućko Statystyka 22 maja / 41

Wskaźnik asymetrii Jeżeli: rozkład jest symetryczny, to = 0, rozkład jest asymetryczny lewostronnie, to < 0. Kwartylowy wskaźnik asymetrii

Metodologia badań psychologicznych. Wykład 12. Korelacje

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Analiza współzależności dwóch cech II

Zawartość. Zawartość

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

e) Oszacuj parametry modelu za pomocą MNK. Zapisz postać modelu po oszacowaniu wraz z błędami szacunku.

Statystyka opisowa SYLABUS A. Informacje ogólne

Stanisław Cichocki. Natalia Nehrebecka. Wykład 4

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

X WYKŁAD STATYSTYKA. 14/05/2014 B8 sala 0.10B Godz. 15:15

Miary asymetrii STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

4.2. Statystyczne opracowanie zebranego materiału

Współczynniki korelacji czastkowej i wielorakiej STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 18 listopada 2017

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ

Imię, nazwisko i tytuł/stopień KOORDYNATORA (-ÓW) kursu/przedmiotu zatwierdzającego protokoły w systemie USOS Jacek Marcinkiewicz, mgr

W1. Wprowadzenie. Statystyka opisowa

REGRESJA (postać liniowa funkcji) - ROZWIĄZANIA Komentarze kursywą, rozwiązania oraz treści zadań pismem prostym.

Statystyka matematyczna i ekonometria

Pojęcie korelacji. Korelacja (współzależność cech) określa wzajemne powiązania pomiędzy wybranymi zmiennymi.

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna

Metoda najmniejszych kwadratów

Przedmiotowe Zasady Oceniania III LO w Łomży. Statystyka. Klasa II-III

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

MATEMATYKA3 Mathematics3. Elektrotechnika. I stopień ogólnoakademicki. studia stacjonarne. Katedra Matematyki dr Zdzisław Piasta

Egzamin ze statystyki, Studia Licencjackie Stacjonarne. TEMAT C grupa 1 Czerwiec 2007

Zajęcia 1. Statystyki opisowe

PRZEWODNIK PO PRZEDMIOCIE. Statystyka opisowa. Zarządzanie. niestacjonarne. I stopnia. dr Agnieszka Strzelecka. ogólnoakademicki.

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Badanie zależności skala nominalna

Z-0033z Statystyka. Zarządzanie i Inżynieria Produkcji I stopień Ogólnoakademicki. Stacjonarne Wszystkie Katedra Matematyki dr Zdzisław Piasta

5. Model sezonowości i autoregresji zmiennej prognozowanej

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

ANALIZA REGRESJI SPSS

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

czerwiec 2013 Uwaga: Przy rozwiązywaniu zadań, jeśli to konieczne, należy przyjąć poziom istotności 0,1 i współczynnik ufności 0,90

Transkrypt:

Analiza współzależności zjawisk Informacje ogólne Jednostki tworzące zbiorowość statystyczną charakteryzowane są zazwyczaj za pomocą wielu cech zmiennych, które nierzadko pozostają ze sobą w pewnym związku. Określenie siły, kierunku oraz kształtu tego związku możliwe jest dzięki analizie współzależności zjawisk. Zakres analizy współzależności zjawisk: analiza korelacji, analiza regresji. Analiza korelacji Analiza korelacji pozwala określić siłę zależności między zmiennymi, a w przypadku zależności liniowej dwóch zmiennych także kierunek tej zależności. Siłę związku między zmiennymi określa się za pomocą szeregu miar, których wybór zależy od tego, czy zmienne mają charakter mierzalny, czy też niemierzalny. W pierwszym przypadku można wykorzystać współczynnik korelacji liniowej Pearsona, natomiast w drugim m. in. skorygowany współczynnik kontyngencji, współczynnik Czuprowa i współczynnik zbieżności V-Cramera.

Współczynnik korelacji liniowej Pearsona Współczynnik korelacji Pearsona określa kierunek i siłę zależności dwóch zmiennych mierzalnych. Przyjmuje on wartości z przedziału < 1; 1>, przy czym im jego wartość jest bliższa 1 lub 1, tym zależność jest silniejsza, a im bliższa 0, tym zależność jest słabsza. Gdzie s(x), s(y) oznaczają odchylenia standardowe zmiennych X oraz Y odpowiednio x y oznaczają średni z tych zmiennych. Własności współczynnika korelacji liniowej Pearsona: r xy 0, gdy brak współzależności, r xy 1, gdy zależność funkcyjna (korelacja doskonała), 1 r xy 0, gdy korelacja ujemna, tzn. wraz ze wzrostem wartości jednej zmiennej maleją wartości drugiej zmiennej, i odwrotnie, 0 r xy 1, gdy korelacja dodatnia, tzn. wraz ze wzrostem wartości jednej zmiennej rosną wartości drugiej zmiennej, i odwrotnie, r xy 0,3, gdy korelacja niewyraźna, 0,3 r xy 0,5, gdy korelacja średnia, r xy 0,5, gdy korelacja wyraźna.

Korelacja cech jakościowych Siłę zależności między zmiennymi niemierzalnymi można określić za pomocą skorygowanego współczynnika kontyngencji, współczynnika Czuprowa lub współczynnika zbieżności V-Cramera, które w swej konstrukcji opierają się na teście niezależności chi-kwadrat16. Współczynniki te przyjmują wartości z przedziału <0; 1>, przy czym ich wartość bliższa 1 oznacza, że zależność jest silniejsza, natomiast wartość bliższa 0 informuje o słabszej zależności. r liczba wierszy w tablicy wielodzielczej, k liczba kolumn w tablicy wielodzielczej, n liczebność próby, n ij liczba jednostek na przecięciu i-tego wiersza i j-tej kolumny tablicy wielodzielczej (liczebność empiryczna),

n ij liczebność teoretyczna, Analiza regresji Rozkład punktów na diagramie korelacyjnym wskazuje, czy między zmiennymi występuje związek, a jeśli tak, to umożliwia wybór typu funkcji, której wykres najlepiej opisywałaby ten związek. Jeżeli zależność ma charakter liniowy, to wówczas funkcje regresji przyjmują postać ŷ=b y x+a y lub x=b x y+a x Parametry powyższych funkcji można oszacować posługując się metodą najmniejszych kwadratów. Pozwala ona znaleźć takie współczynniki równań regresji, aby suma kwadratów odchyleń poszczególnych wartości empirycznych od wartości teoretycznych zmiennej była jak najmniejsza

Powyższe wyrażenia są funkcjami dwóch zmiennych a i b, więc problem sprowadza się do znalezienia minimum tych funkcji. Obliczając pochodne cząstkowe względem a i b oraz przyrównując je do zera (w celu sprawdzenia warunku koniecznego istnienia ekstremum funkcji dwóch zmiennych) otrzymujemy tzw. układ równań normalnych:

Współczynniki równań regresji można oszacować również pośrednio, wykorzystując relację między współczynnikiem korelacji linowej i odchyleniami standardowymi badanych zmiennych Ocena oszacowanej funkcji regresji Ocena oszacowanej funkcji regresji (ocena stopnia dobroci ) pozwala określić, czy funkcja regresji jest dobrze dopasowana do danych empirycznych, tzn. czy dobrze opisuje ilościową stronę zależności między badanymi zmiennymi. W celu dokonania oceny oblicza się m.in.: odchylenie standardowe składnika resztowego (błąd standardowy szacunku), które informuje, o ile średnio wartości empiryczne zmiennej odchylają się

od wartości teoretycznych obliczonych na podstawie oszacowanej funkcji regresji: współczynnik determinacji określający stopień, w jakim oszacowana funkcja regresji wyjaśnia zmienność zmiennej y lub x; współczynnik przyjmuje wartości z przedziału <0, 1>; im bliżej 1, tym oszacowana funkcja regresji jest lepiej dopasowana do danych empirycznych, i odwrotnie: R 2 =r 2 xy współczynnik zgodności, który wskazuje, jaka część zmienności zmiennej y lub x nie jest objaśniona za pomocą oszacowanej funkcji regresji; współczynnik przyjmuje wartości z przedziału <0, 1>; im bliżej 0, tym dopasowanie funkcji jest lepsze, i odwrotnie: φ 2 =1 R 2

współczynnik zmienności resztowej, który informuje, jaki odsetek poziomu zmiennej objaśnianej stanowią wahania losowe; im bliżej 0, tym dopasowanie jest lepsze: V = S y ŷ 100 Analiza dynamiki zjawisk Informacje ogólne Analiza struktury zbiorowości i analiza współzależności zjawisk pozwalają scharakteryzować zbiorowość statystyczną pod względem jednej lub kilku cech zmiennych (w izolacji lub powiązaniu), ale tylko w ujęciu statycznym. Z kolei zmiany poziomu cechy zmiennej w czasie można ocenić dzięki analizie dynamiki zjawisk. Zakres analizy dynamiki zjawisk: metody indeksowe, dekompozycja szeregu czasowego. Metody indeksowe Zmiany, jakie zaszły w poziomie i strukturze badanego zjawiska w czasie można określić za pomocą wskaźników dynamiki. W zależności od przyjętej podstawy porównań wyróżnia się: wskaźniki dynamiki o podstawie stałej (jednopodstawowe), które określają

zmiany (wzrosty, spadki), jakie nastąpiły w poziomie badanego zjawiska w kolejnych okresach (momentach) w porównaniu z okresem (momentem) podstawowym, wskaźniki dynamiki o podstawie zmiennej (łańcuchowe), które określają zmiany (wzrosty, spadki), jakie nastąpiły w poziomie badanego zjawiska w kolejnych okresach (momentach) w porównaniu z okresem (momentem) bezpośrednio poprzedzającym okres (moment) badany. Podział wskaźników dynamiki: przyrosty: absolutne, względne; indeksy dynamiki: indywidualne, agregatowe: wielkości absolutnych, wielkości stosunkowych. Przyrosty absolutne Przyrosty absolutne (bezwzględne) są wyrażone w takich samych jednostkach miary, jak badane zjawisko. W zależności od przyjętej podstawy porównań wyróżnia się: przyrosty absolutne o podstawie stałej, które określają, o ile wzrósł lub spadł

poziom badanego zjawiska w okresie badanym w porównaniu z okresem bazowym: P ab/0 =y t -y 0 gdzie: y t poziom zjawiska w badanym okresie, y 0 poziom zjawiska w okresie bazowym, jeżeli: o nastąpił spadek poziomu zjawiska, to P ab/0 < 0, o nastąpił wzrost poziomu zjawiska, to P ab/0 > 0, o zjawisko pozostało na niezmienionym poziomie, to P ab/0 = 0; przyrosty absolutne o podstawie zmiennej, które określają, o ile wzrósł lub spadł poziom badanego zjawiska w okresie badanym w porównaniu z okresem bezpośrednio poprzedzającym okres badany: P ab/t-1 =y t -y t-1 gdzie: y t poziom zjawiska w badanym okresie, y t-1 poziom zjawiska w okresie bezpośrednio poprzedzającym okres badany, jeżeli: o nastąpił spadek poziomu zjawiska, to P ab/t-1 < 0, o nastąpił wzrost poziomu zjawiska, to P ab/t-1 > 0, o zjawisko pozostało na niezmienionym poziomie, to P ab/t-1 = 0.

Przyrosty względne Przyrosty względne są wyrażone w procentach lub w postaci ułamka dziesiętnego. W zależności od przyjętej podstawy porównań wyróżnia się: przyrosty względne o podstawie stałej, które określają, o ile procent wzrósł lub spadł poziom badanego zjawiska w okresie badanym w porównaniu z okresem bazowym: gdzie: y t poziom zjawiska w badanym okresie, y 0 poziom zjawiska w okresie bazowym, jeżeli: nastąpił spadek poziomu zjawiska, to P wz/0 < 0, nastąpił wzrost poziomu zjawiska, to P wz/0 > 0, zjawisko pozostało na niezmienionym poziomie, to P wz/0 = 0; przyrosty względne o podstawie zmiennej, które określają, o ile procent wzrósł lub spadł poziom badanego zjawiska w okresie badanym w porównaniu z okresem bezpośrednio poprzedzającym okres badany:

gdzie: y t poziom zjawiska w badanym okresie, y t-1 poziom zjawiska w okresie bezpośrednio poprzedzającym okres badany, jeżeli: nastąpił spadek poziomu zjawiska, to P wz/t-1 < 0, nastąpił wzrost poziomu zjawiska, to P wz/t-1 > 0, zjawisko pozostało na niezmienionym poziomie, to P wz/t-1 = 0.