Wykład 7. Opis współzaleŝności zjawisk. 1. Wprowadzenie.

Podobne dokumenty
Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38

Analiza współzależności zjawisk

KURS STATYSTYKA. Lekcja 5 Analiza współzależności ZADANIE DOMOWE. Strona 1

Statystyka. Wykład 7. Magdalena Alama-Bućko. 3 kwietnia Magdalena Alama-Bućko Statystyka 3 kwietnia / 36

Analiza Współzależności

Analiza współzależności dwóch cech I

Wprowadzenie do analizy korelacji i regresji

Statystyka. Wykład 6. Magdalena Alama-Bućko. 9 kwietnia Magdalena Alama-Bućko Statystyka 9 kwietnia / 36

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

Wykład Prezentacja materiału statystycznego. 2. Rodzaje szeregów statystycznych.

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Wielkość dziennego obrotu w tys. zł. (y) Liczba ekspedientek (x) ,5 6,6

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Statystyka matematyczna dla kierunku Rolnictwo w SGGW. BADANIE WSPÓŁZALEśNOŚCI DWÓCH CECH. ANALIZA KORELACJI PROSTEJ.

POLITECHNIKA OPOLSKA

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

4.2. Statystyczne opracowanie zebranego materiału

REGRESJA (postać liniowa funkcji) - ROZWIĄZANIA Komentarze kursywą, rozwiązania oraz treści zadań pismem prostym.

Imię, nazwisko i tytuł/stopień KOORDYNATORA (-ÓW) kursu/przedmiotu zatwierdzającego protokoły w systemie USOS Jacek Marcinkiewicz, mgr

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Próba własności i parametry

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Statystyka opisowa SYLABUS A. Informacje ogólne

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Egzamin ze Statystyki, Studia Licencjackie Stacjonarne czerwiec 2007 Temat A

Rozkłady zmiennych losowych

Statystyka SYLABUS A. Informacje ogólne

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski wersja /13:40

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

Regresja i Korelacja

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

Statystyka. Wykład 9. Magdalena Alama-Bućko. 7 maja Magdalena Alama-Bućko Statystyka 7 maja / 40

Wykład 5. Opis struktury zbiorowości. 1. Miary asymetrii.

X WYKŁAD STATYSTYKA. 14/05/2014 B8 sala 0.10B Godz. 15:15

Współczynniki korelacji czastkowej i wielorakiej STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 18 listopada 2017

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Zarządzanie ryzykiem. Opracował: Dr inŝ. Tomasz Zieliński

Rozdział 8. Regresja. Definiowanie modelu

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

ANALIZA DWUZMIENNOWA. czyli ABC KOREALCJI

Typowe błędy w analizie rynku nieruchomości przy uŝyciu metod statystycznych

Statystyka i Analiza Danych

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Podstawy statystyki - ćwiczenia r.

(x j x)(y j ȳ) r xy =

Miary statystyczne w badaniach pedagogicznych

ELEMENTY STATYSTYKI 1. DANE

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Policealna Szkoła Handlowa Rok I Wymiar godzin: 30 jednostek dydaktycznych Nr programu nauczania: 341(06)/SP/MEN/ (technik rachunkowości)

METODY STATYSTYCZNE W BIOLOGII

Budowanie macierzy danych geograficznych Procedura normalizacji Budowanie wskaźnika syntetycznego

Załącznik Nr 1 KARTA PRZEDMIOTU. 1. NAZWA PRZEDMIOTU: Elementy statystyki i demografii. 2. KIERUNEK: Pedagogika. 3. POZIOM STUDIÓW: I stopień

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

WYKRESY SPORZĄDZANE W UKŁADZIE WSPÓŁRZĘDNYCH:

WYŻSZA SZKOŁA MENEDŻERSKA W WARSZAWIE WYDZIAŁ ZARZĄDZANIA W CIECHANOWIE KARTA PRZEDMIOTU - SYLABUS

Graficzna prezentacja danych statystycznych

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

SPRAWDZIAN NR 2 ROBERT KOPERCZAK, ID studenta : k4342

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

STATYSTYKA MATEMATYCZNA

Badanie zależności skala nominalna

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Analiza współzależności dwóch cech II

Zawartość. Zawartość

Statystyka i analiza danych pomiarowych Podstawowe pojęcia statystyki cz. 2. Tadeusz M. Molenda Instytut Fizyki, Uniwersytet Szczeciński

STATYSTYKA MATEMATYCZNA, LISTA 3

Technikum Ekonomiczne Klasa II Wymiar godzin: 2 godziny tygodniowo Nr programu nauczania: 2302/T-5/SP/MEN/ (technik ekonomista)

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła

W1. Wprowadzenie. Statystyka opisowa

TREŚCI NAUCZANIA z przedmiotu pracowania ekonomiczno - informatyczna na podstawie programu nr 341[02]/MEN/ klasa 3 TE

Badania marketingowe 2016_12. Krzysztof Cybulski Katedra Marketingu Wydział Zarządzania Uniwersytet Warszawski

Prognoza sprawozdania finansowego Bilans

Obliczanie wartości średniej i odchylenia standardowego średniej w programie Origin

STATYSTYKA. dr Agnieszka Figaj

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

Wprowadzenie do technik analitycznych Metoda najmniejszych kwadratów

Statystyka matematyczna i ekonometria

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Doświadczalnictwo leśne. Wydział Leśny SGGW Studia II stopnia

Wyznacz łączne zmiany wartości, ilości i cen sprzedaży w październiku i listopadzie oraz zinterpretuj otrzymane wyniki.

Transkrypt:

Wykład 7. Opis współzaleŝności zjawisk 1. Wprowadzenie. 2. Prezentacja materiału statystycznego.

Rodzaje współzaleŝności zjawisk 1. WspółzaleŜność funkcyjna określonym wartościom jednej zmiennej jest ściśle przyporządkowana jedna odmiana drugiej zmiennej. 2. WspółzaleŜność stochastyczna określonym wartościom jednej zmiennej jest przyporządkowanych wiele odmian drugiej zmiennej.

3. WspółzaleŜność korelacyjna określonym wartościom jednej zmiennej odpowiadają ściśle określone średnie wartości drugiej zmiennej. Przykład współzaleŝności funkcyjnej X powierzchnia glazury w m² Y wynagrodzenie w zł 1 50 2 100 3 150 Całkowite wynagrodzenie za pracę Y=50X.

Przykład współzaleŝności stochastycznej X miesięczna produkcja cukru (w tonach) 10 17 Y koszty stałe (w tys. zł) 122 90 107 213 256 141 216 Koszty stałe są uzaleŝnione nie tylko od wielkości produkcji, ale takŝe, np.: od wynagrodzenia członków zarządu,, amortyzacji, lokalizacji cukrowni, itd.

Przykład współzaleŝności korelacyjnej X wykształcenie podstawowe 1326 średnie 1913 wyŝsze 2289 Y średnie wynagrodzenie miesięczne (w zł) ZauwaŜmy, Ŝe jeŝeli mamy do czynienia z zaleŝnością korelacyjną, to jest ona zawsze i stochastyczna. Nie zawsze jest jednak na odwrót, tzn. jeśli istnieje współzaleŝność stochastyczna, to i korelacyjna. Oto przykład:

WspółzaleŜność stochastyczna X - płeć Y ocena z egzaminu męŝczyźni 3,5 4 3 Brak współzaleŝności korelacyjnej X- płeć Y średnia ocena z egzaminu męŝczyźni 3,5 kobiety 4 5 kobiety 3,5 3 2

Podejścia w analizie współzaleŝności zjawisk: 1. Jakościowe określa związki przyczynowo skutkowe między zmiennymi. WspółzaleŜność dwustronna przyczyna skutek skutek przyczyna X Y X kwoty wydawane na reklamę, Y przychody.

WspółzaleŜność jednostronna przyczyna skutek X Y X wiek, Y staŝ pracy. WspółzaleŜność pozorna X Y Z X wielkość strat po przejściu huraganu, Y liczba osób usuwających skutki huraganu, Z moc huraganu.

2. Ilościowe: Analiza korelacji określa siłę i kierunek zaleŝności między badanymi cechami; Analiza regresji słuŝy do badania mechanizmu powiązań między cechami, którego wyrazem jest funkcja regresji.

Prezentacja materiału statystycznego szereg korelacyjny x i x 1 y i y 1 x 2 x n n M i= 1 x i y 2 M y n n i= 1 y i

diagramy korelacyjne y y x x brak koleracji korelacja liniowa dodatnia

y y x korelacja liniowa ujemna korelacja krzywoliniowa x

tablica korelacyjna jest to tablica skonstruowana w ten sposób, iŝ w poszczególnych wierszach podajemy warianty cechy X, natomiast w kolumnach warianty cechy Y.

x i x 1 x 2 y j y1 y2 n11 n12 n 21 n22 y l n 1l n 2l n i n ij = l n 1 n 2 j= 1 x k nk1 n k 2 n kl n k n k j = n ij i= 1 n 1 n 2 n l n

Przykład Mamy następujący szereg korelacyjny obrazujący zaleŝność między liczbą reklamacji X a tygodniowymi obrotami sklepów obuwniczych Y (w tys. zł): x i 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 y j 1,5 4,5 6,9 8,3 11, 2 6,2 6,3 7,4 8,7 9,6 9,9 10, 4 11, 2 13, 0 18, 9 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 11, 7 12, 0 13, 2 14, 6 15, 2 16, 3 17, 0 19, 6 19, 9 22, 5 25, 6 26, 3 26, 7 28, 2 29, 7

4 4 4 4 4 4 4 4 4 4 10,4 11,0 12,3 13,3 15,6 18,6 20,0 21,1 21,4 22,7 4 4 4 4 4 4 4 4 4 4 22,9 24,0 24,5 25,0 25,7 27,2 27,4 28,7 28,9 29,8 Zbudujemy na ich podstawie tablicę korelacyjną i omówimy, jakich obliczeń i obserwacji moŝemy dokonać na jej podstawie.

Tablica korelacyjna liczby reklamacji X i obrotów sklepów Y wygląda następująco: x i y j [0 10) 5 [10 20) 15 [20 30) 25 n i 1 4 1-5 2 6 4-10 3-9 6 15 4-6 14 20 n j 10 20 20 50

W tablicy korelacyjnej są zawarte dwa rodzaje rozkładów: rozkłady brzegowe i rozkłady warunkowe. Rozkład brzegowy przedstawia strukturę jednej cechy bez względu na kształtowanie się drugiej z nich. W powyŝszej tablicy występują dwa rozkłady brzegowe (w ostatniej kolumnie i ostatnim wierszu), odpowiednio dla cechy X i Y. Chcąc je opisać moŝemy posłuŝyć się parametrami średnią arytmetyczną i wariancją (lub odchyleniem standardowym).

Dla naszego przykładu średnia liczba reklamacji (niezaleŝnie od wielkości obrotów) wyniosła 3 reklamacje, zaś wariancja 1,02 reklamacji². Obliczając pierwiastek z wariancji otrzymujemy odchylenie standardowe, które wynosi 1,01 reklamacji i oznacza, Ŝee we wszystkich analizowanych sklepach liczba reklamacji róŝniła się os średniej liczby reklamacji o 1,01 reklamacji. Natomiast średnie obroty wszystkich sklepów (niezaleŝnie od liczby złoŝonych reklamacji)

wyniosły 17 tys. zł z wariancją 57,14 tys. zł², czyli odchylały się od średnich obrotów średnio o 7,56 tys. zł. Rozkłady warunkowe prezentują strukturę jednej cechy przy nałoŝonym warunku na druga z nich. Mamy zatem 3 rozkłady warunkowe liczby reklamacji (tyle było odmian wielkości obrotów) i 4 rozkłady warunkowe obrotów (tyle było odmian liczby reklamacji). Wartości ich poszczególnych parametrów przedstawiają następujące tabelki:

xi y j 2 S y 5 15 25 j y j 1 7 20,00 xi 1,6 3,0 3,7 2 9 26,67 3 19 25,71 2 S xi 0,27 0,74 0,22 4 22 22,11

Na podstawie ustalonych średnich warunkowych moŝna określić kształt oraz siłę i (niekiedy) kierunek związku. SłuŜy temu tzw. wykres regresji empirycznej. W układzie współrzędnych nanosimy punkty przyporządkowujące średnie warunkowe jednej zmiennej przy kolejnych warunkach kształtowania się drugiej z nich i łączymy je linią łąmaną.

Skrajne przypadki kształtowania się regresji empirycznej:

Dla naszego przykładu wykres wygląda następująco: