Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

Podobne dokumenty
Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

PDF created with FinePrint pdffactory Pro trial version

POLITECHNIKA OPOLSKA

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

Ćwiczenie: Weryfikacja hipotez statystycznych dla jednej i dwóch średnich.

WYKŁAD 8 ANALIZA REGRESJI

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ

Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI

Analiza korelacji

Rozdział 8. Regresja. Definiowanie modelu

Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Wprowadzenie do analizy korelacji i regresji

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

MODELE LINIOWE. Dr Wioleta Drobik

Analiza autokorelacji

X WYKŁAD STATYSTYKA. 14/05/2014 B8 sala 0.10B Godz. 15:15

ANALIZA KORELACJI Korelacja między zmiennymi X i Y jest miarą siły liniowego związku między tymi zmiennymi.

Regresja i Korelacja

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Korelacja krzywoliniowa i współzależność cech niemierzalnych

KORELACJE I REGRESJA LINIOWA

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Spis treści. LaboratoriumV: Podstawy korelacji i regresji. Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych

ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

ANALIZA REGRESJI SPSS

Metodologia badań psychologicznych. Wykład 12. Korelacje

1. Eliminuje się ze zbioru potencjalnych zmiennych te zmienne dla których korelacja ze zmienną objaśnianą jest mniejsza od krytycznej:

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

Badanie normalności rozkładu

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna

Pojęcie korelacji. Korelacja (współzależność cech) określa wzajemne powiązania pomiędzy wybranymi zmiennymi.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38

Co to jest analiza regresji?

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

Kilka uwag o testowaniu istotności współczynnika korelacji

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Analiza współzależności zjawisk

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA

Statystyka. Wykład 9. Magdalena Alama-Bućko. 7 maja Magdalena Alama-Bućko Statystyka 7 maja / 40

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

Katedra Biotechnologii i Genetyki Zwierząt, Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Dopasowanie prostej do wyników pomiarów.

CECHOWANIE TERMOELEMENTU Fe-Mo I WYZNACZANIE PUNKTU INWERSJI

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

METODY STATYSTYCZNE W BIOLOGII

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Zagadnienie 1: Prognozowanie za pomocą modeli liniowych i kwadratowych przy wykorzystaniu Analizy regresji wielorakiej w programie STATISTICA

Projekt okładki: Aleksandra Olszewska. Redakcja: Leszek Plak. Copyright: Wydawnictwo Placet Wydanie ebook. Wydawca

Analiza współzależności dwóch cech I

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

5. Model sezonowości i autoregresji zmiennej prognozowanej

Regresja logistyczna (LOGISTIC)

Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Badanie zależności skala nominalna

Wykresy. Informatyka Arkusz kalkulacyjny Excel dla WINDOWS. Excel. cz.4. Wykresy. Wykresy. Wykresy. Wykresy

STATYSTYKA MATEMATYCZNA

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Wprowadzenie do analizy dyskryminacyjnej

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Sposoby prezentacji problemów w statystyce

REGRESJA (postać liniowa funkcji) - ROZWIĄZANIA Komentarze kursywą, rozwiązania oraz treści zadań pismem prostym.

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Ćwiczenie: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka opisowa w SAS Enterprise Guide.

JAK PROSTO I SKUTECZNIE WYKORZYSTAĆ ARKUSZ KALKULACYJNY DO OBLICZENIA PARAMETRÓW PROSTEJ METODĄ NAJMNIEJSZYCH KWADRATÓW

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

Ekonometria. Weryfikacja modelu. Paweł Cibis 12 maja 2007

Analiza regresji - weryfikacja założeń

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Jak korzystać z Excela?

R-PEARSONA Zależność liniowa

Transkrypt:

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Stanisza r xy = 0 zmienne nie są skorelowane 0 < r xy 0,1 korelacja nikła 0,1 < r xy 0,3 korelacja słaba 0,3 r xy 0,5 korelacja przeciętna 0,5 r xy 0,7 korelacja wysoka 0,7 r xy 0,9 korelacja bardzo wysoka 0,9 r xy 1 korelacja prawie pewna Skala Guillforda Przedział Zależność Współczynnik 0,00±0,20 Słaba Prawie nic nieznaczący ±0,20±040 Niska Wyraźna, ale słaba ±0,40±0,70 Umiarkowana Rzeczywisty ±0,70±0,90 Wysoka Znaczny ±0,90±1,00 Bardzo wysoka Pewny Istotność korelacji - weryfikacja hipotezy o niezależności cech. Polega ona na obliczeniu t 0 i porównaniu go z t tab (ale w odniesieniu do prób mniejszych od 122 - n < 122, w przeciwnym wypadku stosujemy test z) t0 = rxy * n 2 n z0 = rxy * 2 2 1 r 1 r xy t tab odczytujemy z tabeli testu t dla poziomu istotności 0,05 i 0,01 oraz dla liczby stopni swobody równej n-2. Jeżeli t 0 > t tab to korelacja jest istotna statystycznie. Jeżeli t 0 < t tab to korelacja jest nieistotna statystycznie. Istotność korelacji jest liczona po to, aby sprawdzić czy zależność jaką stwierdzono w próbie będzie miała miejsce również w populacji, z której próba ta pochodzi. Funkcje pozwalające obliczyć współczynnik korelacji i regresji: =wsp.korelacji(x2:x100;y2:y100) współczynnik korelacji =nachylenie(y2:y100;x2:x100) współczynnik regresji {=NACHYLENIE(znane_y ; znane_x ) Znane_y jest to tablica lub zakres komórek liczbowych zależnych punktów danych. Znane_x jest to zbiór niezależnych punktów danych.} Jak sporządzić wykres? 1. Zaznaczyć zmienne do analizy 2.Wybrać ikonę kreator wykresów z paska narzędzi (ikona, na której znajduje się wykres) 3. Zaznaczyć obszar arkusza, na którym ma się znaleźć wykres 4. Nacisnąć przycisk DALEJ 5. Wybrać typ wykresu - Punktowy 6. Wybrać format wykresu same punkty 7. Przycisk DALEJ 8. Wpisać tytuł wykresu, osi X i Y Do wpisywanych formuł wygodnie jest wprowadzić adresy bezwzględne komórek, co umożliwia kopiowania (w prawo). xy Statystyka i modelowanie w ochronie środowiska Strona 1

ZADANIE EXCEL: I. 1. Wykonaj wykres rozrzutu dla zmiennych: wzrost oraz długość stopy (stopy2009z.xls). Jaki charakter ma zależność między tymi zmiennymi? 2. Oblicz współczynnik korelacji pomiędzy wzrostem oraz długością stopy. Sprawdź czy jest to współczynnik istotny. 3. Oblicz współczynniki regresji między wzrostem i stopą. Załóż, że długość stopy jest zmienną zależną! 4. Do sporządzonego wykresu rozrzutu dołącz równanie regresji liniowej. Czy jest ono dobrze dopasowane do punktów w układzie współrzędnych? R-Square, R 2 (współczynnik determinacji) informacja o tym, w jakim stopniu równanie regresji wyjaśnia zmienność zmiennej zależnej. To jest inaczej kwadrat współczynnika korelacji. 2 y R 2 2 p przyjmuje wartości od 0 do 1 (0-100%). R = 2 y II. Wykonaj podobną analizę, jeśli chodzi o długość i masę jaj (jajasrok.xls) [załóżmy, że długość jaja to zmienna niezależna, zaś masa jaja zmienna zależna]. ZADANIE STATISTICA: 1. Sprawdź, które z wymiarów ciała są najsilniej związane z masą ciała kretów? Skonstruuj model regresji wielokrotnej, który zawierać będzie trzy zmienne najlepiej wyjaśniające zmienność masy ciała kretów (S:\~\bazyXLS\KRET.XLS). Obliczanie korelacji Statystyka i modelowanie w ochronie środowiska Strona 2

Statystyka i modelowanie w ochronie środowiska Strona 3

Stwierdzono, że wszystkie obliczone współczynniki korelacji prostoliniowej między masą ciała zwierząt a wymiarami ciała były wysoko istotne. Bardzo wysoką zależność zarejestrowano między długością i szerokością tułowia a masą zwierząt. Wysoką zależność stwierdzono między szerokością dłoni a masą ciała. Statystyka i modelowanie w ochronie środowiska Strona 4

Inny sposób obliczenia korelacji Na podstawie uzyskanych wyników podaj wartości współczynnika korelacji oraz skonstruuj równania regresji dla badanych zmiennych. Statystyka i modelowanie w ochronie środowiska Strona 5

Analiza regresji wielokrotnej krokowej postępującej Statystyka i modelowanie w ochronie środowiska Strona 6

2. Zbadaj zależność między różnymi rodzajami drobnoustrojów w ściekach o różnym pochodzeniu. 3. Jakiego rodzaju zależność istnieje między stężeniem pyłu a dwutlenku siarki? WYKRESY Podaj, jaki rodzaj wykresów rozrzutu i dla jakich cech przedstawiono poniżej. Podobne wykresy wykonaj samodzielne w programie Statistica. Wykres 1 Statystyka i modelowanie w ochronie środowiska Strona 7

Wykres 2 Wykres 3 Statystyka i modelowanie w ochronie środowiska Strona 8