Statystyka w analizie i planowaniu eksperymentu

Podobne dokumenty
Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Stosowana Analiza Regresji

KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Regresja liniowa wprowadzenie

Model regresji wielokrotnej Wykład 14 ( ) Przykład ceny domów w Chicago

Regresja liniowa w R Piotr J. Sobczyk

Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

ANALIZA KORELACJI I REGRESJI

Regresja liniowa oraz regresja wielokrotna w zastosowaniu zadania predykcji danych. Agnieszka Nowak Brzezińska Wykład III-VI

Regresja - zadania i przykłady.

Wyk lad 3 Wielomiany i u lamki proste

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Temat zajęć: ANALIZA DANYCH ZBIORU EKSPORT. Część I: analiza regresji

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

WYK LAD 2: PODSTAWOWE STRUKTURY ALGEBRAICZNE, PIERWIASTKI WIELOMIANÓW, ROZK LAD FUNKCJI WYMIERNEJ NA U LAMKI PROSTE

Wyk lad 3. Natalia Nehrebecka Dariusz Szymański. 13 kwietnia, 2010

Statystyka w analizie i planowaniu eksperymentu

Rozdział 8. Regresja. Definiowanie modelu

WYK LAD 5: GEOMETRIA ANALITYCZNA W R 3, PROSTA I P LASZCZYZNA W PRZESTRZENI R 3

Regresja - zadania i przykłady.

Ekonometria dla IiE i MSEMat Z7

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

FUNKCJE LICZBOWE. x 1

Statystyka w analizie i planowaniu eksperymentu

Wybór formy funkcyjnej modelu (cz. II)

Wyk lad 5. Natalia Nehrebecka Stanis law Cichocki. 7 listopada 2015

Analiza współzależności zjawisk

Wprowadzenie do technik analitycznych Metoda najmniejszych kwadratów

Analiza regresji Konspekt do zaj : Statystyczne metody analizy danych

Wyk lad 9 Podpierścienie, elementy odwracalne, dzielniki zera

Regresja ważona. Co, gdy nie ma stałej wariancji? Tu prawdziwe σ 2 =1 (dużo powtórzeń, więc wariancje są dobrze oszacowane) PAR Wykład 5 1/8

Analiza Współzależności

Statystyka w analizie i planowaniu eksperymentu

Statystyka w analizie i planowaniu eksperymentu

Regresja liniowa. Etapy analizy regresji. Założenia regresji. Kodowanie zmiennych jakościowych

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

Wykład 4 Związki i zależności

KORELACJE I REGRESJA LINIOWA

Statystyka. Wykład 7. Magdalena Alama-Bućko. 3 kwietnia Magdalena Alama-Bućko Statystyka 3 kwietnia / 36

Wyk lad 7 Metoda eliminacji Gaussa. Wzory Cramera

Wyk lad 14 Cia la i ich w lasności

Przedmiot statystyki. Graficzne przedstawienie danych.

Statystyka w analizie i planowaniu eksperymentu

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38

Statystyka w analizie i planowaniu eksperymentu

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Metoda najmniejszych kwadratów

Wyk lad 12. (ii) najstarszy wspó lczynnik wielomianu f jest elementem odwracalnym w P. Dowód. Niech st(f) = n i niech a bedzie

Rozdzia l 11. Przestrzenie Euklidesowe Definicja, iloczyn skalarny i norma. iloczynem skalarnym.

MODELE LINIOWE. Dr Wioleta Drobik

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Regresja i Korelacja

DZYSZKOLNE ZAWODY MATEMATYCZNE. Eliminacje rejonowe. Czas trwania zawodów: 150 minut

PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład Przedmiot statystyki

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno

Dyskretne modele populacji

Diagnostyka modelu. Dowód [5.4] Dowód [ ]

Permutacyjna metoda oceny istotności regresji

Ogólny model liniowy

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Regresja logistyczna. Regresja logistyczna. Przykłady DV. Wymagania

Stanisław Cichocki. Natalia Nehrebecka. Wykład 4

Wyk lad 7 Baza i wymiar przestrzeni liniowej

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ

Ekonomia matematyczna i dynamiczna optymalizacja

Systemy Wspomagania Decyzji

przybliżeniema Definicja

Ćwiczenie nr 520: Metody interpolacyjne planowania ruchu manipulatorów

Wprowadzenie do analizy korelacji i regresji

Analiza zależności zmiennych ilościowych regresja

PDF created with FinePrint pdffactory Pro trial version

Metoda najmniejszych kwadratów

Wyk ad II. Stacjonarne szeregi czasowe.

Niezmienniki i pó lniezmienniki w zadaniach

BADANIE ZALEśNOŚCI CECHY Y OD CECHY X - ANALIZA REGRESJI PROSTEJ

g liczb rzeczywistych (a n ) spe lnia warunek

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA. Spis pojȩċ teoretycznych

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy

Statystyczna analiza danych w programie STATISTICA. Dariusz Gozdowski. Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW

Wzory Viete a i ich zastosowanie do uk ladów równań wielomianów symetrycznych dwóch i trzech zmiennych

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

Statystyka. Wykład 9. Magdalena Alama-Bućko. 7 maja Magdalena Alama-Bućko Statystyka 7 maja / 40

Wyk lad 9 Przekszta lcenia liniowe i ich zastosowania

Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2016/2017. Forma studiów: Stacjonarne Kod kierunku: 11.

Wyk lad 11 1 Wektory i wartości w lasne

PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH. Wykład 2 Obserwacje nietypowe i wpływowe Regresja nieliniowa

Egzamin z ekonometrii wersja IiE, MSEMAT

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Badanie zależności skala nominalna

Stanisław Cichocki. Natalia Nehrebecka

Analiza regresji. Analiza korelacji.

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

Transkrypt:

23 kwietnia 2014

Korelacja - wspó lczynnik korelacji 1 Gdy badamy różnego rodzaju rodzaju zjawiska (np. przyrodnicze) możemy stwierdzić, że na każde z nich ma wp lyw dzia lanie innych czynników;

Korelacja - wspó lczynnik korelacji 1 Gdy badamy różnego rodzaju rodzaju zjawiska (np. przyrodnicze) możemy stwierdzić, że na każde z nich ma wp lyw dzia lanie innych czynników; 2 Wydaje sie oczywiste, że badanie zwiazków pomiedzy badanymi zjawiskami jest przedmiotem badań statystycznych;

Korelacja - wspó lczynnik korelacji Przyk lady - z życia 1 Ilość wypalanych papierosów przeż kobiete w trakcie ciaży a waga urodzeniowa noworodka; Ważne pytania

Korelacja - wspó lczynnik korelacji Przyk lady - z życia 1 Ilość wypalanych papierosów przeż kobiete w trakcie ciaży a waga urodzeniowa noworodka; 2 ilość punktów z kolokwium a ilość punktów z egzaminu koncowego; Ważne pytania

Korelacja - wspó lczynnik korelacji Przyk lady - z życia 1 Ilość wypalanych papierosów przeż kobiete w trakcie ciaży a waga urodzeniowa noworodka; 2 ilość punktów z kolokwium a ilość punktów z egzaminu koncowego; 3 szybkość chodzenia a pozycja spo leczna; Ważne pytania

Korelacja - wspó lczynnik korelacji Przyk lady - z życia 1 Ilość wypalanych papierosów przeż kobiete w trakcie ciaży a waga urodzeniowa noworodka; 2 ilość punktów z kolokwium a ilość punktów z egzaminu koncowego; 3 szybkość chodzenia a pozycja spo leczna; 4 d lugość snu w ciagu doby a masa cia la. Ważne pytania

Korelacja - wspó lczynnik korelacji Przyk lady - z życia 1 Ilość wypalanych papierosów przeż kobiete w trakcie ciaży a waga urodzeniowa noworodka; 2 ilość punktów z kolokwium a ilość punktów z egzaminu koncowego; 3 szybkość chodzenia a pozycja spo leczna; 4 d lugość snu w ciagu doby a masa cia la. Ważne pytania 1 Czy istnieja jakiekolwiek zależności pomiedzy wynienionymi charakterystykami?

Korelacja - wspó lczynnik korelacji Przyk lady - z życia 1 Ilość wypalanych papierosów przeż kobiete w trakcie ciaży a waga urodzeniowa noworodka; 2 ilość punktów z kolokwium a ilość punktów z egzaminu koncowego; 3 szybkość chodzenia a pozycja spo leczna; 4 d lugość snu w ciagu doby a masa cia la. Ważne pytania 1 Czy istnieja jakiekolwiek zależności pomiedzy wynienionymi charakterystykami? 2 A jeśli tak to jak mierzyć taka zależność?

Korelacja - wspó lczynnik korelacji Uwaga Zależność pomiedzy takimi charakterystykami nazywamy zwiazkiem korelacyjnym albo korelacja.

korelacja - wspó lczynnik korelacji Zależność funkcyjna - czyli co pami etamy ze szko ly Tajemnicza funkcja matematyczna może opisywać zależność pomi edzy zadanymi charakterystykami. Weźmy nasze ulubione ze szko ly: y = f (x), y = ax + b, y = x 2, y = a n x n + a n 1 x n 1 +... Przyk ladów ze szko ly jest bardzo dużo.

korelacja - wspó lczynnik korelacji Zależność funkcyjna - czyli co pami etamy ze szko ly Tajemnicza funkcja matematyczna może opisywać zależność pomi edzy zadanymi charakterystykami. Weźmy nasze ulubione ze szko ly: y = f (x), y = ax + b, y = x 2, y = a n x n + a n 1 x n 1 +... Przyk ladów ze szko ly jest bardzo dużo. Pytanie Czy nasze zjawisko da si e opisać choćby w przybliżeniu przy pomocy funkcji?

korelacja - wspó lczynnik korelacji zależność liniowa dodatnia zależność liniowa ujemna 0 40 80 120 120 80 40 0 0 10 20 30 40 0 10 20 30 40 brak zależności zależność nieliniowa 0 10 20 30 40 0 500 1000 0 5 10 20 30 0 10 20 30 40

Próbkowy wspó lczynnik korelacji Definicja Wspó lczynnikiem korelacji próbkowej nazywamy zmienna losowa: r = 1 n 1 n ( X i X S i=1 nx 1 )( Y i Ȳ ) S ny 1

W lasności próbkowego wspó lczynnika korelacji 1 Próbkowy wspó lczynnik korelacji jest zmienna losowa ograniczona przez liczby 1 i 1; Uwaga,Uwaga,... Wartość r = 0 nie świadczy o braku zależności mi edzy zmiennymi.

W lasności próbkowego wspó lczynnika korelacji 1 Próbkowy wspó lczynnik korelacji jest zmienna losowa ograniczona przez liczby 1 i 1; 2 Znak wspó lczynnika informuje o kierunku zależności (liniowa ujemna lub liniowa dodatnia); Uwaga,Uwaga,... Wartość r = 0 nie świadczy o braku zależności mi edzy zmiennymi.

W lasności próbkowego wspó lczynnika korelacji 1 Próbkowy wspó lczynnik korelacji jest zmienna losowa ograniczona przez liczby 1 i 1; 2 Znak wspó lczynnika informuje o kierunku zależności (liniowa ujemna lub liniowa dodatnia); 3 Wartość bezwgl edna r informuje o sile korelacji liniowej; Uwaga,Uwaga,... Wartość r = 0 nie świadczy o braku zależności mi edzy zmiennymi.

W lasności próbkowego wspó lczynnika korelacji 1 Próbkowy wspó lczynnik korelacji jest zmienna losowa ograniczona przez liczby 1 i 1; 2 Znak wspó lczynnika informuje o kierunku zależności (liniowa ujemna lub liniowa dodatnia); 3 Wartość bezwgl edna r informuje o sile korelacji liniowej; 4 W szczególnym przypadku, gdy r = 1 mamy do czynienia z dok ladnie liniowa zależnościa. Uwaga,Uwaga,... Wartość r = 0 nie świadczy o braku zależności mi edzy zmiennymi.

Jak oszukać wspó lczynnik korelacji y 0 20 40 60 80 100 Jak dziecko we mgle Wartość wspó lczynnika korelacji w tym przypadku wynosi r = 0 10 5 0 5 10

Pu lapka - korelacje pozorne Wyniki analizy korelacji liniowej dla 17 krajów europejskich (dane z 1990 roku) pomiedzy powierzchnia, liczba mieszkańców, liczba urodzeń a liczba bocianów: powierzchnia liczba bocianów liczba mieszkańców liczba urodzeń powierzchnia 1 0.579 0.812 0.923 liczba bocianów 0.579 1 0.354 0.620 liczba mieszkańców 0.812 0.354 1 0.851 liczba urodzeń 0.923 0.620 0.851 1

Pu lapka - korelacje pozorne Wyniki analizy korelacji liniowej dla 17 krajów europejskich (dane z 1990 roku) pomiedzy powierzchnia, liczba mieszkańców, liczba urodzeń a liczba bocianów: powierzchnia liczba bocianów liczba mieszkańców liczba urodzeń powierzchnia 1 0.579 0.812 0.923 liczba bocianów 0.579 1 0.354 0.620 liczba mieszkańców 0.812 0.354 1 0.851 liczba urodzeń 0.923 0.620 0.851 1 I jak tu nie wierzyć w bociana.

Regresja liniowa Poniżej na wykresie zosta ly umieszczone wyniki kolokwium zaliczeniowego i egzaminu z pewnego przedmiotu dla studentów studiujacych matematyke. Zależność pomiedzy wynikiem z kolokwium a wynikiem z egzaminu można przedstawić graficznie wykres rozproszenia

Regresja liniowa - Wykres rozproszenia egzamin 15 20 25 30 35 40 5 10 15 20 kolokwium

Regresja liniowa Zauważmy, że w naszym przyk ladzie dużym (odpowiednio ma lym) wartościom wyniku kolokwium odpowiadaja z regu ly duże (ma le) wartości egzaminu końcowego. Mówimy w takim przypadku o zależności dodatniej miedzy zmiennymi, w odróżnieniu od zależności ujemnej, gdy duże wartości jednej zmiennej odpowiadaja w wiekszości przypadków ma lym wartościom drugiej zmiennej (zależnść ujemna).

Regresja liniowa - terminologia Zmienna Y bed ac a wynikiem doświadczenia bedziemy nazywali zmienna objaśniana w odróżnieniu od X zmiennej objaśniajacej ( za pomoca zmian X chcemy objaśnić zmiany zmiennej Y ).

Regresja liniowa - zależność funkcyjna Powstaje pytanie - Czy przedstawiona na tym wykresie chmura punktów ma choćby w przybliżeniu zależność funkcyjna? To znaczy czy punkty z wykresu uk ladaja sie wzd luż wykresu pewnej funkcji?

Regresja liniowa - zależność funkcyjna egzamin 15 20 25 30 35 40 5 10 15 20 kolokwium

Wspó lczynnik korelacji W naszym przypadku (kolokwia, egzamin) wspó lczynnik korelacji wynosi 0.973430184460792 co świadczy o silnej dodatniej zależności pomi edzy tymi zmiennymi.

Regresja liniowa - prosta regresji Zadanie Wyznaczenie prostej reprezentujacej w sposób adekwatny chmure punktów z wykresy rozproszenia.

Regresja liniowa - prosta regresji Zadanie Wyznaczenie prostej reprezentujacej w sposób adekwatny chmure punktów z wykresy rozproszenia. Rozwiazanie Jeżeli przyjmiemy, że funkcja liniowa ma przybliżać chmure punktów, to wartość: y i = ax i + b można interpretować jako wartość przewidywana y i na podstawie rozpatrywanej prostej. B l ad oszacowania wynosi wtedy yi y i (wartość resztowa rezyduum).

Regresja liniowa - metoda najmniejszych kwadratów Niech S(a, b) = Definicja n (y i yi ) 2. i=1 Prosta regresji oparta na metodzie najmniejszych kwadratów nazywamy prosta y = ax + b, dla której wartość S(a, b) jest minimalna.

Regresja liniowa - przydatne wzory 1 b = ȳ a x; Pytanie Jak te wzory uzyskano?

Regresja liniowa - przydatne wzory 1 b = ȳ a x; 2 a = r Sn X S ny. Pytanie Jak te wzory uzyskano?

Regresja liniowa - przydatne wzory Ca lkowita suma kwadratów n SST = (y i ȳ) 2 i=1 Suma kwadratów b l edów n SSE = (y i yi ) 2 i=1 Regresyjna suma kwadratów n SSR = (yi ȳ) 2 i=1

Wspó lczynnik determinacji iloraz R 2 = SSR SST nazywamy wspó lczynnikiem determinacji. W lasności R 2 1 R 2 jest miara stopnia dopasowania funkcji regresji do danych empirycznych;

Wspó lczynnik determinacji iloraz R 2 = SSR SST nazywamy wspó lczynnikiem determinacji. W lasności R 2 1 R 2 jest miara stopnia dopasowania funkcji regresji do danych empirycznych; 2 W naszym przypadku R 2 = r 2.

Wspó lczynniki prostej regresji Call: lm(formula = y ~ x) Coefficients: (Intercept) x 5.20 1.76

Bardziej szczegó lowy wydruk Call: lm(formula = y ~ x) Residuals: Min 1Q Median 3Q Max -4.0855-1.2261-0.1272 0.7530 4.8728 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 5.1999 1.5660 3.321 0.00405 ** x 1.7604 0.1004 17.528 2.56e-12 *** --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 Residual standard error: 2.018 on 17 degrees of freedom Multiple R-squared: 0.9476, Adjusted R-squared: 0.9445 F-statistic: 307.2 on 1 and 17 DF, p-value: 2.555e-12