Zadanie W celu sprawdzenia, czy pipeta jest obarczona błędem systematycznym stałym lub zmiennym wykonano szereg pomiarów przy różnych ustawieniach pipety. Wyznacz równanie regresji liniowej, które pozwoli stwierdzić z jakim błędem mamy do czynienia. X wartość ustawiona, Y wartość zmierzona. X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9
Prosta regresji najmniejszych kwadratów: y=a x b Szukamy takich wartości a i b, aby różnice: y i y i były jak najmniejsze.
Współczynniki regresji liniowej: a= N x i y i x i y i N x i 2 x i 2 b= x i x i y 2 i x 2 i y i x i 2 N 2 x i a= y b x b= y a x a=0,99 b= 0,84
Odchylenie standardowe współczynnika kierunkowego regresji a oraz współczynnika przesunięcia b wyliczmy ze wzorów: s a= s 2 xy 2 N s x s b = s 2 2 a x i N Przedziały ufności dla współczynnika kierunkowego regresji a oraz współczynnika przesunięcia b wyliczmy ze wzorów: a t /2 ;df =n 2 s a A a t /2 ;df =n 2 s a b t /2 ;df =n 2 s b B b t /2 ;df =n 2 s b
Odchylenie standardowe resztkowe: s xy = y i y i 2 N 2 y x=4,0 =3,12 y x=8,0 =7,08 y x=12,0 =11,04 y x=16,0 =15,00 y x=20,0 =18,96 s xy =0,23
Odchylenie standardowe s a oraz s b wynosi: s a =0,016 s b =0,21 Przedziały ufności dla współczynnika kierunkowego regresji a oraz współczynnika przesunięcia b są następujące: 0,94 A 1,04 1,51 B 0,17
Miarą współzależności liniowej dwóch zmiennych X i Y jest kowariancja określona wzorem: cov x, y = 1 n i=1 n x i x y i y cov x, y = x i y i n x y Bezpośrednie porównywanie pierwotnych wartości liczbowych par cech w badanej próbie nie ma merytorycznego uzasadnienia. Można porównywać ze sobą wartości unormowane różnych cech. Wartości unormowane są obliczane z następujących wzorów. x '= x i x s x y'= y i y s y
Powszechnie przyjęto używać jako miary związku współzależności między cechami wielkość zwaną współczynnikiem korelacyjnym Pearsona r: r= cov x, y s x s y = x i x y i y x i x 2 y i y 2 Uwaga! W tym przypadku we wzorach na s x oraz s y w mianowniku jest n, a nie n-1! Lub współczynnika determinacji - r 2 : Odchylenie standardowe współczynnika korelacji dla małolicznej próby wynosi: s r = 1 r 2 n 1
Współczynnik korelacji r przybiera wartości z zakresu <-1;1>. Przy zupełnym braku korelacji r = 0. Przy pełnej korelacji r = 1 (korelacja dodatnia) lub r = -1 (korelacja ujemna). Pozostałe wartości świadczą o częściowej korelacji. Istotność korelacji można zweryfikować testem t-studenta. Hipoteza H 0 : = =0 cov X,Y x y Statystykę oblicza się ze wzoru: t d= r 2 N 2 1 r 2 df =N 2
Zadanie Z populacji mężczyzn wybrano losowo próbę złożoną z 6 osób i określono ich masę oraz wzrost otrzymując następujące pary liczb: Wzrost (cm) Masa (kg) 161,9 54,3 164,7 51,4 180,6 71,6 188,8 81,5 176,7 75,0 171,6 60,8 Czy pomiędzy tymi cechami istnieje istotna statystycznie korelacja?
x cov x, y = i y i x y=96,8 n s x =9,2 s y =11,03 r= cov x, y s x s y =0,95 t d= r 2 N 2 1 r 2 =6,08 df =4 t / 2=0,025 ; df =4 =2,776 Odp.: Istnieje korelacja pomiędzy wzrostem a masą ciała. 0,01<pvalue<0,002
Masa (kg) 90 85 80 75 70 65 60 55 50 45 40 35 30 25 20 15 10 5 0 160 165 170 175 180 185 190 195 Wzrost (cm)
Zadanie Biorąc dane z poprzedniego zadania oblicz współczynnik determinacji. r 2 =0,90
Zadanie W celu sprawdzenia dokładności dwóch metod stosowanych do oznaczania stężenia glukozy przygotowano roztwór wzorcowy glukozy o stężeniu 6 mg/ml. Następnie wykonano 9 pomiarów dwoma metodami otrzymując następujące wyniki: Czy metody te różnią się precyzją, jeśli tak, to która z nich jest bardziej precyzyjna? Co można powiedzieć o dokładności obydwu metod? Metoda I Metoda II 6,15 5,96 6,19 6,12 6,03 6,04 6,12 6,1 6,17 5,9 6,20 5,81 6,04 6,17 6,06 6,01 6,07 6,13
x I =6,11 s I =0,066 x II =6,03 s II =0,12 Sprawdzamy dokładność metod: F =3,23 F /2=0,025 ;8;8 =4,43 Metody nie różnią się istotnie precyzją. Sprawdzamy rzetelność metod: t I = 6,114 6 0,066 9 =5,0 t II= 6,027 6 0,119 9 =0,67 t /2=0,025 ;8 =2,306 Odp.: Metoda I jest niedokładna.