Wykład 7 Testowanie zgodności z rozkładem normalnym Wrocław, 05 kwietnia 2017
Rozkład normalny Niech X = (X 1, X 2,..., X n ) będzie próbą z populacji o rozkładzie normalnym określonym przez dystrybuantę F. Gęstość tego rozkładu to: f (t; µ, σ) = 1 e (t µ)2 2σ 2 2πσ Histogram Frequency 0 500 1000 1500 2000 3 2 1 0 1 2 3
Za pomocą momentu rzędu trzeciego określa się wskaźnik asymetrii (wskaźnik skośności) γ 1 = E (X EX )3 [Var(X )] 3/2 Za pomocą momentu centralnego rzędu czwartego definiuje się wskaźnik spłaszczenia zwany kurtozą lub ekcesem. γ 2 = E (X EX )4 [Var(X )] 2 3.
Za pomocą momentu rzędu trzeciego określa się wskaźnik asymetrii (wskaźnik skośności) γ 1 = E (X EX )3 [Var(X )] 3/2 Za pomocą momentu centralnego rzędu czwartego definiuje się wskaźnik spłaszczenia zwany kurtozą lub ekcesem. γ 2 = E (X EX )4 [Var(X )] 2 3. W przypadku, gdy zmienna losowa pochodzi z rozkładu normalnego wskaźniki γ 1 oraz γ 2 są równe zero.
Test Shapiro - Wilka Niech X = (X 1, X 2,..., X n ) będzie próbą z populacji o rozkładzie określonym przez dystrybuantę F.
Test Shapiro - Wilka Niech X = (X 1, X 2,..., X n ) będzie próbą z populacji o rozkładzie określonym przez dystrybuantę F. Testujemy hipotezę: Przy alternatywie: H 0 : γ 1 = 0, γ 2 = 0 H 1 : co najmniej jedna z wielkości γ 1, γ 2 0
Test Shapiro - Wilka Niech X = (X 1, X 2,..., X n ) będzie próbą z populacji o rozkładzie określonym przez dystrybuantę F. Testujemy hipotezę: Przy alternatywie: H 0 : γ 1 = 0, γ 2 = 0 H 1 : co najmniej jedna z wielkości γ 1, γ 2 0 co jest równoważne problemowi testowania hipotezy przy alternatywie: H 0 : F jest dystrybuantą rozkładu normalnego H 1 : F jest dystrybuantą rozkładu innego niż normalny
Test Shapiro - Wilka Statystyka testowa jest postaci: W = [ [n/2] ] 2 i=1 a i(n)(x (n i+1):n X i:n ) ni=1 (X i X ) 2, gdzie a i są wartościami stablicowanymi, zależnymi od rozmiaru próby n jak i od i.
Test Shapiro - Wilka Statystyka testowa jest postaci: W = [ [n/2] ] 2 i=1 a i(n)(x (n i+1):n X i:n ) ni=1 (X i X ) 2, gdzie a i są wartościami stablicowanymi, zależnymi od rozmiaru próby n jak i od i. Hipotezę zerową H 0 odrzucamy, gdy W < w α (n) gdzie w α (n) jest odpowiednią wartością krytyczną rozkładu Shapiro - Wilka.
Przykład 7.1 Wyniki osiągane w skoku w dal przez jednego z zawodników przedstawiają się następująco: 7.48, 7.88, 8.00, 7.15, 7.26, 7.33, 7.71, 7.18, 8.03, 7.97, 7.17, 8.08. Należy sprawdzić o normalności badanej cechy.
Przykład 7.1 Wyniki osiągane w skoku w dal przez jednego z zawodników przedstawiają się następująco: 7.48, 7.88, 8.00, 7.15, 7.26, 7.33, 7.71, 7.18, 8.03, 7.97, 7.17, 8.08. Należy sprawdzić o normalności badanej cechy. Testujemy hipotezę: H 0 : wyniki mają rozkład normalny H 1 : wyniki mają rozkład inny niż normalny
Przykład 7.1 - c.d. Ustawiamy wyniki skoczka w kolejności rosnącej otrzymując następujący wektor danych: 7.15, 7.17, 7.18, 7.26, 7.33, 7.48, 7.71, 7.88, 7.97, 8.00, 8.03, 8.08 Wiedząc, że n = 12: obliczmy kolejne różnice x 12:12 x 1:12, x 11:12 x 2:12,..., x 7:12 x 6:12 korzystając z tablic odczytujemy kolejne wartości a 1 (12), a 2 (12),..., a 6 (12)
Przykład 7.1 - c.d. Ustawiamy wyniki skoczka w kolejności rosnącej otrzymując następujący wektor danych: 7.15, 7.17, 7.18, 7.26, 7.33, 7.48, 7.71, 7.88, 7.97, 8.00, 8.03, 8.08 Wiedząc, że n = 12: obliczmy kolejne różnice x 12:12 x 1:12, x 11:12 x 2:12,..., x 7:12 x 6:12 korzystając z tablic odczytujemy kolejne wartości a 1 (12), a 2 (12),..., a 6 (12) i x n i+1:n x i:n a i (n) a i (n) (x n i+1:n x i:n ) 1 0.93 0.5475 0.509 2 0.86 0.3325 0.286 3 0.82 0.2460 0.202 4 0.71 0.1586 0.113 5 0.55 0.0922 0.051 6 0.23 0.0303 0.007
Przykład 7.1 - c.d. Wyznaczamy wartość statystyki: 6 a i (12)(x 12 i+1:12 x i:12 ) = 1.168. i=1
Przykład 7.1 - c.d. Wyznaczamy wartość statystyki: 6 a i (12)(x 12 i+1:12 x i:12 ) = 1.168. i=1 Obliczamy również: n 12 (x i x) 2 = (x i 7.6) 2 = 1.569, i=1 i=1
Przykład 7.1 - c.d. Wyznaczamy wartość statystyki: 6 a i (12)(x 12 i+1:12 x i:12 ) = 1.168. i=1 Obliczamy również: n 12 (x i x) 2 = i=1 A następnie wartość statystyki: i=1 (x i 7.6) 2 = 1.569, W = (1.168)2 1.569 = 1.364 1.569 = 0.869
Przykład 7.1 - c.d. Wyznaczamy wartość statystyki: 6 a i (12)(x 12 i+1:12 x i:12 ) = 1.168. i=1 Obliczamy również: n 12 (x i x) 2 = i=1 A następnie wartość statystyki: i=1 (x i 7.6) 2 = 1.569, W = (1.168)2 1.569 = 1.364 1.569 = 0.869 Wartość krytyczna w 0.05 (12) = 0.859, a zatem W > w 0.05 (12) czyli nie ma podstaw do odrzucenia hipotezy o normalności rozkładu.
Wykres kwantyl-kwantyl Wykreślamy na płaszczyźnie punkty, dla których współrzędne są równe kwantylom teoretycznym rozkładu normalnego i kwantylom empirycznym wyliczonym na podstawie danych. Na osi OY odkładamy kolejne kwantyle rzędu k n, k = 1, 2,..., n 1 rozkładu normalnego, a na osi OX otrzymane na podstawie danych kwantyle empiryczne rzędu k n. Jeżeli dane pochodzą z rozkładu normalnego, wówczas otrzymane punkty układają się wzdłuż linii prostej.
Wykres kwantyl-kwantyl. Rozkład normalny. 3 2 1 0 1 2 3 2 0 2 4 Normal Q Q Plot Theoretical Quantiles Sample Quantiles
Wykres kwantyl-kwantyl. Rozkład beta 3 2 1 0 1 2 3 0.2 0.4 0.6 0.8 1.0 Normal Q Q Plot Theoretical Quantiles Sample Quantiles
Wykres kwantyl-kwantyl. Rozkład dwumianowy 3 2 1 0 1 2 3 0 1 2 3 4 5 Normal Q Q Plot Theoretical Quantiles Sample Quantiles
Wykres kwantyl-kwantyl. Rozkład jednostajny 3 2 1 0 1 2 3 0.0 0.2 0.4 0.6 0.8 1.0 Normal Q Q Plot Theoretical Quantiles Sample Quantiles
Wykres kwantyl-kwantyl. Rozkład gamma G(32, 23) 3 2 1 0 1 2 3 0.8 1.0 1.2 1.4 1.6 1.8 2.0 Normal Q Q Plot Theoretical Quantiles Sample Quantiles
Wykres kwantyl-kwantyl. Rozkład gamma G(3, 2) 3 2 1 0 1 2 3 0 1 2 3 4 5 Normal Q Q Plot Theoretical Quantiles Sample Quantiles
Przykład 9.1 - c.d. Normal Q Q Plot Sample Quantiles 7.2 7.4 7.6 7.8 8.0 1.5 1.0 0.5 0.0 0.5 1.0 1.5 Magdalena Theoretical Frąszczak Quantiles
Literatura: Bartoszewicz J.,Wykłady ze statystyki matematycznej, PWN, Warszawa 1989. Koronacki J. i Mielniczuk J., Statystyka, dla studentów kierunków technicznych i przyrodniczych, WNT, 2001 Wrysicki W., Bartos J., Dyczka W., Krówlikowska K., Wasilewski M., Rachunek Prawdopodobieństwa i Statystyka Matematyczna w Zadaniach, część II, PWN, 2012 Magiera M, Modele i metody statystyki matematycznej, część II, wnioskowanie statystyczne, Wrocław, 2007