Testowanie hipotez statystycznych.

Wielkość: px
Rozpocząć pokaz od strony:

Download "Testowanie hipotez statystycznych."

Transkrypt

1 Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011

2 Temat. Test zgodności χ 2 Pearsona.

3 Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie P{X 1 = x i } = p i, i = 1,..., k. Oznaczmy przez O i liczbę tych zmiennych spośród X 1,..., X n, które przyjęły wartość x i a przez E i = np i oczekiwaną liczbę wartości x i. Wektor losowy (O 1, O 2,..., O k ) ma rozkład wielomianowy z parametrami n i (p 1,..., p k ) natomiast zmienna losowa χ 2 P = k i=1 (O i E i ) 2 E i, ma asymptotyczny rozkład chi kwadrat z (k 1) stopniami swobody χ 2 k 1.

4 Test zgodności χ 2 dla hipotezy prostej Rozważmy dyskretną zmienną losową X o nieznanym rozkładzie P{X = x i } = q i, i = 1,..., k, q i są nieznane. Stawiamy hipotezę H 0 : q i = p i dla każdego i = 1,..., k. Statystyka testowa to statystyka Pearsona χ 2 P χ 2 P = k i=1 która w tym przypadku ma postać (O i E i ) 2 E i, χ 2 P = k i=1 (O i np i ) 2 np i.

5 Test zgodności χ 2 dla hipotezy prostej Rozważmy dyskretną zmienną losową X o nieznanym rozkładzie P{X = x i } = q i, i = 1,..., k, q i są nieznane. Stawiamy hipotezę H 0 : q i = p i dla każdego i = 1,..., k. Statystyka testowa to statystyka Pearsona χ 2 P χ 2 P = k i=1 która w tym przypadku ma postać (O i E i ) 2 E i, χ 2 P = k i=1 (O i np i ) 2 np i.

6 Przykład Sprawdzamy, że cyfry z tabeli i O i są wygenerowane z rozkładu jednostajnego. Przetestujemy hipotezę H 0 : P{X = i} = 1, dla każdego i = 0,..., 9, 10 na poziomie istotności α = 0, 01.

7 Przykład Sprawdzamy, że cyfry z tabeli i O i są wygenerowane z rozkładu jednostajnego. Przetestujemy hipotezę H 0 : P{X = i} = 1, dla każdego i = 0,..., 9, 10 na poziomie istotności α = 0, 01.

8 Przykład Sprawdzamy, że cyfry z tabeli i O i są wygenerowane z rozkładu jednostajnego. Przetestujemy hipotezę H 0 : P{X = i} = 1, dla każdego i = 0,..., 9, 10 na poziomie istotności α = 0, 01.

9 Przykład cd. W tabeli jest 320 cyfr a więc n = 320. Wszystkie częstości oczekiwane są takie same E i = n 10 = = 32. Statystyka testowa ma wartość χ 2 P = 2, 5, natomiast kwantyl rzędu 0, 99 dla rozkładu χ 2 z 9 stopniami swobody jest równy χ 2 9:0,01 = 21, 67. Tak więc nie ma podstaw do odrzucenia hipotezy zerowej i przyjmujemy H 0, (p wartość jest w tym przypadku równa p = 0, 981.)

10 Test zgodności χ 2 dla rozkładu ciągłego. Test χ 2 możemy także stosować do sprawdzania hipotez o postaci rozkładu ciągłego. W tym celu należy wyznaczyć rozłączne klasy A 1,..., A k (podobnie jak przy konstrukcji histogramu) i obliczyć, przy założeniu hipotezy zerowej H 0, prawdopodobieństwa p 1 = P{X A 1 }, p 2 = P{X A 2 },..., p k = P{X A k }. Niech n oznacza wielkość próby, a O i liczbę obserwacji w i tej klasie. Za pomocą testu χ 2 Pearsona możemy sprawdzić, czy zaobserwowane częstości O 1, O 2,..., O k podlegają rozkładowi z gęstością {p i, i = 1,..., k}.

11 Test zgodności χ 2 dla rozkładu ciągłego. Test χ 2 możemy także stosować do sprawdzania hipotez o postaci rozkładu ciągłego. W tym celu należy wyznaczyć rozłączne klasy A 1,..., A k (podobnie jak przy konstrukcji histogramu) i obliczyć, przy założeniu hipotezy zerowej H 0, prawdopodobieństwa p 1 = P{X A 1 }, p 2 = P{X A 2 },..., p k = P{X A k }. Niech n oznacza wielkość próby, a O i liczbę obserwacji w i tej klasie. Za pomocą testu χ 2 Pearsona możemy sprawdzić, czy zaobserwowane częstości O 1, O 2,..., O k podlegają rozkładowi z gęstością {p i, i = 1,..., k}.

12 Test zgodności χ 2 dla rozkładu ciągłego. Test χ 2 możemy także stosować do sprawdzania hipotez o postaci rozkładu ciągłego. W tym celu należy wyznaczyć rozłączne klasy A 1,..., A k (podobnie jak przy konstrukcji histogramu) i obliczyć, przy założeniu hipotezy zerowej H 0, prawdopodobieństwa p 1 = P{X A 1 }, p 2 = P{X A 2 },..., p k = P{X A k }. Niech n oznacza wielkość próby, a O i liczbę obserwacji w i tej klasie. Za pomocą testu χ 2 Pearsona możemy sprawdzić, czy zaobserwowane częstości O 1, O 2,..., O k podlegają rozkładowi z gęstością {p i, i = 1,..., k}.

13 Test zgodności χ 2 dla rozkładu ciągłego. Test χ 2 możemy także stosować do sprawdzania hipotez o postaci rozkładu ciągłego. W tym celu należy wyznaczyć rozłączne klasy A 1,..., A k (podobnie jak przy konstrukcji histogramu) i obliczyć, przy założeniu hipotezy zerowej H 0, prawdopodobieństwa p 1 = P{X A 1 }, p 2 = P{X A 2 },..., p k = P{X A k }. Niech n oznacza wielkość próby, a O i liczbę obserwacji w i tej klasie. Za pomocą testu χ 2 Pearsona możemy sprawdzić, czy zaobserwowane częstości O 1, O 2,..., O k podlegają rozkładowi z gęstością {p i, i = 1,..., k}.

14 Test zgodności χ 2 dla rozkładu ciągłego. Test χ 2 możemy także stosować do sprawdzania hipotez o postaci rozkładu ciągłego. W tym celu należy wyznaczyć rozłączne klasy A 1,..., A k (podobnie jak przy konstrukcji histogramu) i obliczyć, przy założeniu hipotezy zerowej H 0, prawdopodobieństwa p 1 = P{X A 1 }, p 2 = P{X A 2 },..., p k = P{X A k }. Niech n oznacza wielkość próby, a O i liczbę obserwacji w i tej klasie. Za pomocą testu χ 2 Pearsona możemy sprawdzić, czy zaobserwowane częstości O 1, O 2,..., O k podlegają rozkładowi z gęstością {p i, i = 1,..., k}.

15 Test zgodności χ 2 dla rozkładu ciągłego. Test χ 2 możemy także stosować do sprawdzania hipotez o postaci rozkładu ciągłego. W tym celu należy wyznaczyć rozłączne klasy A 1,..., A k (podobnie jak przy konstrukcji histogramu) i obliczyć, przy założeniu hipotezy zerowej H 0, prawdopodobieństwa p 1 = P{X A 1 }, p 2 = P{X A 2 },..., p k = P{X A k }. Niech n oznacza wielkość próby, a O i liczbę obserwacji w i tej klasie. Za pomocą testu χ 2 Pearsona możemy sprawdzić, czy zaobserwowane częstości O 1, O 2,..., O k podlegają rozkładowi z gęstością {p i, i = 1,..., k}.

16 Test zgodności χ 2 dla rozkładu ciągłego cd. Metodę tę zilustrujemy następującym przykładem. Przykład Według producenta pojemność jego naczynie miareczkowego ma rozkład normalny z wartością średnią równą nominalnej pojemności oraz odchyleniu standardowym równym 0, 01 mm 3. Aby to sprawdzić, przebadano pojemność 200 naczyń o nominalnej pojemności równej 30 mm 3. Wyznaczono k = 10 rozłącznych klas A 1,..., A 10. Ich granice z zaobserwowanymi liczebnościami są podane w tabeli

17 Test zgodności χ 2 dla rozkładu ciągłego cd. Metodę tę zilustrujemy następującym przykładem. Przykład Według producenta pojemność jego naczynie miareczkowego ma rozkład normalny z wartością średnią równą nominalnej pojemności oraz odchyleniu standardowym równym 0, 01 mm 3. Aby to sprawdzić, przebadano pojemność 200 naczyń o nominalnej pojemności równej 30 mm 3. Wyznaczono k = 10 rozłącznych klas A 1,..., A 10. Ich granice z zaobserwowanymi liczebnościami są podane w tabeli

18 Przykład cd. i Klasa O i E i 1 (, 29, 980] 2 4, 55 2 (29, 980, 29, 985] 13 8, 81 3 (29, 985, 29, 990] 20 18, 37 4 (29, 990, 29, 995] 26 29, 98 5 (29, 995, 30, 000] 40 38, 29 6 (30, 000, 30, 005] 42 38, 29 7 (30, 005, 30, 010] 26 29, 98 8 (30, 010, 30, 015] 21 18, 37 9 (30, 015, 30, 020] 10 8, (30, 020, + ) 0 4, 55

19 Przykład cd. Niech X oznacza pomiar pojemności oraz niech q i = P{X A i }. W zapewnienia producenta oznaczają, że X ma rozkład normalny N(30, 00, 0, 0001). My sprawdzamy hipotezę H 0 : q i = p i, w której p i = Φ ( ) ai 30 Φ 0, 01 gdzie A i = (a i 1, a i ] jest i tą klasą. ( ai , 01 Na podstawie danych z tablicy, w których łączymy w jedną dwie dolne i dwie górne klasy otrzymujemy następującą wartość statystyki testowej χ 2 P = 3, 06. Ponieważ przy 7 stopniach swobody p wartość wynosi 0,879, nie ma podstaw do odrzucenia hipotezy zerowej H 0, a w takim razie także hipotezy o rozkładzie normalnym N(0, 1) pojemności naczyń miareczkowych. ),

20 Przykład cd. Niech X oznacza pomiar pojemności oraz niech q i = P{X A i }. W zapewnienia producenta oznaczają, że X ma rozkład normalny N(30, 00, 0, 0001). My sprawdzamy hipotezę H 0 : q i = p i, w której p i = Φ ( ) ai 30 Φ 0, 01 gdzie A i = (a i 1, a i ] jest i tą klasą. ( ai , 01 Na podstawie danych z tablicy, w których łączymy w jedną dwie dolne i dwie górne klasy otrzymujemy następującą wartość statystyki testowej χ 2 P = 3, 06. Ponieważ przy 7 stopniach swobody p wartość wynosi 0,879, nie ma podstaw do odrzucenia hipotezy zerowej H 0, a w takim razie także hipotezy o rozkładzie normalnym N(0, 1) pojemności naczyń miareczkowych. ),

21 Test zgodności χ 2 dla rozkładu ciągłego cd. Uwaga Przybliżenie rozkładem χ 2 można uznać za dopuszczalne, gdy np i 5 dla każdego i = 1,..., k.

22 Test zgodności χ 2 dla hipotezy złożonej. Omówiliśmy przypadek, w którym sformułowana hipoteza H 0 określała całkowicie rozkład zmiennej losowej. W wielu zagadnieniach praktycznych stawia się również hipotezy, które nie określają całkowicie rozkładu. Możemy mieć na przykład do czynienia z hipotezą, która orzeka, że zmienna losowa X ma rozkład dyskretny o znanej postaci ogólnej {p i (θ), i = 1,..., k}, a parametr θ pozostaje nieokreślony.

23 W tej sytuacji nie możemy bezpośrednio skorzystać ze statystyki χ 2 P gdyż nie możemy obliczyć, E i = E i (θ) = np i (θ), teoretycznych oczekiwanych liczebności klas. Zależą one bowiem od wartości nieznanego parametru θ. Okazuje się, że jeśli nieznany parametr θ jest oszacowany za pomocą metody największej wiarogodności, to statystyka k χ 2 P = (O i E i (ˆθ)) 2, E i (ˆθ) i=1 gdzie ˆθ oznacza estymator największej wiarogodności parametru θ, ma nadal asymptotyczny rozkład χ 2 ale już nie z k 1 stopniami swobody ale z k 2 stopniami swobody.

24 Test zgodności χ 2 dla hipotezy złożonej cd. Przykład W diploidalnej populacji z losowym kojarzeniem częstość allelu A jest równa θ. Jeśli populacja znajduje się w równowadze Hardyego-Weinberga to częstości genotypów AA, Aa i aa są równe odpowiednio θ 2, 2θ(1 θ) i (1 θ) 2.

25 Przykład cd. Załóżmy, że w populacji stwierdzono 110 osobników o genotypie AA, 235 osobników o genotypie Aa oraz 155 osobników o genotypie aa. Czy istnieje podstawa do odrzucenia hipotezy o znajdowaniu się tej populacji w warunkach równowagi Hardyego-Wainberga.

26 Przykład cd. W tym przypadku hipoteza zerowa ma postać H 0 : p 1 (θ) = θ 2, p 2 (θ) = 2θ(1 θ), p 3 (θ) = (1 θ) 2. Estymator parametru θ wyznaczony metodą największej wiarogodności jest postaci ˆθ = 2n 1 + n 2, 2n gdzie n = n 1 + n 2 + n 3. Ponieważ Genotyp AA Aa aa n i więc ˆθ = 0, 455.

27 Przykład cd. W tym przypadku hipoteza zerowa ma postać H 0 : p 1 (θ) = θ 2, p 2 (θ) = 2θ(1 θ), p 3 (θ) = (1 θ) 2. Estymator parametru θ wyznaczony metodą największej wiarogodności jest postaci ˆθ = 2n 1 + n 2, 2n gdzie n = n 1 + n 2 + n 3. Ponieważ Genotyp AA Aa aa n i więc ˆθ = 0, 455.

28 Przykład cd. W tym przypadku hipoteza zerowa ma postać H 0 : p 1 (θ) = θ 2, p 2 (θ) = 2θ(1 θ), p 3 (θ) = (1 θ) 2. Estymator parametru θ wyznaczony metodą największej wiarogodności jest postaci ˆθ = 2n 1 + n 2, 2n gdzie n = n 1 + n 2 + n 3. Ponieważ Genotyp AA Aa aa n i więc ˆθ = 0, 455.

29 Przykład cd. Statystyka testowa jest więc równa χ 2 P ( , 51)2 ( , 97)2 ( , 51)2 = , , , 51 = 1, 369. Dla tej wartości statystyki testowej p wartość jest równa 0,24, czyli nie ma podstaw do odrzucenia hipotezy zerowej.

30 Przykład cd. Statystyka testowa jest więc równa χ 2 P ( , 51)2 ( , 97)2 ( , 51)2 = , , , 51 = 1, 369. Dla tej wartości statystyki testowej p wartość jest równa 0,24, czyli nie ma podstaw do odrzucenia hipotezy zerowej.

31 Testowanie hipotezy o niezależności Za pomocą testu χ 2 możemy przetestować hipotezę o niezależności dwóch zmiennych losowych. Niech (X, Y ) będzie dwuwymiarowym wektorem losowym o rozkładzie dyskretnym r ij = P{X = x i, Y = y j }, i = 1,..., a, j = 1,..., b. Rozkład {r ij } możemy wygodnie zapisać w tablicy X/Y y 1 y 2... y b x 1 r 11 r r 1b x 2 r 21 r r 2b x a r a1 r a2... r ab

32 Testowanie hipotezy o niezależności Za pomocą testu χ 2 możemy przetestować hipotezę o niezależności dwóch zmiennych losowych. Niech (X, Y ) będzie dwuwymiarowym wektorem losowym o rozkładzie dyskretnym r ij = P{X = x i, Y = y j }, i = 1,..., a, j = 1,..., b. Rozkład {r ij } możemy wygodnie zapisać w tablicy X/Y y 1 y 2... y b x 1 r 11 r r 1b x 2 r 21 r r 2b x a r a1 r a2... r ab

33 Testowanie hipotezy o niezależności Stawiamy hipotezę zerową H 0, że zmienne losowe X i Y są niezależne. H 0 : P {(X, Y ) = (x i, y j )} = P {X = x i } P {Y = y j }, dla wszystkich i, j Jeśli wprowadzimy oznaczenia p i = P{X = x i } oraz q j = P{Y = y j } to możemy hipotezę H 0 zapisać w postaci H 0 : r ij = p i q j, dla wszystkich i, j.

34 Testowanie hipotezy o niezależności Hipoteza zerowa jest hipotezą złożoną. Nie określamy ani prawdopodobieństw r ij ani prawdopodobieństw p i oraz q j. Orzekamy jedynie, że prawdopodobieństwo r ij jest równe iloczynowi pewnych liczb p i oraz q j, które będziemy traktować jako parametry. Ponieważ p 1 + p p a = 1 oraz q 1 + q q b = 1 więc mamy a + b 2 niezależnych parametrów, które musimy estymować na podstawie danych. Dwa pozostałe parametry, p a oraz q b, określamy za pomocą równości a 1 b 1 p a = 1 p i oraz q b = 1 q j. i=1 j=1

35 Testowanie hipotezy o niezależności Estymacji dokonujemy na podstawie n elementowej próby prostej (X 1, Y 1 ), (X 2, Y 2 ),..., (X n, Y n ). Oznaczmy przez O ij liczbę par (X k, Y k ) równych (x i, y j ). Wygodnie jest zapisać dane w tabeli X/Y y 1 y 2... y b Suma x 1 O 11 O O 1b O 1 x 2 O 21 O O 2b O O 1. x a O a1 O a2... O ab O a Suma O 1 O 2... O b n gdzie O i O j oznacza sumę liczb w i tym wierszu, oznacza sumę liczb w j tej kolumnie.

36 Testowanie hipotezy o niezależności Estymatorami wyznaczonymi metoda największej wiarogodności nieznanych parametrów p 1,..., p a oraz q 1,..., q b są odpowiednio oraz ˆp i = O i, i = 1,..., a, n ˆq j = O j, j = 1,..., b. n

37 Procedurę testowania opieramy na statystyce testowej Po przekształceniu χ 2 P = b a j=1 i=1 χ 2 P = n b j=1 i=1 ( O ij n O i n n O i n O j n ( a O ij O i O j n ) O 2 j n ) 2 O i O j. Statystyka χ 2 P ma asymptotyczny rozkład chi kwadrat z (a 1)(b 1) stopniami swobody..

38 Procedurę testowania opieramy na statystyce testowej Po przekształceniu χ 2 P = b a j=1 i=1 χ 2 P = n b j=1 i=1 ( O ij n O i n n O i n O j n ( a O ij O i O j n ) O 2 j n ) 2 O i O j. Statystyka χ 2 P ma asymptotyczny rozkład chi kwadrat z (a 1)(b 1) stopniami swobody..

39 Procedurę testowania opieramy na statystyce testowej Po przekształceniu χ 2 P = b a j=1 i=1 χ 2 P = n b j=1 i=1 ( O ij n O i n n O i n O j n ( a O ij O i O j n ) O 2 j n ) 2 O i O j. Statystyka χ 2 P ma asymptotyczny rozkład chi kwadrat z (a 1)(b 1) stopniami swobody..

40 Stopnie swobody Liczba stopni swobody wynika z faktu, że mamy k = ab klatek oraz szacujemy a + b 2 niezależnych parametrów, a więc liczba swobody rozkładu statystyki testowej jest równa ν = ab 1 (a + b 2) = (a 1)(b 1).

41 Stopnie swobody Liczba stopni swobody wynika z faktu, że mamy k = ab klatek oraz szacujemy a + b 2 niezależnych parametrów, a więc liczba swobody rozkładu statystyki testowej jest równa ν = ab 1 (a + b 2) = (a 1)(b 1).

42 Przykład W fabryce telewizorów sądzi się, że jakość obrazu wyprodukowanego telewizora nie zależy od jakości dźwięku. Aby sprawdzić to przypuszczenie, zbadano 100 wybranych losowo telewizorów i otrzymano wynik podany w tablicy: Obraz/Dźwięk zła dobra wysoka Suma zła dobra wysoka Suma

43 Przykład W fabryce telewizorów sądzi się, że jakość obrazu wyprodukowanego telewizora nie zależy od jakości dźwięku. Aby sprawdzić to przypuszczenie, zbadano 100 wybranych losowo telewizorów i otrzymano wynik podany w tablicy: Obraz/Dźwięk zła dobra wysoka Suma zła dobra wysoka Suma

44 Przykład cd. Należy postawić i przetestować hipotezę, przyjmując poziom istotności 1 α = 0, 9. Hipoteza zerowa orzeka, że jakość dźwięku jest niezależna od jakości obrazu.

45 Przykład cd. Należy postawić i przetestować hipotezę, przyjmując poziom istotności 1 α = 0, 9. Hipoteza zerowa orzeka, że jakość dźwięku jest niezależna od jakości obrazu.

46 Przykład cd. Należy postawić i przetestować hipotezę, przyjmując poziom istotności 1 α = 0, 9. Hipoteza zerowa orzeka, że jakość dźwięku jest niezależna od jakości obrazu.

47 Przykład cd. Oczekiwana częstość w poszczególnych klatkach. Jakość obrazu/dźwięku zła dobra wysoka Suma zła 11, 56 14, 62 7, dobra 13, 60 17, 20 9, wysoka 8, 84 11, 18 5, Suma 34, 00 43, 00 23, Otrzymujemy wartość statystyki χ 2 P = 5, 23 dla rozkładu χ2 z 4 stopniami swobody daje to p wartość równą 0,26. Tak więc nie ma podstaw do odrzucenia hipotezy zerowej. Jakość dźwięku jest niezależna od jakości obrazu.

48 Przykład cd. Oczekiwana częstość w poszczególnych klatkach. Jakość obrazu/dźwięku zła dobra wysoka Suma zła 11, 56 14, 62 7, dobra 13, 60 17, 20 9, wysoka 8, 84 11, 18 5, Suma 34, 00 43, 00 23, Otrzymujemy wartość statystyki χ 2 P = 5, 23 dla rozkładu χ2 z 4 stopniami swobody daje to p wartość równą 0,26. Tak więc nie ma podstaw do odrzucenia hipotezy zerowej. Jakość dźwięku jest niezależna od jakości obrazu.

49 Przykład cd. Oczekiwana częstość w poszczególnych klatkach. Jakość obrazu/dźwięku zła dobra wysoka Suma zła 11, 56 14, 62 7, dobra 13, 60 17, 20 9, wysoka 8, 84 11, 18 5, Suma 34, 00 43, 00 23, Otrzymujemy wartość statystyki χ 2 P = 5, 23 dla rozkładu χ2 z 4 stopniami swobody daje to p wartość równą 0,26. Tak więc nie ma podstaw do odrzucenia hipotezy zerowej. Jakość dźwięku jest niezależna od jakości obrazu.

50 Tablice kontyngencji Dla danych, które możemy przedstawić w tablicy dwudzielczej X/Y 0 1 Suma 0 a b a + b 1 c d c + d Suma a + c b + d n statystyka χ 2 P przyjmuje postać χ 2 P = n(ad bc) 2 (a + b)(c + d)(a + c)(b + d).

51 Tablice kontyngencji Dla danych, które możemy przedstawić w tablicy dwudzielczej X/Y 0 1 Suma 0 a b a + b 1 c d c + d Suma a + c b + d n statystyka χ 2 P przyjmuje postać χ 2 P = n(ad bc) 2 (a + b)(c + d)(a + c)(b + d).

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA Zadanie 0.1 Zmienna losowa X ma rozkład określony funkcją prawdopodobieństwa: x k 0 4 p k 1/3 1/6 1/ obliczyć EX, D X. (odp. 4/3;

Bardziej szczegółowo

STATYSTYKA wykład 5-6

STATYSTYKA wykład 5-6 TATYTYKA wykład 5-6 Twierdzenia graniczne Rozkłady statystyk z próby Wanda Olech Twierdzenia graniczne Jeżeli rozpatrujemy ciąg zmiennych losowych {X ; X ;...; X n }, to zdarza się, że ich rozkłady przy

Bardziej szczegółowo

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona Badanie zależności między cechami Obserwujemy dwie cechy: X oraz Y Obiekt (X, Y ) H 0 : Cechy X oraz Y są niezależne Próba: (X 1, Y 1 ),..., (X n, Y n ) Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności

Bardziej szczegółowo

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej 7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach

Bardziej szczegółowo

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW ODRZUCANIE WYNIKÓW OJEDYNCZYCH OMIARÓW W praktyce pomiarowej zdarzają się sytuacje gdy jeden z pomiarów odstaje od pozostałych. Jeżeli wykorzystamy fakt, że wyniki pomiarów są zmienną losową opisywaną

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;

Bardziej szczegółowo

Analiza wariancji. dr Janusz Górczyński

Analiza wariancji. dr Janusz Górczyński Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik

Bardziej szczegółowo

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski Narzędzia statystyczne i ekonometryczne Wykład 1 dr Paweł Baranowski Informacje organizacyjne Wydział Ek-Soc, pok. B-109 pawel@baranowski.edu.pl Strona: baranowski.edu.pl (w tym materiały) Konsultacje:

Bardziej szczegółowo

Test lewostronny dla hipotezy zerowej:

Test lewostronny dla hipotezy zerowej: Poznajemy testowanie hipotez statystycznych w środowisku R Zajęcia z dnia 11 maja 2011 roku Najpierw teoria TESTY ISTOTNOŚCI WARTOŚCI ŚREDNIEJ W POPULACJI GENERALNEJ gdy znana jest wariancja!!! Test prawostronny

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych 1 Laboratorium III: Testy statystyczne Spis treści Laboratorium III: Testy statystyczne... 1 Wiadomości ogólne... 2 1. Krótkie przypomnienie wiadomości na temat testów statystycznych... 2 1.1. Weryfikacja

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

Statystyka i Analiza Danych

Statystyka i Analiza Danych Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki -

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl. wersja 20.01.2013/13:40

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl. wersja 20.01.2013/13:40 Statystyka dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl wersja 20.01.2013/13:40 Tematyka wykładów 1. Definicja statystyki 2. Populacja, próba 3. Skale pomiarowe 4. Miary położenia (klasyczne i pozycyjne)

Bardziej szczegółowo

Instytut Matematyczny Uniwersytet Wrocławski. Zakres egzaminu magisterskiego. Wybrane rozdziały anazlizy i topologii 1 i 2

Instytut Matematyczny Uniwersytet Wrocławski. Zakres egzaminu magisterskiego. Wybrane rozdziały anazlizy i topologii 1 i 2 Instytut Matematyczny Uniwersytet Wrocławski Zakres egzaminu magisterskiego Wybrane rozdziały anazlizy i topologii 1 i 2 Pojęcia, fakty: Definicje i pojęcia: metryka, iloczyn skalarny, norma supremum,

Bardziej szczegółowo

Statystyczna analiza danych

Statystyczna analiza danych Statystyczna analiza danych Marek Ptak 21 października 2013 Marek Ptak Statystyka 21 października 2013 1 / 70 Część I Wstęp Marek Ptak Statystyka 21 października 2013 2 / 70 LITERATURA A. Łomnicki, Wprowadzenie

Bardziej szczegółowo

Często spotykany jest również asymetryczny rozkład gamma (Г), opisany za pomocą parametru skali θ i parametru kształtu k:

Często spotykany jest również asymetryczny rozkład gamma (Г), opisany za pomocą parametru skali θ i parametru kształtu k: Statystyczne opracowanie danych pomiarowych W praktyce pomiarowej często spotykamy się z pomiarami wielokrotnymi, gdy podczas pomiaru błędy pomiarowe (szumy miernika, czynniki zewnętrzne) są na tyle duże,

Bardziej szczegółowo

Oszacowanie i rozkład t

Oszacowanie i rozkład t Oszacowanie i rozkład t Marcin Zajenkowski Marcin Zajenkowski () Oszacowanie i rozkład t 1 / 31 Oszacowanie 1 Na podstawie danych z próby szacuje się wiele wartości w populacji, np.: jakie jest poparcie

Bardziej szczegółowo

EGZAMIN DYPLOMOWY, część II, 23.09.2008 Biomatematyka

EGZAMIN DYPLOMOWY, część II, 23.09.2008 Biomatematyka Biomatematyka W 200-elementowej próbie losowej z diploidalnej populacji wystąpiło 89 osobników genotypu AA, 57 osobników genotypu Aa oraz 54 osobników genotypu aa. Na podstawie tych danych (a) dokonaj

Bardziej szczegółowo

Sterowanie wielkością zamówienia w Excelu - cz. 3

Sterowanie wielkością zamówienia w Excelu - cz. 3 Sterowanie wielkością zamówienia w Excelu - cz. 3 21.06.2005 r. 4. Planowanie eksperymentów symulacyjnych Podczas tego etapu ważne jest określenie typu rozkładu badanej charakterystyki. Dzięki tej informacji

Bardziej szczegółowo

Proces modelowania zjawiska handlu zagranicznego towarami

Proces modelowania zjawiska handlu zagranicznego towarami Załącznik nr 1 do raportu końcowego z wykonania pracy badawczej pt. Handel zagraniczny w województwach (NTS2) realizowanej przez Centrum Badań i Edukacji Statystycznej z siedzibą w Jachrance na podstawie

Bardziej szczegółowo

Rozkłady zmiennych losowych

Rozkłady zmiennych losowych Rozkłady zmiennych losowych Wprowadzenie Badamy pewną zbiorowość czyli populację pod względem występowania jakiejś cechy. Pobieramy próbę i na podstawie tej próby wyznaczamy pewne charakterystyki. Jeśli

Bardziej szczegółowo

Środowisko R wprowadzenie c.d. Wykład R2; 21.05.07 Struktury danych w R c.d.

Środowisko R wprowadzenie c.d. Wykład R2; 21.05.07 Struktury danych w R c.d. Środowisko R wprowadzenie c.d. Wykład R2; 21.05.07 Struktury danych w R c.d. Oprócz zmiennych i wektorów strukturami danych w R są: macierze; ramki (ang. data frames); listy; klasy S3 1 Macierze Macierze

Bardziej szczegółowo

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 Zadanie 1 a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 b) W naszym przypadku populacja są inżynierowie w Tajlandii. Czy można jednak przypuszczać, że na zarobki kobiet-inżynierów

Bardziej szczegółowo

ZALICZENIA. W celu uzyskania zaliczenia należy wybrać jeden z trzech poniższych wariantów I, II lub III

ZALICZENIA. W celu uzyskania zaliczenia należy wybrać jeden z trzech poniższych wariantów I, II lub III ZALICZENIA W celu uzyskania zaliczenia należy wybrać jeden z trzech poniższych wariantów I, II lub III 1 Wariant I. PROBLEM WŁASNY Sformułować własne zadanie statystyczne związane z własną pracą badawczą

Bardziej szczegółowo

Testy zgodności 9 113

Testy zgodności 9 113 Testy zgodności 9 3 9. TESTY ZGODNOŚCI 9. Różne sytuace praktyczne W praktyce badań statystycznych, ak uż poprzednio stwierdzono, cały proces analizy statystyczne dzielimy na dwa etapy: formułowanie hipotezy

Bardziej szczegółowo

Analiza danych jakościowych. Andrzej Dąbrowski

Analiza danych jakościowych. Andrzej Dąbrowski Analiza danych jakościowych Andrzej Dąbrowski 2 Spis treści 1 Dane 7 1.1 Skale.................................. 8 2 Statystyczne modele danych jakościowych 11 2.1 Rozkłady prawdopodobieństwa dla liczności

Bardziej szczegółowo

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Zadanie Zbadano satysfakcję z życia w skali 1 do 10 w dwóch grupach rodziców: a) Rodzice dzieci zdrowych oraz b) Rodzice dzieci z niepełnosprawnością

Bardziej szczegółowo

Wielowymiarowe uogólnienie testu niezależności

Wielowymiarowe uogólnienie testu niezależności Piotr SULEWSKI Wielowymiarowe uogólnienie testu niezależności W literaturze statystycznej znajdujemy głównie metody wnioskowania dotyczące jednej zmiennej. Jednak w badaniach statystycznych obiekty opisywane

Bardziej szczegółowo

Analiza korespondencji

Analiza korespondencji Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć: Wprowadzenie Statystyka opisowa to dział statystyki zajmujący się metodami opisu danych statystycznych (np. środowiskowych) uzyskanych podczas badania statystycznego (np. badań terenowych, laboratoryjnych).

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 3. Zmienne losowe 4. Populacje i próby danych 5. Testowanie hipotez i estymacja parametrów 6. Test t 7. Test

Bardziej szczegółowo

O ŚREDNIEJ STATYSTYCZNEJ

O ŚREDNIEJ STATYSTYCZNEJ O ŚREDNIEJ STATYSTYCZNEJ Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków Rachunek Prawdopodobieństwa i Statystyka Kraków, 20 26 IX 2009 r. WYNIKI OBSERWACJI X 1, X 2,..., X n WYNIKI

Bardziej szczegółowo

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07. Przedmiot statystyki

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07. Przedmiot statystyki Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07 Statystyka dzieli się na trzy części: Przedmiot statystyki -zbieranie danych; -opracowanie i kondensacja danych (analiza danych);

Bardziej szczegółowo

Generatory takie mają niestety okres, po którym sekwencja liczb powtarza się.

Generatory takie mają niestety okres, po którym sekwencja liczb powtarza się. 1 Wstęp Będziemyrozważaćgeneratorytypux n+1 =f(x n,x n 1,...,x n k )(modm). Zakładamy,żeargumentamifunkcjifsąliczbycałkowitezezbioru0,1,...,M 1. Dla ustalenia uwagi mogą to być generatory liniowe typu:

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 1 i 2

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 1 i 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 1 i 2 Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Słowo statystyka pochodzi od łacińskiego słowa status, które oznacza

Bardziej szczegółowo

A B. 2 5 8 18 2 x x x 5 x x 8 x 18

A B. 2 5 8 18 2 x x x 5 x x 8 x 18 Narzędzia modelowania niezawodności 1 Arkusz kalkulacyjny - jest to program zbudowany na schemacie relacyjnych baz danych. Relacje pomiędzy dwiema (lub więcej) cechami można zapisać na kilka sposobów.

Bardziej szczegółowo

Weryfikacja hipotez. Etap I. Formułowanie hipotezy zerowej H 0 oraz związanej z nią hipotezy alternatywnej H 1.

Weryfikacja hipotez. Etap I. Formułowanie hipotezy zerowej H 0 oraz związanej z nią hipotezy alternatywnej H 1. Weryfikacja hipotez Każde badanie naukowe rozpoczyna się od sformułowania problemu badawczego oraz najbardziej prawdopodobnego (na gruncie wiedzy badającego) ogólnego rozwiązania, czyli hipotezy badawczej.

Bardziej szczegółowo

S t a t y s t y k a, część 3. Michał Żmihorski

S t a t y s t y k a, część 3. Michał Żmihorski S t a t y s t y k a, część 3 Michał Żmihorski Porównanie średnich -test T Założenia: Zmienne ciągłe (masa, temperatura) Dwie grupy (populacje) Rozkład normalny* Równe wariancje (homoscedasticity) w grupach

Bardziej szczegółowo

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007 Modele regresji wielorakiej - dobór zmiennych, szacowanie Paweł Cibis pawel@cibis.pl 1 kwietnia 2007 1 Współczynnik zmienności Współczynnik zmienności wzory Współczynnik zmienności funkcje 2 Korelacja

Bardziej szczegółowo

Statystyka matematyczna

Statystyka matematyczna Statystyka matematyczna dla kierunku Zarządzanie na studiach drugiego stopnia Wojciech Kordecki Wyższa Szkoła Handlowa we Wrocławiu Wrocław 2012 Materiał wyłącznie do użytku edukacyjnego. Reprodukcja do

Bardziej szczegółowo

ZASTOSOWANIE METOD SYMULACYJNYCH W ANALIZIE WIELOWYMIAROWYCH TABLIC WIELODZIELCZYCH

ZASTOSOWANIE METOD SYMULACYJNYCH W ANALIZIE WIELOWYMIAROWYCH TABLIC WIELODZIELCZYCH Grzegorz Kończak Magdalena Chmielińska Uniwersytet Ekonomiczny w Katowicach ZASTOSOWANIE METOD SYMULACYJNYCH W ANALIZIE WIELOWYMIAROWYCH TABLIC WIELODZIELCZYCH Wprowadzenie W ostatnich latach w badaniach

Bardziej szczegółowo

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ Dopasowanie rozkładów Dopasowanie rozkładów- ogólny cel Porównanie średnich dwóch zmiennych 2 zmienne posiadają rozkład normalny -> test parametryczny (t- studenta) 2

Bardziej szczegółowo

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów

Bardziej szczegółowo

ANALIZA KORELACJI Korelacja między zmiennymi X i Y jest miarą siły liniowego związku między tymi zmiennymi.

ANALIZA KORELACJI Korelacja między zmiennymi X i Y jest miarą siły liniowego związku między tymi zmiennymi. ANALIZA KORELACJI Większość zjawisk w otaczającym nas świecie występuje nie samotnie a w różnorodnych związkach. Odnosi się to również do zjawisk biologiczno-medycznych. O powiązaniach między nimi mówią

Bardziej szczegółowo

PODSTAWOWE ROZKŁADY ZMIENNYCH LOSOWYCH CIĄGŁYCH

PODSTAWOWE ROZKŁADY ZMIENNYCH LOSOWYCH CIĄGŁYCH Opracowała: Joanna Kisielińska 1 PODSTAWOWE ROZKŁADY ZMIENNYCH LOSOWYCH CIĄGŁYCH Rozkład normalny Zmienna losowa X ma rozkład normalny z parametrami µ i σ (średnia i odchylenie standardowe), jeśli jej

Bardziej szczegółowo

KADD Metoda najmniejszych kwadratów funkcje nieliniowe

KADD Metoda najmniejszych kwadratów funkcje nieliniowe Metoda najmn. kwadr. - funkcje nieliniowe Metoda najmniejszych kwadratów Funkcje nieliniowe Procedura z redukcją kroku iteracji Przykłady zastosowań Dopasowanie funkcji wykładniczej Dopasowanie funkcji

Bardziej szczegółowo

Wykład 12: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Mieszanina rozkładów.

Wykład 12: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Mieszanina rozkładów. Rachunek prawdopodobieństwa MAP1181 Wydział PPT, MS, rok akad. 213/14, sem. zimowy Wykładowca: dr hab. Agnieszka Jurlewicz Wykład 12: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Mieszanina rozkładów.

Bardziej szczegółowo

Wykład z Nowej ekonometrii, 7 marca 2006:

Wykład z Nowej ekonometrii, 7 marca 2006: Wykład z Nowej ekonometrii, 7 marca 2006: Na mojej stronie internetowej podane są pliki z danymi: http://akson.sgh.waw.pl/~ewams/mills.zip http://akson.sgh.waw.pl/~ewams/mills_obligacje.xls dane z pierwszego

Bardziej szczegółowo

Wykład 7: Warunkowa wartość oczekiwana. Rozkłady warunkowe.

Wykład 7: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Rachunek prawdopodobieństwa MAP3040 WPPT FT, rok akad. 2010/11, sem. zimowy Wykładowca: dr hab. Agnieszka Jurlewicz Wykład 7: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Warunkowa wartość oczekiwana.

Bardziej szczegółowo

Wykład 2. Wpływ stałej (odejmujemy 20) Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd.

Wykład 2. Wpływ stałej (odejmujemy 20) Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd. Wykład 2 Wpływ przekształceń Co się stanie ze średnią i odchyleniem standardowym gdy zmienimy jednostki? stopnie Celsiusza stopnie Fahrenheita dolary 1,000 dolarów wartość faktyczna odległość od minimum

Bardziej szczegółowo

MODELOWANIE ZMIENNOŚCI I RYZYKA INWESTYCJI W ZŁOTO. Celina Otolińska

MODELOWANIE ZMIENNOŚCI I RYZYKA INWESTYCJI W ZŁOTO. Celina Otolińska MODELOWANIE ZMIENNOŚCI I RYZYKA INWESTYCJI W ZŁOTO Celina Otolińska PLAN: 1. Rynek złota-krótka informacja. 2. Wartość zagrożona i dlaczego ona. 3. Badany szereg czasowy oraz jego własności. 4. Modele

Bardziej szczegółowo

Analiza struktury transferów na rynku OFE

Analiza struktury transferów na rynku OFE 1 Sugerowany przypis: Chybalski F, Analiza struktury transferów na rynku, Przegląd Statystyczny, nr 4/2005, Dom Wydawniczy Elipsa, Warszawa 2005, s 78 95 Filip Chybalski Analiza struktury transferów na

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)

Bardziej szczegółowo

1 Zmienne losowe wielowymiarowe.

1 Zmienne losowe wielowymiarowe. 1 Zmienne losowe wielowymiarowe. 1.1 Definicja i przykłady. Definicja1.1. Wektorem losowym n-wymiarowym(zmienna losowa n-wymiarowa )nazywamywektorn-wymiarowy,któregoskładowymisązmiennelosowex i dlai=1,,...,n,

Bardziej szczegółowo

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Zmienne muszą być zmiennymi ilościowym (liczymy i porównujemy średnie!) Są to testy parametryczne Nazwa

Bardziej szczegółowo

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Wprowadzenie Podstawowe cele analizy zbiorów danych Uogólniony opis poszczególnych

Bardziej szczegółowo

Diagramy Venna. Uwagi:

Diagramy Venna. Uwagi: Wykład 3: Prawdopodobieństwopodstawowe pojęcia i modele Często modelujemy zmienność używając rachunku prawdopodobieństwa. Prawdopodobieństwo opadów deszczu wynosi 80%. (zinterpretuj) Prawdopodobieństwo

Bardziej szczegółowo

Agata Boratyńska. WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE) Warszawa 2014

Agata Boratyńska. WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE) Warszawa 2014 1 Agata Boratyńska WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE) Warszawa 2014 Agata Boratyńska Wykłady ze statystyki matematycznej 2 Literatura W. Niemiro Rachunek prawdopodobieństwa i statystyka matematyczna,

Bardziej szczegółowo

Janusz Woch Instytut Transportu Politechniki Śląskiej w Katowicach. Statystyka procesów transportowych

Janusz Woch Instytut Transportu Politechniki Śląskiej w Katowicach. Statystyka procesów transportowych Janusz Woch Instytut Transportu Politechniki Śląskiej w Katowicach Statystyka procesów transportowych Katowice maj 2000 Wstęp 2 SPIS TREŚCI 2 WSTĘP 4 1. Zakres Statystyki Procesów Transportowych 13 1.1

Bardziej szczegółowo

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU Zał. nr 4 do ZW WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU Nazwa w języku polskim STATYSTYCZNA ANALIZA DANYCH Nazwa w języku angielskim STATISTICAL DATA ANALYSIS Kierunek studiów (jeśli dotyczy):

Bardziej szczegółowo

Ćwiczenia 7. Badanie istotności róŝnic część II.

Ćwiczenia 7. Badanie istotności róŝnic część II. Ćwiczenia 7. Badanie istotności róŝnic część II. Zadania obowiązkowe UWAGA! Elementy zadań oznaczone kolorem czerwonym naleŝy przygotować lub wypełnić. Zadanie 7.1. (STATISTICA/R) W pliku Serce2.sta (porównaj

Bardziej szczegółowo

dr Dominik M. Marciniak Analizy statystyczne w pracach naukowych czego unikać, na co zwracać uwagę.

dr Dominik M. Marciniak Analizy statystyczne w pracach naukowych czego unikać, na co zwracać uwagę. dr Dominik M. Marciniak Analizy statystyczne w pracach naukowych czego unikać, na co zwracać uwagę. Statistics in academic papers, what to avoid and what to focus on. Uniwersytet Medyczny im. Piastów Śląskich

Bardziej szczegółowo

Proces Poissona. Proces {N(t), t 0} nazywamy procesem zliczającym jeśli N(t) oznacza całkowitą liczbę badanych zdarzeń zaobserwowanych do chwili t.

Proces Poissona. Proces {N(t), t 0} nazywamy procesem zliczającym jeśli N(t) oznacza całkowitą liczbę badanych zdarzeń zaobserwowanych do chwili t. Procesy stochastyczne WYKŁAD 5 Proces Poissona. Proces {N(t), t } nazywamy procesem zliczającym jeśli N(t) oznacza całkowitą liczbę badanych zdarzeń zaobserwowanych do chwili t. Proces zliczający musi

Bardziej szczegółowo

Statystyka stosowana MAP 1079

Statystyka stosowana MAP 1079 MAP 1079 Lista 1a 1 Statystyka stosowana MAP 1079 Lista 1a (powtórka z rachunku prawdopodobieństwa) 1. Zmienna losowa X przyjmuje wartości 2, 3, 5, 8 z prawdopodobieństwami odpowiednio równymi 2/10, 4/10,

Bardziej szczegółowo

STATYSTYKA zadania do ćwiczeń. Weryfikacja hipotez część I.

STATYSTYKA zadania do ćwiczeń. Weryfikacja hipotez część I. STATYSTYKA zadania do ćwiczeń Weryfikacja hipotez część I Zad 1 W pewnej firmie postanowiono zbadać staż pracy pracowników W tym celu wylosowano prostą próbę losową z populacji pracowników i otrzymano,

Bardziej szczegółowo

istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy

istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy MODEL REGRESJI LINIOWEJ. METODA NAJMNIEJSZYCH KWADRATÓW Analiza regresji zajmuje się badaniem zależności pomiędzy interesującymi nas wielkościami (zmiennymi), mające na celu konstrukcję modelu, który dobrze

Bardziej szczegółowo

Rozkłady dwóch zmiennych losowych

Rozkłady dwóch zmiennych losowych Rozkłady dwóch zmiennych losowych Uogólnienie pojęć na rozkład dwóch zmiennych Dystrybuanta i gęstość prawdopodobieństwa Rozkład brzegowy Prawdopodobieństwo warunkowe Wartości średnie i odchylenia standardowe

Bardziej szczegółowo

Państwowa Wyższa Szkoła Zawodowa w Nowym Sączu. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2011/2012

Państwowa Wyższa Szkoła Zawodowa w Nowym Sączu. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2011/2012 Państwowa Wyższa Szkoła Zawodowa w Nowym Sączu Karta Instytut Pedagogiczny obowiązuje studentów rozpoczynających studia w roku akademickim 011/01 Kierunek studiów: Matematyka Profil: Ogólnoakademicki Forma

Bardziej szczegółowo

Analiza Współzależności

Analiza Współzależności Statystyka Opisowa z Demografią oraz Biostatystyka Analiza Współzależności Aleksander Denisiuk denisjuk@euh-e.edu.pl Elblaska Uczelnia Humanistyczno-Ekonomiczna ul. Lotnicza 2 82-300 Elblag oraz Biostatystyka

Bardziej szczegółowo

STATYSTYKA STOSOWANA MAP1079

STATYSTYKA STOSOWANA MAP1079 STATYSTYKA STOSOWANA MAP1079 LISTY ZADAŃ opracowanie W. Wawrzyniak-Kosz Literatura podstawowa 1.J.Koronacki, J.Mielniczuk, Statystyka dla studentów kierunków technicznych i przyrodniczych, WNT, Warszawa

Bardziej szczegółowo

SCENARIUSZ LEKCJI MATEMATYKI, FIZYKI LUB BIOLOGII Z WYKORZYSTANIEM FILMU ROZKŁAD NORMALNY.

SCENARIUSZ LEKCJI MATEMATYKI, FIZYKI LUB BIOLOGII Z WYKORZYSTANIEM FILMU ROZKŁAD NORMALNY. SCENARIUSZ LEKCJI MATEMATYKI, FIZYKI LUB BIOLOGII Z WYKORZYSTANIEM FILMU ROZKŁAD NORMALNY. SPIS TREŚCI: I. Wprowadzenie. II. Części lekcji. 1. Część wstępna. 2. Część realizacji. 3. Część podsumowująca.

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela

Statystyka w pracy badawczej nauczyciela Statystyka w pracy badawczej nauczyciela Wykład 1: Terminologia badań statystycznych dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka (1) Statystyka to nauka zajmująca się zbieraniem, badaniem

Bardziej szczegółowo

Analiza regresji część II. Agnieszka Nowak - Brzezińska

Analiza regresji część II. Agnieszka Nowak - Brzezińska Analiza regresji część II Agnieszka Nowak - Brzezińska Niebezpieczeństwo ekstrapolacji Analitycy powinni ograniczyć predykcję i estymację, które są wykonywane za pomocą równania regresji dla wartości objaśniającej

Bardziej szczegółowo

JEDNOCZYNNIKOWA ANALIZA WARIANCJI, ANOVA 1

JEDNOCZYNNIKOWA ANALIZA WARIANCJI, ANOVA 1 Powtórzenie: ANOVA 1 JEDNOCZYNNIKOWA ANALIZA WARIANCJI, ANOVA 1 Obserwowana (badana) cecha Y Czynnik wpływający na Y (badany) A A i i ty poziom czynnika A (i=1..a), n i liczba powtórzeń w i tej populacji

Bardziej szczegółowo

Statystyki pozycyjne w procedurach estymacji i ich zastosowania w badaniach ekonomicznych

Statystyki pozycyjne w procedurach estymacji i ich zastosowania w badaniach ekonomicznych Statystyki pozycyjne w procedurach estymacji i ich zastosowania w badaniach ekonomicznych Dorota Pekasiewicz Statystyki pozycyjne w procedurach estymacji i ich zastosowania w badaniach ekonomicznych Dorota

Bardziej szczegółowo

Zadania o numerze 4 z zestawów licencjat 2014.

Zadania o numerze 4 z zestawów licencjat 2014. Zadania o numerze 4 z zestawów licencjat 2014. W nawiasie przy zadaniu jego występowanie w numerze zestawu Spis treści (Z1, Z22, Z43) Definicja granicy ciągu. Obliczyć granicę:... 3 Definicja granicy ciągu...

Bardziej szczegółowo

0.1 ROZKŁADY WYBRANYCH STATYSTYK

0.1 ROZKŁADY WYBRANYCH STATYSTYK 0.1. ROZKŁADY WYBRANYCH STATYSTYK 1 0.1 ROZKŁADY WYBRANYCH STATYSTYK Zadaia 0.1.1. Niech X 1,..., X będą iezależymi zmieymi losowymi o tym samym rozkładzie. Obliczyć ES 2 oraz D 2 ( 1 i=1 X 2 i ). 0.1.2.

Bardziej szczegółowo

Generacja liczb pseudolosowych

Generacja liczb pseudolosowych Generacja liczb pseudolosowych Zapis liczb w komputerze Generatory liczb pseudolosowych Liniowe kongruentne Liniowe mutiplikatywne kongruentne Jakość generatorów Test widmowy Generowanie liczb losowych

Bardziej szczegółowo

50 zadań ze statystyki matematycznej dla studentów ZARZĄDZANIA z rozwiązaniami

50 zadań ze statystyki matematycznej dla studentów ZARZĄDZANIA z rozwiązaniami Jan Rusinek 50 zadań ze statystyki matematycznej dla studentów ZARZĄDZANIA z rozwiązaniami UWAGA! Ten tekst jest w trakcie przygotowania i sprawdzania. Może zawierać błędy. Jest sukcesywnie poprawiany

Bardziej szczegółowo

4. ELEMENTY PŁASKIEGO STANU NAPRĘŻEŃ I ODKSZTAŁCEŃ

4. ELEMENTY PŁASKIEGO STANU NAPRĘŻEŃ I ODKSZTAŁCEŃ 4. ELEMENTY PŁASKIEGO STANU NAPRĘŻEŃ I ODKSZTAŁCEŃ 1 4. 4. ELEMENTY PŁASKIEGO STANU NAPRĘŻEŃ I ODKSZTAŁCEŃ 4.1. Elementy trójkątne Do opisywania dwuwymiarowego kontinuum jako jeden z pierwszych elementów

Bardziej szczegółowo

Wybrane metody statystycznego repróbkowania

Wybrane metody statystycznego repróbkowania Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki Tomasz Kulczyński, Błażej Osiński Nr albumu: 262964, 262963 Wybrane metody statystycznego repróbkowania Praca licencjacka na kierunku

Bardziej szczegółowo

Metody oceny ryzyka operacyjnego

Metody oceny ryzyka operacyjnego Instytut Matematyki i Informatyki Wrocław, 10 VII 2009 Bazylejski Komitet Nadzoru Bankowego Umowa Kapitałowa - 1988 Opracowanie najlepszych praktyk rynkowych w zakresie zarządzania ryzykiem Nowa Umowa

Bardziej szczegółowo

Gimnastyka artystyczna

Gimnastyka artystyczna Gimnastyka artystyczna Zbadano losową próbę N=40 dziewcząt i chłopców z klas o profilu ogólnym i sportowym pod kątem ich ogólnej sprawności fizycznej ocenianej na skali Hirscha (od 0 do 20 pkt.), gdzie

Bardziej szczegółowo

Sterowanie procesem i jego zdolność. Zbigniew Wiśniewski

Sterowanie procesem i jego zdolność. Zbigniew Wiśniewski Sterowanie procesem i jego zdolność Zbigniew Wiśniewski Wybór cech do kart kontrolnych Zaleca się aby w pierwszej kolejności były brane pod uwagę cechy dotyczące funkcjonowania wyrobu lub świadczenia usługi

Bardziej szczegółowo

Metody numeryczne. Wykład nr 12. Dr Piotr Fronczak

Metody numeryczne. Wykład nr 12. Dr Piotr Fronczak Metody numeryczne Wykład nr 1 Dr Piotr Fronczak Generowanie liczb losowych Metody Monte Carlo są oparte na probabilistyce działają dzięki generowaniu liczb losowych. W komputerach te liczby generowane

Bardziej szczegółowo

W tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji.

W tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji. 5 Collocations Związek frazeologiczny (kolokacja), to często używane zestawienie słów. Przykłady: strong tea, weapons of mass destruction, make up. Znaczenie całości wyrażenia, nie zawsze wynika ze znaczeń

Bardziej szczegółowo

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie. SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:

Bardziej szczegółowo

Analiza przeżycia. Wprowadzenie

Analiza przeżycia. Wprowadzenie Wprowadzenie Przedmiotem badania analizy przeżycia jest czas jaki upływa od początku obserwacji do wystąpienia określonego zdarzenia, które jednoznacznie kończy obserwację na danej jednostce. Analiza przeżycia

Bardziej szczegółowo

Janusz Wywiał Katedra Statystyki Akademia Ekonomiczna w Katowicach

Janusz Wywiał Katedra Statystyki Akademia Ekonomiczna w Katowicach Janusz Wywiał Katedra Statystyki Akademia Ekonomiczna w Katowicac Analiza dokładności ocen wartości średnic cec małyc firm W niniejszej pracy przedstawiono na odpowiednim materiale statystycznym praktyczny

Bardziej szczegółowo

Modele selekcji próby

Modele selekcji próby Plan zajęć 1 Problem selekcji próby- heurystyka 2 Problem selekcji próby- teoria 3 Przykład empiryczny Selekcja próby 1 regresja tobitowa- cenzurowanie(transformacja) zmiennej objaśnianej 2 regresja ucięta-

Bardziej szczegółowo

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty

Bardziej szczegółowo

III. ZMIENNE LOSOWE JEDNOWYMIAROWE

III. ZMIENNE LOSOWE JEDNOWYMIAROWE III. ZMIENNE LOSOWE JEDNOWYMIAROWE.. Zmienna losowa i pojęcie rozkładu prawdopodobieństwa W dotychczas rozpatrywanych przykładach każdemu zdarzeniu była przyporządkowana odpowiednia wartość liczbowa. Ta

Bardziej szczegółowo