Statystyczna analiza danych

Wielkość: px
Rozpocząć pokaz od strony:

Download "Statystyczna analiza danych"

Transkrypt

1 Statystyczna analiza danych Marek Ptak 21 października 2013 Marek Ptak Statystyka 21 października / 70

2 Część I Wstęp Marek Ptak Statystyka 21 października / 70

3 LITERATURA A. Łomnicki, Wprowadzenie do statystyki dla przyrodników W. Krysicki, J. Bartos, W. Dyczka, K. Królikowska, M. Wasilewski, Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach J. Koronacki, J. Mieliczuk, Statystyka dla studentów kierunków technicznych i przyrodniczych Marek Ptak Statystyka 21 października / 70

4 Statystyka zajmuje się opisem zjawisk masowych przy pomocy metod rachunku prawdopodobieństwa. Przykład Krzyżujemy nasiona okragłe i żółte z pomarszczonymi i zielonymi. Otrzymano następujace wyniki: pomarszczone zielone 32, pomarszczone i żółte 101, okragłe zielone 108, okragłe żółte 315. Czy stosunek wynosi 1 : 3 : 3 : 9? Marek Ptak Statystyka 21 października / 70

5 Przykład Badamy, która kapusta: biała czy czerwona zawiera więcej witaminy C. W próbkach po 100 g otrzymano następujace wyniki (w mg): biała: 45, 50, 64, 38, 66, 43, 49, 58, 31, 49 oraz czerwona: 70, 68, 55, 61, 62, 74, 52, 71, 56, 61. Który z gatunków zawiera więcej witaminy C? Marek Ptak Statystyka 21 października / 70

6 Przykład Badamy zmienność tymotki. Wykonano pomiary długości najwyższego liścia oraz kłosa kwiatostanu w próbie losowej o liczności 30 kwitnacych pędów i otrzymano następujace wyniki: Nr pędu Liść (cm) 23, 4 22, 0 25, 0 18, 1 18, 9 25, 0 19, 1 27, 5 21, 6 14, 3 Kłos (cm) 9, 8 9, 5 12, 2 8, 3 9, 5 9, 2 8, 5 12, 1 10, 4 5, , 0 16, 3 23, 1 17, 4 17, 0 26, 8 12, 5 18, 4 16, 7 24, 0 10, 6 5, 5 10, 5 7, 4 6, 8 11, 7 4, 1 9, 3 6, 2 11, , 2 21, 2 15, 0 20, 0 20, 1 19, 2 21, 0 13, 0 19, 7 26, 0 10, 2 9, 6 5, 0 8, 5 9, 7 7, 0 7, 9 4, 7 8, 3 12, 6 Czy istnieje zależność między długością najwyższego liścia a długością kłosa kwiatostanu? Marek Ptak Statystyka 21 października / 70

7 Przykład Badamy czy proporcje samic i samców pewnego bardzo rzadkiego gatunku wynosza 1 : 1, tzn, czy rozkład jest dwumianowy. Testowanie hipotez: 1 Przyjęcie założeń. 2 Otrzymanie rozkładu z próby. 3 Wyznaczenie poziomu istotności i obszaru krytycznego. 4 Przeprowadzenie badań i wyliczenie statystyki testowej. 5 Podjęcie decyzji. Marek Ptak Statystyka 21 października / 70

8 X zmienna losowa określająca liczbę samców w wybranych 10 sztukach P(X = k) = ( ) n k p k (1 p) n k ( ) P(X = 0) = 10 ( )10 ( 1 2 )0 = = 0, ( ) P(X = 1) = 10 ( )9 ( 1 2 )1 = = = 0, ( ) P(X = 2) = 10 ( )8 ( 1 2 )2 = 45 1 = 45 = 0, ( ) P(X = 3) = 10 ( )7 ( 1 2 )3 = = 15 = 0, ( ) P(X = 4) = 10 ( )6 ( 1 2 )4 = = = 0, ( ) P(X = 5) = 10 ( )5 ( 1 2 )5 = = = 0, ( ) P(X = 6) = 10 ( )4 ( 1 2 )6 = = = 0, ( ) P(X = 7) = 10 ( )3 ( 1 2 )7 = = = 0, ( ) P(X = 8) = 10 ( )2 ( 1 2 )8 = = = 0, ( ) P(X = 9) = 10 ( )1 ( 1 2 )9 = = 0, P(X = 10) = ( ) ( 1 2 )0 ( 1 2 )10 = = = 0, Marek Ptak Statystyka 21 października / 70

9 Część II Rachunek prawdopodobieństwa Marek Ptak Statystyka 21 października / 70

10 (Ω, S, P) przestrzeń probabilistyczna Np. X : Ω R zmienna losowa {ω Ω : X(ω) < t} S Dystrubuanta zmiennej losowej X F X : R [0, 1] F X (t) = P({ω Ω : X(ω) < t}) Marek Ptak Statystyka 21 października / 70

11 Zmienna losowa typu dyskretnego Skończona lub przeliczalna liczba wartości W X = {x 1, x 2,... x n, x n+1,... } P(X = x i ) = p(x i ) = p i p(x 1 ) + + p(x n ) + = 1 F X (x) = x i <x p(x i ) P(X = x i ) = p(x i ) rozkład zmiennej losowej P(a X < b) = p(x i ) a x i <b Marek Ptak Statystyka 21 października / 70

12 Przykład: Dwie komórki dzielą się każda z prawdopodobieństwem 0, 4 X zmienna losowa określająca liczbę podzielonych komórek P(X = 0) = 0, 6 0, 6 = 0, 36 P(X = 1) = 0, 6 0, 4 + 0, 4 0, 6 = 0, 48 P(X = 2) = 0, 4 0, 4 = 0, 16 Rozkład zmiennej losowej X x i p(x i ) 0, 36 0, 48 0, 16 Marek Ptak Statystyka 21 października / 70

13 Dystrybuanta zmiennej losowej X 0 dla x 0, 0, 36 dla 0 < x 1, F(x) = 0, 84 dla 1 < x 2, 1 dla 2 < x. Marek Ptak Statystyka 21 października / 70

14 Zmienna typu dyskretnego wartość oczekiwana zmiennej losowej X EX = x i p i x i Ω Wariancja zmiennej losowej X VarX, D 2 X, σ 2, σ 2 X, µ 2, DX = VarX VarX = E(X EX) 2 kwantylem rzędu p jest liczba x p taka, że P(X < x p ) P(X = x i ) p P(X = x i ) x i <x p x i x p Współczynnik zmienności τ X = DX EX Marek Ptak Statystyka 21 października / 70

15 Rozkład dwupunktowy Zmienna typu skokowego o prawdopodobieństwie: E(X) = p, D 2 (X) = p(1 p) x i 0 1 p(x i ) 1 p p Np. Prawdopodobieństwo, że nastąpiła mutacja lub nie, białe lub czarne. Marek Ptak Statystyka 21 października / 70

16 Rozkład dwumianowy Liczba sukcesów w n doświadczeniach P(X = k) = ( ) n k p k (1 p) n k X i wynik w i tej próbie X 1,..., X n niezależne zmienne losowe X = X X n E(X) = E(X X n ) = E(X 1 ) + + E(X n ) = p + + p = np D 2 (X) = D 2 (X 1 )+ +D 2 (X n ) = p(1 p)+ +p(1 p) = np(1 p) Marek Ptak Statystyka 21 października / 70

17 Rozkład geometryczny Mamy dane pewne zdarzenie losowe zachodzące z prawdopodobieństwem p. Przeprowadzamy je wiele razy. Zmienna losowa o rozkładzie geometrycznym X to liczba prób potrzebnych, aby to zdarzenie się zrealizowało P(X = k) = (1 p) k 1 p (bo k 1 zd. przeciwne i raz zd. dane) E(X) = 1 p D 2 (X) = 1 p p 2 Np. X 1 obsługa masowa, jak długo trzeba czekać, aby być obsłużonym Marek Ptak Statystyka 21 października / 70

18 Rozkład Poissona λ λk P(X = k) = e k = 0, 1, 2,... k! EX = λ D 2 X = λ µ 3 = λ Rozkład Poissona opisuje liczbę pewnych zdarzeń w pewnym określonym przedziale czasowym. Np. ile komórek podzieliło się w ciągu jakiegoś odcinka czasu, np. w ciągu 1 minuty, 1 godz. λ oznacza intensywność danego zjawiska Marek Ptak Statystyka 21 października / 70

19 Rozkład hipergeometryczny Zmienna typu skokowego o rozkładzie prawdopodobieństwa P(X = k) = (n k)( N M n k ) ( N n) EX = np D 2 X = np(1 p) ( ) N n N 1 p = M N Marek Ptak Statystyka 21 października / 70

20 Zmienna losowa typu ciągłego Istnieje f : R R ciągła (całkowalna) a<b + P(a X b) = f gęstość rozkładu F X (x) = Twierdzenie b a f (t) dt x f (t) dt X : Ω R zmienna losowa typu ciagłego + f (t) dt = 1 P(X = a) = 0 P(a < X < b) = P(a X < b) = P(a < X b) = P(a X b) = F X (b) F X (a) Marek Ptak Statystyka 21 października / 70

21 Twierdzenie f : R R gęstość zmiennej losowej, f ciagła w x 0. Wtedy F X(x) = f (x) Marek Ptak Statystyka 21 października / 70

22 Przykład f (t) = { 2 3 t2 dla 0 < t < 1, 0 dla t 0 lub t 1. Dystrybuanta ma postać 0 dla x 0, 1 F(x) = 3 ) dla 0 < x 1 1 dla 1 < x. Marek Ptak Statystyka 21 października / 70

23 Zmienna losowa typu ciągłego EX = + x f (x) dx D 2 X = VarX = E(X E(X)) 2 Kwantylem rzędu p jest liczba x p taka, że P(X < x p ) = p x p f (x) dx = p F(x p ) = p Współczynnik zmienności τ X = DX EX Marek Ptak Statystyka 21 października / 70

24 Rozkład równomierny f (x) = { 1 b a dla x [a, b], 0 dla x / [a, b]. 0 dla x < a, x a F(x) = dla a x b, b a 1 dla x > b. E(X) = a+b D 2 (X) = (b a) Marek Ptak Statystyka 21 października / 70

25 Rozkład Cauchy ego Zmienna typu ciągłego o gęstości f (x) = 1 λ λ > 0 π λ 2 +(x µ) 2 EX, D 2 X nie istnieją Marek Ptak Statystyka 21 października / 70

26 Rozkład wykładniczy f (x) = { λe λx dla x > 0, 0 dla x < 0. F(x) = { 1 e λx dla x > 0, 0 dla x < 0. Zmienna o rozkładzie wykładniczym to czas oczekiwania do wystąpienia pierwszego zdarzenia w rozkładzie Poissona Marek Ptak Statystyka 21 października / 70

27 Rozkład normalny N(µ, σ) f (x) = 1 2πσ e (x µ)2 2σ 2 F(x) = Φ(x) = 1 2π x EX = µ D 2 X = σ 2 e t2 2 dt Marek Ptak Statystyka 21 października / 70

28 Twierdzenie X zmienna o rozkładzie normalnym N(µ, σ) to EX = µ, D 2 X = σ 2. Ponadto Z = X µ σ ma rozkład N(0, 1), tzn EZ = 0, D 2 Z = 1. Marek Ptak Statystyka 21 października / 70

29 Dystrybuanta standaryzowanego rozkładu normalnego, Φ(x) = 1 x 2π e 1 2 t2 dt, x > 0 x 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177 1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545 1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633 1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706 1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767 2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817 2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857 2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890 2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916 2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936 2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952 2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964 2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974 2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981 2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986 3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990 Marek Ptak Statystyka 21 października / 70

30 Dla rozkładu normalnego zachodzi tzw. Reguła 3σ P( X µ 3σ) = 1 P( X µ < 3σ) = 1 P( 3σ < X µ < 3σ) = 1 P( 3 < X µ < 3) = 1 P( 3 < Z < 3) = σ 1 (Φ(3) Φ( 3)) = 1 (0, , 00135) = 0, 0027 Marek Ptak Statystyka 21 października / 70

31 Twierdzenie Niech X 1,..., X n będa zmiennymi losowymi o tym samym rozkładzie normalnym N(µ, σ). Wtedy zmienna Z = 1(X n X n ) ma rozkład N(µ, σ n ). Marek Ptak Statystyka 21 października / 70

32 Rozkład logarytmiczno-normalny Zmienna losowa Y ma rozkład logarytmiczno-normalny, gdy zmienna losowa X = ln Y ma rozkład normalny N(µ, σ) (ln y µ) 2 f (y) = 1 yσ 2π e 2σ 2 Marek Ptak Statystyka 21 października / 70

33 Rozkład t Studenta o n 1 stopniach swobody Zmienna losowa o gęstości f (x) = ( ) (n+1)/2 Γ[(n + 1)/2] 1 + x2, x R, n N nπ Γ(n/2) n gdzie Γ(r) = + 0 x r 1 e x dx, r > 0 Marek Ptak Statystyka 21 października / 70

34 Rozkład t Studenta o n 1 stopniach swobody Marek Ptak Statystyka 21 października / 70

35 Wartości krytyczne rozkładu t-studenta, P( T tα; r) = α α r 0,8 0,6 0,4 0,2 0,1 0,05 0,04 0,02 0,01 0,002 0, ,325 0,727 1,376 3,078 6,314 12,706 15,894 31,821 63, ,29 636,58 2 0,289 0,617 1,061 1,886 2,920 4,303 4,849 6,965 9,925 22,328 31, ,277 0,584 0,978 1,638 2,353 3,182 3,482 4,541 5,841 10,214 12, ,271 0,569 0,941 1,533 2,132 2,776 2,999 3,747 4,604 7,173 8, ,267 0,559 0,920 1,476 2,015 2,571 2,757 3,365 4,032 5,894 6, ,265 0,553 0,906 1,440 1,943 2,447 2,612 3,143 3,707 5,208 5, ,263 0,549 0,896 1,415 1,895 2,365 2,517 2,998 3,499 4,785 5, ,262 0,546 0,889 1,397 1,860 2,306 2,449 2,896 3,355 4,501 5, ,261 0,543 0,883 1,383 1,833 2,262 2,398 2,821 3,250 4,297 4, ,260 0,542 0,879 1,372 1,812 2,228 2,359 2,764 3,169 4,144 4, ,260 0,540 0,876 1,363 1,796 2,201 2,328 2,718 3,106 4,025 4, ,259 0,539 0,873 1,356 1,782 2,179 2,303 2,681 3,055 3,930 4, ,259 0,538 0,870 1,350 1,771 2,160 2,282 2,650 3,012 3,852 4, ,258 0,537 0,868 1,345 1,761 2,145 2,264 2,624 2,977 3,787 4, ,258 0,536 0,866 1,341 1,753 2,131 2,249 2,602 2,947 3,733 4, ,258 0,535 0,865 1,337 1,746 2,120 2,235 2,583 2,921 3,686 4, ,257 0,534 0,863 1,333 1,740 2,110 2,224 2,567 2,898 3,646 3, ,257 0,534 0,862 1,330 1,734 2,101 2,214 2,552 2,878 3,610 3, ,257 0,533 0,861 1,328 1,729 2,093 2,205 2,539 2,861 3,579 3, ,257 0,533 0,860 1,325 1,725 2,086 2,197 2,528 2,845 3,552 3, ,257 0,532 0,859 1,323 1,721 2,080 2,189 2,518 2,831 3,527 3, ,256 0,532 0,858 1,321 1,717 2,074 2,183 2,508 2,819 3,505 3, ,256 0,532 0,858 1,319 1,714 2,069 2,177 2,500 2,807 3,485 3, ,256 0,531 0,857 1,318 1,711 2,064 2,172 2,492 2,797 3,467 3, ,256 0,531 0,856 1,316 1,708 2,060 2,167 2,485 2,787 3,450 3, ,256 0,531 0,856 1,315 1,706 2,056 2,162 2,479 2,779 3,435 3, ,256 0,531 0,855 1,314 1,703 2,052 2,158 2,473 2,771 3,421 3, ,256 0,530 0,855 1,313 1,701 2,048 2,154 2,467 2,763 3,408 3, ,256 0,530 0,854 1,311 1,699 2,045 2,150 2,462 2,756 3,396 3, ,256 0,530 0,854 1,310 1,697 2,042 2,147 2,457 2,750 3,385 3, ,255 0,529 0,852 1,306 1,690 2,030 2,133 2,438 2,724 3,340 3, ,255 0,529 0,851 1,303 1,684 2,021 2,123 2,423 2,704 3,307 3, ,255 0,528 0,850 1,301 1,679 2,014 2,115 2,412 2,690 3,281 3, ,255 0,528 0,849 1,299 1,676 2,009 2,109 2,403 2,678 3,261 3, ,254 0,527 0,848 1,296 1,671 2,000 2,099 2,390 2,660 3,232 3, ,254 0,527 0,847 1,294 1,667 1,994 2,093 2,381 2,648 3,211 3, ,254 0,526 0,846 1,292 1,664 1,990 2,088 2,374 2,639 3,195 3, ,254 0,526 0,846 1,291 1,662 1,987 2,084 2,368 2,632 3,183 3, ,254 0,526 0,845 1,290 1,660 1,984 2,081 2,364 2,626 3,174 3, ,254 0,526 0,845 1,289 1,658 1,980 2,076 2,358 2,617 3,160 3,373 0,253 0,524 0,842 1,282 1,645 1,960 2,054 2,327 2,576 3,091 3,291 Marek Ptak Statystyka 21 października / 70

36 Rozkład χ 2 o n stopniach swobody Zmienna o gęstości f (x) = { 1 2 n/2 2 k 1 e 1 2 x2, Γ(n/2) gdy x > 0, 0, gdy x 0 Marek Ptak Statystyka 21 października / 70

37 Wartości krytyczne rozkładu χ 2, P(χ 2 χ 2 α; r) = α α r 0,999 0,995 0,99 0,975 0,95 0,9 0,1 0,05 0,025 0,01 0,005 0, ,000 0,000 0,000 0,001 0,004 0,016 2,706 3,841 5,024 6,635 7,879 10, ,002 0,010 0,020 0,051 0,103 0,211 4,605 5,991 7,378 9,210 10,597 13, ,024 0,072 0,115 0,216 0,352 0,584 6,251 7,815 9,348 11,345 12,838 16, ,091 0,207 0,297 0,484 0,711 1,064 7,779 9,488 11,143 13,277 14,860 18, ,210 0,412 0,554 0,831 1,145 1,610 9,236 11,070 12,832 15,086 16,750 20, ,381 0,676 0,872 1,237 1,635 2,204 10,645 12,592 14,449 16,812 18,548 22, ,599 0,989 1,239 1,690 2,167 2,833 12,017 14,067 16,013 18,475 20,278 24, ,857 1,344 1,647 2,180 2,733 3,490 13,362 15,507 17,535 20,090 21,955 26, ,152 1,735 2,088 2,700 3,325 4,168 14,684 16,919 19,023 21,666 23,589 27, ,479 2,156 2,558 3,247 3,940 4,865 15,987 18,307 20,483 23,209 25,188 29, ,834 2,603 3,053 3,816 4,575 5,578 17,275 19,675 21,920 24,725 26,757 31, ,214 3,074 3,571 4,404 5,226 6,304 18,549 21,026 23,337 26,217 28,300 32, ,617 3,565 4,107 5,009 5,892 7,041 19,812 22,362 24,736 27,688 29,819 34, ,041 4,075 4,660 5,629 6,571 7,790 21,064 23,685 26,119 29,141 31,319 36, ,483 4,601 5,229 6,262 7,261 8,547 22,307 24,996 27,488 30,578 32,801 37, ,942 5,142 5,812 6,908 7,962 9,312 23,542 26,296 28,845 32,000 34,267 39, ,416 5,697 6,408 7,564 8,672 10,085 24,769 27,587 30,191 33,409 35,718 40, ,905 6,265 7,015 8,231 9,390 10,865 25,989 28,869 31,526 34,805 37,156 42, ,407 6,844 7,633 8,907 10,117 11,651 27,204 30,144 32,852 36,191 38,582 43, ,921 7,434 8,260 9,591 10,851 12,443 28,412 31,410 34,170 37,566 39,997 45, ,447 8,034 8,897 10,283 11,591 13,240 29,615 32,671 35,479 38,932 41,401 46, ,983 8,643 9,542 10,982 12,338 14,041 30,813 33,924 36,781 40,289 42,796 48, ,529 9,260 10,196 11,689 13,091 14,848 32,007 35,172 38,076 41,638 44,181 49, ,085 9,886 10,856 12,401 13,848 15,659 33,196 36,415 39,364 42,980 45,558 51, ,649 10,520 11,524 13,120 14,611 16,473 34,382 37,652 40,646 44,314 46,928 52, ,222 11,160 12,198 13,844 15,379 17,292 35,563 38,885 41,923 45,642 48,290 54, ,803 11,808 12,878 14,573 16,151 18,114 36,741 40,113 43,195 46,963 49,645 55, ,391 12,461 13,565 15,308 16,928 18,939 37,916 41,337 44,461 48,278 50,994 56, ,986 13,121 14,256 16,047 17,708 19,768 39,087 42,557 45,722 49,588 52,335 58, ,588 13,787 14,953 16,791 18,493 20,599 40,256 43,773 46,979 50,892 53,672 59, ,688 17,192 18,509 20,569 22,465 24,797 46,059 49,802 53,203 57,342 60,275 66, ,917 20,707 22,164 24,433 26,509 29,051 51,805 55,758 59,342 63,691 66,766 73, ,251 24,311 25,901 28,366 30,612 33,350 57,505 61,656 65,410 69,957 73,166 80, ,674 27,991 29,707 32,357 34,764 37,689 63,167 67,505 71,420 76,154 79,490 86, ,738 35,534 37,485 40,482 43,188 46,459 74,397 79,082 83,298 88,379 91,952 99, ,036 43,275 45,442 48,758 51,739 55,329 85,527 90,531 95, ,43 104,21 112, ,520 51,172 53,540 57,153 60,391 64,278 96, ,88 106,63 112,33 116,32 124, ,156 59,196 61,754 65,647 69,126 73, ,57 113,15 118,14 124,12 128,30 137, ,918 67,328 70,065 74,222 77,929 82, ,50 124,34 129,56 135,81 140,17 149, ,756 83,852 86,923 91,573 95, ,62 140,23 146,57 152,21 158,95 163,65 173, , ,65 104,03 109,14 113,66 119,03 161,83 168,61 174,65 181,84 186,85 197,45 Marek Ptak Statystyka 21 października / 70

38 Rozkład Weibulla Zmienna o gęstości p, λ > 0 f (x) = D 2 X = λ 2 p { λp x p 1 e λxp, gdy x > 0, 0, gdy x 0 EX = λ 1 p ( 1 p + 1 ) {Γ( 2p + 1) [Γ( 1p )]2 }, gdzie Γ(r) = + 0 x r 1 e x dx, r > 0 Marek Ptak Statystyka 21 października / 70

39 Twierdzenie Czebyszewa X 1, X 2,..., X n zmienne losowe parami niezależne E(X k ) = a, D 2 (X k ) < c Wtedy lim 1 Xi a < ε) = 1 n n Marek Ptak Statystyka 21 października / 70

40 Twierdzenie X 1,..., X n niezależne zmienne losowe o tym samym rozkładzie o średniej µ < i odchyleniu standardowym σ <. Wtedy zmienna n losowa X = 1 X n i o średniej µ i odchyleniu standardowym σ n. Wniosek i=1 Jeżeli X 1,..., X n niezależne zmienne losowe o tym samym rozkładzie n normalnym N(µ, σ), to X = 1 X n i ma rozkład N(µ, σ n ). i=1 Marek Ptak Statystyka 21 października / 70

41 Twierdzenie Jeżeli X 1,..., X n to niezależne zmienne losowe o rozkładzie N(µ, σ), n n X = 1 X n i oraz S 2 = 1 (X n i X) 2, to zmienna losowa i=1 i=1 V = X µ S n 1 ma rozkład t Studenta o (n 1) stopniach swobody. Marek Ptak Statystyka 21 października / 70

42 Twierdzenie (Centralne twierdzenie graniczne Linberga-Levy ego) X 1,..., X n niezależne zmienne losowe o tym samym rozkładzie o średniej µ i wariancji σ 2. Wtedy dystrybuanta zmiennej losowej X n = 1 n (X X n ) jest zbieżna do dystrybuanty rozkładu normalnego N(µ, σ n ), tzn. dystrybuanta zmiennej losowej X µ σ n do dystrybuanty rozkładu normalnego N(0, 1). Wniosek P ( a X µ b ) P(a Z b) = Φ(b) Φ(a) σ n Z ma rozkład N(0, 1). stosujemy n > 25 zmierza Marek Ptak Statystyka 21 października / 70

43 Część III Statystyka Marek Ptak Statystyka 21 października / 70

44 Populacja to zbiór, który badamy Definicja Prosta próba losowa o liczności n nazywamy ciag niezależnych zmiennych losowych X 1,..., X n określonych na Ω takich, że każda ma taki sam rozkład. Realizacja zmiennej losowej to konkretny ciąg wartości zmiennych losowych (takie samo prawdopodobieństwo wyboru). Realizacja próby w postaci wartości np. wielkość komórki, liczba podziałów w jednostce czasu, temperatura, czasu do pierwszego podziału komórki (próba mała n 30, duża n > 30) Marek Ptak Statystyka 21 października / 70

45 Niech x 1,..., x n będzie realizacją próby. Realizacja próby małej porządkujemy. Realizacja próby dużej tworzymy szereg rozdzielczy R rozstęp, R = x max x min Dzielimy na klasy, liczba klas k 5 ln n, k = n Długość klasy b = R k n k Średnia arytmetyczna x = 1 x n i x = 1 x n i n i Średnia geometryczna g = n x1... x n g = n x n xn k k n log g = 1 log x n i i=1 Średnia harmoniczna h = i=1 ( 1 n n i=1 ) 1 1 x i i=1 h = ( 1 n k i=1 ) 1 n i x i Marek Ptak Statystyka 21 października / 70

46 Mediana (wartość środkowa) m e x 1 x 2 x n { x (n+1)/2, gdy n nieparzyste, m e = 1 (x 2 n/2 + x n/2+1 ), gdy n parzyste. Wartość modalna (moda, dominanta) m 0 próbki x 1,..., x n o powtarzających się wartościach to najczęściej powtarzająca się wartość. Marek Ptak Statystyka 21 października / 70

47 Dla szeregu rozdzielczego m e = x l + b ( m 1 n n m 2 n i ), i=1 gdzie x l lewy koniec klasy zawierającej medianę, m numer klasy zawierającej medianę, n liczność próbki, n i liczność i-tej próbki, b długość klasy. Moda środek najliczniejszej klasy. Marek Ptak Statystyka 21 października / 70

48 Miary rozproszenia (rozrzutu, rozsiania) Wariancja S 2 próbki x 1,..., x n to średnia arytmetyczna kwadratów odchyleń poszczególnych wartości x i od średniej arytmetycznej X próbki S 2 = 1 n n (x i x) 2 = 1 n n xi 2 x 2 S 2 = 1 n n (x i x) 2 n i i=1 i=1 i=1 Odchylenie standardowe S S 2 = 1 n 1 n i=1 (x i x) 2 S 2 = 1 n 1 n n i (x i x) 2 i=1 Marek Ptak Statystyka 21 października / 70

49 Miary rozproszenia (rozrzutu, rozsiania) Odchylenie przeciętne d 1 od wartości średniej x to średnia arytmetyczna wartości bezwzględnych odchyleń poszczególnych wartości x i od średniej arytmetycznej x próbki d 1 = 1 n n x i x d 1 = 1 n i=1 k n i x i x i=1 Odchylenie przeciętne d 2 od mediany m e próbki x 1,..., x n to średnia arytmetyczna wartości bezwzględnych odchyleń poszczególnych wartości x i od mediany m e próbki d 2 = 1 n n x i m e d 2 = 1 n i=1 k n i x i m e i=1 Marek Ptak Statystyka 21 października / 70

50 Miary rozproszenia (rozrzutu, rozsiania) v współczynnik zmienności v = S x 100% Moment zwykły m r rzędu r próbki x 1,..., x n to średnia arytmetyczna r-tych potęg wartości x i n k m r = 1 n x r i m r = 1 n n i x r i i=1 i=1 Moment centralny M r rzędu r próbki x 1,..., x n to średnia arytmetyczna r-tych potęg wartości x i od średniej arytmetycznej x próbki M r = 1 n n (x i x) r M r = 1 n i=1 k n i (x i x) r i=1 Marek Ptak Statystyka 21 października / 70

51 Miary rozproszenia (rozrzutu, rozsiania) Współczynnik skośności (asymetrii) γ 1 = M 3 S 3 Współczynnik koncentracji (skupienia) K = M 4 S 4 Marek Ptak Statystyka 21 października / 70

52 Przykład Zmierzono średnice 50 komórek pewnej bakterii i otrzymano następujace wyniki: 3, 6; 5, 0; 4, 0; 4, 7; 5, 2; 5, 9; 4, 5; 5, 3; 5, 5; 3, 9; 5, 6; 3, 5; 5, 4; 5, 2; 4, 1; 5, 0; 3, 1; 5, 8; 4, 8; 4, 4; 4, 6; 5, 1; 4, 7; 3, 0; 5, 5; 6, 1; 3, 8; 4, 9; 5, 6; 6, 1; 5, 9; 4, 2; 6, 4; 5, 3; 4, 5; 4, 9; 4, 0; 5, 2; 3, 3; 5, 4; 4, 7; 6, 4; 5, 1; 3, 4; 5, 2; 6, 2; 4, 4; 4, 3; 5, 8; 3, 7. Sporzadzić dla danej próbki szereg rozdzielczy. n = 50, k = 7, x min = 3, 0, x max = 6, 4. Stąd R = 3, 4, R/k = 0, 49. Marek Ptak Statystyka 21 października / 70

53 Szereg rozdzielczy Nr klasy Klasy Grupowanie wartości próbki Środki klas x i Liczebności klas n i 1 2,95-3,45 3, ,45-3,95 3, ,95-4,45 4, ,45-4,95 4, ,95-5,45 5, ,45-5,95 5, ,95-6,45 6,2 5 Marek Ptak Statystyka 21 października / 70

54 Statystyki Definicja Statystyka to każda funkcja określona na próbie Θ n (X 1,..., X n ) np. X = 1 n (X X n ) Statystykę Θ n (X 1,..., X n ), którą przyjmujemy jako ocenę nieznanego parametru Θ nazywamy estymatorem parametru Θ. Marek Ptak Statystyka 21 października / 70

55 Jakie własności powinien mieć estymator, abyśmy mogli go zaakceptować? Niech Θ n = Θ n (X 1,..., X n ) estymator parametru Θ Estymator nazywamy zgodnym, jeżeli lim P( Θ n Θ < ε) = 1 n Uwaga Θ n zgodny = n Θ n 1 n zgodny (α n Θ n, α n 1) Marek Ptak Statystyka 21 października / 70

56 Estymator nazywamy nieobciażonym EΘ n (X 1,..., X n ) = Θ Estymator asymptotycznie nieobciażony lim EΘ n(x 1,..., X n ) = Θ n Może istnieć dużo estymatorów nieobciążonych. Estymator efektywny to ten spośród estymatorów nieobciążonych, który ma najmniejszą wariancję. Marek Ptak Statystyka 21 października / 70

57 Tw. Czebyszewa mówi, że X jest estymatorem zgodnym. Twierdzenie Czebyszewa X 1, X 2,..., X n zmienne losowe parami niezależne E(X k ) = a, D 2 (X k ) < c Wtedy lim 1 Xi a < ε) = 1 n n X nieobciążony, bo E( 1 n Xi ) = 1 n E(Xi ) = 1 n nµ = µ S 2 = 1 n n (X i X) 2 zgodny asymptotycznie nieobciążony i=1 S 2 = 1 n 1 n (X i X) 2 zgodny nieobciążony i=1 Marek Ptak Statystyka 21 października / 70

58 Nieznany parametr Estymator Własności Wartość oczekiwana E(X) X = n 1 n X i zgodny nieobciążony rozkład dowolny, dla i=1 rozkładu normalnego, również efektywny mediana z próby zgodny asymptotycznie nieobciążony Wariancja D 2 (X) S1 2 = 1 n (X n i E(X)) 2 zgodny nieobciążony, dla normalnego również efektywny i=1 S 2 = 1 n (X n i X) 2 zgodny asymptotycznie nieobciążony i=1 S = n 1 1 n (X i X) 2 zgodny nieobciążony asymptotycznie efektywnie i=1 odchylenie standardowe σ S 1, S, S zgodny b ns, c ns zgodny nieobciążony, asymptotycznie efektywny dla rozkładu normalnego wskaźnik struktury ˆΘ = k n dla rozkładu Bernouliego zgodny, nieobciążony, efektywny b n = Γ( n 2 ) 2 Γ( n 1 ) n 2 c n = n 1 n = Γ2 ( n 2 ) 2 Γ 2 ( n 1 ) n n Marek Ptak Statystyka 21 października / 70

59 Parametryczne testy istotności Testy dotyczące wartości przeciętnej. Badana cecha X populacji generalnej ma rozkład N(µ, σ) przy znanym σ. H : µ = µ 0 H 1 : µ µ 0 (H 1 : µ > µ 0, H 1 : µ < µ 0 ) Statystyka testowa U = X µ 0 σ ma rozkład N(0, 1) n Marek Ptak Statystyka 21 października / 70

60 Parametryczne testy istotności Testy dotyczące wartości przeciętnej. Marek Ptak Statystyka 21 października / 70

61 Parametryczne testy istotności Testy dotyczące wartości przeciętnej. Przykład Pewien automat w fabryce czekolady wytwarza tabliczki czekolady o nominalnej wadze 250 g. Wiadomo, że rozkład wagi produkowanych tabliczek jest normalny N(µ, σ), gdzie odchylenie standardowe wynosi σ = 5. Kontrola techniczna w pewnym dniu pobrała próbkę losową 16 tabliczek czekolady i otrzymała następujące wyniki (w g): 251, 2; 246, 1; 250, 1; 247, 1; 251, 2; 251, 2; 243, 2; 243, 1; 251, 1; 245, 2; 251, 2; 245, 3; 242, 1; 250, 2; 246, 1; 252, 0. Czy (na poziomie istotności α = 0, 05) można stwierdzić, że automat produkuje tabliczki czekolady o wadze mniejszej niż nominalna? Marek Ptak Statystyka 21 października / 70

62 Parametryczne testy istotności Testy dotyczące wartości przeciętnej. Hipoteza H 0 : µ = 250g wobec hipotezy alternatywnej H 1 : µ < 250g x = 247, 9 u obl = x µ 0 σ n = 247, = 1, 68 Wartość u α, dla której P(U u α ) wynosi 1, 64 Marek Ptak Statystyka 21 października / 70

63 Parametryczne testy istotności Testy dotyczące wartości przeciętnej. Ponieważ wartość ta znalazła się w obszarze krytycznym, gdyż u obl = 1, 68 < 1, 64 = u α, więc hipotezę H 0 należy odrzucić na korzyść hipotezy alternatywnej H 1. Oznacza to, że z prawdopodobieństwem błędu mniejszym niż 0, 05 możemy twierdzić, że średnia waga tabliczek czekolady jest za niska. Marek Ptak Statystyka 21 października / 70

64 Parametryczne testy istotności Testy dotyczące wartości przeciętnej. Przykład Inne dane. Rozkład wagi produkowanych tabliczek jest normalny N(µ, σ). µ = 250 g,σ = 5, n = 16. Masa poszczególnych tabliczek czekolady (w g): 251,2; 246,1; 250,0; 249,3; 247,5; 251,2; 245,1; 247,2; 251,9; 245,7; 250,7; 244,4; 242,2; 250,3; 246,2; 252,1. Czy (na poziomie istotności α = 0, 05) można stwierdzić, że automat produkuje tabliczki czekolady o wadze mniejszej niż nominalna? Marek Ptak Statystyka 21 października / 70

65 Parametryczne testy istotności Testy dotyczące wartości przeciętnej. Hipoteza H 0 : µ = 250g wobec hipotezy alternatywnej H 1 : µ < 250g x = 248, 2 u obl = x µ 0 σ n = 248, = 1, 45 Wartość u α, dla której P(U u α ) wynosi 1, 64 Ponieważ wartość ta nie znalazła się w obszarze krytycznym, gdyż u obl = 1, 45 > 1, 64 = u α, więc nie ma podstaw do odrzucenia hipotezy H 0. Marek Ptak Statystyka 21 października / 70

66 Parametryczne testy istotności Testy dotyczące wartości przeciętnej. Przykład Inne dane. Rozkład wagi produkowanych tabliczek jest normalny N(µ, σ). µ = 250 g, σ = 5, n = 16 Masa poszczególnych tabliczek czekolady (w g): 249, 2; 248, 2; 243, 1; 249, 9; 248, 8; 249, 1; 249, 7; 245, 1; 248, 9; 247, 2; 249, 3; 248, 6; 247, 5; 248, 2; 249, 1; 247, 1;. Czy (na poziomie istotności α = 0, 05) można stwierdzić, że automat produkuje tabliczki czekolady o wadze mniejszej niż nominalna? Marek Ptak Statystyka 21 października / 70

67 Parametryczne testy istotności Testy dotyczące wartości przeciętnej. Hipoteza H 0 : µ = 250g wobec hipotezy alternatywnej H 1 : µ < 250g x = 248, 1 u obl = x µ 0 σ n = 248, = 1, 55 Wartość u α, dla której P(U u α ) wynosi 1, 64 Ponieważ wartość ta nie znalazła się w obszarze krytycznym, gdyż u obl = 1, 55 > 1, 64 = u α, więc nie ma podstaw do odrzucenia hipotezy H 0. Marek Ptak Statystyka 21 października / 70

68 Twierdzenie X 1,..., X n to prosta próba losowa o średniej µ i odchyleniu n standardowym σ. Wtedy zmienna losowa X = 1 X n i o średniej µ i odchyleniu standardowym σ n Wniosek i=1 Jeżeli próba ma rozkład normalny N(µ, σ), to X = 1 n ma rozkład N(µ, σ n ). n X i = 1 n i=1 n X i i=1 Marek Ptak Statystyka 21 października / 70

69 Twierdzenie n Jeżeli X 1,..., X n jest próba losowa o rozkładzie N(µ, σ), X = 1 n i=1 n oraz S 2 = 1 (X n i X) 2, to zmienna losowa V = X µ S n 1 ma i=1 rozkład t Studenta o (n 1) stopniach swobody. X i Marek Ptak Statystyka 21 października / 70

70 Twierdzenie (Centralne twierdzenie graniczne Linberga-Levy ego) X 1,..., X n próba losowa o średniej µ i wariancji σ 2 Wtedy dystrybuanta zmiennej losowej X n = 1 n (X X n ) jest zbieżna do dystrybuanty rozkładu normalnego N(µ, σ n ) tzn. dystrybuanta zmiennej losowej X µ σ n N(0, 1) Wniosek zmierza do dystrybuanty rozkładu normalnego P ( a X µ b ) P(a Z b) = Φ(b) Φ(a) σ n Z ma rozkład N(0, 1). stosujemy n > 25 Marek Ptak Statystyka 21 października / 70

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Rozkłady zmiennych losowych

Rozkłady zmiennych losowych Rozkłady zmiennych losowych Wprowadzenie Badamy pewną zbiorowość czyli populację pod względem występowania jakiejś cechy. Pobieramy próbę i na podstawie tej próby wyznaczamy pewne charakterystyki. Jeśli

Bardziej szczegółowo

STATYSTYKA wykład 5-6

STATYSTYKA wykład 5-6 TATYTYKA wykład 5-6 Twierdzenia graniczne Rozkłady statystyk z próby Wanda Olech Twierdzenia graniczne Jeżeli rozpatrujemy ciąg zmiennych losowych {X ; X ;...; X n }, to zdarza się, że ich rozkłady przy

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;

Bardziej szczegółowo

II WYKŁAD STATYSTYKA. 12/03/2014 B8 sala 0.10B Godz. 15:15

II WYKŁAD STATYSTYKA. 12/03/2014 B8 sala 0.10B Godz. 15:15 II WYKŁAD STATYSTYKA 12/03/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 2 Rachunek prawdopodobieństwa zdarzenia elementarne zdarzenia losowe zmienna losowa skokowa i ciągła prawdopodobieństwo i gęstość prawdopodobieństwa

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin. Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Zadania analityczne (1) Analiza przewiduje badanie podobieństw

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Przykład. Producent pewnych detali twierdzi, że wadliwość jego produkcji nie przekracza 2%. Odbiorca pewnej partii tego produktu chce sprawdzić, czy może wierzyć producentowi.

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

O ŚREDNIEJ STATYSTYCZNEJ

O ŚREDNIEJ STATYSTYCZNEJ O ŚREDNIEJ STATYSTYCZNEJ Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków Rachunek Prawdopodobieństwa i Statystyka Kraków, 20 26 IX 2009 r. WYNIKI OBSERWACJI X 1, X 2,..., X n WYNIKI

Bardziej szczegółowo

Statystyczne metody analizy danych

Statystyczne metody analizy danych Statystyczne metody analizy danych Statystyka opisowa Wykład I-III Agnieszka Nowak - Brzezińska Definicje Statystyka (ang.statistics) - to nauka zajmująca się zbieraniem, prezentowaniem i analizowaniem

Bardziej szczegółowo

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć: Wprowadzenie Statystyka opisowa to dział statystyki zajmujący się metodami opisu danych statystycznych (np. środowiskowych) uzyskanych podczas badania statystycznego (np. badań terenowych, laboratoryjnych).

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 1 i 2

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 1 i 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 1 i 2 Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Słowo statystyka pochodzi od łacińskiego słowa status, które oznacza

Bardziej szczegółowo

Statystyka Opisowa z Demografią oraz Biostatystyka. Zmienne losowe. Aleksander Denisiuk. denisjuk@euh-e.edu.pl

Statystyka Opisowa z Demografią oraz Biostatystyka. Zmienne losowe. Aleksander Denisiuk. denisjuk@euh-e.edu.pl Statystyka Opisowa z Demografią oraz Biostatystyka Zmienne losowe Aleksander Denisiuk denisjuk@euh-e.edu.pl Elblaska Uczelnia Humanistyczno-Ekonomiczna ul. Lotnicza 2 82-300 Elblag oraz Biostatystyka p.

Bardziej szczegółowo

STATYSTYKA Statistics. Inżynieria Środowiska. II stopień ogólnoakademicki

STATYSTYKA Statistics. Inżynieria Środowiska. II stopień ogólnoakademicki Załącznik nr 7 do Zarządzenia Rektora nr../12 z dnia.... 2012r. KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2012/13 STATYSTYKA

Bardziej szczegółowo

Statystyczna analiza danych

Statystyczna analiza danych Statytyka. v.0.9 egz mgr inf nietacj Statytyczna analiza danych Statytyka opiowa Szereg zczegółowy proty monotoniczny ciąg danych i ) n uzykanych np. w trakcie pomiaru lub za pomocą ankiety. Przykłady

Bardziej szczegółowo

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Wprowadzenie Podstawowe cele analizy zbiorów danych Uogólniony opis poszczególnych

Bardziej szczegółowo

Wykład 10 (12.05.08). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

Wykład 10 (12.05.08). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego Wykład 10 (12.05.08). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego Przykład Cena metra kwadratowego (w tys. zł) z dla 14 losowo wybranych mieszkań w

Bardziej szczegółowo

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych Przykłady: Błąd pomiarowy Wzrost, wydajność Temperatura ciała Zawartość różnych składników we

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej 7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA Zadanie 0.1 Zmienna losowa X ma rozkład określony funkcją prawdopodobieństwa: x k 0 4 p k 1/3 1/6 1/ obliczyć EX, D X. (odp. 4/3;

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych

Bardziej szczegółowo

Przegląd ważniejszych rozkładów

Przegląd ważniejszych rozkładów Przegląd ważniejszych rozkładów Rozkład dwupunktowy P (X = x) = { p dla x = a, 1 p dla x = b, to zmienna losowa X ma rozkład dwupunktowy z parametrem p (0 < p < 1). Rozkład ten pojawia się przy opisie

Bardziej szczegółowo

Statystyka matematyczna

Statystyka matematyczna Statystyka matematyczna dla kierunku Zarządzanie na studiach drugiego stopnia Wojciech Kordecki Wyższa Szkoła Handlowa we Wrocławiu Wrocław 2012 Materiał wyłącznie do użytku edukacyjnego. Reprodukcja do

Bardziej szczegółowo

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl Wprowadzenie Podstawowe cele analizy zbiorów danych Uogólniony opis poszczególnych

Bardziej szczegółowo

Zmienna losowa i jej rozkład Dystrybuanta zmiennej losowej Wartość oczekiwana zmiennej losowej

Zmienna losowa i jej rozkład Dystrybuanta zmiennej losowej Wartość oczekiwana zmiennej losowej Zmienna losowa i jej rozkład Dystrybuanta zmiennej losowej Wartość oczekiwana zmiennej losowej c Copyright by Ireneusz Krech ikrech@ap.krakow.pl Instytut Matematyki Uniwersytet Pedagogiczny im. KEN w Krakowie

Bardziej szczegółowo

Zadania o numerze 4 z zestawów licencjat 2014.

Zadania o numerze 4 z zestawów licencjat 2014. Zadania o numerze 4 z zestawów licencjat 2014. W nawiasie przy zadaniu jego występowanie w numerze zestawu Spis treści (Z1, Z22, Z43) Definicja granicy ciągu. Obliczyć granicę:... 3 Definicja granicy ciągu...

Bardziej szczegółowo

Wprowadzenie 2010-10-20

Wprowadzenie 2010-10-20 PODSTAWY STATYSTYKI Dr hab. inż. Piotr Konieczka piotr.konieczka@pg.gda.pl 1 Wprowadzenie Wynik analityczny to efekt przeprowadzonego pomiaru(ów). Pomiar to zatem narzędzie wykorzystywane w celu uzyskania

Bardziej szczegółowo

Test lewostronny dla hipotezy zerowej:

Test lewostronny dla hipotezy zerowej: Poznajemy testowanie hipotez statystycznych w środowisku R Zajęcia z dnia 11 maja 2011 roku Najpierw teoria TESTY ISTOTNOŚCI WARTOŚCI ŚREDNIEJ W POPULACJI GENERALNEJ gdy znana jest wariancja!!! Test prawostronny

Bardziej szczegółowo

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW ODRZUCANIE WYNIKÓW OJEDYNCZYCH OMIARÓW W praktyce pomiarowej zdarzają się sytuacje gdy jeden z pomiarów odstaje od pozostałych. Jeżeli wykorzystamy fakt, że wyniki pomiarów są zmienną losową opisywaną

Bardziej szczegółowo

Agata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne.

Agata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne. 1 Agata Boratyńska WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne. Agata Boratyńska Wykłady ze statystyki 2 Literatura J. Koronacki i J. Mielniczuk Statystyka WNT 2004

Bardziej szczegółowo

III. ZMIENNE LOSOWE JEDNOWYMIAROWE

III. ZMIENNE LOSOWE JEDNOWYMIAROWE III. ZMIENNE LOSOWE JEDNOWYMIAROWE.. Zmienna losowa i pojęcie rozkładu prawdopodobieństwa W dotychczas rozpatrywanych przykładach każdemu zdarzeniu była przyporządkowana odpowiednia wartość liczbowa. Ta

Bardziej szczegółowo

Parametry statystyczne

Parametry statystyczne I. MIARY POŁOŻENIA charakteryzują średni lub typowy poziom wartości cechy, wokół nich skupiają się wszystkie pozostałe wartości analizowanej cechy. I.1. Średnia arytmetyczna x = x 1 + x + + x n n = 1 n

Bardziej szczegółowo

POLITECHNIKA WARSZAWSKA

POLITECHNIKA WARSZAWSKA POLITECHNIKA WARSZAWSKA WYDZIAŁ BUDOWNICTWA, MECHANIKI I PETROCHEMII INSTYTUT INŻYNIERII MECHANICZNEJ STATYSTYCZNA KONTROLA PROCESU (SPC) Ocena i weryfikacja statystyczna założeń przyjętych przy sporządzaniu

Bardziej szczegółowo

Zadanie 2.Na III roku bankowości złożonym z 20 studentów i 10 studentek przeprowadzono test pisemny ze statystyki. Oto wyniki w obu podgrupach.

Zadanie 2.Na III roku bankowości złożonym z 20 studentów i 10 studentek przeprowadzono test pisemny ze statystyki. Oto wyniki w obu podgrupach. Zadanie 1.Wiadomo, że dominanta wagi tuczników jest umiejscowiona w przedziale [120 kg, 130 kg] i wynosi 122,5 kg. Znane są również liczebności przedziałów poprzedzającego i następnego po przedziale dominującym:

Bardziej szczegółowo

Aleksander Adamowski (s1869) zmienn ą losow ą T o rozkładzie wykładniczym o średniej 5 minut.

Aleksander Adamowski (s1869) zmienn ą losow ą T o rozkładzie wykładniczym o średniej 5 minut. Zadanie Statystyczna Analiza Danych - Zadania 6 Aleksander Adamowski (s869) W pewnym biurze czas losowo wybranej rozmowy telefonicznej jest zmienn ą losow ą T o rozkładzie wykładniczym o średniej 5 minut.

Bardziej szczegółowo

Generatory takie mają niestety okres, po którym sekwencja liczb powtarza się.

Generatory takie mają niestety okres, po którym sekwencja liczb powtarza się. 1 Wstęp Będziemyrozważaćgeneratorytypux n+1 =f(x n,x n 1,...,x n k )(modm). Zakładamy,żeargumentamifunkcjifsąliczbycałkowitezezbioru0,1,...,M 1. Dla ustalenia uwagi mogą to być generatory liniowe typu:

Bardziej szczegółowo

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak Autor prezentuje spójny obraz najczęściej stosowanych metod statystycznych, dodatkowo omawiając takie

Bardziej szczegółowo

Statystyka w analizie i planowaniu eksperymentu

Statystyka w analizie i planowaniu eksperymentu Statystyka w analizie i planowaniu eksperymentu Wprowadzenie Prowadzący zajęcia: dr Janusz Piechota Zakład Biofizyki Kierownik zajęć: dr Paweł Błażej Zakład Genomiki Na zajęciach przydają się: dobre chęci,

Bardziej szczegółowo

a)dane są wartości zmiennej losowej: 2, 4, 2, 1, 1, 3, 2, 1. Obliczyć wartość średnią i wariancję.

a)dane są wartości zmiennej losowej: 2, 4, 2, 1, 1, 3, 2, 1. Obliczyć wartość średnią i wariancję. Zad Rozkład zmiennej losowej dyskretnej : a)dane są wartości zmiennej losowej: 2, 4, 2,,, 3, 2,. Obliczyć wartość średnią i wariancję. b)oceny z pracy klasowej w tabeli: Ocena 2 3 4 5 6 Liczba uczniów

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

ZALICZENIA. W celu uzyskania zaliczenia należy wybrać jeden z trzech poniższych wariantów I, II lub III

ZALICZENIA. W celu uzyskania zaliczenia należy wybrać jeden z trzech poniższych wariantów I, II lub III ZALICZENIA W celu uzyskania zaliczenia należy wybrać jeden z trzech poniższych wariantów I, II lub III 1 Wariant I. PROBLEM WŁASNY Sformułować własne zadanie statystyczne związane z własną pracą badawczą

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

Analiza wariancji. dr Janusz Górczyński

Analiza wariancji. dr Janusz Górczyński Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

Opisowa analiza struktury zjawisk statystycznych

Opisowa analiza struktury zjawisk statystycznych Statystyka Opisowa z Demografią oraz Biostatystyka Opisowa analiza struktury zjawisk statystycznych Aleksander Denisiuk denisjuk@euh-e.edu.pl Elblaska Uczelnia Humanistyczno-Ekonomiczna ul. Lotnicza 2

Bardziej szczegółowo

Pytanie: Kiedy do testowania hipotezy stosujemy rozkład normalny?

Pytanie: Kiedy do testowania hipotezy stosujemy rozkład normalny? Pytanie: Kiedy do testowania hipotezy stosujemy rozkład normalny? Gdy: badana cecha jest mierzalna (tzn. posiada rozkład ciągły); badana cecha posiada rozkład normalny; dysponujemy pojedynczym wynikiem;

Bardziej szczegółowo

Z Wikipedii, wolnej encyklopedii.

Z Wikipedii, wolnej encyklopedii. Rozkład normalny Rozkład normalny jest niezwykle ważnym rozkładem prawdopodobieństwa w wielu dziedzinach. Nazywa się go także rozkładem Gaussa, w szczególności w fizyce i inżynierii. W zasadzie jest to

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

Oszacowanie i rozkład t

Oszacowanie i rozkład t Oszacowanie i rozkład t Marcin Zajenkowski Marcin Zajenkowski () Oszacowanie i rozkład t 1 / 31 Oszacowanie 1 Na podstawie danych z próby szacuje się wiele wartości w populacji, np.: jakie jest poparcie

Bardziej szczegółowo

Instytut Matematyczny Uniwersytet Wrocławski. Zakres egzaminu magisterskiego. Wybrane rozdziały anazlizy i topologii 1 i 2

Instytut Matematyczny Uniwersytet Wrocławski. Zakres egzaminu magisterskiego. Wybrane rozdziały anazlizy i topologii 1 i 2 Instytut Matematyczny Uniwersytet Wrocławski Zakres egzaminu magisterskiego Wybrane rozdziały anazlizy i topologii 1 i 2 Pojęcia, fakty: Definicje i pojęcia: metryka, iloczyn skalarny, norma supremum,

Bardziej szczegółowo

Graficzna prezentacja danych statystycznych

Graficzna prezentacja danych statystycznych Szkolenie dla pracowników Urzędu Statystycznego nt. Wybrane metody statystyczne w analizach makroekonomicznych Katowice, 12 i 26 czerwca 2014 r. Dopasowanie narzędzia do typu zmiennej Dobór narzędzia do

Bardziej szczegółowo

Agata Boratyńska. WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE) Warszawa 2014

Agata Boratyńska. WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE) Warszawa 2014 1 Agata Boratyńska WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE) Warszawa 2014 Agata Boratyńska Wykłady ze statystyki matematycznej 2 Literatura W. Niemiro Rachunek prawdopodobieństwa i statystyka matematyczna,

Bardziej szczegółowo

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych 1 Laboratorium III: Testy statystyczne Spis treści Laboratorium III: Testy statystyczne... 1 Wiadomości ogólne... 2 1. Krótkie przypomnienie wiadomości na temat testów statystycznych... 2 1.1. Weryfikacja

Bardziej szczegółowo

Planowanie eksperymentu (optymalizacja procesów chemicznych)

Planowanie eksperymentu (optymalizacja procesów chemicznych) Planowanie eksperymentu (optymalizacja procesów chemicznych) dr inż. Agnieszka Gadomska-Gajadhur E-mail: agadomska@ch.pw.edu.pl Lab. Pawilon, nr tel. 34 54 63 Plan wykładu Dlaczego planujemy eksperymenty?

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

Probabilistyka i statystyka - Teoria

Probabilistyka i statystyka - Teoria Probabilistyka i statystyka - Teoria 1 Prawdopodobieństwo 1. Aksjomatyczna definicja prawdopodobieństwa Kołmogorowa: P (E) 0 - prawdopodobieństwo dowolnego zdarzenia jest większe lub równe 0 by Antek Grzanka,

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY Liczebności i częstości Liczebność liczba osób/respondentów/badanych, którzy udzielili tej konkretnej odpowiedzi. Podawana w osobach. Częstość odsetek,

Bardziej szczegółowo

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ Dopasowanie rozkładów Dopasowanie rozkładów- ogólny cel Porównanie średnich dwóch zmiennych 2 zmienne posiadają rozkład normalny -> test parametryczny (t- studenta) 2

Bardziej szczegółowo

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl. wersja 20.01.2013/13:40

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl. wersja 20.01.2013/13:40 Statystyka dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl wersja 20.01.2013/13:40 Tematyka wykładów 1. Definicja statystyki 2. Populacja, próba 3. Skale pomiarowe 4. Miary położenia (klasyczne i pozycyjne)

Bardziej szczegółowo

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 Zadanie 1 a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 b) W naszym przypadku populacja są inżynierowie w Tajlandii. Czy można jednak przypuszczać, że na zarobki kobiet-inżynierów

Bardziej szczegółowo

Zawartość. Zawartość

Zawartość. Zawartość Opr. dr inż. Grzegorz Biesok. Wer. 2.20 2011 Zawartość Zawartość 1. Tworzenie szeregu rozdzielczego przedziałowego (klasowego)... 3 2. Podstawowy opis struktury... 3 3. Opis rozkładu jednej cechy szereg

Bardziej szczegółowo

Analiza przeżycia. Wprowadzenie

Analiza przeżycia. Wprowadzenie Wprowadzenie Przedmiotem badania analizy przeżycia jest czas jaki upływa od początku obserwacji do wystąpienia określonego zdarzenia, które jednoznacznie kończy obserwację na danej jednostce. Analiza przeżycia

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Testowanie hipotez statystycznych Hipotezą statystyczną jest dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Uwaga! Test studenta dla pojedynczej próby, niekierunkowy. Wykład 9: Testy Studenta. Test Studenta dla jednej próby, kierunkowy

Uwaga! Test studenta dla pojedynczej próby, niekierunkowy. Wykład 9: Testy Studenta. Test Studenta dla jednej próby, kierunkowy Wykład 9: Testy Studenta Jest kilka typów testów Studenta. Mają podobną strukturę, ale służą do testowania różnych hipotez i różnią się nieco postacią statystyki testowej. Trzy podstawowe typy testów Studenta

Bardziej szczegółowo

Statystyka matematyczna Test χ 2. Wrocław, 18.03.2016r

Statystyka matematyczna Test χ 2. Wrocław, 18.03.2016r Statystyka matematyczna Test χ 2 Wrocław, 18.03.2016r Zakres stosowalności Testowanie zgodności Testowanie niezależności Test McNemara Test ilorazu szans Copyright 2014, Joanna Szyda ZAKRES STOSOWALNOŚCI

Bardziej szczegółowo

Statystyka stosowana MAP 1079

Statystyka stosowana MAP 1079 MAP 1079 Lista 1a 1 Statystyka stosowana MAP 1079 Lista 1a (powtórka z rachunku prawdopodobieństwa) 1. Zmienna losowa X przyjmuje wartości 2, 3, 5, 8 z prawdopodobieństwami odpowiednio równymi 2/10, 4/10,

Bardziej szczegółowo

Wykład 7: Warunkowa wartość oczekiwana. Rozkłady warunkowe.

Wykład 7: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Rachunek prawdopodobieństwa MAP3040 WPPT FT, rok akad. 2010/11, sem. zimowy Wykładowca: dr hab. Agnieszka Jurlewicz Wykład 7: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Warunkowa wartość oczekiwana.

Bardziej szczegółowo

Przedmiot statystyki. Graficzne przedstawienie danych.

Przedmiot statystyki. Graficzne przedstawienie danych. Przedmiot statystyki. Graficzne przedstawienie danych. dr Mariusz Grządziel 23 lutego 2009 Przedmiot statystyki Statystyka dzieli się na trzy części: -zbieranie danych; -opracowanie i kondensacja danych

Bardziej szczegółowo

metoda momentów, Wartość oczekiwana (pierwszy moment) dla zmiennej o rozkładzie γ(α, λ) to E(X) = αλ, drugi moment (wariancja) to

metoda momentów, Wartość oczekiwana (pierwszy moment) dla zmiennej o rozkładzie γ(α, λ) to E(X) = αλ, drugi moment (wariancja) to 3.1 Wprowadzenie do estymacji Ile mamy czerwonych krwinek w krwi? Ile karpi żyje w odrze? Ile ton trzody chlewnej będzie wyprodukowane w przyszłym roku? Ile białych samochodów jeździ ulicami Warszawy?

Bardziej szczegółowo

STATYSTYCZNE OPRACOWANIE WYNIKÓW KONTROLI JAKOŚCI ROBÓT ZIEMNYCH

STATYSTYCZNE OPRACOWANIE WYNIKÓW KONTROLI JAKOŚCI ROBÓT ZIEMNYCH Dane bibliograiczne o artykule: http://mieczyslaw_polonski.users.sggw.pl/mppublikacje STATYSTYCZNE OPRACOWANIE WYNIKÓW KONTROLI JAKOŚCI ROBÓT ZIEMNYCH Mieczysław Połoński 1 1. Metodyka statystycznego opracowania

Bardziej szczegółowo

2008-03-18 wolne wolne 2008-03-25 wolne wolne

2008-03-18 wolne wolne 2008-03-25 wolne wolne PLAN SPOTKAŃ ĆWICZEŃ: Data Grupa 2a Grupa 4a Grupa 2b Grupa 4b 2008-02-19 Zajęcia 1 Zajęcia 1 2008-02-26 Zajęcia 1 Zajęcia 1 2008-03-04 Zajęcia 2 Zajęcia 2 2008-03-11 Zajęcia 2 Zajęcia 2 2008-03-18 wolne

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych JERZY STEFANOWSKI Instytut Informatyki Politechnika Poznańska Plan wykładu 1. Metody wnioskowania statystycznego vs. metody opisu 2. Testowanie hipotez statystycznych

Bardziej szczegółowo

Wykład 12: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Mieszanina rozkładów.

Wykład 12: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Mieszanina rozkładów. Rachunek prawdopodobieństwa MAP1181 Wydział PPT, MS, rok akad. 213/14, sem. zimowy Wykładowca: dr hab. Agnieszka Jurlewicz Wykład 12: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Mieszanina rozkładów.

Bardziej szczegółowo

Diagramy Venna. Uwagi:

Diagramy Venna. Uwagi: Wykład 3: Prawdopodobieństwopodstawowe pojęcia i modele Często modelujemy zmienność używając rachunku prawdopodobieństwa. Prawdopodobieństwo opadów deszczu wynosi 80%. (zinterpretuj) Prawdopodobieństwo

Bardziej szczegółowo

Zastosowanie Excela w matematyce

Zastosowanie Excela w matematyce Zastosowanie Excela w matematyce Komputer w dzisiejszych czasach zajmuje bardzo znamienne miejsce. Trudno sobie wyobrazić jakąkolwiek firmę czy instytucję działającą bez tego urządzenia. W szkołach pierwsze

Bardziej szczegółowo

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem

Bardziej szczegółowo

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski Narzędzia statystyczne i ekonometryczne Wykład 1 dr Paweł Baranowski Informacje organizacyjne Wydział Ek-Soc, pok. B-109 pawel@baranowski.edu.pl Strona: baranowski.edu.pl (w tym materiały) Konsultacje:

Bardziej szczegółowo

Statystyka i Analiza Danych

Statystyka i Analiza Danych Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki -

Bardziej szczegółowo

O średniej arytmetycznej i medianie

O średniej arytmetycznej i medianie MATEMATYKA STOSOWANA TOM 11/5 010 Ryszard Zieliński Warszawa) O średniej arytmetycznej i medianie Streszczenie. Mierząc pewną wielkość μ długość, ciężar, temperaturę...) otrzymujemy wynik X, zwykle różniący

Bardziej szczegółowo

2.Wstępna analiza danych c.d.- wykład z 5.03.2006 Populacja i próba

2.Wstępna analiza danych c.d.- wykład z 5.03.2006 Populacja i próba 2.Wstępna analiza danych c.d.- wykład z 5.03.2006 Populacja i próba Populacja- zbiorowość skończona lub nieskończona, w stosunku do której mają być formułowane wnioski. Próba- skończony podzbiór populacji

Bardziej szczegółowo

STATYSTYKA STOSOWANA MAP1079

STATYSTYKA STOSOWANA MAP1079 STATYSTYKA STOSOWANA MAP1079 LISTY ZADAŃ opracowanie W. Wawrzyniak-Kosz Literatura podstawowa 1.J.Koronacki, J.Mielniczuk, Statystyka dla studentów kierunków technicznych i przyrodniczych, WNT, Warszawa

Bardziej szczegółowo

Testy zgodności 9 113

Testy zgodności 9 113 Testy zgodności 9 3 9. TESTY ZGODNOŚCI 9. Różne sytuace praktyczne W praktyce badań statystycznych, ak uż poprzednio stwierdzono, cały proces analizy statystyczne dzielimy na dwa etapy: formułowanie hipotezy

Bardziej szczegółowo

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07. Przedmiot statystyki

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07. Przedmiot statystyki Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07 Statystyka dzieli się na trzy części: Przedmiot statystyki -zbieranie danych; -opracowanie i kondensacja danych (analiza danych);

Bardziej szczegółowo

Państwowa Wyższa Szkoła Zawodowa w Suwałkach SYLLABUS na rok akademicki 2014/2015

Państwowa Wyższa Szkoła Zawodowa w Suwałkach SYLLABUS na rok akademicki 2014/2015 Tryb studiów Stacjonarne Nazwa kierunku studiów Finanse i Rachunkowość Poziom studiów Stopień pierwszy Rok studiów/ semestr II/ Specjalność Państwowa Wyższa Szkoła Zawodowa w Suwałkach SYLLABUS na rok

Bardziej szczegółowo

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów

Bardziej szczegółowo

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota Ekonometria ćwiczenia 3 Prowadzący: Sebastian Czarnota Strona - niezbędnik http://sebastianczarnota.com/sgh/ Normalność rozkładu składnika losowego Brak normalności rozkładu nie odbija się na jakości otrzymywanych

Bardziej szczegółowo

50 zadań ze statystyki matematycznej dla studentów ZARZĄDZANIA z rozwiązaniami

50 zadań ze statystyki matematycznej dla studentów ZARZĄDZANIA z rozwiązaniami Jan Rusinek 50 zadań ze statystyki matematycznej dla studentów ZARZĄDZANIA z rozwiązaniami UWAGA! Ten tekst jest w trakcie przygotowania i sprawdzania. Może zawierać błędy. Jest sukcesywnie poprawiany

Bardziej szczegółowo

Państwowa Wyższa Szkoła Zawodowa w Nowym Sączu. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2011/2012

Państwowa Wyższa Szkoła Zawodowa w Nowym Sączu. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2011/2012 Państwowa Wyższa Szkoła Zawodowa w Nowym Sączu Karta Instytut Pedagogiczny obowiązuje studentów rozpoczynających studia w roku akademickim 011/01 Kierunek studiów: Matematyka Profil: Ogólnoakademicki Forma

Bardziej szczegółowo

PODSTAWOWE ROZKŁADY ZMIENNYCH LOSOWYCH CIĄGŁYCH

PODSTAWOWE ROZKŁADY ZMIENNYCH LOSOWYCH CIĄGŁYCH Opracowała: Joanna Kisielińska 1 PODSTAWOWE ROZKŁADY ZMIENNYCH LOSOWYCH CIĄGŁYCH Rozkład normalny Zmienna losowa X ma rozkład normalny z parametrami µ i σ (średnia i odchylenie standardowe), jeśli jej

Bardziej szczegółowo

Metody numeryczne. Wykład nr 12. Dr Piotr Fronczak

Metody numeryczne. Wykład nr 12. Dr Piotr Fronczak Metody numeryczne Wykład nr 1 Dr Piotr Fronczak Generowanie liczb losowych Metody Monte Carlo są oparte na probabilistyce działają dzięki generowaniu liczb losowych. W komputerach te liczby generowane

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)

Bardziej szczegółowo

0.1 ROZKŁADY WYBRANYCH STATYSTYK

0.1 ROZKŁADY WYBRANYCH STATYSTYK 0.1. ROZKŁADY WYBRANYCH STATYSTYK 1 0.1 ROZKŁADY WYBRANYCH STATYSTYK Zadaia 0.1.1. Niech X 1,..., X będą iezależymi zmieymi losowymi o tym samym rozkładzie. Obliczyć ES 2 oraz D 2 ( 1 i=1 X 2 i ). 0.1.2.

Bardziej szczegółowo

Pytanie: Kiedy do testowania hipotezy stosujemy test F (Fishera-Snedecora)?

Pytanie: Kiedy do testowania hipotezy stosujemy test F (Fishera-Snedecora)? Pytanie: Kiedy do testowania hipotezy stosujemy test F (Fishera-Snedecora)? Gdy: badana cecha jest mierzalna (ewentualnie policzalna); dysponujemy dwoma próbami; chcemy porównać, czy wariancje w tych próbach

Bardziej szczegółowo

Matematyka ubezpieczeń majątkowych 1.10.2012 r.

Matematyka ubezpieczeń majątkowych 1.10.2012 r. Zadanie. W pewnej populacji każde ryzyko charakteryzuje się trzema parametrami q, b oraz v, o następującym znaczeniu: parametr q to prawdopodobieństwo, że do szkody dojdzie (może zajść co najwyżej jedna

Bardziej szczegółowo

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2012/2013

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2012/2013 Krakowska Akademia im. Andrzeja Frycza Modrzewskiego Karta przedmiotu obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 01/01 Wydział Prawa, Administracji i Stosunków Miedzynarodowych Kierunek

Bardziej szczegółowo

Matematyka do liceów i techników Szczegółowy rozkład materiału Zakres podstawowy

Matematyka do liceów i techników Szczegółowy rozkład materiału Zakres podstawowy Matematyka do liceów i techników Szczegółowy rozkład materiału Zakres podstawowy Wariant nr (klasa I 4 godz., klasa II godz., klasa III godz.) Klasa I 7 tygodni 4 godziny = 48 godzin Lp. Tematyka zajęć

Bardziej szczegółowo

Sposoby prezentacji problemów w statystyce

Sposoby prezentacji problemów w statystyce S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki

Bardziej szczegółowo

Rozkłady dwóch zmiennych losowych

Rozkłady dwóch zmiennych losowych Rozkłady dwóch zmiennych losowych Uogólnienie pojęć na rozkład dwóch zmiennych Dystrybuanta i gęstość prawdopodobieństwa Rozkład brzegowy Prawdopodobieństwo warunkowe Wartości średnie i odchylenia standardowe

Bardziej szczegółowo