PODSTAWY BIOSTATYSTYKI ĆWICZENIA FILIP RACIBORSKI FILIP.RACIBORSKI@WUM.EDU.PL ZAKŁAD PROFILAKTYKI ZAGROŻEŃ ŚRODOWISKOWYCH I ALERGOLOGII WUM ZADANIE 1 Z populacji wyborców pobrao próbkę 1000 osób i okazało się, że wśród ich 300 popiera partię. Podać przedział ufości dla frakcji wyborców popierających partię w populacji a poziomie ufości 0.95 http://wyborcza.pl/1,75478,19099031,sukces-pis-choc-ie-triumf.html 1
ZADANIE 1 Z populacji wyborców pobrao próbkę 1000 osób i okazało się, że wśród ich 300 popiera partię. Podać przedział ufości dla frakcji wyborców popierających partię w populacji a poziomie ufości 0.95 k=300 - liczba osób popierających partię w próbie =1000 - rozmiar próby p=k/= 300/1000=0.3 - oszacowaa częstość poparcia dla partii Poziom ufości=0.95, więc α=0.05 (poziom istotości) z = (1 α )- kwatyl rzędu (1 α ) ze stadardowego rozkładu ormalego 1 1 z; z ZADANIE 1 0,5 0,4 0,4 0,3 0,3 0, 0, 0,1,5% 0,1,5% 0,0-3,0 -,5 -,0-1,5-1,0-0,5 0,0 0,5 1,0 1,5,0,5 3,0 z = 1 α = 1 0.05 = 1 0.05 = 0.975
TABLICE ROZKŁADU NORMALNEGO STANDARYZOWANEGO Powierzchia pod krzywą rozkładu ormalego stadaryzowaego. Dla wartości stadardowej Z tablica podaje powierzchię pod krzywą od Z=0 do podaej w kolumie pierwszej i główce tablicy wartości Z 0 0,01 0,0 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,00000 0,00399 0,00798 0,01197 0,01595 0,01994 0,039 0,0790 0,03188 0,03586 0,1 0,03983 0,04380 0,04776 0,0517 0,05567 0,0596 0,06356 0,06749 0,0714 0,07535 0, 0,0796 0,08317 0,08706 0,09095 0,09483 0,09871 0,1057 0,1064 0,1106 0,11409 0,3 0,11791 0,117 0,155 0,1930 0,13307 0,13683 0,14058 0,14431 0,14803 0,15173 0,4 0,1554 0,15910 0,1676 0,16640 0,17003 0,17364 0,1774 0,1808 0,18439 0,18793 0,5 0,19146 0,19497 0,19847 0,0194 0,0540 0,0884 0,16 0,1566 0,1904 0,40 0,6 0,575 0,907 0,337 0,3565 0,3891 0,415 0,4537 0,4857 0,5175 0,5490 0,7 0,5804 0,6115 0,644 0,6730 0,7035 0,7337 0,7637 0,7935 0,830 0,854 0,8 0,8814 0,9103 0,9389 0,9673 0,9955 0,3034 0,30511 0,30785 0,31057 0,3137 0,9 0,31594 0,31859 0,311 0,3381 0,3639 0,3894 0,33147 0,33398 0,33646 0,33891 1,0 0,34134 0,34375 0,34614 0,34849 0,35083 0,35314 0,35543 0,35769 0,35993 0,3614 1,1 0,36433 0,36650 0,36864 0,37076 0,3786 0,37493 0,37698 0,37900 0,38100 0,3898 1, 0,38493 0,38686 0,38877 0,39065 0,3951 0,39435 0,39617 0,39796 0,39973 0,40147 1,3 0,4030 0,40490 0,40658 0,4084 0,40988 0,41149 0,41309 0,41466 0,4161 0,41774 1,4 0,4194 0,4073 0,40 0,4364 0,4507 0,4647 0,4785 0,49 0,43056 0,43189 1,5 0,43319 0,43448 0,43574 0,43699 0,438 0,43943 0,4406 0,44179 0,4495 0,44408 1,6 0,4450 0,44630 0,44738 0,44845 0,44950 0,45053 0,45154 0,4554 0,4535 0,45449 1,7 0,45543 0,45637 0,4578 0,45818 0,45907 0,45994 0,46080 0,46164 0,4646 0,4637 1,8 0,46407 0,46485 0,4656 0,46638 0,4671 0,46784 0,46856 0,4696 0,46995 0,4706 1,9 0,4718 0,47193 0,4757 0,4730 0,47381 0,47441 0,47500 0,47558 0,47615 0,47670,0 0,4775 0,47778 0,47831 0,4788 0,4793 0,4798 0,48030 0,48077 0,4814 0,48169 Poieważ tablica jest dla połowy pola powierzchi pod krzywą rozkładu ormalego, to zamiast wartości 0.975 szukamy wartości miejszej o 0.5, czyli 0.475. z=1.96 [ECEL]=ROZKŁAD.NORMALNY.S.ODW(0,975) ZADANIE 1 1 L 0,716 1 1 z; z 0,3 L 0,3 0,084 z 0,3 0,7 1,96 0,3 0,084 1000 P 0,3 0,084 P 0,384 Stąd z ufością 95 % poparcie dla partii zawiera się w przedziale: [0.716, 0.384]. Przeważie przekazując badaia opiii publiczej ie podaje się przedziału ufości lecz mówi się o błędzie (media podałyby: poparcie dla partii wyosi 30%; błąd oszacowaia 3%) 3
ZADANIE Na pewej uczeli zbadao próbę 65 studetek. Okazało się, że 15 z ich pali papierosy. Podać przedział ufości 90% dla frakcji palących w całej populacji studetek. http://www.youth-culture.csd.pl/pages1/gadzets/paleie.html ZADANIE Na pewej uczeli zbadao próbę 65 studetek. Okazało się, że15 z ich pali papierosy. Podać przedział ufości 90% dla frakcji palących w całej populacji studetek. k=15 - liczba palących papierosy studetek =65 - łącza liczba studetek p=k/= 15/65=0. - oszacowaa częstość paleia papierosów Poziom ufości=0.90, więc poziom istotości α=0.1 z = (1 α ) - kwatyl rzędu (1 α ) ze stadardowego rozkładu ormalego 1 1 z; z 4
ZADANIE 0,5 0,4 0,4 0,3 0,3 0, 0, 0,1 5% 0,1 5% 0,0-3,0 -,5 -,0-1,5-1,0-0,5 0,0 0,5 1,0 1,5,0,5 3,0 z = 1 α = 1 0.1 = 1 0.05 = 0.95 TABLICE ROZKŁADU NORMALNEGO STANDARYZOWANEGO Powierzchia pod krzywą rozkładu ormalego stadaryzowaego. Dla wartości stadardowej Z tablica podaje powierzchię pod krzywą od Z=0 do podaej w kolumie pierwszej i główce tablicy wartości Z 0 0,01 0,0 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,00000 0,00399 0,00798 0,01197 0,01595 0,01994 0,039 0,0790 0,03188 0,03586 0,1 0,03983 0,04380 0,04776 0,0517 0,05567 0,0596 0,06356 0,06749 0,0714 0,07535 0, 0,0796 0,08317 0,08706 0,09095 0,09483 0,09871 0,1057 0,1064 0,1106 0,11409 0,3 0,11791 0,117 0,155 0,1930 0,13307 0,13683 0,14058 0,14431 0,14803 0,15173 0,4 0,1554 0,15910 0,1676 0,16640 0,17003 0,17364 0,1774 0,1808 0,18439 0,18793 0,5 0,19146 0,19497 0,19847 0,0194 0,0540 0,0884 0,16 0,1566 0,1904 0,40 0,6 0,575 0,907 0,337 0,3565 0,3891 0,415 0,4537 0,4857 0,5175 0,5490 0,7 0,5804 0,6115 0,644 0,6730 0,7035 0,7337 0,7637 0,7935 0,830 0,854 0,8 0,8814 0,9103 0,9389 0,9673 0,9955 0,3034 0,30511 0,30785 0,31057 0,3137 0,9 0,31594 0,31859 0,311 0,3381 0,3639 0,3894 0,33147 0,33398 0,33646 0,33891 1,0 0,34134 0,34375 0,34614 0,34849 0,35083 0,35314 0,35543 0,35769 0,35993 0,3614 1,1 0,36433 0,36650 0,36864 0,37076 0,3786 0,37493 0,37698 0,37900 0,38100 0,3898 1, 0,38493 0,38686 0,38877 0,39065 0,3951 0,39435 0,39617 0,39796 0,39973 0,40147 1,3 0,4030 0,40490 0,40658 0,4084 0,40988 0,41149 0,41309 0,41466 0,4161 0,41774 1,4 0,4194 0,4073 0,40 0,4364 0,4507 0,4647 0,4785 0,49 0,43056 0,43189 1,5 0,43319 0,43448 0,43574 0,43699 0,438 0,43943 0,4406 0,44179 0,4495 0,44408 1,6 0,4450 0,44630 0,44738 0,44845 0,44950 0,45053 0,45154 0,4554 0,4535 0,45449 1,7 0,45543 0,45637 0,4578 0,45818 0,45907 0,45994 0,46080 0,46164 0,4646 0,4637 1,8 0,46407 0,46485 0,4656 0,46638 0,4671 0,46784 0,46856 0,4696 0,46995 0,4706 1,9 0,4718 0,47193 0,4757 0,4730 0,47381 0,47441 0,47500 0,47558 0,47615 0,47670,0 0,4775 0,47778 0,47831 0,4788 0,4793 0,4798 0,48030 0,48077 0,4814 0,48169 Poieważ tablica jest dla połowy pola powierzchi pod krzywą rozkładu ormalego, to zamiast wartości 0.95 szukamy wartości miejszej o 0.5, czyli 0.45. z=1.64 [ECEL]=ROZKŁAD.NORMALNY.S.ODW(0,95) 5
ZADANIE 1 1 z; 1 0, 0,8 z 0, 1,64 0, 65 0,4 0, 1,64 0, 0,063 5 z Przedział ufości dla frakcji palących w całej populacji studetek: [0.1737, 0.6] W Excelu wartość z dla tego zdaia możemy uzyskać za pomocą formuły: =ROZKŁAD.NORMALNY.S.ODW(0,95) =ROZKŁAD.NORMALNY.ODW(0,95;0;1) 0,16 1,64 5 PRZYPOMNIENIE ROZKŁAD T-STUDENTA Agielski statystyk, William Sealy Gosset (1876-1937) zasłyął jako twórca wprowadzoego w 1908 roku rozkładu prawdopodobieństwa, zaego pod azwą rozkładu t - Studeta. Nazwa związaa jest z pseudoimem Studet, pod którym Gosset publikował. Podstawą do opracowaia rozkładu prawdopodobieństwa stały się testy statystycze przeprowadzae z próbkami piwa w irladzkim browarze Arta Guiesa, w którym Gosset pracował. https://pl.wikipedia.org/wiki/william_sealy_gosset http://www.edustat.com.pl/historia.html?r=14 6
PRZYPOMNIENIE ROZKŁAD T-STUDENTA Dyspoujemy wyikami pomiarów, dla których możemy wyzaczyć estymatory parametrów populacyjych, jak średia ( ) i odchyleie stadardowe (s) lub wariacja (s ), ie zamy atomiast odchyleia stadardowego (σ) w populacji. Zagadieie to rozwiązał (w 1908r.) W.S. Gosset (pseudoim Studet) podając fukcję zależą od tzw. stopi swobody (df) i poziomu istotości (α). Wartości krytycze t(α; -1) dla rozkładu t-studeta odczytujemy z tablicy rozkładu t-studeta. Stopie swobody związae są z liczością próbki df= -1. Wykład dr M. Zalewska Szeregi statystycze, estymacja parametrycza puktowa i przedziałowa https://pl.wikipedia.org/wiki/rozk%c5%8ad_studeta#zastosowaia 7
Szeregi statystycze, estymacja parametrycza puktowa i przedziałowa - współczyik ufości/poziom istotości (1 - ) poziom ufości http://www.statystyka-zadaia.pl/tablica-rozkladu-t-studeta/ 15 stopi swobody Wartości krytycze rozkładu t dla różych poziomów istotości testu jedostroego i dwustroego Poziom istotości dla testu jedostroego 0,1 0,05 0,05 0,01 0,005 0,0005 Poziom istotości dla testu dwustroego 0, 0,1 0,05 0,0 0,01 0,001 1 3,0777 6,3137 1,706 31,810 63,6559 636,5776 1,8856,900 4,307 6,9645 9,950 31,5998 3 1,6377,3534 3,184 4,5407 5,8408 1,944 4 1,533,1318,7765 3,7469 4,6041 8,6101 5 1,4759,0150,5706 3,3649 4,031 6,8685 6 1,4398 1,943,4469 3,147 3,7074 5,9587 7 1,4149 1,8946,3646,9979 3,4995 5,4081 8 1,3968 1,8595,3060,8965 3,3554 5,0414 9 1,3830 1,8331,6,814 3,498 4,7809 10 1,37 1,815,81,7638 3,1693 4,5868 11 1,3634 1,7959,010,7181 3,1058 4,4369 1 1,356 1,783,1788,6810 3,0545 4,3178 13 1,350 1,7709,1604,6503 3,013 4,09 14 1,3450 1,7613,1448,645,9768 4,1403 15 1,3406 1,7531,1315,605,9467 4,078 16 1,3368 1,7459,1199,5835,908 4,0149 17 1,3334 1,7396,1098,5669,898 3,9651 18 1,3304 1,7341,1009,554,8784 3,917 19 1,377 1,791,0930,5395,8609 3,8833 0 1,353 1,747,0860,580,8453 3,8496 1 1,33 1,707,0796,5176,8314 3,8193 1,31 1,7171,0739,5083,8188 3,79 3 1,3195 1,7139,0687,4999,8073 3,7676 4 1,3178 1,7109,0639,49,7970 3,7454 5 1,3163 1,7081,0595,4851,7874 3,751 6 1,3150 1,7056,0555,4786,7787 3,7067 7 1,3137 1,7033,0518,477,7707 3,6895 8 1,315 1,7011,0484,4671,7633 3,6739 9 1,3114 1,6991,045,460,7564 3,6595 30 1,3104 1,6973,043,4573,7500 3,6460 40 1,3031 1,6839,011,433,7045 3,5510 50 1,987 1,6759,0086,4033,6778 3,4960 60 1,958 1,6706,0003,3901,6603 3,460 10 1,886 1,6576 1,9799,3578,6174 3,3734 1,816 1,6449 1,9600,363,5758 3,906 8
ZADANIE 3 Czasy wykoaia pewej aalizy jest zmieą losową o rozkładzie ormalym. Na podstawie poiższej próby (w sekudach): 10.3, 15.1, 13.8, 16.4, 13, 15., 14.8, 16.4, 16.1, 15.1 podaj 95 % i 90 % przedziały ufości dla średiego czasu wykoaia aalizy. http://polaik.ifo.pl/pl/p/hs80tw-stoper-casio/1640 ZADANIE 3 Na podstawie poiższej próby (w sekudach): 10.3, 15.1, 13.8, 16.4, 13, 15., 14.8, 16.4, 16.1, 15.1 podaj 95 % i 90 % przedziały ufości dla średiego czasu wykoaia aalizy. 1 x i i1 10,3 15,1 13,8 16,4 1315, 14,8 16,4 16,1 15,1 14,6 10 D 1 1 x i i1 x i 10,3 15,1 13,8 16,4 13 15, 14,8 16,4 16,1 15,1 x i - -4,3 0,48-0,8 1,78-1,6 0,58 0,18 1,78 1,48 0,48 (x i -) 18,66 0,30 0,67 3,178,64 0,336 0,03 3,178,190 0,30 9
ZADANIE 3 D 1 1 x i 3, 48 i1 s D 3,48 1,865 wzór a przedział ufości dla średiej przy iezaym odchyleiu stadardowym w populacji przedstawioo poiżej: [ t(1 ; 1) S, t(1 ; 1) S ] graica lewego (L) przedziału ufości graica prawego (P) przedziału ufości stopi swobody Wartości krytycze rozkładu t dla różych poziomów istotości testu jedostroego i dwustroego Poziom istotości dla testu jedostroego 0,1 0,05 0,05 0,01 0,005 0,0005 Poziom istotości dla testu dwustroego 0, 0,1 0,05 0,0 0,01 0,001 1 3,0777 6,3137 1,706 31,810 63,6559 636,5776 1,8856,900 4,307 6,9645 9,950 31,5998 3 1,6377,3534 3,184 4,5407 5,8408 1,944 4 1,533,1318,7765 3,7469 4,6041 8,6101 5 1,4759,0150,5706 3,3649 4,031 6,8685 6 1,4398 1,943,4469 3,147 3,7074 5,9587 7 1,4149 1,8946,3646,9979 3,4995 5,4081 8 1,3968 1,8595,3060,8965 3,3554 5,0414 9 1,3830 1,8331,6,814 3,498 4,7809 10 1,37 1,815,81,7638 3,1693 4,5868 11 1,3634 1,7959,010,7181 3,1058 4,4369 1 1,356 1,783,1788,6810 3,0545 4,3178 13 1,350 1,7709,1604,6503 3,013 4,09 14 1,3450 1,7613,1448,645,9768 4,1403 15 1,3406 1,7531,1315,605,9467 4,078 16 1,3368 1,7459,1199,5835,908 4,0149 17 1,3334 1,7396,1098,5669,898 3,9651 18 1,3304 1,7341,1009,554,8784 3,917 19 1,377 1,791,0930,5395,8609 3,8833 0 1,353 1,747,0860,580,8453 3,8496 1 1,33 1,707,0796,5176,8314 3,8193 1,31 1,7171,0739,5083,8188 3,79 3 1,3195 1,7139,0687,4999,8073 3,7676 4 1,3178 1,7109,0639,49,7970 3,7454 5 1,3163 1,7081,0595,4851,7874 3,751 6 1,3150 1,7056,0555,4786,7787 3,7067 7 1,3137 1,7033,0518,477,7707 3,6895 8 1,315 1,7011,0484,4671,7633 3,6739 9 1,3114 1,6991,045,460,7564 3,6595 30 1,3104 1,6973,043,4573,7500 3,6460 40 1,3031 1,6839,011,433,7045 3,5510 50 1,987 1,6759,0086,4033,6778 3,4960 60 1,958 1,6706,0003,3901,6603 3,460 10 1,886 1,6576 1,9799,3578,6174 3,3734 1,816 1,6449 1,9600,363,5758 3,906 α=0.05, obliczamy kwatyl rzędu t(0.975,9)=.6 α =0.10, obliczamy kwatyl rzędu t(0.95,9)=1.83 W Excelu wartość t dla tego zadaia możemy uzyskać za pomocą formuły: =ROZKŁAD.T.ODW(0,05;9) =ROZKŁAD.T.ODW(0,1;9) 10
podstawiamy wartości do wzoru a przedział ufości s L t 1,865 14,6,6 13,9 10 s P t 1,865 14,6,6 15,95 10 Odp. [13.9; 15.95] 1,865 1,865 L 14,6 1,83 13,54 P 14,6 1,83 15, 70 10 10 Odp. [13.54; 15.70] 1 ZADANIE 4 W celu ustaleia przeciętej zawartości witamiy C w owocach dzikiej róży pobrao 15 próbek 100 gramowych miąższu owocowego. Uzyskao astępujące rezultaty (w mg a 100 g miąższu): 495, 455, 438, 483, 501, 468, 49, 471, 474, 485, 504, 469, 478, 495, 481. Przyjmując współczyik ufości 0,95 zbuduj przedział ufości dla średiej wartości badaej cechy. Porówaj wyiki dla współczyika ufości 0.99. http://bellis.blog.oet.pl/009/10/8/dzika-roza/ 11
ZADANIE 4 W celu ustaleia przeciętej zawartości witamiy C w owocach dzikiej róży pobrao 15 próbek 100 gramowych miąższu owocowego. Uzyskao astępujące rezultaty (w mg a 100 g miąższu): 495, 455, 438, 483, 501, 468, 49, 471, 474, 485, 504, 469, 478, 495, 481. Przyjmując współczyik ufości 0,95 zbuduj przedział ufości dla średiej wartości badaej cechy. Porówaj wyiki dla współczyika ufości 0.99. 1 x i i1 495 455 438 483 501 468 49 471 474 485 504 469 478 495 481 15 7189 479,7 15 ZADANIE 4 D 1 1 x i i1 495 455 438 483 501 468 49 471 474 485 504 469 478 495 481 x i - 15,7-4,3-41,3 3,7 1,7-11,3 1,7-8,3-5,3 5,7 4,7-10,3-1,3 15,7 1,7 (x i -) 47,5 588,9 170,9 13,9 47,3 16,9 16,1 68,3 7,7 3,9 611,7 105,4 1,6 47,5 3,0 D 1 1 441,9 x i 315, 1 i1 15 1 s D 315,1 17,754 1
stopi swobody Wartości krytycze rozkładu t dla różych poziomów istotości testu jedostroego i dwustroego Poziom istotości dla testu jedostroego 0,1 0,05 0,05 0,01 0,005 0,0005 Poziom istotości dla testu dwustroego 0, 0,1 0,05 0,0 0,01 0,001 1 3,0777 6,3137 1,706 31,810 63,6559 636,5776 1,8856,900 4,307 6,9645 9,950 31,5998 3 1,6377,3534 3,184 4,5407 5,8408 1,944 4 1,533,1318,7765 3,7469 4,6041 8,6101 5 1,4759,0150,5706 3,3649 4,031 6,8685 6 1,4398 1,943,4469 3,147 3,7074 5,9587 7 1,4149 1,8946,3646,9979 3,4995 5,4081 8 1,3968 1,8595,3060,8965 3,3554 5,0414 9 1,3830 1,8331,6,814 3,498 4,7809 10 1,37 1,815,81,7638 3,1693 4,5868 11 1,3634 1,7959,010,7181 3,1058 4,4369 1 1,356 1,783,1788,6810 3,0545 4,3178 13 1,350 1,7709,1604,6503 3,013 4,09 14 1,3450 1,7613,1448,645,9768 4,1403 15 1,3406 1,7531,1315,605,9467 4,078 16 1,3368 1,7459,1199,5835,908 4,0149 17 1,3334 1,7396,1098,5669,898 3,9651 18 1,3304 1,7341,1009,554,8784 3,917 19 1,377 1,791,0930,5395,8609 3,8833 0 1,353 1,747,0860,580,8453 3,8496 1 1,33 1,707,0796,5176,8314 3,8193 1,31 1,7171,0739,5083,8188 3,79 3 1,3195 1,7139,0687,4999,8073 3,7676 4 1,3178 1,7109,0639,49,7970 3,7454 5 1,3163 1,7081,0595,4851,7874 3,751 6 1,3150 1,7056,0555,4786,7787 3,7067 7 1,3137 1,7033,0518,477,7707 3,6895 8 1,315 1,7011,0484,4671,7633 3,6739 9 1,3114 1,6991,045,460,7564 3,6595 30 1,3104 1,6973,043,4573,7500 3,6460 40 1,3031 1,6839,011,433,7045 3,5510 50 1,987 1,6759,0086,4033,6778 3,4960 60 1,958 1,6706,0003,3901,6603 3,460 10 1,886 1,6576 1,9799,3578,6174 3,3734 1,816 1,6449 1,9600,363,5758 3,906 α=0.05, obliczamy kwatyl rzędu t(0.975,14)=.14 α =0.01, obliczamy kwatyl rzędu t(0.995,14)=.98 W Excelu wartość t dla tego zadaia możemy uzyskać za pomocą formuły: =ROZKŁAD.T.ODW(0,05;14) =ROZKŁAD.T.ODW(0,01;14) podstawiamy wartości do wzoru a przedział ufości [ t(1 ; 1) S, t(1 ; 1) S ] α=0.05 17,75 L 479,7,14 15 479,7 9,8 469,45 17,75 P 479,7,14 15 479,7 9,8 489,08 Odp. [469.45; 489.08] α=0.01 17,75 L 479,7,98 15 479,7 13,67 465,6 17,75 P 479,7,98 15 479,7 13,67 49,93 Odp. [465.6; 49.93] 6 13
14