Statystyka. matematyczna. Mieczys aw Sobczyk

Podobne dokumenty
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

Rachunek prawdopodobieństwa

Spis treści 3 SPIS TREŚCI

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

STATYSTYKA wykład 1. Wanda Olech. Katedra Genetyki i Ogólnej Hodowli Zwierząt

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Rozkłady statystyk z próby

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

SPIS TEŚCI CZĘŚĆ I RACHUNEK PRAWDOPODOBIEŃSTWA

Zdarzenia losowe i prawdopodobieństwo

Opis przedmiotu: Probabilistyka I

dr Jerzy Pusz, st. wykładowca, Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej B. Ogólna charakterystyka przedmiotu

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

Probabilistyczne podstawy statystyki matematycznej. Dr inż. Małgorzata Michalcewicz-Kaniowska

Opis przedmiotu. Karta przedmiotu - Probabilistyka I Katalog ECTS Politechniki Warszawskiej

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

RACHUNEK PRAWDOPODOBIEŃSTWA WYKŁAD 1. L. Kowalski, Statystyka, 2005

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

Statystyka matematyczna

Wprowadzenie do analizy korelacji i regresji

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Podstawy metod probabilistycznych. dr Adam Kiersztyn

Statystyka matematyczna

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

Prawdopodobieństwo. Prawdopodobieństwo. Jacek Kłopotowski. Katedra Matematyki i Ekonomii Matematycznej SGH. 16 października 2018

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Statystyka Astronomiczna

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

W1. Wprowadzenie. Statystyka opisowa

Statystyka matematyczna

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Metody Statystyczne. Metody Statystyczne.

Transport II stopień (I stopień / II stopień) Ogólnoakademicki (ogólno akademicki / praktyczny) Studia stacjonarne (stacjonarne / niestacjonarne)

1 Podstawy rachunku prawdopodobieństwa

przedmiot podstawowy obowiązkowy polski drugi

Wnioskowanie statystyczne. Statystyka w 5

4,5. Dyskretne zmienne losowe (17.03; 31.03)

Inżynieria danych I stopień Praktyczny Studia stacjonarne Wszystkie specjalności Katedra Ekonomii i Finansów Dr Katarzyna Brzozowska-Rup

WNIOSKOWANIE STATYSTYCZNE SYLABUS A. Informacje ogólne

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Rachunek prawdopodobieństwa- wykład 2

STATYSTYKA MATEMATYCZNA

Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0

Dyskretne zmienne losowe

KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Podstawy nauk przyrodniczych Matematyka

Pobieranie prób i rozkład z próby

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

STATYSTYKA

Statystyka matematyczna i ekonometria

Wykład 2. Prawdopodobieństwo i elementy kombinatoryki

Po co nam statystyka matematyczna? Żeby na podstawie próby wnioskować o całej populacji

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

Statystyka opisowa SYLABUS A. Informacje ogólne

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Sylabus do programu kształcenia obowiązującego od roku akademickiego 2014/15

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

KARTA KURSU. Kod Punktacja ECTS* 1

SPIS TREŚCI. Do Czytelnika... 7

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

RACHUNEK PRAWDOPODOBIEŃSTWA - POJĘCIA WSTĘPNE MATERIAŁY POMOCNICZE - TEORIA

Opis programu studiów

Z poprzedniego wykładu

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

WSTĘP. Tematy: Regresja liniowa: model regresji liniowej, estymacja nieznanych parametrów. Wykład:30godz., ćwiczenia:15godz., laboratorium:30godz.

(C. Gauss, P. Laplace, Bernoulli, R. Fisher, J. Spława-Neyman) Wikipedia 2008

Zadania o numerze 4 z zestawów licencjat 2014.

KARTA PRZEDMIOTU. 1. NAZWA PRZEDMIOTU: Statystyka matematyczna (STA230) 2. KIERUNEK: MATEMATYKA. 3. POZIOM STUDIÓW: I stopnia

Metody statystyczne w socjologii SYLABUS A. Informacje ogólne Opis

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

166 Wstęp do statystyki matematycznej

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Statystyka matematyczna dla leśników

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Nazwa przedmiotu: Informatyczne systemy statystycznej obróbki danych. Informatics systems for the statistical treatment of data Kierunek:

Wykład 3 Hipotezy statystyczne

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski

Transkrypt:

Statystyka matematyczna Mieczys aw Sobczyk

Statystyka matematyczna

Statystyka matematyczna Mieczys aw Sobczyk WYDAWNICTWO C.H. BECK WARSZAWA 2010

Wydawca: Dorota Ostrowska-Furmanek Redakcja merytoryczna: Danuta Kamińska-Hass Recenzent: prof. dr hab. Józef Pociecha Projekt okładki i stron tytułowych: Maryna Wiśniewska Ilustracja na okładce: c MarkEvans/iStockphoto.com Seria: Metody ilościowe Złożono programem TEX c Wydawnictwo C.H. Beck 2010 Wydawnictwo C.H. Beck Sp. z o.o. ul. Bonifraterska 17, 00-203 Warszawa Skład i łamanie: Wydawnictwo C.H. Beck Druk i oprawa: Poznańskie Zakłady Graficzne ISBN 978-83-255-1606-2

Spis treści Wstęp........................................ 9 Rozdział 1. Probabilistyczne podstawy statystyki matematycznej....... 13 1.1. Prawdopodobieństwo i jego własności................... 13 1.2. Zmienna losowa i jej rodzaje........................ 23 1.3. Parametry rozkładu zmiennej losowej................... 30 1.4. Podstawowe rozkłady prawdopodobieństwa zmiennych losowych..... 37 1.4.1. Rozkład zerojedynkowy....................... 37 1.4.2. Rozkład Bernoulliego........................ 38 1.4.3. Rozkład Poissona.......................... 40 1.4.4. Rozkład normalny.......................... 42 1.4.5. Rozkład t-studenta......................... 46 1.4.6. Rozkład chi-kwadrat (χ 2 )...................... 48 1.4.7. Rozkład F-Snedecora........................ 49 1.5. Prawa wielkich liczb i twierdzenia graniczne................ 50 Pytania kontrolne................................. 54 Zadania...................................... 55 Rozdział 2. Próba losowa i rozkłady statystyk z próby............. 67 2.1. Schematy losowania próby......................... 67 2.2. Podstawowe rozkłady statystyk z próby................... 72 2.2.1. Rozkład średniej arytmetycznej................... 75 2.2.2. Rozkład wariancji.......................... 77 2.2.3. Rozkład różnicy średnich...................... 79 2.2.4. Rozkład ilorazu wariancji...................... 80 2.2.5. Rozkład frakcji........................... 80 2.2.6. Rozkład różnicy frakcji....................... 82 Pytania kontrolne................................. 82 Zadania...................................... 83 Rozdział 3. Estymacja parametrów struktury................. 85 3.1. Estymator i jego pożądane własności.................... 85 3.2. Estymacja punktowa i estymacja przedziałowa............... 90 3.2.1. Szacowanie wartości oczekiwanej.................. 92 3.2.2. Szacowanie wariancji i odchylenia standardowego......... 98 3.2.3. Szacowanie wskaźnika struktury.................. 100 3.3. Wyznaczanie minimalnej liczebności próby................ 102 3.3.1. Minimalna liczebność próby przy szacowaniu średniej populacji. 103 5

Spis treści 3.3.2. Minimalna liczebność próby przy szacowaniu wskaźnika struktury 104 Pytania kontrolne................................. 105 Zadania...................................... 106 Rozdział 4. Weryfikacja hipotez statystycznych w zakresie analizy struktury 117 4.1. Uwagi wstępne............................... 117 4.2. Parametryczne testy istotności w przypadku jednej populacji....... 121 4.2.1. Testy istotności dla średniej..................... 122 4.2.2. Testy istotności dla wariancji.................... 127 4.2.3. Test istotności dla frakcji...................... 130 4.3. Parametryczne testy istotności w przypadku dwóch populacji....... 131 4.3.1. Testy istotności dla dwóch średnich................. 131 4.3.2. Testy istotności dla dwóch wariancji................ 135 4.3.3. Testy istotności dla dwóch frakcji.................. 136 4.4. Nieparametryczne testy istotności w przypadku jednej populacji..... 137 4.4.1. Test zgodności χ 2.......................... 139 4.4.2. Test serii do badania losowości próby................ 146 Pytania kontrolne................................. 148 Zadania...................................... 149 Rozdział 5. Wnioskowanie statystyczne w analizie korelacji i regresji..... 161 5.1. Dwuwymiarowa zmienna losowa...................... 161 5.2. Estymacja przedziałowa w analizie współzależności zjawisk....... 171 5.2.1. Przedziały ufności dla współczynnika korelacji liniowej Pearsona. 171 5.2.2. Przedziały ufności dla parametrów strukturalnych liniowej funkcji regresji z jedną zmienną objaśniającą................ 173 5.3. Weryfikacja hipotez w analizie współzależności zjawisk.......... 179 5.3.1. Testy parametryczne......................... 180 5.3.2. Testy nieparametryczne....................... 186 Pytania kontrolne................................. 196 Zadania...................................... 197 Rozdział 6. Wnioskowanie statystyczne w analizie szeregów czasowych... 207 6.1. Przedziały ufności dla parametrów strukturalnych liniowej funkcji trendu. 207 6.2. Ocena istotności współczynnika kierunkowego liniowej funkcji trendu.. 211 6.3. Badanie hipotezy o braku trendu w szeregu czasowym.......... 212 6.4. Testowanie liniowości funkcji trendu.................... 213 6.5. Badanie autokorelacji składników losowych................ 215 Pytania kontrolne................................. 218 Zadania...................................... 219 Odpowiedzi do zadań............................... 222 Rozdział 1.................................... 222 Rozdział 2.................................... 224 Rozdział 3.................................... 224 Rozdział 4.................................... 225 Rozdział 5.................................... 226 Rozdział 6.................................... 227 Tablice statystyczne................................ 229 1. Alfabet grecki................................ 229 2. Liczby losowe (fragment).......................... 230 6

Spis treści 3. Dystrybuanta rozkładu normalnego N(0; 1)................ 231 4. Rozkład t-studenta............................. 235 5. Rozkład χ 2................................. 237 6. Rozkład F-Snedecora (dla α = 0,01).................... 238 7. Rozkład F-Snedecora (dla α = 0,05).................... 242 8. Rozkład Poissona.............................. 246 9. Rozkład liczby serii............................. 248 10. Wartości krytyczne współczynnika korelacji rangowej Spearmana.... 251 11. Przekształcenie współczynnika korelacji r na z.............. 252 12. Wartości krytyczne testu Durbina-Watsona................. 253 Bibliografia..................................... 255

Wstęp Do podejmowania prawidłowych decyzji i analizowania procesów gospodarczych, demograficznych, społecznych itp. niezbędna jest znajomość metod ilościowych. Z tego też względu w programach nauczania uczelni wyższych przewidziano zajęcia ze statystyki. Programy te obejmują zazwyczaj statystykę opisową (studia licencjackie) oraz statystykę matematyczną (studia magisterskie). Przedmiotem zainteresowań statystyki opisowej są problemy programowania badań statystycznych, metody obserwacji statystycznej, sposoby opracowywania i prezentacji materiału statystycznego oraz syntetyzująca (sumaryczna) charakterystyka za pomocą odpowiednich parametrów właściwości zbioru danych. Metody statystyki opisowej są wykorzystywane wtedy, gdy obserwacją jest objęta cała zbiorowość (populacja generalna). Mówimy wówczas o badaniach pełnych, wyczerpujących. Statystyka matematyczna (zwana też statystyką indukcyjną) zajmuje się metodami wnioskowania, tj. estymacji i weryfikacji hipotez o całej zbiorowości (populacji generalnej) na podstawie wybranej w sposób losowy pewnej jej części, określanej mianem próby losowej. Metody statystyki matematycznej znajdują szerokie zastosowanie w badaniach częściowych (niepełnych, niewyczerpujących). Fundamentalną sprawą w badaniu częściowym jest to, aby próba była reprezentatywna, tzn. jej struktura pod względem badanej właściwości (cechy) była zbliżona do struktury tej cechy w populacji generalnej. Zapewnienie wysokiej reprezentatywności próby jest zagadnieniem dość skomplikowanym. Wynika to z faktu, że populacja generalna jest nieznana, a dopiero badanie częściowe ma dostarczyć informacji o niej. Wykorzystanie metod wnioskowania statystycznego (statystyki matematycznej, statystyki indukcyjnej) wymaga znajomości rachunku prawdopodobieństwa. Z tego też względu w rozdziale 1 oraz w podrozdziale 5.1 (dotyczącym dwuwymiarowej zmiennej losowej). zamieszczono podstawowe wiadomości z tej dziedziny wiedzy. Zakres przedmiotowy statystyki przedstawia rysunek 1. Metody statystyczne dotyczące zarówno opisu, jak i wnioskowania mogą być użyteczne w liczbowym rozpoznaniu struktury, współzależności oraz dynamiki zjawisk masowych. O ile jednak opis statystyczny odpowiada na pytanie: jak jest?, o tyle wnioskowanie statystyczne jest związane z pytaniem: jak prawdopo- 9

Wstęp Rysunek 1. Zakres statystyki Źródło: [Cieciura, Zacharski, 2007, s. 239]. dobnie może być?. Tak więc, wnioskowanie statystyczne w obydwu zasadniczych procedurach, tj. estymacji i weryfikacji hipotez, odbywa się zawsze w warunkach niepewności. Mówimy, że jest ono wnioskowaniem indukcyjnym o charakterze stochastycznym (opartym na rachunku prawdopodobieństwa). Wzajemne relacje pomiędzy metodami analizy, opisem i wnioskowaniem statystycznym przedstawia tabela 1. Tabela 1. Podstawowe metody analizy statystycznej Metody analizy Struktury zjawisk Współzależności zjawisk Dynamiki zjawisk Opis statystyczny Miary średnie Miary zmienności Miary asymetrii Miary koncentracji i spłaszczenia (kurtozy) Rachunek korelacji Rachunek regresji Szeregi czasowe bez sezonowości Szeregi czasowe z sezonowością Indeksy statystyczne Wnioskowanie statystyczne Estymacja parametrów (punktowa i przedziałowa) Weryfikacja hipotez (parametrycznych i nieparametrycznych) Źródło: opracowanie własne na podstawie: [Luszniewicz, Słaby, 2008, s.14]. Całość problematyki statystyki jest ujęta w dwóch odrębnych, wzajemnie uzupełniających się pozycjach noszących tytuły: Statystyka opisowa i Statystyka matematyczna. Prezentowane w nich zagadnienia są podawane od podstaw i nie są nazbyt skomplikowane pod względem matematycznym. Cenną zaletą tych pozycji jest zdaniem autora zamieszczenie wielu rozwiązanych przykładów, które ilustrują istotę omawianych procedur statystycznych oraz pokazują możliwości interpretacyjne otrzymanych wyników. Ponadto zawierają one bogaty zestaw zadań do samodzielnego rozwiązania. Kontrolę stopnia opanowania wiedzy ułatwiają 10

Wstęp zamieszczone na końcu podręczników odpowiedzi do wszystkich zadań. Celowi temu służą również pytania kontrolne. W pracach zamieszczono obszerną bibliografię, zawierającą publikacje książkowe z zakresu statystyki. Pozwoli ona na pogłębienie znajomości prezentowanych zagadnień, jak również na poszerzenie wiedzy w zakresie pominiętych z konieczności treści. We współczesnym świecie nabycie umiejętności praktycznego stosowania metod statystycznych jest nieodzowne. Serwisy informacyjne, gazety codzienne, pisma popularne zawierają gąszcz liczb. Należy umieć je interpretować. W przeciwnym przypadku nie jesteśmy w stanie trafnie ocenić tych doniesień, jak też wyciągać z nich odpowiednie wnioski. Autor daleki jest od popierania stwierdzeń typu: statystyka jest prosta i oczywista czy statystyka jest intuicyjnie zrozumiała. Tak jak każda dziedzina wiedzy wymaga ona znacznego wysiłku i żmudnej pracy w celu zdobycia określonych umiejętności. Autor żywi nadzieję, że zawarty w pracach zakres przedmiotowy i zrozumiały sposób ujęcia rozpatrywanych zagadnień, uczynią je przyjaznymi dla studentów wydziałów ekonomicznych i humanistycznych (socjologów, psychologów, pedagogów, historyków itp.), jak również dla szerokiego grona praktyków prowadzących analizy statystyczne. Oby przekonanie o nieuchronności związku nudy i statystyki stało się nieuzasadnione, a wątpliwości w zakresie możliwości zrozumienia świata opisanego za pomocą statystyki błędne 1. *** Podręcznik Statystyka matematyczna obejmuje problematykę wnioskowania statystycznego (statystyki indukcyjnej). Pod względem formalnym zawiera on pięć rozdziałów poświęconych kolejno: probabilistycznym podstawom statystyki matematycznej, próbie losowej i rozkładom z próby, estymacji i weryfikacji hipotez w analizie struktury, współzależności i dynamiki zjawisk masowych. Integralną częścią podręcznika jest aneks, w którym zamieszczono niezbędne przy rozwiązywaniu problemów dotyczących badań częściowych tablice statystyczne. W tej pracy, podobnie jak w Statystyce opisowej zamieszczono dużo rozwiązanych przykładów oraz zadań do samodzielnego zmagania się ze statystycznymi problemami. Poprawność otrzymanych wyników można sprawdzić z podanymi odpowiedziami do zadań. Zarówno sposób prezentacji materiału statystycznego, jak i przyjęta symbolika wskazują na to, że obydwie części: Statystyka opisowa i Statystyka matematyczna, stanowią integralną całość. W zależności od liczby godzin przeznaczonych w programach studiów różnych kierunków na zgłębianie statystyki, niektóre treści mogą być pominięte. 1 Jak mawiał jeden ze studentów: jeśli pozostałby mi tylko jeden dzień życia, spędziłbym go na statystyce dzięki temu wydałby mi się on znacznie dłuższy, por. [Szwed, 2009, s. 11]. 11

Wstęp Jakkolwiek w podręcznikach występuje duża liczba wzorów, to nie powinny one wzbudzać niepokoju. Ich zrozumienie i wykorzystanie nie wymaga bowiem pogłębionej znajomości wiedzy z matematyki. Świadomie pominięto wyprowadzanie wzorów, podając je w gotowej do praktycznych zastosowań postaci. Pogłębieniu metod statystycznych służy zamieszczona w obydwu podręcznikach bogata literatura przedmiotu. Autor składa serdeczne podziękowania na ręce Pana Profesora Józefa Pociechy z Uniwersytetu Ekonomicznego w Krakowie za niezwykle trafne i cenne uwagi, które miały istotny wpływ na ostateczny kształt tej pracy. Dziękuję również córce Ewelinie oraz Monice Sobolewskiej za ich trud włożony w techniczne redagowanie tekstu. Autor 12

Rozdział 1. Probabilistyczne podstawy statystyki matematycznej 1.1. Prawdopodobieństwo i jego własności W różnych dziedzinach ludzkiej działalności mamy do czynienia ze zjawiskami losowymi (przypadkowymi), tj. takimi, których wyniku nie można z góry przewidzieć. Tego rodzaju zjawiska są bowiem zależne od przyczyn, których nie jesteśmy w stanie wyeliminować. Przykładowo, nie jesteśmy w stanie przewidzieć liczby wypadków drogowych, wad produkowanych wyrobów, ceny akcji na giełdzie, dokładnego czasu żarzenia się żarówki itp. Badaniem prawidłowości rządzących zjawiskami losowymi zajmuje się rachunek prawdopodobieństwa. W każdym doświadczeniu losowym można wyróżnić najprostsze, nierozkładalne zdarzenia (wyniki doświadczenia). Zdarzenia te nazywamy elementarnymi. Zbiór wszystkich zdarzeń elementarnych związanych z danym doświadczeniem losowym nazywamy przestrzenią zdarzeń elementarnych. Elementy przestrzeni zdarzeń elementarnych będziemy oznaczać symbolem e i, natomiast przestrzeń zdarzeń elementarnych symbolem E. Każdy podzbiór przestrzeni zdarzeń elementarnych nazywamy zdarzeniem losowym. Zdarzenia losowe oznaczamy dużymi literami alfabetu A, B, C,... Przestrzeń zdarzeń elementarnych może być zbiorem skończonym lub nieskończonym. Ze skończoną przestrzenią zdarzeń elementarnych mamy do czynienia np. w doświadczeniu polegającym na jednokrotnym rzucie kostką do gry. Zdarzeniami losowymi mogą być tutaj [Oczkoś, 2005, s. 3]: A wypadła parzysta liczba oczek, B wypadła liczba oczek większa od 3, C wypadła liczba oczek będąca liczbą pierwszą. W tym doświadczeniu zbiór zdarzeń elementarnych jest sześcioelementowy E = {e 1, e 2, e 3, e 4, e 5, e 6 }, gdzie e i (i = 1, 2,..., 6) oznaczają zdarzenie elementarne: wypadło i oczek. Zdarzeniem A określamy podzbiór {e 2, e 4, e 6 }. Zachodzi ono wtedy i tylko wtedy, gdy wypada 2 lub 4, lub 6 oczek. Zdarzenie B to podzbiór {e 4, e 5, e 6 }. Zachodzi ono wtedy i tylko wtedy, gdy wypada 4 lub 5, lub 6 oczek. Wreszcie zdarzenie C określamy jako podzbiór {e 2, e 3, e 5 }. Zachodzi ono wtedy i tylko wtedy, gdy wypada 2 lub 3, lub 5 oczek. 13

Rozdział 1. Probabilistyczne podstawy statystyki matematycznej Jeżeli jakieś zdarzenie elementarne należy do zdarzenia losowego (zbioru) A, to mówimy, że sprzyja ono zdarzeniu A. W przeciwnym przypadku mówimy o zdarzeniu przeciwnym (niesprzyjającym). Spośród wszystkich podzbiorów zbioru E, na szczególną uwagę zasługują dwa z nich: podzbiór identyczny z całym zbiorem E i podzbiór Ø niezawierający żadnego elementu. W pierwszym przypadku mówimy o zdarzeniu pewnym, a w drugim o zdarzeniu niemożliwym. Inaczej mówiąc, zdarzenie A jest zdarzeniem pewnym, jeśli każde zdarzenie elementarne ze zbioru E sprzyja zdarzeniu A. Podobnie, zdarzenie A jest zdarzeniem niemożliwym, jeśli żadne zdarzenie elementarne ze zbioru E nie sprzyja zajściu zdarzenia A. Jeżeli przestrzeń zdarzeń elementarnych jest zbiorem n-elementowym, to liczba jego podzbiorów jest równa 2 n. Ze zbioru E = {e 1, e 2, e 3, e 4, e 5, e 6 } można więc utworzyć 2 6 = 64 podzbiory (zdarzenia), a mianowicie: 1) 2 podzbiory niewłaściwe: Ø, E; 2) 6 podzbiorów jednoelementowych: {e 1 },..., {e 6 }; 3) 15 podzbiorów dwuelementowych: {e 1, e 2 }, {e 1, e 3 },..., {e 1, e 6 }; 4) 20 podzbiorów trzyelementowych: {e 1, e 2, e 3 },..., {e 4, e 5, e 6 }; 5) 15 podzbiorów czteroelementowych: {e 1, e 2, e 3, e 4 },..., {e 3, e 4, e 5, e 6 }; 6) 6 podzbiorów pięcioelementowych: {e 1, e 2, e 3, e 4, e 5 },..., {e 2, e 3, e 4, e 5, e 6 }. Z nieskończoną przestrzenią zdarzeń elementarnych mamy np. do czynienia w doświadczeniu polegającym na obserwacji wzrostu przypadkowo wybranej osoby. Przestrzeń tę stanowi pewien przedział liczbowy możliwych wartości wzrostu. Na zdarzeniach losowych, podobnie jak na zbiorach, możemy wykonywać działania, a mianowicie: 1) Zdarzenia A i B nazywamy identycznymi (A = B), jeżeli zdarzenie A zachodzi wtedy i tylko wtedy, gdy zachodzi zdarzenie B. Zdarzeniom tym sprzyjają te same zdarzenia elementarne. 2) Zdarzenie A pociąga za sobą (implikuje) zdarzenie B (A B), jeśli zdarzenia elementarne sprzyjające zdarzeniu A sprzyjają również zdarzeniu B (jeśli zaszło zdarzenie A, to zaszło również zdarzenie B). 3) Sumą (alternatywą) zdarzeń A i B (A B) nazywamy takie zdarzenie C, które zachodzi wtedy i tylko wtedy, gdy zachodzi zdarzenie A lub zdarzenie B. Niech A oznacza zdarzenie polegające na tym, że w rzucie kostką wypadła nieparzysta liczba oczek, a B zdarzenie polegające na otrzymaniu liczby oczek mniejszej od 4. Mamy wówczas: C = A B = {e 1, e 3, e 5 } {e 1, e 2, e 3 } = {e 1, e 2, e 3, e 5 }. 4) Iloczynem (koniunkcją, częścią wspólną) zdarzeń A i B nazywamy takie zdarzenie C, które zachodzi wtedy i tylko wtedy, gdy zachodzi zdarzenie A i zdarzenie B, tj. C = A B. 14

1.1. Prawdopodobieństwo i jego własności Niech A oznacza zdarzenie polegające na wylosowaniu z listy mężczyzny, a B na wylosowaniu osoby palącej papierosy. Wtedy A B oznacza zdarzenie polegające na wylosowaniu mężczyzny palącego papierosy. Jeżeli iloczyn zdarzeń A i B tworzy zbiór pusty (A B = Ø), to zdarzenia A i B nazywamy wykluczającymi się (wyłączającymi się). Przykładowo w rzucie kostką do gry zdarzeniami wykluczającymi się są: zdarzenie A polegające na wyrzuceniu liczby oczek mniejszej od 2 oraz zdarzenie B polegające na otrzymaniu liczby oczek większej od 4. 5) Różnicą zdarzeń A i B (A B) nazywamy takie zdarzenie C, które zachodzi wtedy i tylko wtedy, gdy zachodzi zdarzenie A i nie zachodzi zdarzenie B. Niech A oznacza zdarzenie polegające na wyrzuceniu w rzucie kostką parzystej liczby oczek, a B oznacza wyrzucenie liczby oczek większej od 3. Wówczas: C = A B = {e 2, e 4, e 6 } {e 4, e 5, e 6 } = {e 2 }. Zdarzeniem przeciwnym do zdarzenia A (A) nazywamy zdarzenie, do którego należą zdarzenia elementarne nienależące do A, tzn. A = E A. Niech A oznacza zdarzenie polegające na wypadnięciu nieparzystej liczby oczek w rzucie kostką do gry. Zdarzenie A jest następującym zbiorem zdarzeń elementarnych: A = E {e 1, e 3, e 5 } = {e 2, e 4, e 6 }. Zdarzenie A oznacza: wypadła parzysta liczba oczek. Graficzną ilustrację działań na zdarzeniach są wykresy Eulera, zwane też diagramami Venna (rys. 1.1). Na rysunku 1.1 przestrzeń zdarzeń elementarnych symbolizuje kwadrat, a zdarzenia A lub B koła w tym kwadracie. Zakreskowany obszar ilustruje rozważane zdarzenie. W praktyce jesteśmy zainteresowani nie tyle pojedynczymi zdarzeniami elementarnymi, ale ich zbiorami (czyli podzbiorami E). Rodzinę podzbiorów nazywamy ciałem zdarzeń losowych (przestrzenią zdarzeń losowych) i oznaczamy symbolem S. Jeżeli E jest zbiorem przeliczalnym, to S składa się ze wszystkich podzbiorów E. Jeśli natomiast E jest zbiorem nieprzeliczalnym, to S jest pewną rodziną podzbiorów E zwaną σ-ciałem zdarzeń lub borelowskim ciałem zdarzeń, spełniającą następujące warunki [Grzegorzewski, Bobecka, Dembińska, Pusz, 2001, s. 10]: E S, jeżeli A S, to A S, jeżeli A 1, A 2,... S, to A i S. i=1 Nazwa zdarzenie losowe odnosi się wyłącznie do tych zbiorów zdarzeń elementarnych, które zostały zaliczone do ciała zdarzeń. Przestrzeń zdarzeń elementarnych wraz z ciałem zdarzeń, tj. parę (E, S), nazywamy przestrzenią mierzalną, a zdarzenie A S S-mierzalnym. Na 15

Rozdział 1. Probabilistyczne podstawy statystyki matematycznej Rysunek 1.1. Graficzna ilustracja działań na zdarzeniach losowych Źródło: [Sobczyk, 2000, s. 86]. przestrzeni mierzalnej można określać różne funkcje (miary). Niech P będzie funkcją rzeczywistą określoną na zdarzeniach S-mierzalnych, spełniającą następujące warunki: 1) dla każdego zdarzenia A S, P (A) 0, 2) P (E) = 1, 3) jeżeli A 1, A 2,... S jest dowolnym ciągiem zdarzeń parami rozłącznych, tzn. A i A j = Ø dla i j, to ( ) P A i = P (A i ). i=1 i=1 Funkcję P, która spełnia powyższe warunki, określa się mianem miary probabilistycznej lub krótko prawdopodobieństwem. Wartość liczbową P (A) nazywamy prawdopodobieństwem zdarzenia A. Trójkę (E, S, P ) nazywamy przestrzenią probabilistyczną związaną z danym doświadczeniem losowym. Z podanych powyżej warunków 1) 3), zwanych aksjomatami Kołmogorowa (znanych od 1933 r.), oraz z własności działań na zdarzeniach, wynikają następujące własności prawdopodobieństwa [Major, 2007, s. 23 24]: 1) prawdopodobieństwo każdego zdarzenia A jest liczbą z przedziału [0; 1] 16 0 P (A) 1, (1.1)

1.1. Prawdopodobieństwo i jego własności 2) prawdopodobieństwo zdarzenia niemożliwego jest równe 0 P (Ø) = 0, (1.2) 3) prawdopodobieństwo zdarzenia A (przeciwnego do zdarzenia A) jest równe P (A) = 1 P (A), (1.3) 4) jeżeli zdarzenie losowe A zawiera się w zdarzeniu losowym B (A B), to P (B) P (A), (1.4) 5) prawdopodobieństwo sumy dowolnych dwóch zdarzeń losowych A i B jest równe sumie prawdopodobieństw tych zdarzeń pomniejszonej o prawdopodobieństwo ich iloczynu 6) jeżeli A B = Ø, to P (A B) = P (A) + P (B) P (A B), (1.5) P (A B) = P (A) + P (B), (1.6) 7) jeżeli A i B są zdarzeniami losowymi należącymi do pewnej przestrzeni E oraz jeśli P (B) 0, to prawdopodobieństwo warunkowe (względne) zdarzenia A pod warunkiem B jest określone wzorem stąd podobnie P (A/B) = P (A B), P (B) > 0, (1.7) P (B) P (A B) = P (B) P (A/B); (1.8) P (A B) P (B/A) =, P (A) > 0, P (A) (1.9) P (A B) = P (A) P (B/A), (1.10) 8) jeżeli A i B są zdarzeniami niezależnymi, to oraz P (A/B) = P (A), (1.11) P (B/A) = P (B) (1.12) P (A B) = P (A) P (B). (1.13) Równość (1.13) definiuje niezależność zdarzeń. Dwa zdarzenia A i B nazywamy niezależnymi, jeśli zajście jednego z nich nie ma wpływu na prawdopodobieństwo zajścia drugiego. 17

Rozdział 1. Probabilistyczne podstawy statystyki matematycznej Przy obliczaniu prawdopodobieństwa sumy zdarzeń, należy najpierw określić czy zdarzenia są wykluczające się (wyłączające się, rozłączne), czy też nie. Dwa zdarzenia A i B nazywamy wykluczającymi się, jeśli zajście jednego z nich wyklucza zajście drugiego (w tym samym doświadczeniu). Sposób obliczania prawdopodobieństwa iloczynu zdarzeń jest uwarunkowany tym, czy zdarzenia te są zależne, czy niezależne. Jakkolwiek aksjomatyczna definicja prawdopodobieństwa podana w 1933 r. przez A. Kołmogorowa jest poprawna z teoretycznego punktu widzenia, to jest ona niewygodna w praktycznych zastosowaniach. Nie podaje ona bowiem sposobu obliczania prawdopodobieństwa P (A) dla konkretnych zdarzeń losowych. W związku z tym stosuje się inne definicje prawdopodobieństwa, np. klasyczną definicję Laplace a czy definicję geometryczną. Klasyczna definicja prawdopodobieństwa, sformułowana w 1812 r. przez P.S. Laplace a, brzmi następująco: jeżeli przestrzeń zdarzeń elementarnych E składa się z n jednakowo prawdopodobnych zdarzeń, z których k realizuje (sprzyja) zdarzeniu A, to P (A) = k n. (1.14) Niech A oznacza zdarzenie polegające na otrzymaniu parzystej liczby oczek w rzucie kostką do gry, a zdarzenie B zdarzenie polegające na otrzymaniu liczby oczek większej od 4. Przestrzeń zdarzeń elementarnych E składa się tu z 6 elementów (n = 6): E = {e 1, e 2, e 3, e 4, e 5, e 6 }. Zdarzeniu A sprzyjają trzy wyniki (k = 3): {e 2, e 4, e 6 }, a zdarzeniu B 2 wyniki (k = 2): {e 5, e 6 }. Korzystając z klasycznej definicji prawdopodobieństwa określonej wzorem (1.14), otrzymujemy oraz P (A) = 3 6 = 0,5 P (B) = 2 6 = 0,33(3). Podczas obliczania prawdopodobieństw zdarzeń za pomocą klasycznej definicji prawdopodobieństwa często wykorzystuje się pojęcie kombinacji. Z kombinacjami mamy do czynienia wtedy, gdy tworzymy podzbiory z elementów określonego zbioru. W kombinacjach tego typu nie jest ważna kolejność występujących elementów. Stąd też jest używany termin kombinacje bez powtórzeń. Liczba k-elementowych kombinacji bez powtórzeń ze zbioru n-elementowego jest określona wzorem: Ck n n! = k!(n k)!, (1.15) gdzie symbol n! (n silnia) jest iloczynem kolejnych liczb naturalnych od 1 do n, tzn. n! = 1 2 3... (n 1) n. Warto zapamiętać, że 0! = 1. Rozważmy popularną grę w toto-lotka. Doświadczenie losowe polega tu na wykonaniu losowania 6 spośród 49 liczb. Zdarzeniem losowym jest wynik 18

1.1. Prawdopodobieństwo i jego własności losowania. Przestrzeń zdarzeń elementarnych E składa się ze wszystkich sześcioelementowych podzbiorów, jakie można utworzyć z 49 liczb. Jest ich tyle, ile jest kombinacji bez powtórzeń z 49 po 6 elementów, czyli ( 49 6 ) = 49! = 13 983 816. 6!(49 6)! Zakładamy, że wszystkie zdarzenia elementarne są jednakowo możliwe (jednakowo prawdopodobne). Obliczmy prawdopodobieństwa zajścia następujących zdarzeń: 1) A 1 wylosowanie (trafienie) trójki, 2) A 2 wylosowanie czwórki, 3) A 3 wylosowanie piątki, 4) A 4 wylosowanie szóstki (największa wygrana). ( ) Z sześciu wylosowanych liczb można utworzyć 6 3 różnych trójek. Do każdej z tych trójek można ( dołączyć ) dowolną trójkę liczb spośród pozostałych 43 liczb. Takich trójek jest 43 3, a więc wszystkich możliwych kombinacji sprzyjających ( ) zdarzeniu A 1 jest 6 43 3)( 3. Prawdopodobieństwo wygrania trójki w toto-lotka jest zatem równe ) P (A 1 ) = ( )( 6 43 3 3 ( 49 6 ) = 0,01765040. Prawdopodobieństwa dla pozostałych zdarzeń są równe: ) P (A 2 ) = P (A 3 ) = P (A 4 ) = ( )( 6 43 4 2 ( 49 6 ( )( ) 6 43 5 1 ( 49 6 ( )( ) 6 43 6 0 ( 49 6 ) = 0,0009686, ) = 0,00001845, ) = 0,0000000715. Chociaż klasyczna definicja prawdopodobieństwa jest intuicyjnie zrozumiała, to pod jej adresem formułowany jest zarzut tautologii (błąd idem per idem) polegający na użyciu w definicji słowa definiowanego. Dotyczy on słowa: zdarzenie (mówiąc o zdarzeniach jednakowo możliwych, mamy na myśli zdarzenia jednakowo prawdopodobne). Ponadto klasyczna definicja prawdopodobieństwa wymaga istnienia skończonej liczby elementów przestrzeni zdarzeń elementarnych i zbioru zdarzeń sprzyjających, co nie zawsze jest możliwe. 19