Dwa podstawowe zagadnienia klasycznej statystyki matematycznej.

Podobne dokumenty
X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

Ćwiczenia rachunkowe TEST ZGODNOŚCI χ 2 PEARSONA ROZKŁAD GAUSSA

16 Przedziały ufności

Rozkład normalny (Gaussa)

Estymacja przedziałowa

Lista 6. Estymacja punktowa

ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA

Statystyka i Opracowanie Danych. W7. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

Charakterystyki liczbowe zmiennych losowych: wartość oczekiwana i wariancja

Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.

Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)

3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej

Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste

Metrologia: miary dokładności. dr inż. Paweł Zalewski Akademia Morska w Szczecinie

1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o

Wyższe momenty zmiennej losowej

Statystyka matematyczna dla leśników

n k n k ( ) k ) P r s r s m n m n r s r s x y x y M. Przybycień Rachunek prawdopodobieństwa i statystyka

Estymacja: Punktowa (ocena, błędy szacunku) Przedziałowa (przedział ufności)

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Ćwiczenia rachunkowe TEST ZGODNOŚCI 2 PEARSONA ROZKŁAD GAUSSA

PRZEDZIAŁY UFNOŚCI. Niech θ - nieznany parametr rozkładu cechy X. Niech α będzie liczbą z przedziału (0, 1).

Wokół testu Studenta 1. Wprowadzenie Rozkłady prawdopodobieństwa występujące w testowaniu hipotez dotyczących rozkładów normalnych

1 Testy statystyczne. 2 Rodzaje testów

1 Dwuwymiarowa zmienna losowa

Rachunek różniczkowy funkcji wielu zmiennych

θx θ 1, dla 0 < x < 1, 0, poza tym,

Dwumian Newtona. Agnieszka Dąbrowska i Maciej Nieszporski 8 stycznia 2011

Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja

N ( µ, σ ). Wyznacz estymatory parametrów µ i. Y które są niezależnymi zmiennymi losowymi.

Analiza I.1, zima wzorcowe rozwiązania

H brak zgodności rozkładu z zakładanym

Statystyka matematyczna. Wykład II. Estymacja punktowa

WYKŁAD 1. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).

STATYSTYKA MATEMATYCZNA

Estymacja parametrów populacji

0.1 ROZKŁADY WYBRANYCH STATYSTYK

Wykład 7. Przestrzenie metryczne zwarte. x jest ciągiem Cauchy ego i posiada podciąg zbieżny. Na mocy

1 Twierdzenia o granicznym przejściu pod znakiem całki

Wykład 11 ( ). Przedziały ufności dla średniej

Prawdopodobieństwo i statystyka

f '. Funkcja h jest ciągła. Załóżmy, że ciąg (z n ) n 0, z n+1 = h(z n ) jest dobrze określony, tzn. n 0 f ' ( z n

STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr inż Krzysztof Bryś

Parametryczne Testy Istotności

Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w

Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

Ćwiczenie nr 14. Porównanie doświadczalnego rozkładu liczby zliczeń w zadanym przedziale czasu z rozkładem Poissona

STATYSTKA I ANALIZA DANYCH LAB II

Analiza matematyczna i algebra liniowa

Techniczne Aspekty Zapewnienia Jakości

Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

Estymacja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 7

Komputerowa analiza danych doświadczalnych

STATYSTYKA I ANALIZA DANYCH

PODSTAWY BIOSTATYSTYKI ĆWICZENIA

Analiza I.1, zima globalna lista zadań

Estymacja przedziałowa:

KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1

Statystyka Inżynierska

Testowanie hipotez. H 1 : µ 15 lub H 1 : µ < 15 lub H 1 : µ > 15

1 Zmienne losowe. Własności dystrybuanty F (x) = P (X < x): F1. 0 F (x) 1 dla każdego x R, F2. lim F (x) = 0 oraz lim F (x) = 1,

Estymacja przedziałowa - przedziały ufności

Twierdzenia o funkcjach ciągłych

ma rozkład złożony Poissona z oczekiwaną liczbą szkód równą λ i rozkładem wartości pojedynczej szkody takim, że Pr( Y

n n X n = σ σ = n n n Ponieważ zmienna losowa standaryzowana ma rozkład normalny N(0, 1), więc

Ćwiczenie 2 ESTYMACJA STATYSTYCZNA

JEDNOWYMIAROWA ZMIENNA LOSOWA

Elementy modelowania matematycznego

Statystyczny opis danych - parametry

3. Regresja liniowa Założenia dotyczące modelu regresji liniowej

KOMBINATORYKA. Oznaczenia. } oznacza zbiór o elementach a, a2,..., an. Kolejność wypisania elementów zbioru nie odgrywa roli.

Wykład 8: Zmienne losowe dyskretne. Rozkłady Bernoulliego (dwumianowy), Pascala, Poissona. Przybliżenie Poissona rozkładu dwumianowego.

INDUKCJA MATEMATYCZNA

UWAGI O GRANICZNYCH ROZKŁADACH EKSTREMALNYCH STATYSTYK POZYCYJNYCH

Statystyka i rachunek prawdopodobieństwa

Funkcja generująca rozkład (p-two)

ZBIEŻNOŚĆ CIĄGU ZMIENNYCH LOSOWYCH. TWIERDZENIA GRANICZNE

Lista 5. Odp. 1. xf(x)dx = xdx = 1 2 E [X] = 1. Pr(X > 3/4) E [X] 3/4 = 2 3. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym

Prawdopodobieństwo i statystyka r.

Statystyka. Katarzyna Chudy Laskowska

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.

Twierdzenia graniczne:

Liczebnośd (w tys.) n

Komputerowa analiza danych doświadczalnych

APROKSYMACJA I INTERPOLACJA. funkcja f jest zbyt skomplikowana; użycie f w dalszej analizie problemu jest trudne

O liczbach naturalnych, których suma równa się iloczynowi

STATYSTYKA OPISOWA PODSTAWOWE WZORY

MODELE MATEMATYCZNE W UBEZPIECZENIACH. 1. Renty

TESTY LOSOWOŚCI. Badanie losowości próby - test serii.

SIGMA KWADRAT LUBELSKI KONKURS STATYSTYCZNO- DEMOGRAFICZNY

2.1. Studium przypadku 1

ĆWICZENIE 1 Symulacja doświadczeń losowych Statystyka opisowa Estymacja parametryczna i nieparametryczna T E O R I A

Zajęcia nr. 2 notatki

Rachunek prawdopodobieństwa i statystyka Wnioskowanie statystyczne. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

Ciągi liczbowe wykład 3

1 Przedziały ufności. ). Obliczamy. gdzie S pochodzi z rozkładu B(n, 1 2. P(2 S n 2) = 1 P(S 2) P(S n 2) = 1 2( 2 n +n2 n +2 n ) = 1 (n 2 +n+2)2 n.

tek zauważmy, że podobnie jak w dziedzinie rzeczywistej wprowadzamy dla funkcji zespolonych zmiennej rzeczywistej pochodne wyższych rze

Transkrypt:

5. Podstawowe pojęcia statystyi CZĘŚĆ II STATYSTYKA MATEMATYCZNA Rachue prawdopodobieństwa a statystya matematycza. Część I, rachue prawdopodobieństwa, dostarcza podstawowych pojęć i wzorów języa, za pomocą tórego możemy rozmawiać w sposób ścisły o problemach dotyczących zjawis i procesów, w tórych czyi losowy odgrywa iezaiedbywalą rolę. Rachue prawdopodobieństwa daje też modele zjawis (rozłady prawdopodobieństwa). Część iiejsza statystya matematycza jest związaa z zastosowaiem modeli probabilistyczych a jej celem jest formułowaie wiosów dotyczących oreśloej zbiorowości (tzw. populacji geeralej, łączoej dalej ze zmieą losową) a podstawie pewego podzbioru tej zbiorowości, zwaego próbą lub próbą. Fat te ozacza, że statystya zajmuje się wiosowaiem o całości (zbiorze) a podstawie części (podzbioru), czyli wiosowaiem w waruach iepełej iformacji. Wiosowaie to jest związae z dwoma astępującymi podstawowymi zagadieiami. Dwa podstawowe zagadieia lasyczej statystyi matematyczej. Wiosowaie statystycze w postaci lasyczej (tzw. lasycza statystya matematycza) obejmuje dwa zasadicze zagadieia, tórymi są (i) estymacja statystycza (putowa i przedziałowa) oraz (ii) weryfiacja hipotez statystyczych (parametryczych i ieparametryczych). Estymacja statystycza. Podstawowym problemem estymacji statystyczej jest odpowiedź a pytaie typu "ile wyosi wartość iezaego parametru g populacji geeralej?" Jeśli podaa odpowiedzieć ma postać "g. ĝ", gdzie ĝ jest obliczoą przez as liczbą, to mamy do czyieia z estymacją putową. Jeśli atomiast odpowiedź jest typu: "g zawarte jest w przedziale (ĝ, ĝ )", to tai przypade estymacji azywa się estymacją przedziałową. Weryfiacja hipotez statystyczych ozacza pewie sposób postępowaia (tzw. test statystyczy) pozwalający przyjąć lub odrzucić postawioą hipotezę statystyczą H 0 dotyczącą pewej charaterystyi. Gdy hipoteza H 0 dotyczy parametru g populacji p. H 0:(g=5) azywaa jest parametryczą, gdy Staisław Węglarczy, XII 005

5. Podstawowe pojęcia statystyi atomiast dotyczy fucji rozładu populacji p. H 0:(rozładem populacji jest rozład ormaly o parametrach µ=.5 i σ=0.3) azywamy ją ieparametryczą, a test z tym związay testem ieparametryczym (lub: zgodości). Staisław Węglarczy, XII 005

5. Podstawowe pojęcia statystyi 3 Rozdział 5 PODSTAWOWE POJĘCIA STATYSTYKI W rozdziale tym zostaą omówioe taie pojęcia, ja populacja geerala obiet badań statystyi, próba losowa, czyli posiadaa iformacja o populacji geeralej, statystya zmiea losowa będąca fucją próby, oraz rozłady ajważiejszych statysty iformacja iezbęda dla wiosowaia statystyczego. 5. PRÓBA LOSOWA I STATYSTYKA JAKO FUNKCJA PRÓBY Rys. 5.. Przyład sończoej zbiorowości geeralej (zbiorowość prostoątów) i podzbioru tej zbiorowości próby Zbiorowość geerala. Pojęciem podstawowym, podobie ja w części I, jest doświadczeie losowe. Często używaym dalej syoimem tego pojęcia jest słowo obserwacja. Dotyczy oa pewej zbiorowości (czyli zbioru), tórej elemety obserwujemy. Zbiorowość ta osi azwę zbiorowości geeralej lub populacji geeralej (rys. 5.) i słada się z pewych obietów, tóre mogą być obietami materialymi, p. jaimiś przedmiotami, lub też obietami iematerialymi, p. wyiami obserwacji, zarówo ilościowymi, ja i jaościowymi. Ta więc zbiorowością geeralą może być zarówo zbiór samochodów daej mari, jaie zostały wyproduowae w daym rou, zbiór prostoątów z rys. 5., zbiór wszystich opadów, jaie spadły (i spadą) w daym pucie geograficzym, ja też zbiór wszystich możliwych wyiów pomiarów długości daego przedmiotu. Cecha X populacji geeralej. Wspomiae obiety elemety populacji badamy zwyle ze względu a pewą cechę (charaterystyę), tórą zawsze muszą posiadać wszystie elemety daej populacji. Cechę tę zawsze watyfiujemy, tz. wyrażamy ją liczbowo. W przypadu zbiorowości samochodów cechą tą może być p. Staisław Węglarczy, XII 005

5. Podstawowe pojęcia statystyi 4 czas do pierwszej aprawy (jeda liczba dla ażdego samochodu), dla zbioru prostoątów z rys. 5. może to być długość i szeroość prostoąta (dwie liczby dla ażdego prostoąta), w przypadu opadów może as iteresować wysoość opadu, czas jego trwaia oraz masymale atężeie (trzy liczby a ażdy opad), podczas gdy w ostatim przypadu pomiaru długości daego przedmiotu jest to jeda liczba (długość) a ażdy pomiar. Badaa i swatyfiowaa cecha, azwijmy ją X, jest z założeia zmieą losową i jao taa posiada pewie rozład prawdopodobieństwa o dystrybuacie F X(x). Często mówi się też, że daa populacja ma rozład FX(x). Należy tutaj od razu zdać sobie sprawę z fatu, że rozład te jest a ogół iezay (jeśli jest zay, to iformacja o tym pochodzi spoza statystyi). Dyspoujemy jeda pewą iformacją pochodzącą z obserwacji próbą losową {x, x,..., x }. Iformacja ta jest prawie zawsze iepeła, tz. ie sposób a jej podstawie oreślić absolutie doładie postać rozładu F X(x). Niepełość iformacji o iezaym rozładzie FX(x), pochodzącej z szeroo rozumiaego esperymetu, spowodowaa jest tym, że esperymet te daje pewie podzbiór zbioru możliwych obserwacji i a podstawie tego podzbioru tzw. próby wysuwamy wiosi dotyczące cechy X wszystich elemetów daej zbiorowości. Przyład 5.. Zmiea losowa i jej realizacje. Wyoao trzy serie pomiarów długości pewego odcia po 5 pomiarów w ażdej serii. Tabela 5. zawiera uzysae wyii. Staisław Węglarczy, XII 005 Tabela 5.. Wyii pomiarów długości odcia umer serii wyi x i i-go pomiaru w daej serii, m pomiarów x x x 3 x 4 x 5 9.99 0.0 9.98 9.99 9.98 0.00 0.0 9.99 0.0 0.00 3 0.00 0.00 0.00 0.0 9.99 Każda z trzech 5-elemetowych serii pomiarów może być tratowaa jao realizacja 5-elemetowej próby losowej (X,X,X 3,X 4,X 5), atomiast wartości w olejych olumach są realizacjami olejych zmieych losowych sładowych wetora losowego (X,X,X 3,X 4,X 5). Na przyład liczby 9.99, 0.00 i 0.00 (pierwsza oluma) są realizacjami zmieej losowej X. Oczywiście, realizacji zmieej losowej X (i pozostałych zmieych) może być iesończeie wiele. Próba losowa. Niech doświadczeie losowe polega a -rotej obserwacji zmieej losowej X. Wyiiem tego doświadczeia będzie zbiór liczb x, x,...,x, gdzie ides ozacza umer pomiaru. Poieważ doświadczeie było losowe (ie mogliśmy z całowitą pewością przewidzieć jego wyiów i przeprowadzoo je ta, aby ie preferować żadych wyiów), to wartości te są realizacjami pewych To sformułowaie sugeruje, że ażdą populację możemy w ońcu rozumieć jao zbiór X liczb (zbiór X możliwych wyiów pomiaru) i do taiego spojrzeia prowadzi podejście statystycze. Dla prawidłowego wiosowaia jest wszaże oiecze, aby ja ajlepiej rozumieć czego dotyczą liczby x i ich zbiór X.

5. Podstawowe pojęcia statystyi 5 zmieych losowych, odpowiedio: X, X,...,X, lub iaczej: realizacjami wetora losowego (X, X,...,X ). Zmieą X i azwiemy wyiiem i-tej obserwacji (lub: wyiiem i-go pomiaru) zmieej losowej X, wetor (X, X,...,X) azwiemy próbą losową, a zbiór liczb (x, x,..., x) realizacją tej próby. Formalą defiicję próby losowej moża zaleźć p. w podręcziu Fisza []. Zamiast sformułowaia realizacja próby losowej często stosuje się sformułowaie próba losowa, co prowadzi do oflitu z podaym powyżej oreśleiem przeważie jeda otest pozwala domyślić się, o tórym z dwu powyższych termiów jest mowa. Liczba azywaa jest liczebością próby i jest to bardzo waży parametr statystyczy. Losowość próby. Losowość próby jest iezbędym waruiem tego, aby moża było używać jej do wyciągaia wiosów dotyczących całej populacji (aby próba była reprezetatywa). (Ta więc przedstawioa a rys. 5. próba, jeśli tylo jest losowa, może być podstawą wiosowaia o całej populacji prostoątów). Próba losowa jest podstawą wiosowaia statystyczego o rozładzie badaej cechy X populacji geeralej. Poieważ próba jest częścią całej populacji, zawiera iformację loalą związaą wyłączie z samą próbą i iformację globalą, tóra dotyczy całej populacji. Z putu widzeia wiosowaia statystyczego iformacja loala zaciemia poszuiwaą przez as iformację o populacji (jest szumem ), co ozacza, że wiosowaie statystycze jest zawsze obarczoe iepewością. Prosta próba losowa. Spośród prób losowych szczególe zastosowaie zalazła prosta (lub: iezależa) próba losowa. Jest to taa próba losowa, tóra posiada astępującą własość: F ( x, x,..., x ) = F ( x ) F ( x )... F ( x ) X X X (5.) gdzie F (x,x,...,x ) jest dystrybuatą łączego rozładu wetora losowego (X, X,..., X ), F X( ) iezaą dystrybuatą zmieej losowej (cechy) X, a dowolą liczbą aturalą. Powyższa rówość ozacza, że zmiee X,X,...,X () mają tai sam rozład F X(x) oraz że () są iezależe (zespołowo). Możemy więc uważać, że w prostej próbie losowej olejość jej elemetów ie odgrywa żadej roli, co ozacza, że wartość olejego elemetu próby ie zależy od wartości elemetów poprzedich (i astępych). Mówiąc jeszcze iaczej: œi> F i(x i x i-, x i-,...,x ) = F X(x i). Staisław Węglarczy, XII 005

5. Podstawowe pojęcia statystyi 6 Wyia z tego dalej, że jeśli poprzez zmiaę olejości wyrazów utworzymy z ciągu {x,x,..., x } tzw. ciąg uporządoway (albo iaczej: próbę uporządowaą) iemalejący {x(),x(),...,x()}, tj. tai, że: x x... x () () ( ) lub ierosący {x(),x(),...,x()}, tz. tai, że (5.) x x... x () () ( ) (5.3) to dostarcza o tyle samo iformacji co orygialy ciąg (x, x,...,x). Bardzo często założeie () przyjmowae jest bez dowodu, co może prowadzić do poważych błędów. Przyład 5.. Uporządowaa próba losowa. Niech będzie daa 5-elemetowa próba losowa {x, x, x 3, x 4, x 5} = {, 4,, 3, 7}. Uporządowaa rosąca próba losowa to {x (), x (), x (3), x (4), x (5)} = {,,3,4,7}, a próba uporządowaa malejąco to oczywiście {x (), x (), x (3), x (4), x (5)} = {7, 4, 3,, }. Wyrażając istotę prostej próby losowej w termiach miej matematyczych, moża powiedzieć, że zasadza się oa a założeiu o idetyczych waruach, w jaich przeprowadzae jest doświadczeie (obserwacja) oraz rówomożliwości (idetyczym prawdopodobieństwie) uzysaia wszystich otrzymaych wyiów. Statystya. Poieważ próba losowa jest wetorem losowym, to wyia stąd, że dowola fucja Z próby (X, X,...,X ) Z = g( X, X,..., X ) (5.4) jest taże zmieą losową. Fucja Z osi azwę statystyi. Jest więc, a przyład, zmieą losową (i zarazem statystyą) wartość średia z próby, wariacja z próby, itp. Wyzaczaie rozładów statysty jest jedym z podstawowych zagadień statystyi matematyczej. Nietóre rozłady statysty są zamieszczoe w rozdziale 5.3. Mała i duża próba. Istieją dwa podejścia do rozwiązaia problemu wyzaczaia rozładu daej statystyi. Podejście pierwsze polega a wyzaczeiu dla ażdego rozładu F ( x ) statystyi Z (a podstawie zajomości F X(x), czyli zajomości Z rozładu daej cechy populacji geeralej). Tai rozład azywamy doładym rozładem statystyi Z. Gdy liczba jest duża, możemy sorzystać z pewych twierdzeń rachuu prawdopodobieństwa i wyzaczyć rozład daej statystyi Z, gdy zmierza do iesończoości (tai rozład azywa się rozładem graiczym lub asymptotyczym). Rozłady asymptotycze statysty mają tę ważą cechę, że ie zależą od roz- Staisław Węglarczy, XII 005

5. Podstawowe pojęcia statystyi 7 ładu F X(x) populacji, co czyi z ich bardzo pożądae arzędzie aalizy statystyczej. Jeśli jest ta duże, że możemy sorzystać z rozładu graiczego badaej statystyi, to taa próba azywa się dużą próbą (dla daej statystyi). Jeśli atomiast wielość ie pozwala a sorzystaie z rozładu graiczego, to mamy do czyieia z próbą małą (dla daej statystyi). Ostrzeżeie. Niestety ie istieje ryterium pozwalające jedozaczie zdefiiować próbę małą i dużą zależy to od rozpatrywaej statystyi. Chyba ajczęściej stosowaą liczbą defiiującą dużą próbę jest =30. Należy jeda moco podreślić, że liczba ta dotyczy przede wszystim statystyi średia wartość z próby. W ażdym iym przypadu liczba ta może być ia. 5. PODSTAWOWE TWIERDZENIE STATYSTYKI MATEMATYCZNEJ Iformacją ajbardziej pożądaą, jaą chcemy uzysać o cesze X a podstawie próby losowej jest zajomość rozładu F X(x). Poieważ próba losowa iesie z sobą iformację o X, to zaczy, że iesie oa iformację o rozładzie F X(x). Poiższe twierdzeie, zwae czasami podstawowym twierdzeiem statystyi matematyczej lub częściej twierdzeiem Gliwiei albo też Gliwiei-Catelliego, pozwala zbudować pewie empiryczy odpowiedi iezaej dystrybuaty F X(x) ta zwaą dystrybuatę empiryczą F (x) i wyazuje użyteczość tego pojęcia. 5.. Dystrybuata empirycza Mamy daą prostą próbę losową (x, x,...,x ) (mówiąc ściśle mamy daą realizację prostej próby losowej, jedaże słowo realizacja często się opuszcza). Dystrybuata empirycza F emp(x), gdzie x jest dowolą liczbą rzeczywistą, jest taą fucją, że F emp liczba elemetów xi próby taich, że xi < x ( x) = (5.5) Jeśli utworzymy próbę uporządowaą rosąco (zwaą też czasem rosącym ciągiem rozdzielczym) (x (), x (),...,x ()), gdzie x ()#x ()#...#x (), to defiicja F emp(x) rówoważa defiicji (5.5) będzie miała postać: 0, dla x() x F ( x) =, dla x x < x, dla x > x( ) emp ( ) ( + ) (5.6) Staisław Węglarczy, XII 005

5. Podstawowe pojęcia statystyi 8 Wzory (5.5) i (5.6) wyiają z przyjmowaego powszechie założeia o rówym prawdopodobieństwie pojawiaia się wyiów daej próby losowej (x, x,...,x ): P( X = xi ) =, i =,,..., (5.7) Moża spotać też ie wzory a dystrybuatę empiryczą, m.i. tai dla próby uporządowaej rosąco x ()#x ()#...#x (). : podający wartości dystrybuaty w putach jej ieciągłości. F emp ( x( )) = + (5.8) Przyład 5.3. Wyreślaie dystrybuaty empiryczej. Daa jest 0-elemetowa próba losowa {x i} i=,0 = {4.6, 6.90, -.03, -0.76, 4.50, 0.8,.64, 5.84, 5.56, 0.4} wylosowaa z pewej populacji X, gdzie X ozacza ciągłą zmieą losową. Zadaie. Wyreślić dystrybuatę empiryczą F emp(x) zmieej losowej X dla tej próby. Rozwiązaie. Porządujemy rosąco próbę {x i} i=,0 i dostajemy próbę uporządowaą {x (i)} i=,0 = {-.03, -0.76, 0.4, 0.8,.64, 4.5, 4.6, 5.56, 5.84, 6.9}, po czym orzystamy ze wzoru (5.6). (Moża też orzystać, co jest często stosowae, ze wzoru(5.8)). Wyi poazay jest a rys. 5.. Rys. 5.. Dystrybuata empirycza zmieej X obliczoa a podstawie 0-elemetowej próby losowej. 5.. Podstawowe twierdzeie statystyi matematyczej twierdzeie Gliwiei-Catelliego Jeśli prosta próba losowa (X,X,...,X) pochodzi z populacji o rozładzie FX(x), to P lim sup F ( x) F ( x) = 0 = emp X x R (5.9) gdzie Femp(.) jest dystrybuatą empiryczą zmieej losowej X, a P( ) ozacza prawdopodobieństwo. Wzór te jest teoretyczym uzasadieiem przeoaia, że w miarę wzrostu liczebości próby powięsza się asza wiedza o iezaym rozładzie F X(x), co wyraża się miejszą masymalą odległością sup F emp(x)-f X(x) Staisław Węglarczy, XII 005

5. Podstawowe pojęcia statystyi 9 pomiędzy rozładem empiryczym F emp(x) a rzeczywistym rozładem FX(x) (zob. rys. 5.3, gdzie przedstawioo 3 dystrybuaty empirycze dla = 0, 0 i 40). (Istieją ie możliwości zdefiiowaia odległości pomiędzy fucjami). Histogram (wyres częstości względych) jao obraz fucji gęstości. Dystrybuata empirycza jest esperymetalym obrazem rzeczywistej dystrybuaty badaej zmieej X. Na podstawie daej próby losowej moża taże zbudować Rys. 5.3. Ilustracja sesu twierdzeia Catelliego: im bardziej licza próba tym bardziej dystrybuata empirycza jest bliższa dystrybuacie populacji (liia pogrubioa) empiryczy odpowiedi fucji gęstości, co jest zilustrowae a rys. 5.4. Należy w tym celu obrać w sposób miej lub więcej arbitraly pewe przedziały a osi wartości zmieej X, zliczyć liczbę i realizacji zmieej w olejych przedziałach, obliczyć wartość częstości względej i/, gdzie jest liczebością próby, oraz wyreślić prostoąt o wysoości i/()x) i szeroości )x. Niestety ta reprezetacja w odróżieiu od dystrybuaty empiryczej zawsze gubi część iformacji zawartej w próbie. Dzieje się ta wsute czyości grupowaia elemetów próby "wrzucaia" wartości zmieej do '< przedziałów )x, gdzie tracą oe swoją idywidualość (tz. wiadomo, ile elemetów próby ależy do daego przedziału, ie wiadomo jeda, gdzie oe leżą wewątrz tego przedziału). Pewą egatywą rolę odgrywa tutaj rówież arbitralość w wyborze długości przedziału )x, co dosoale ilustrują wyresy B, C i D a rys. 5.4, ja też arbitralość wyboru początu przedziału zmieości zmieej X (a rys. 5.4 jest to put x 0=5). Przyład 5.4. Histogram jest obrazem fucji gęstości prawdopodobieństwa. Z populacji ormalej o parametrach µ=0 i σ= (rys. 5.4A), N(0,), wylosowao =40- elemetową prostą próbę losową. Wyii zawarte są w tabeli A. Tabela A. 40-elemetowa próba wylosowaa z populacji N(0,).37.3 3.9 9.0.7.84 0.44.9 0.57 8.55 3.58 9.47 7.94.38 4.36 8.9 5.53 8.43 8.77. 9.76 8.0.57 8.8 5.7 6.59.65 8.96 7.7 0.69 9.90 7.88 9.06 8.8 0.9 7. 0.6 3.6.05 7.06 Następie zares zmieości próby losowej (dla wygody przyjęto przedział (5;5)) został podzieloy trzyrotie: odpowiedio a 0, 8 i 5 rówych przedziałów x i i w ażdym z ich zalezioo liczbę i wartości daej próby losowej. Uzysae wyii przedstawioe są olejo Staisław Węglarczy, XII 005

5. Podstawowe pojęcia statystyi 0 w tabelach B, C i D. Tabela B. 0 przedziałów grupowaia wartości 40-elemetowej próby losowej (rys. 5.4B) i 3 4 5 6 7 8 9 0 )x i 5-6 6-7 7-8 8-9 9-0 0- - -3 3-4 4-5 i 5 8 5 5 9 3 Tabela C. 8 przedziałów grupowaia wartości 40-elemetowej próby losowej (rys. 5.4C) i 3 4 5 6 7 8 )x i 5.0-6.5 6.5-7.50 7.50-8.75 8.75-0.00 0.00-.5.5-.50.50-3.75 3.75-5.00 i 3 6 0 7 7 4 Tabela D. 5 przedziałów grupowaia wartości 40-elemetowej próby losowej (rys. 5.4D) i 3 4 5 )x i 5-7 7-9 9- -3 3-5 i 3 3 3 0 4 Wszystie histogramy (rys. 5.4B, C i D) są empiryczymi obrazami (reprezetacjami) tej samej fucji gęstości fhxl NH0; L f f(x) (rys. 5.4A). Każdy z * HxL Dx =0 0. ich w iym stopiu A 0. 0.5 B iesie iformację o 0.5 0. rzeczywistej fucji 0. gęstości. Wydaje się, że histogram B jest zbyt szczegółowy: za dużo jest tam iformacji powstałej a sute tego podziału. Z olei, histogram D jest zbyt ogóly: sugeruje, że rzeczywista fucja gęstości ma masimum a lewym rańcu przedziału 0.05 f * HxL Dx =8 0. 0.5 0.05 6. 8. 0.. 4. zmieości. W porówaiu z tymi dwoma histogramami, ajlepszy (w sesie podobieństwa do f(x)), wydaje się histogram C. 0. 6 8 0 4 x C x 0.05 f * HxL Dx =5 0. 0.5 0. 0.05 6. 8. 0.. 4. D 6. 8. 0.. 4. Rys. 5.4. Wyreśloe dla 40-elemetowej próbi: A. fucja gęstości populacji N(0,) oraz histogramy o przedziałach zliczaia B. )x=.0, C. )x=.5 i D. )x=. Istieje ia metoda zajdowaia empiryczej fucji gęstości tzw. estymacja ieparametrycza fucji gęstości pozwalająca uiąć więszości błędów opisaego wyżej histogramu. Metoda ta ie będzie jeda tutaj omawiaa. x x Staisław Węglarczy, XII 005

5. Podstawowe pojęcia statystyi 5.3 NAJWAŻNIEJSZE STATYSTYKI I ICH ROZKŁADY Daa jest próba losowa (X,X,...,X ). Możemy oreślić dla iej wiele statysty, czyli zmieych losowych będących fucjami próby. Najważiejsze z ich, z pratyczego putu widzeia, to momety z próby i ich fucje. W olejych podrozdziałach podae zostały rówaia defiicyje ietórych podstawowych statysty wraz z ajważiejszymi rozładami z imi związaymi. W ietórych podręcziach statystyi te ozaczae są małymi literami iezależie od tego, czy ma oa w daej chwili ses zmieej losowej, czy jej wartości. W iiejszym teście taie rozróżieie będzie zachowae. Stosowaa dalej pozioma resa (6) ad symbolem lub grupą symboli ( resa poad ) ozacza średią arytmetyczą liczoą ze względu a zmieą lub zmiee występujące pod tym zaiem. Jest oa odpowiediiem operatora wartości oczeiwaej E używaego dla średiej przy zaym rozładzie prawdopodobieństwa. Przyład 5.5. Działaie operatora resa poad. def g( x) = g( xi ) x = xi ( x x) = ( xi x) (5.0) i= i = i = Wszędzie powyżej załadamy, że liczebość próby wyosi. W olejych podrozdziałach przedstawioe zostaą waże statystyi i ich rozłady w zależości od tego, czy badaa jest populacja jedowymiarowa, dwuwymiarowa, czy dwie populacje jedowymiarowe. 5.3. Populacja jedowymiarowa. Wartość średia z próby Daa jest próba losowa (X, X,...,X ) pobraa z badaej jedowymiarowej populacji X. Statystya wartość średia z próby (lub: wartość średia w próbie) jest zdefiiowaa rówością X i i = X = (5.) Populacja X ormala ze zaą wartością odchyleia stadardowego σ. Jeśli populacja, z tórej pochodzi elemetowa prosta próba, ma rozład ormaly: FX=N(µ,σ) ze zaą wartością σ, to statystya U = X µ σ (5.) ma rozład ormaly N(0,). Staisław Węglarczy, XII 005

5. Podstawowe pojęcia statystyi Przypade te jest często spotyay w pratyce pomiarowej, gdy przyjmujemy tzw. ormaly model iepewości (błędów) pomiarowych, tz. przyjmujemy za prawdziwe założeie, że iepewości pomiarowe (zwae często miej precyzyjie błędami pomiarowymi) czyli odchyłi X-µ wyiów x pomiaru od iezaej wartości prawdziwej µ podlegają rozładowi ormalemu N(0,σ), gdzie σ jest zaą doładością przyrządu pomiarowego (doładością pojedyczego pomiaru). Iaczej mówimy, że wyi X pomiaru iezaej wartości prawdziwej µ podlega rozładowi ormalemu N(µ,σ). Fat, że statystya (5.) podlega rozładowi N(0,) jest ią formą stwierdzeia, że użycie wartości średiej x z pomiarów zamiast pojedyczej wartości x daje orzyść polegającą a miejszej iepewości (miejszym błędzie), gdyż zmiea X podlega rozładowi ormalemu N(µ,σ/ X. (Zwróćmy uwagę a fat, że EX = EX = µ). ) zamiast N(µ,σ) ja dla Przyład 5.6. Obliczaie liczby pomiarów iezbędych do 0-rotego zmiejszeia iepewości pomiaru. Wyoujemy pomiarów x i, i=,,...,, długości L pewego przedmiotu przyrządem o doładości σ = mm, po czym obliczamy wartość średią x. Ile pomiarów trzeba wyoać, aby prawdopodobieństwo, że uzysaa średia ie różi się od wartości prawdziwej więcej iż 0. mm było rówe 95%? Odpowiedź. Przyjmujemy, że wartość prawdziwa L odpowiada parametrowi µ statystyi U (5.), stąd moża przyjąć, że warue postawioy w zadaiu ma postać ( X µ ) P <0. mm = 0.95 (5.3) Z uwag zamieszczoych bezpośredio powyżej moża przyjąć astępujący ciąg dalszy: X µ 0. ( X µ ) = = ( U ) P <0. mm P < P <0. σ / σ / ( U ) ( ) ( ) ( ) ( ) = P 0. < < 0. = Φ 0. Φ 0. ( ) ( ) = Φ 0. Φ 0. = Φ 0. = 0.95 bo σ= mm a Φ() jest dystrybuatą rozładu N(0,). Z (5.4) mamy, że wartość 0. (5.4) jest watylem rzędu 0.975: 0. = u 0.975. Z tablic rozładu ormalego mamy: u 0.975 =.96. Rówaie 0. =.96 daje rozwiązaie: =384.6, sąd mamy odpowiedź: Trzeba co ajmiej =385 pomiarów. Populacja X ormala z iezaą wartością σ. Jeśli populacja, z tórej pochodzi elemetowa prosta próba, ma rozład ormaly FX=N(µ,σ) z iezaą wartością σ, to statystya Staisław Węglarczy, XII 005

5. Podstawowe pojęcia statystyi 3 X µ t = S (5.5) ma rozład Studeta z parametrem <=- azywaym liczbą stopi swobody. i= i Wielość S jest odchyleiem stadardowym z próby ( S = (/ ) ( x x) ). Wyjątowo, ze względu a tradycję, zmiea losowa (tj. t) jest tutaj ozaczaa małą, ie dużą, literą. Ze względu a swą iezależość od σ rozład te zajduje szeroie zastosowaie. Charateryzuje się o astępującymi pierwszymi mometami Et = 0 ν var t = = ν 3 (5.6) i bardzo szybo ze wzrostem < upodabia się do rozładu ormalego N(0,) (rys. 5.5). Z doładością wystarczającą dla pratyczych zastosowań moża przyjąć, że dla ν>30 rozłady te są idetycze. Wartości ietórych watyli tego rozładu dla ν 30 podae są w tabeli 3 zamieszczoej w Dodatu A. Populacja X o rozładzie ie-ormalym lub iezaym. Gdy rozład populacji ie jest zay lub gdy jest zay ale ie jest ormaly, to dla dużej próby (tj. więcej iż o. 30) ma zastosowaie graiczy rozład ormaly, co ozacza, że wartość średia X z -elemetowej próby losowej podlega w przybliżeiu rozładowi N( x, s X / ). Rys. 5.5. Im więsza liczba stopi swobody ν tym bardziej rozład Studeta jest bliższy rozładowi N(0,) (liia pogrubioa) Przyład 5.7. Duża próba. Z populacji X o iezaym rozładzie pobrao =00- elemetową prostą próbę losową i zalezioo, że x =8.3 i s X=.75. Zgodie z powyższym twierdzeiem zmiea losowa podlega w przybliżeiu rozładowi N(8.3,.75/ 00 ) = N(8.3, 0.75). 5.3. Populacja jedowymiarowa. Wariacja z próby Populacja X ormala. Wariacja z próby S jest zdefiiowaa astępująco: S X X X X (5.7) def = ( ) = ( i ) i = Staisław Węglarczy, XII 005

5. Podstawowe pojęcia statystyi 4 Jeśli populacja, z tórej pochodzi elemetowa prosta próba losowa, ma rozład ormaly F X=N(µ,σ) z iezaą wartością σ, to statystya χ (chi-wadrat) S χ = σ (5.8) podlega rozładowi χ z parametrem ν=- (z ν stopiami swobody). Wartość oczeiwaa i wariacja tej zmieej wyrażają się wzorami sąd (i z (5.8)) wyiają wzory dla S : E = var = χ ν χ ν (5.9) ( ) E χ var σ χ = = σ 4 (5.0) Tabela 4 z Dodatu A zawiera ietóre watyle tego rozładu dla liczby stopi swobody 30. Dla ν>30 moża stosować rozład graiczy zmieej losowej (χ ) /, tóra podlega rozładowi ormalemu N[(-) /,]. Przyład 5.8. Rozład wariacji z próby. Obliczyć prawdopodobieństwo, że obliczoa wartość wariacji S z próby o liczebości =0 ie różi się od wartości prawdziwej wariacji σ o więcej iż 5%. Rozwiązaie. Zadaie moża zapisać astępująco: Biorąc pod uwagę defiicję, mamy dalej S P 0.95 < <.05 =? σ S P 0.95 < <.05 P = ( 0.95 < χ <.05) = P( 9 < χ < ) σ = F (; ν = 9) F (9; ν = 9) = 0.663 0.543 = 0.0 χ Wartości dystrybuaty F χ(x) zostały odczytae z tablicy 4 (Dodate A) rozładu χ. χ (5.) (5.) Populacja X o rozładzie ie-ormalym lub iezaym. Gdy rozład populacji X ie jest oreśloy, to dla dużej próby ma zastosowaie graiczy rozład ormaly dla S = M, tz. zmiea S podlega wtedy w przybliżeiu rozładowi ormalemu: F ( x) N(E M,D M ) S E M = µ D M = µ 4 µ gdzie µ = E(X-EX). *********przyład?? ( ) (5.3) Staisław Węglarczy, XII 005

5. Podstawowe pojęcia statystyi 5 5.3.3 Populacja jedowymiarowa. Odchyleie stadardowe z próby Odchyleie stadardowe z próby S. Oreśla je rówaie def S = S = X X (5.4) ( i ) i = Rozłady zmieej losowej S są oczywiście ściśle związae z rozładami wariacji z próby S, toteż łatwo obliczyć żądae wartości związae z S a podstawie zależości dotyczących S. Przyład 5.9. Rozład odchyleia stadardowego z próby. Obliczyć prawdopodobieństwo, że obliczoa wartość odchyleia stadardowego S z próby o liczebości =0 ie różi się od wartości prawdziwej odchyleia stadardowego σ o więcej iż 5%. Rozwiązaie. Zadaie jest podobe do zadaia z przyładu 5.8: S S P 0.95 < <.05 = P 0.95 < <.05 =? σ σ Ja w przyładzie 5.8, dostajemy dalej dla =0: (5.5) S P 0.95 < <.05 P = ( 0.95 < χ <.05 ) = P( 8.05 < χ <.05) σ (5.6) = F (.05; ν = 9) F (8.05; ν = 9) = 0.78 0.48 = 0.37 χ Wartości dystrybuaty F χ(x) zostały odczytae z tablic 4 (Dodate A) rozładu χ. 5.3.4 Populacja jedowymiarowa. Momet początowy A rzędu z próby χ Defiicja mometu początowego A rzędu z próby jest aalogicza do defiicji mometu teoretyczego α (??): def i i = A = X = X (5.7) Prawdziwe jest astępujące twierdzeie o rozładzie graiczym mometu A : Jeśli mamy daą -elemetową prostą próbę losową i istieje sończoy momet " populacji geeralej, to gdzie F ( x) N(E A, D A ) A E A = α D A = α α ( ) (5.8) (5.9) Staisław Węglarczy, XII 005

5. Podstawowe pojęcia statystyi 6 Rys. 5.6. W miarę wzrostu liczebości próby rozłady R, R, R3, R4 (R=A, B, C, D) wartości średiej z próby są coraz miej podobe do rozładu R zmieej losowej X supioego a przedziale (0,). Rys. 5.6 ilustruje powyższe twierdzeie dla pierwszego mometu A X. Przeprowadzoy został astępujący esperymet umeryczy. Wybrae zostały 4 róże (pod względem symetrii) rozłady populacji (A, B, C i D), astępie z ażdej z tych populacji losowae było 00 prób o liczebości i dla ażdej próby obliczao wartość średią x. W te sposób tworzoe były 00-elemetowe próby wartości średich. Rozłady częstości względych wystąpień wartości średiej X, przedstawioe a rys. 5.6, już dla =0 pratyczie ie przypomiają rozładu wyjściowego cechy X populacji. 5.3.5 Populacja jedowymiarowa. Momet cetraly M rzędu z próby Momet cetraly M rzędu z próby jest zdefiioway ja astępuje: def M = ( X X ) = ( X X i ) (5.30) i = Aalogiczie ja momet początowy, rówież momet cetraly ma swój rozład graiczy: Staisław Węglarczy, XII 005

5. Podstawowe pojęcia statystyi 7 F ( x) N(E M, D M ) M E M = µ D M = µ µ µ µ µ µ ( + + ) gdzie µ jest mometem cetralym rzędu zmieej X: µ =E(X-EX). (5.3) Przyład 5.0******************* 5.3.6 Populacja dwuwymiarowa. Współczyi orelacji R z próby Mamy daą dwuwymiarową (prostą) próbę losową {(X,Y ), (X,Y ),..., (X,Y )} wziętą z dwuwymiarowej populacji (X,Y). Defiiujemy współczyi orelacji R z próby zmieych losowych (X,Y): def R = ( X X )( Y Y ) = XY i= ( X X )( Y Y ) i S S X Y (5.3) gdzie S X i S Y są odchyleiami stadardowymi (5.4) odpowiedio zmieej X i Y. Populacja ormala ze współczyiiem orelacji D=0. Jeżeli populacja, z tórej pobrao prostą próbę, podlega dwuwymiarowemu rozładowi ormalemu ze współczyiiem orelacji D=0, to statystya R t = R podlega rozładowi Studeta o ν=- stopiach swobody. (5.33) Przyład 5.. Rozład współczyia orelacji z próby (ρ=0). Daa jest dwuwymiarowa populacja ormala o współczyiu orelacji ρ=0. Obliczyć prawdopodobieństwo, że współczyi orelacji z =0-elemetowej próby ie różi się od zera więcej iż 0.. Rozwiązaie. Poieważ fucja t(r) jest fucją rosącą, to prawdziwa jest astępująca rówość: sąd mamy dalej: ( R ) ( t R t ) P < 0. = P ( ) < (0.) =? (5.34) 0. P ( R < 0.) = P ( t( R) < t(0.) ) = P t < 0 = P ( t < 0.464) 0. = P( 0.464 < t < 0.464) = F (0.464; ν = 8) F ( 0.464; ν = 8) (5.35) = 0.6535 0.3465 = 0.3070 Symbol F t(x,<) ozacza wartość dystrybuaty rozładu Studeta o < stopiach swobody w pucie x (tabela 3 w Dodatu A). t t Staisław Węglarczy, XII 005

5. Podstawowe pojęcia statystyi 8 Populacja ormala z dowolym współczyiiem orelacji. Jeżeli populacja, z tórej pobrao prostą próbę, podlega dwuwymiarowemu rozładowi ZHRL ormalemu z dowolym współczyiiem orelacji ρ (a więc ieoieczie ρ=0 ja wyżej) to statystya Z (tzw. przeształceie Fishera) + R Z = l R (5.36) (zob. rys. 5.7) ma już dla iedużych (pratyczie dla $ 0 [?]) rozład w przybliżeiu ormaly + ρ ρ N l + ; ρ ( ) (5.37) Przyład 5.. Jaość przybliżeia (5.37), gdy współczyi orelacji z próby ρ=0. (Zadaie ja w przyładzie 5.). Daa jest dwuwymiarowa populacja ormala o współczyiu orelacji ρ=0. Korzystając z (5.37) obliczyć prawdopodobieństwo, że współczyi orelacji z =0-elemetowej próby ie różi się od zera więcej iż 0.. Rozwiązaie. Poieważ przeształceie Fishera jest fucją rosącą i symetryczą względem putu (0,0), to moża apisać Dalej mamy: ( R ) ( Z R Z ) P < 0. = P ( ) < (0.) =? (5.38) ( R < ) = ( Z R < Z ) P 0. P ( ) (0.) + 0. = P Z < 0.5l = P ( Z < 0.003 ) =... 0. Zgodie z zmiea Z w tym przyładzie podlega rozładowi N(0, (5.39) /9 ) = N(0,0.94). Aby więc móc sorzystać z tablic dystrybuaty Φ(u) rozładu N(0,), ależy zmieą Z stadaryzować, co sprowadza się w tym przypadu do podzieleia obu stro ierówości w przez wartość 0.94 Z 0.003... = P < = P ( U < 0.437) 0.94 0.94 = Φ(0.437) Φ( 0.437) = Φ(0.437) - -0.5 0.5 R (5.40) = 0.6690 = 0.338 Otrzymaa wartość 0.338 jest o ieco poad 0% wyższa od wartości doładej (0.307) uzysaej w przyładzie 5.. Gdyby próba losowa była 30-elemetowa, wtedy otrzymae - - Rys. 5.7. Przeształceie Z Fishera (5.36) Staisław Węglarczy, XII 005

5. Podstawowe pojęcia statystyi 9 wartości prawdopodobieństwa P( R <0.) wyiosłyby odpowiedio 0.408 i 0.3874 (różica 6%). Przyład 5.3. Rozład współczyia orelacji z próby (ρ=0.5). Daa jest dwuwymiarowa populacja ormala o współczyiu orelacji ρ=0.5. Obliczyć prawdopodobieństwo, że współczyi orelacji z =30-elemetowej próby ie różi się od 0.5 więcej iż 0.. Rozwiązaie. Trochę iaczej iż w poprzedim przyładzie 5. mamy + ρ ρ µ = l + = 0.5407 ρ ( ) (5.4) σ = = 0.857 i dalej: ( R ρ < ) = ( ρ < R < ρ + ) = ( Z ρ < Z R < Z ρ + ) P 0. P 0. 0. P ( 0.) ( ) ( 0.) + (0.5 0.) + (0.5 + 0.) = P 0.5l < Z < 0.5l (0.5 0.) (0.5 + 0.) = P 0.436 < < 0.693 ( Z ) 0.436 0.5407 Z 0.5407 0.693 0.5407 = P < < 0.857 0.857 0.857 = P 0.6306 < U < 0.807 = Φ(0.807) Φ( 0.6306) ( ) = 0.794 0.64 = 0.599 5.3.7 Populacja dwuwymiarowa. Współczyi ieruowy A regresji liiowej z próby zmieej Y względem zmieej X (5.4) Współczyi ieruowy A regresji liiowej z próby zmieej Y względem zmieej X day jest rówaiem S A = R S Y X (5.43) gdzie R jest współczyiiem orelacji z próby (5.3), a S X i S Y są odchyleiami stadardowymi odpowiedio zmieych X i Y. Jeżeli populacja, z tórej pobrao prostą próbę, podlega dwuwymiarowemu rozładowi ormalemu o (rzeczywistej) fucji regresji E(Y x) = αx+β zalezioej jao fucja regresji z próby w postaci Ŷ = Ax+B, to statystya S t = ( A α) S Y X R (5.44) Staisław Węglarczy, XII 005

5. Podstawowe pojęcia statystyi 0 podlega rozładowi Studeta o - stopiach swobody (tzw. twierdzeie Bartletta). Losowość ocey prawdziwej regresji wyraża się tutaj poprzez losowe współczyii regresji A i B, co będzie miało swoją osewecję w rozdziale o weryfiacji hipotez statystyczych. Przyład 5.4. Twierdzeie Bartletta. Daa jest dwuwymiarowa... 5.3.8 Dwie populacje jedowymiarowe. Różica X X wartości średich z próby Dae są dwie proste próby losowe (X,X,..., X ) oraz (X,X,..., X ) wzięte iezależie z dwu badaych populacji jedowymiarowych. Populacje ormale o zaych odchyleiach stadardowych F i F. Jeśli populacje, z tórych pochodzą i -elemetowe proste próby losowe, mają rozłady ormale, odpowiedio: N(µ,σ) i N(µ,σ), ze zaymi wartościami σ i σ, to statystya U = ( X X ) ( µ µ ) σ / + σ / (5.45) ma rozład ormaly N(0,). Przyład 5.5. Pomiar dwoma przyrządami. Daa jest dwuwymiarowa... Jaie jest p-stwo Populacje ormale o iezaych ale idetyczych odchyleiach stadardowych σ=σ=σ. Jeśli populacje, z tórych pochodzą i -elemetowe proste próby, mają rozłady ormale, odpowiedio: N(µ,σ) i N(µ,σ), z iezaą wspólą wartością σ, to statystya U = ( X X ) ( µ µ ) S + S + + (5.46) ma rozład Studeta z + - stopiami swobody. Przyład 5.6....... 5.3.9 Dwie populacje jedowymiarowe. Stosue dwu wariacji z próby Stosue dwu wariacji z próby F=S /S. Jeśli populacje, z tórych pochodzą i -elemetowe proste próby losowe, mają rozłady ormale, odpowiedio: N(µ, σ) i N(µ, σ), z iezaą wspólą wartością σ, to statystya Staisław Węglarczy, XII 005

5. Podstawowe pojęcia statystyi S F = S (5.47) ma rozład F Sedecora z odpowiedio - i - stopiami swobody. Użyte powyżej symbole ozaczają dla ażdej z próby z osoba: S S X X = = = ( i ) i (5.48) Wartości watyli rozładu F dla wybraych par stopi swobody są podae w Dodatu A (tabela 5). ** wyrzucić? ********************** 5.4 STATYSTYKI EKSTREMALNE I ICH ROZKŁADY Defiicja statystyi wartość estremala. Day jest ciąg wartości x, x,..., x N, obserwacji zmieej losowej X o (a ogół iezaym) rozładzie F X(x). Ciąg te dzielimy a T podciągów, często o tej samej liczebości m, ta że mt=n. Najczęściej T ozacza długość oresu obserwacji (p. T lat), a m liczbę obserwacji (p. wartości dobowych, deadowych czy miesięczych). Z ażdego podciągu wybieramy ajwięszą (albo ajmiejszą) wartość. Powstaje w te sposób (r) owa próba losowa zawierająca realizację owej zmieej losowej: wartości masymalej X max (albo miimalej X mi). Obie te zmiee oszą wspólą azwę: wartości estremale i poszuiwaie ich rozładu, odpowiedio Fmax(x) (albo Fmi(x)) jest ważym zagadieiem statystyi zajdującym zastosowaie p. w hydrologii czy gospodarce wodej. Wyzaczaie rozładu wartości estremalych I. Jeśli jest możliwe wyzaczeie rozładu F X(x) (bo p. zamy wszystie wartości z rys. 5.8) i liczebość próby jest zaa, to rozłady wartości masymalej F max(x) lub miimalej F mi(x) dają się stosuowo łatwo wyzaczyć, ja to poazao w rozdziale.3.6. I ta p. dla wartości masymalej wyprowadzoo astępujący wzór [ ] P( X < x) F ( x) = F ( x) max max X Rys. 5.8. Najczęstszy sposób defiiowaia wartości masymalej (jao masimum w daym oresie) (5.49) Wyzaczaie rozładu wartości estremalych II. Z reguły jeda sytuacja wygląda iaczej, a ajczęstszym przypadiem jest tai, gdy day jest tylo zbiór wartości estremalych, xmax, xmax,..., xmax, (ja a rys. 5.8 wartości ropowae), Staisław Węglarczy, XII 005

5. Podstawowe pojęcia statystyi po jedej wartości a ażdy podzbiór zbioru wartości zmieej X (tj. a ażdy przedział )t osi t, gdzie t może być olejym umerem daych; może też ozaczać czas). W taim przypadu możemy tratować zmieą X max ja ażdą ią zmieą i poszuiwać jej rozładu używając zwyłych techi estymacyjych (tz. założyć fucję rozładu i a podstawie posiadaej próby uzasadić dooay wybór, zob. rozdział 6). Wyzaczaie rozładu wartości estremalych III. Istieje wszaże pewa możliwość potratowaia wartości estremalych w sposób szczególy. Jest to przypade, gdy możemy zastosować rozłady asymptotycze (czyli gdy mamy dużą próbę). Oczywiście moża wtedy stosować twierdzeia graicze, tóre wsazują a rozład ormaly. Mamy jeda ią możliwość. Otóż udowodioo, że pod pewymi waruami wariacja wartości estremalych jest miejsza od wariacji przewidywaej przez twierdzeia graicze (Yevjevich [30]), co ozacza, że rozłady te lepiej wyorzystują posiadaą iformację od cetralego twierdzeia graiczego. Zostały wyprowadzoe ie-ormale rozłady asymptotycze wartości estremalych (zwae rozładami estremalymi), spośród tórych dwa są zae i stosowae ajszerzej. Są to: rozład Gumbela o dystrybuacie α ( ) ( ) exp x Fmax x = e, α > 0, x > (5.50) zway rówież rozładem podwójie wyładiczym (zob. rys. 5.9), i rozład Fishea-Tippeta (zway też rozładem Weibulla), tórego dystrybuata może być przedstaioa astępująco (zob. rys. 5.0): Fmax ( x) = exp α ( x ) β, α, β > 0, x > (5.5) Staisław Węglarczy, XII 005

5. Podstawowe pojęcia statystyi 3 Rys. 5.9 Fucja gęstości i dystrybuata rozładu Gumbela dla ilu wartości parametru α Rys. 5.0 Fucja gęstości i dystrybuata rozładu Weibulla dla ilu wartości parametru ß Dwa zaczeia termiu rozład estremaly. Ta więc pojęcie rozład estremaly ma dwa zaczeia: (i) szersze rozład wartości estremalych i (ii) węższe asymptotyczy rozład wartości estremalych (rozłady Gumbela i Fishera-Tippeta), co może czasami wprowadzać pewe zamieszaie. Oba powyższe rozłady mogą być stosowae do aalizy wartości miimalych jest to tylo westia zmiay przedziału wartości zmieej X. W przypadu (5.50) ozacza to ujemą wartość współczyia ", a dla (5.5) zastąpieie wyrażeia (x-ß) wyrażeiem (ß-x), tz. przejście z przedziału ograiczoego od dołu (wartości masymale) do przedziału ograiczoego od góry (wartości miimale). Sposób defiiowaia wartości estrealych poprzez poziom odcięcia. Drugim ważym sposobem defiiowaia wartości masymalych jest ustaleie pewego progu poziomu odcięcia, ja to zilustrowao a rys. 5. (wartość x 0), i przyjęciu za wartości X max wszystie wartości przeraczające x 0. Te sposób podziału dostępej iformacji wprowadza dodatową zmieą losową liczbę Rys. 5.. Wybór wartości masymalych przez oreśleie poziomu odcięcia (por. z rys. 5.8) Staisław Węglarczy, XII 005

5. Podstawowe pojęcia statystyi 4 przeroczeń zadaego poziomu, czyli liczbę realizacji zmieej X przeraczających poziom odcięcia (wartość progową) w jedym oresie. Liczba ta może wyosić zero (ja w przedziale a rys. 5.), może być więsza od jedości. Oczywiście taie podejście ompliuje matematyczą stroę problemu, może jeda czasami lepiej wyorzystać dostępą iformację. Najprostszy sposób aalizy tego przypadu polega a tym, że wprowadza się średią liczbę, śr, zdarzeń (przeroczeń zadaego poziomu) a ores i rozwiązaie zadaia ma postać aalogiczą do wzoru (5.49). Wyrazimy ją tym razem trochę iaczej poprzez fucje prawdopodobieństwa przewyższeia: [ ] sr max max X sr p ( x) = P( X x) = F ( x), > 0 (5.5) Wzór te jest wyprowadzay przy założeiu, że w ażdym oresie wystąpi z prawdopodobieństwem przyajmiej jedo zdarzeie (przeroczeie zadaego poziomu)., a więc ależałoby apisać iaczej lewą stroę rówaia : P( X x) = P( X x I ) max max (5.53) gdzie I ozacza liczbę zdarzeń opadowych w daym oresie (rou). W taim przypadu, jai został przedstawioy a rys. 5., warue te (tj. P(I$)=) ie jest spełioy trzeba więc uwzględiać prawdopodobieństwo przeroczeia czy ieprzeroczeia wartości progowej, a więc, zamiast, apisać ta: P( X max x I )= P( X max x I = i)p( I = i) (5.54) i= gdzie I ozacza liczbę przeroczeń daego poziomu w zadaym oresie czasu. Jeśli założymy, że liczba ta ie ma wpływu a wartość Xmax, to wzór moża uprościć: P( X x I ) = P( X x) P( I = i) = P( X x)p( I > 0) (5.55) max max max i= Ta więc wyiowe prawdopodobieństwo zostało teraz zmiejszoe o czyi P(I=0) = -P(I>0), tj. prawdopodobieństwo ieprzeroczeia zadaej wartości progowej x 0. Staisław Węglarczy, XII 005