Liczebnośd (w tys.) n

Podobne dokumenty
X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

Estymacja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 7

Statystyka matematyczna. Wykład II. Estymacja punktowa

STATYSTYKA MATEMATYCZNA

Twierdzenia graniczne:

Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.

Statystyka i Opracowanie Danych. W7. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste

Lista 6. Estymacja punktowa

ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

θx θ 1, dla 0 < x < 1, 0, poza tym,

PRZEDZIAŁY UFNOŚCI. Niech θ - nieznany parametr rozkładu cechy X. Niech α będzie liczbą z przedziału (0, 1).

Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja

Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w

STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr inż Krzysztof Bryś

1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o

Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)

16 Przedziały ufności

Estymacja przedziałowa:

Prawdopodobieństwo i statystyka r.

Estymatory nieobciążone o minimalnej wariancji

Estymacja przedziałowa

1 Zmienne losowe. Własności dystrybuanty F (x) = P (X < x): F1. 0 F (x) 1 dla każdego x R, F2. lim F (x) = 0 oraz lim F (x) = 1,

Wokół testu Studenta 1. Wprowadzenie Rozkłady prawdopodobieństwa występujące w testowaniu hipotez dotyczących rozkładów normalnych

0.1 ROZKŁADY WYBRANYCH STATYSTYK

3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej

Estymacja: Punktowa (ocena, błędy szacunku) Przedziałowa (przedział ufności)

Podstawowe rozkłady zmiennych losowych typu dyskretnego

Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).

1 Dwuwymiarowa zmienna losowa

Parametryczne Testy Istotności

Kurs Prawdopodobieństwo Wzory

Modele probabilistyczne zjawisk losowych

WYKŁAD 1. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

Testowanie hipotez. H 1 : µ 15 lub H 1 : µ < 15 lub H 1 : µ > 15

Charakterystyki liczbowe zmiennych losowych: wartość oczekiwana i wariancja

Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

1 Testy statystyczne. 2 Rodzaje testów

TESTY LOSOWOŚCI. Badanie losowości próby - test serii.

STATYSTKA I ANALIZA DANYCH LAB II

1 Twierdzenia o granicznym przejściu pod znakiem całki

ZMIENNA LOSOWA I JEJ PARAMETRY -powtórzenie

będą niezależnymi zmiennymi losowymi z rozkładu jednostajnego na przedziale ( 0,

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

1 Przedziały ufności. ). Obliczamy. gdzie S pochodzi z rozkładu B(n, 1 2. P(2 S n 2) = 1 P(S 2) P(S n 2) = 1 2( 2 n +n2 n +2 n ) = 1 (n 2 +n+2)2 n.

ZBIEŻNOŚĆ CIĄGU ZMIENNYCH LOSOWYCH. TWIERDZENIA GRANICZNE

Estymacja parametrów populacji

Pojcie estymacji. Metody probabilistyczne i statystyka Wykład 9: Estymacja punktowa. Własnoci estymatorów. Rozkłady statystyk z próby.

Niezależność zmiennych, funkcje i charakterystyki wektora losowego, centralne twierdzenia graniczne

ZADANIA NA ĆWICZENIA 3 I 4

Statystyka Wzory I. Analiza struktury

Plan wykładu. Analiza danych Wykład 1: Statystyka opisowa. Literatura. Podstawowe pojęcia

Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2

Wybrane litery alfabetu greckiego

Rozkłady statystyk z próby Twierdzenia graniczne

Ćwiczenie nr 14. Porównanie doświadczalnego rozkładu liczby zliczeń w zadanym przedziale czasu z rozkładem Poissona

Lista 5. Odp. 1. xf(x)dx = xdx = 1 2 E [X] = 1. Pr(X > 3/4) E [X] 3/4 = 2 3. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym

Podstawowe pojęcia. Próba losowa. Badanie próby losowej

n n X n = σ σ = n n n Ponieważ zmienna losowa standaryzowana ma rozkład normalny N(0, 1), więc

Estymacja punktowa i przedziałowa

Statystyka matematyczna dla leśników

Komputerowa analiza danych doświadczalnych

PODSTAWY BIOSTATYSTYKI ĆWICZENIA

Matematyka ubezpieczeń majątkowych r.

PODSTAWY PROBABILISTYKI Z PRZYKŁADAMI ZASTOSOWAŃ W INFORMATYCE

są niezależnymi zmiennymi losowymi o jednakowym rozkładzie Poissona z wartością oczekiwaną λ równą 10. Obliczyć v = var( X

Statystyka w rozumieniu tego wykładu to zbiór metod służących pozyskiwaniu, prezentacji, analizie danych.

Statystyka powtórzenie (I semestr) Rafał M. Frąk

Prawdopodobieństwo i statystyka r.

Rachunek prawdopodobieństwa i statystyka Wnioskowanie statystyczne. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

0.1 Statystyczne Podstawy Modelu Regresji

P ( i I A i) = i I P (A i) dla parami rozłącznych zbiorów A i. F ( ) = lim t F (t) = 0, F (+ ) = lim t + F (t) = 1.

Ćwiczenie 2 ESTYMACJA STATYSTYCZNA

z przedziału 0,1. Rozważmy trzy zmienne losowe:..., gdzie X

Komputerowa analiza danych doświadczalnych

STATYSTYKA OPISOWA WYKŁAD 1 i 2

Statystyka i opracowanie danych W3: Wprowadzenie do statystycznej analizy danych Podstawy wnioskowania statystycznego. Estymacja i estymatory

Estymacja przedziałowa - przedziały ufności

Zmienna losowa N ma rozkład ujemny dwumianowy z parametrami (, q) = 7,

oznaczają łączne wartości szkód odpowiednio dla k-tego kontraktu w t-tym roku. O składnikach naszych zmiennych zakładamy, że:

3. Regresja liniowa Założenia dotyczące modelu regresji liniowej

Rozkład χ 2 = + 2π 2. Niech zmienna losowa x ma rozkład normalnyn(x; µ,σ). Znajdziemy rozkład zmiennej:

Informatyka Stosowana-egzamin z Analizy Matematycznej Każde zadanie należy rozwiązać na oddzielnej, podpisanej kartce!

ma rozkład złożony Poissona z oczekiwaną liczbą szkód równą λ i rozkładem wartości pojedynczej szkody takim, że Pr( Y

Zdarzenia losowe, definicja prawdopodobieństwa, zmienne losowe

Rozkład normalny (Gaussa)

Jarosław Wróblewski Analiza Matematyczna 1, zima 2016/17

Punktowe procesy niejednorodne

1) Jakie są różnice pomiędzy analiza danych a wnioskowaniem statystycznym?

1 Podstawy rachunku prawdopodobieństwa

Miary położenia (tendencji centralnej) to tzw. miary przeciętne charakteryzujące średni lub typowy poziom wartości cechy.

ZSTA LMO Zadania na ćwiczenia

MACIERZE STOCHASTYCZNE

8. Udowodnić, że: a) macierz X X jest macierzą symetryczną; b) jeśli M jest macierzą idempotentną, o wyznaczniku różnym od 0, to M = I;

ZDARZENIE ELEMENTARNE to możliwy wynik doświadczenia losowego. Wszystkie takie możliwe wyniki tworzą zbiór zdarzeń elementarnych.

Statystyka Matematyczna Anna Janicka

Statystyka opisowa. () Statystyka opisowa 24 maja / 8

ANALIZA DANYCH DYSKRETNYCH

χ 2 = + 2π 2 Niech zmienna losowa x ma rozkład normalnyn(x; µ,σ). Znajdziemy rozkład zmiennej: σ

Transkrypt:

STATYSTYKA Statystyka bada prawidłowości w zjawiskach masowych (tz. takich, które mogą występowad ieograiczoą ilośd razy). Przedmiotem badao statyki są zbiory (populacje), których elemetami są wszelkiego rodzaju obiekty materiale i zjawiska. Populacja geerala zbór dowolych elemetów, ieidetyczych z puktu widzeia badaej cechy X Elemety populacji geeralej azywamy jedostkami statystyczymi. Właściwości jedostek statystyczych, które podlegają badaiu statystyczemu, azywamy cechami statystyczymi Próbą losową azywamy częśd populacji, dostępą bezpośrediej obserwacji ze względu a cechę X i-ta jedostka statystycza ma cechę X i, czyli próbę elemetową traktujemy jako ciąg zmieych losowych (X 1, X 2,, X ) Próbą prostą azywamy próbę losową, w której cechy jedostek statystyczych X i są iezależe i mają te sam rozkład, co cecha X w populacji geeralej Statystyką azywamy zmieą losową będącą dowolą fukcją wyików próby losowej Z = f(x 1, X 2,, X ) Wartości cechy X u poszczególych jedostek statystyczych, zarejestrowae w trakcie badaia statystyczego, azywają się obserwacjami statystyczymi, a zbiór uzyskaych w trakcie badaia obserwacji statystyczych azywamy materiałem statystyczym Zbiór obserwacji statystyczych uporządkoway według wartości rosących cechy X azywamy statystyczym szeregiem uporządkowaym

Jeżeli obserwacje statystycze pogrupujemy zliczając je do utworzoych wcześiej przedziałów, tzw. klas szeregu rozdzielczego, to otrzymamy szereg rozdzielczy (rozkład empiryczy). Liczbę obserwacji wchodzących do daej klasy azywamy liczebością klasy, a kooce przedziału wyzaczającego daą klasę, graicami przedziału klasowego; wariatem klasowym azywamy środek przedziału klasowego, oz. X Dzieląc liczebośd daej klasy przez sumę liczebości wszystkich klas w szeregu otrzymamy częstośd (względą) g(x) tej klasy, dodając do częstości daej klasy sumę częstości klas poprzedich otrzymamy częstośd skumulowaą G(x). Nr Wiek ucziów szkół podstawowych X Liczebośd (w tys.) częstośd g(x) częstośd skumulowaa G(x) 1 6,5 i miej 6 20 0,006 0,006 2 6,5 7,5 7 573 0,179 0,184 3 7,5 8,5 8 529 0,165 0,35 4 8,5 9,5 9 386 0,121 0,471 5 9,5 10,5 10 387 0,121 0,592 6 10,5 11,5 11 375 0,117 0,709 7 11,5 12,5 12 373 0,11 0,819 8 12,5 13,5 13 351 0,109 0,928 9 13,5 14,5 14 150 0,053 0,981 10 14,5 15,5 15 49 0,016 0,997 11 15,5 i więcej 16 10 3203 0,003 1,0

Wiosek: związki pomiędzy rachukiem prawdopodobieostwa i statystyką odpowiedikiem zmieej losowej jest cecha statystycza rozkładu teoretyczego jest rozkład empiryczy dystrybuaty jest częstośd skumulowaa Estymatorem azywamy dowolą statystykę Z służącą do oszacowaia iezaej wartości parametru populacji geeralej lub iezaego rozkładu populacji Hipotezą statystyczą azywamy dowole przypuszczeie dotyczące rozkładu populacji geeralej lub parametrów tego rozkładu Testem statystyczym azywamy regułę postępowaia, która a podstawie wyików próby ma doprowadzid do decyzji przyjęcia lub odrzuceia postawioej hipotezy statystyczej W przeciwieostwie do mometów zwykłych m k i cetralych c k zmieej losowej, które azywamy mometami teoretyczymi, momety empirycze ozaczamy M k i C k. Momety empirycze są statystykami. Def. Niech (X 1, X 2,, X ) będzie próbą prostą. k-tym empiryczym mometem zwykłym azywamy M k = 1 k X i=1 i i=1 i=1 X i ( statystyka X z kreską ) k-tym empiryczym mometem cetralym azywamy C k = 1 X i M 1 k średią empiryczą azywamy X = M 1 = 1 wariacją empiryczą azywamy S 2 = C 2 = 1 X i X 2 ( statystyka S kwadrat ) i=1 wariacją empiryczą poprawioą azywamy S 2 = 1 X i X 2 ( statystyka 1 i=1 S kwadrat z daszkiem )

Wiosek: Jeżeli X jest cechą w populacji geeralej, gdzie (X 1, X 2,, X ) jest próbą prostą z tej populacji i istieje wartośd oczekiwaa, to EX = EX, ES 2 = D 2 X, ES 2 = 1 D2 X Niech (X 1, X 2,, X ) będzie próbą prostą z populacji geeralej, a (X 1, X 2,, X ) tą samą próbą z rosąco posortowaymi wartościami Def. Kwatylem empiryczym rzędu p azywamy statystykę ξ p = X p, dla p Z, *x+ ozacza cechę z x. X p +1, dla p Z Mediaą empiryczą azywamy statystykę X+1, dla ieparzystego 2 Me = 1 + X 1+, dla parzystego. 2 X 2 2 Kwatyle empirycze rzędu 1 4, 1 2 i 3 4 azywamy kwartylami empiryczymi i ozaczamy Q 1, Q 2 i Q 3 (Q 2 = Me ) Np. Oblicz kwartyle empirycze dla próby (1,05; 1,13; 0,41; 0,12; 0,12; 0,19; 3,02; 0,08; 3,87; 0,54; 2,63; 0,4; 1,15; 0,24; 0,46; 1,07; 0,58; 0,29; 0,56; 2,11; 0,4; 0,04; 0,74; 1,41; 0,18; 3,14; 0,4; 0,64; 0,29; 2,47) Dae posortowae: (0,04; 0,08; 0,12; 0,12; 0,18; 0,19; 0,24; 0,29; 0,29; 0,4; 0,4; 0,4; 0,41; 0,46; 0,54; 0,56; 0,58; 0,64; 0,74; 1,05; 1,07; 1,13; 1,15; 1,41; 2,11; 2,47; 2,63; 3,02; 3,14; 3,87) =30, [30 1 4 - = 7, [30 3 4 - =22, Q 1 = 0,29; Q 2 = Me = 0,55; Q 3 = 1,15

Niech będzie pewym parametrem rozkładu cechy X w populacji geeralej. Ozaczmy przez Z = θ estymator tego parametru (statystycze oszacowaie ). Def. Mówimy, że statystyka Z jest estymatorem ieobciążoym parametru EZ = θ Mówimy, że estymator Z jest zgody ε > 0: lim P Z θ < ε = 1 Mówimy, że estymator Z jest asymptotyczie ieobciążoy lim EZ = θ Wiosek: 1. Nieobciążoy estymator parametru o wariacji dążącej do zera, jest zgodym estymatorem parametru, gdy wielkośd próby dąży do ieskooczoości ( ) *słabe prawo wielkich liczb+ 2. X jest estymatorem ieobciążoym wartości oczekiwaej, a poieważ D 2 X = 1 D2 X, jest też estymatorem zgodym Tw. Słuckiego Jeżeli θ jest estymatorem zgodym parametru i η = g(θ), gdzie g(x) jest fukcją wymierą, to g(θ ) jest estymatorem zgodym parametru. Def. Estymatorem ajefektywiejszym parametru azywamy estymator ieobciążoy Z, który ma ajmiejszą wariację Jeżeli Z jest ieobciążoym estymatorem parametru, to efektywością estymatora Z azywamy e Z = D2 (Z ) D 2 (Z ) 1. Gdy ie ma estymatorów ajefektywiejszych, szukamy estymatorów asymptotyczie ajefektywiejszych tz. takich, dla których lim e(z ) = 1

Tw. ierówośd Rao-Cramera Jeżeli f(x, θ) jest fukcją gęstości rozkładu populacji geeralej, Z estymatorem parametru, to D 2 1 Z = D 2 (Z 2 ) l f x, θ E θ Np. Niech (X 1, X 2,, X ) będzie próbą prostą z populacji geeralej 1. Zbadaj efektywośd estymatora X wartości oczekiwaej cechy X w populacji geeralej o rozkładzie ormalym N(m, ). f x = 1 e (x m)2 2σ 2 lf x = lσ 2π (x m)2 lf(x) σ 2π 2σ 2 m E 1 l f x m 2 = E 1 x m σ 2 2 czyli X jest estymatorem ajefektywiejszym i e X = 1. = 1 σ2 σ 4 = = x m σ 2 σ 2 = D2 X 2. Zajdź wariację ajefektywiejszego estymatora parametru σ 2 cechy X w populacji geeralej o rozkładzie ormalym N(m, ). f x = 1 e (x m)2 2σ 2 lf x = l 2π l σ 2 (x m)2 σ 2π 1 1 D 2 Z = E l f x σ 2 2 = 2σ 2 lf(x) σ 2 = 1 E( 1 = (X m)2 2σ2 + 2σ 4 ) 2 + (x m)2 2σ 2 2σ 4

= 4σ 8,E X m 4 2σ 2 E X m 2 + σ 4 - = 4σ 8,3σ 4 2σ 4 + σ 4 - = 2σ4 3. Cecha X populacji geeralej ma rozkład jedostajy a przedziale *a,a+1+. Sprawdź, czy estymator T = max X i parametru a jest ieobciążoy i zgody. 0 i +1 0, x a 1, x,a, a + 1- fukcja gęstości f(x) = 0, x,a, a + 1 i dystrybuata F(x) = x a, a < x a + 1 1, x > a + 1 F max (X 1,X 2,,X ) x = P X 1 < x X 2 < x X < x = (F x ) f max(x 1,X 2,,X ) x = F x 1 f x = (x a) 1, x,a, a + 1-0, x,a, a + 1- a+1 E(max (X 1, X 2,, X )) = x(x a) 1 dx = a + a ET +1 = a czyli estymator T jest ieobciążoy E([max (X 1, X 2,, X )- 2 a+1 ) = x 2 (x a) 1 dx = a + 2a + +2 +1 a2 D 2 T = D 2 max (X 1, X 2,, X ) = czyli estymator T jest zgody +2 + 2a + +1 a2 ( + +1 a)2 = +2 Def. Niech (X 1, X 2,, X ) będzie próbą prostą z populacji geeralej Dystrybuatą empiryczą cechy X populacji geeralej azywamy fukcję 2 (+1) 2 0 F x = 1 *i: X i < x+

Uwaga: 1. Dla ustaloego fukcja F jest przedziałami stała i ma skoki o wartości 1 w puktach x i = X i (ω) 2. Dla ustaloego x, F (x) jest zmieą losową Dla rozkładów typu ciągłego statystyczym przybliżeiem gęstości rozkładu jest histogram. Niech (X 1, X 2,, X ) będzie próbą prostą z populacji geeralej, a ciąg (x 1, x 2,, x ) ciągiem obserwacji w tej próbie. Ozaczamy x = mi(x 1, x 2,, x ), x = max (x 1, x 2,, x ) Dzielimy przedział *x,x + a klasy puktami x = a 0 < a 1 < < a k = x i = *j: x j a i 1, a i +, i = 1,, k Def. Histogramem dla próby prostej (X 1, X 2,, X ) z populacji geeralej azywamy fukcję 0, x (, x ) (x, ) x = i (a i a i 1 ), x a i 1, a i Uwaga: Wykres histogramu jest wykresem słupkowym, w którym słupki mają pole proporcjoale do częstości względej poszczególych klas. Histogram spełia wszystkie własości gęstości rozkładu typu ciągłego. Wiosek: Jeżeli klasy, a które obserwacje są podzieloe mają małą szerokośd, a obserwacje mają rozkład jedostajy w każdym przedziale klasowym, to przybliżeiami wartości statystyk X, S 2 i S 2 są statystyki

x = 1 k i=1 x i i, s 2 = 1 k i=1(x i x) 2 i, s 2 = 1 1 (x i x) 2 k i=1 i, gdzie x i = a i 1+a i 2 Ustaleie liczby klas tak, aby powyższe statystyki były dobrymi przybliżeiami prawdziwych wartości odpowiedich statystyk zależy od liczby obserwacji. Przyjmuje się, że k lub k 1 + 3,322log Np. Dla podaych materiałów statystyczych oblicz X, S 2 i S 2, arysuj histogram i oblicz x, s 2 i s 2 porówując je z prawdziwymi wartościami odpowiedich statystyk 1. (0.5, 0.93, 0.75, 0.89, 0.15, 0.94, 0.16, 0, 0.63, 0.57, 0.33, 0.1, 0.14, 0.21, 0.05, 0.15, 0.37, 0.51, 0.09, 0.25) X = 0.386, S 2 = 0.090914 i S 2 = 0.0956989 k 20 = 4.47214 k 1 + 3,322log20 = 5.32202 k=5 x = 0.3243, s 2 = 0.0653828, s 2 = 0.068824 r,a i 1, a i ) i x i (x i x) 2 1 [0,0.188) 8 0.094 0.053038 2 [0.188,0.376) 4 0.282 0.000179 3 [0.376,0.564) 2 0.47 0.002123 4 [0.564,0.752) 3 0.658 0.11135 5 [0.752,0.94] 2 0.846 0.27217

2. (0.798955,0.81413,0.7904,0.307137,0.342783,-1.0968,-0.378992,-0.452682,-0.921005, -1.0124,-0.903119,-0.659144,-1.04451,-1.92985,0.7313,0.778717,-0.246786,-0.412439, 0.311415,-1.0318,-0.802116,-0.992476,-0.670884,-1.21274,-0.389695,-0.471496,-1.40024, 0.419988,0.407631,-0.282595,-0.120198,0.402077,-1.20905,0.460571,0.151101,0.225885, -0.556859,0.442095,0.654481,-1.64419,1.49428,0.352118,0.665502,-0.123524,0.668605, 0.244939,0.52167,-0.85173,1.75322,0.53866) X = 0.130793, S 2 = 0.65715 i S 2 = 0.670561 k 50 = 7.07107 k 1 + 3,322log50 = 6.64398 x = 0.160224, s 2 = 0. 62011, s 2 = 0.63276 r,a i 1, a i ) i x i (x i x) 2 1 [-1.92985, -1.4037) 2-1.6668 2.26978 2 [-1.4037, -0.877548) 10-1.1406 0.96114 3 [-0.877548, -0.351395) 4 [-0.351395, 0.174759) 10-0.6145 0.20636 5-0.0883 0.005173 5 [0.174759, 0.700912] 16 0.4378 0.357633 6 [0.700912, 1.22707) 5 0.964 1.26388 7 [1.22707,1.75322] 1 1.4901 2.72357

Metody modyfikacji histogramu w celu wygładzeia jego wykresu: 1. Zmiaa szerokości klas h: a) wybieramy początkową szerokośd klasy 0 = 2.64 (Q 3 Q 1 ) 3 taka zmiaa wystarczy, gdy populacja ma rozkład zbliżoy do ormalego b) zwiększamy h biorąc koleje szerokości: a 0, a 2 0, a 3 0, lub zmiejszamy h biorąc koleje szerokości: 1 a 0, 1 a 2 0, 1 a 3 0, dla a=1.2 lub a=1.5 2. Wybór początku histogramu środkiem pierwszego przedziału klasowego powia byd ajmiejsza obserwacja Np. Poprawioy histogram dla przykładu poprzediego ma kształt

Rozkłady pewych statystyk: Tw. Jeżeli (X 1, X 2,, X ) jest próbą prostą z populacji geeralej o rozkładzie ormalym N(m, ), to statystyka X m ma rozkład ormaly stadaryzoway N(0,1) σ Tw. Jeżeli (X 1, X 2,, X ) jest próbą prostą z populacji geeralej o rozkładzie ormalym N(m, ), to statystyka S2 σ 2 = ( 1)S2 σ 2 ma rozkład chi-kwadrat o (-1) stopiach swobody Tw. Jeżeli cecha X w populacji geeralej ma rozkład ormaly, to statystyki X i S 2 są iezależymi zmieymi losowymi Tw. Jeżeli (X 1, X 2,, X ) jest próbą prostą z populacji geeralej o rozkładzie ormalym N(m, ), to statystyka X m 1 ma rozkład t-studeta o (-1) stopiach swobody S Tw. Jeżeli (X 1, X 2,, X ) jest próbą prostą z populacji geeralej o wartości oczekiwaej m i skooczoej wariacji σ 2, to statystyki X m i X m mają rozkład asymptotyczie σ S ormaly stadaryzoway N(0,1)

Tw. Jeżeli (X 1, X 2,, X 1 ) i (Y 1, Y 2,, Y 2 ) są próbami prostymi z dwóch iezależych populacji geeralych o rozkładach ormalych N(m 1,σ 1 ) i N(m 2,σ 2 ), to statystyka X Y (m 1 m 2 ) ma (σ1) 2 1 +(σ 2) 2 2 rozkład ormaly stadaryzoway N(0,1) Tw. Jeżeli (X 1, X 2,, X 1 ) i (Y 1, Y 2,, Y 2 ) są próbami prostymi z dwóch iezależych populacji geeralych o rozkładach ormalych N(m 1,σ 1 ) i N(m 2,σ 2 ), to statystyka ma rozkład t-studeta o ( 1 + 2 2) stopiach swobody X Y (m 1 m 2 ) 1 S1 2 +2 S2 2 ( 1 1+2 2 1 + 1 2 ) Tw. Jeżeli (X 1, X 2,, X 1 ) i (Y 1, Y 2,, Y 2 ) są próbami prostymi z dwóch iezależych populacji geeralych o wartościach oczekiwaych m 1 i m 2 oraz skooczoych wariacjach (σ 1 ) 2 i (σ 2 ) 2, to statystyki X Y (m 1 m 2 ) (σ1) 2 1 +(σ 2) 2 2 i X Y (m 1 m 2 ) (S1) 2 1 +(S 2) 2 2 mają rozkład asymptotyczie ormaly N(0,1) Tw. Jeżeli (X 1, X 2,, X 1 ) i (Y 1, Y 2,, Y 2 ) są próbami prostymi z dwóch iezależych populacji geeralych o rozkładach ormalych N(m 1,σ 1 ) i N(m 2,σ 2 ), to statystyka Sedecora o ( 1 1, 2 1) stopiach swobody (S1) 2 σ1 (S2) 2 σ2 ma rozkład

Estymacja puktowa: I. Metoda mometów Niech parametr będzie jedozaczie określoy przy pomocy wartości pierwszych k mometów teoretyczych tz. θ = f(m 1, m 2,, m k ) Def. Estymator θ otrzymay metodą mometów ma postad θ = f M 1, M 2,, M k, gdzie M 1, M 2,, M k są mometami empiryczymi Uwaga: Estymatory otrzymae metoda mometów rzadko mają dużą efektywośd, ale stosuje się je jako pierwsze przybliżeia badaej cechy, ze względu a prostotę ich zalezieia. Np. 1. Niech X ma rozkład wykładiczy z iezaym parametrem. Zajdź estymator tego parametru. EX = 1 λ = 1 EX z metody mometów λ = 1 X 2. Niech X ma rozkład jedostajy a iezaym przedziale *a,b+. Zajdź estymatory obydwu parametrów. EX = a+b 2 D 2 X = (b a)2 12 b = 2EX a a = EX 3D 2 X a = X 3S b = X + 3S

II. Metoda ajwiększej wiarygodości: Niech rozkład zmieej losowej X zależy od parametrów (θ 1, θ 2,, θ m ) oraz (x 1, x 2,, x ) obserwacjami w próbie prostej (X 1, X 2,, X ) z populacji geeralej mającej cechę X. Def. Fukcją wiarygodości dla parametrów (θ 1, θ 2,, θ m ) azywamy L θ 1, θ 2,, θ m = p x 1 p x 2 p x, gdzie p x i = P(X = x i ) dla zmieej X typu skokowego oraz L θ 1, θ 2,, θ m = f x 1 f x 2 f x, gdzie f(x) jest gęstością zmieej X typu ciągłego Def. Estymator θ otrzymay metodą ajwiększej wiarygodości jest tą wartością parametru = (θ 1, θ 2,, θ m ), dla której fukcja wiarygodości osiąga wartośd ajwiększą. Uwaga: Jeżeli fukcja wiarygodości jest różiczkowala, to wygodiej jest badad pochodą ll(θ) zamiast pochodej L(θ). Np. 1. X ma rozkład Poissoa z parametrem. Zajdź estymator tego parametru dla obserwacji (k 1, k 2,, k ) fukcja wiarygodości L λ = e λ λk 1 +k 2 + +k ll λ = λ + k 1 + k 2 + + k lλ l k 1! k 2 k! ll λ = + k 1+k 2 + +k = 0 λ = k 1+k 2 + +k λ ll λ = k 1+k 2 + +k < 0 L ma maksimum λ 2 czyli λ = X k 1! k 2! k!

2. Niech X ma rozkład jedostajy a przedziale *0,b+. Zajdź estymator parametru b. 0, mi x i < 0 1 dla obserwacji (x 1, x 2,, x ) fukcja wiarygodości L b =, mi x b i 0 max *x i + b 0, max x i > b jest ieciągła w b = max,x i + i b=mi{x i + 0, mi x i < 0 L b =, mi x b +1 i 0 max x i < b z aalizy zaków pochodej w b = mi{x i } 0, max x i > b fukcja L ma wartośd ajwiększą czyli b = mi *X i + Niech A M(). Def. Miorem wiodącym stopia k macierzy A azywamy wyzaczik A i macierzy, która powstaje z macierzy A przez skreśleie kolum i wierszy o ideksach k+1,k+2,,. Niech fukcja f θ 1, θ 2,, θ m będzie dwukrotie różiczkowala oraz d 2 f będzie ciągła. 2 f θ2 (θ) 2 f (θ) 2 f (θ) 1 θ 1 θ 2 θ 1 θ m A( ) = 2 f (θ) θ 1 θ 2 2 f (θ) θ 1 θ m 2 f θ2 (θ) 2 2 f (θ) θ 2 θ m 2 f θ 2 θ m (θ) 2 f θ m 2 (θ)

Tw. WK istieia ekstremum fukcji f θ 1, θ 2,, θ m Jeżeli różiczkowala fukcja f θ 1, θ 2,, θ m ma ekstremum w θ = θ 1, θ 2,, θ m to i = 1,, m: f θ i θ = 0 Tw. WW istieie ekstremum fukcji f θ 1, θ 2,, θ m Jeżeli dla fukcji dwukrotie różiczkowalej f θ 1, θ 2,, θ m zachodzi i = 1,, m: f θ i θ = 0 oraz i = 1,, m: A i (θ) > 0, to f ma w pukcie θ miimum, a jeżeli i = 1,, m: 1 i A i (θ) > 0, to f ma w pukcie θ miimum. Np. Niech X ma rozkład ormaly N(m, ). Zajdź estymatory parametrów m i σ 2. dla obserwacji (x 1, x 2,, x ) fukcja wiarygodości L m, σ 2 1 = σ e (2π) ll (x 1 m) 2 +(x 2 m) 2 + +(x m) 2 2σ 2 ll m, σ 2 = 2 l 2πσ2 (x 1 m) 2 +(x 2 m) 2 + + (x m) 2 m, m σ2 = x 1 m + x 2 m + +(x m) σ 2 x 1 +x 2 + +x m = 0 σ 2 σ2 + x 1 m 2 + x 2 m 2 + + x m 2 2σ 4 2σ 4 2 ll m 2 = σ 2, 2 ll σ 2 2 =, ll σ 2 m, σ 2 = = 0 2σ 2 + (x 1 m) 2 +(x 2 m) 2 + +(x m) 2 2σ 2 2σ 4 m = x 1+x 2 + +x 2 σ 2 = x 1 m 2 + x 2 m 2 + + x m 2 x 1 m 2 + x 2 m 2 + + x m 2, 2 ll = x 1+x 2 + +x m 2σ 4 σ 6 m σ 2 σ 4 m = X σ 2 = S 2

A(m, σ 2 ) = S 2 0 0 L ma maksimum 2S 4, A 1 (m, σ 2 ) = S 2 < 0, A 2(m, σ 2 ) = 2 2S 6 > 0 Najczęściej szacowaym iemierzalym (jakościowym) parametrem rozkładu jest wskaźik struktury, czyli frakcja (lub procet) elemetów wyróżioych (mających cechę X) w populacji Najlepszym estymatorem wskaźika struktury jest θ = k, gdzie k ozacza liczbę elemetów wyróżioych zalezioych w losowej próbie o liczebości Podsumowaie: Parametr Estymator Własości Rozkłady Wartośd oczekiwaa EX = m Wariacja D 2 X = σ 2 gdy m zae Wariacja D 2 X = σ 2 gdy m iezae X 1 Xi i 1 Me 1 S X m 2 2 1 ( i ) i 1 1 S X X 2 2 ( i ) i 1 ˆ 1 S ( X X ) 2 2 i 1 i 1 zgody, ieobciążoy zgody, asymptotyczie ieobciążoy zgody, ieobciążoy zgody, asymptotyczie ieobciążoy zgody, ieobciążoy dowoly dla N(m, ) efektywy dowoly dla N(m, ) e(me) = 2 π dowoly dla N(m, ) efektywy dowoly dowoly dla N(m, ) e(s 2 )= 1

Parametr Estymator Własości Rozkłady Odchyleie stadardowe S 1, S, S zgody, obciążoy dowoly Γ( 1 2 ) Γ() Γ( 1 2 ) Γ() 2 S, 1 2 S zgody, ieobciążoy, asymptotyczie efektywy ( tz. lim e(σ) = 1 ) ormaly Wskaźik struktury θ = k zgody, ieobciążoy, efektywy Beroulliego