STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr inż Krzysztof Bryś

Podobne dokumenty
Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste

1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o

3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej

X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

Testowanie hipotez. H 1 : µ 15 lub H 1 : µ < 15 lub H 1 : µ > 15

1 Testy statystyczne. 2 Rodzaje testów

Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.

Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).

Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

Statystyka matematyczna dla leśników

ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA

Estymacja parametrów populacji

Statystyka i Opracowanie Danych. W7. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

TESTY LOSOWOŚCI. Badanie losowości próby - test serii.

Prawdopodobieństwo i statystyka r.

ANALIZA DANYCH DYSKRETNYCH

Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)

Estymacja przedziałowa

Statystyczny opis danych - parametry

Plan wykładu. Analiza danych Wykład 1: Statystyka opisowa. Literatura. Podstawowe pojęcia

Lista 6. Estymacja punktowa

Estymacja przedziałowa - przedziały ufności

Wybrane litery alfabetu greckiego

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Estymacja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 7

Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja

będą niezależnymi zmiennymi losowymi z rozkładu jednostajnego na przedziale ( 0,

L.Kowalski zadania ze statystyki matematycznej-zestaw 3 ZADANIA - ZESTAW 3

Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w

STATYSTYKA OPISOWA PODSTAWOWE WZORY

Parametryczne Testy Istotności

STATYSTYKA MATEMATYCZNA dla ZPM I dr inż Krzysztof Bryś wyk lad 1,2 KLASYCZNY RACHUNEK PRAWDOPODOBIEŃSTWA

Ćwiczenie 2 ESTYMACJA STATYSTYCZNA

θx θ 1, dla 0 < x < 1, 0, poza tym,

STATYSTYKA MATEMATYCZNA

Miary rozproszenia. Miary położenia. Wariancja. Średnia. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.

STATYSTYKA OPISOWA PODSTAWOWE WZORY

Miary położenia (tendencji centralnej) to tzw. miary przeciętne charakteryzujące średni lub typowy poziom wartości cechy.

Estymacja: Punktowa (ocena, błędy szacunku) Przedziałowa (przedział ufności)

STYSTYSTYKA dla ZOM II dr inż Krzysztof Bryś Wykad 1

Miary położenia. Miary rozproszenia. Średnia. Wariancja. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.

PODSTAWY BIOSTATYSTYKI ĆWICZENIA

Modele probabilistyczne zjawisk losowych

16 Przedziały ufności

SIGMA KWADRAT LUBELSKI KONKURS STATYSTYCZNO- DEMOGRAFICZNY

PRZEDZIAŁY UFNOŚCI. Niech θ - nieznany parametr rozkładu cechy X. Niech α będzie liczbą z przedziału (0, 1).

Modele tendencji rozwojowej STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 18 listopada 2017

Liczebnośd (w tys.) n

d wymiarowy wektor losowy Niech (Ω, S, P) przestrzeń probabilistyczna Definicja Odwzorowanie X: Ω R nazywamy 1-wymiarowym wektorem

(X i X) 2. n 1. X m S

STATYSTYKA MATEMATYCZNA

n n X n = σ σ = n n n Ponieważ zmienna losowa standaryzowana ma rozkład normalny N(0, 1), więc

KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1

Statystyka Wzory I. Analiza struktury

COLLEGIUM MAZOVIA INNOWACYJNA SZKOŁA WYŻSZA WYDZIAŁ NAUK STOSOWANYCH. Kierunek: Finanse i rachunkowość. Robert Bąkowski Nr albumu: 9871

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

STATYSTYKA OPISOWA WYKŁAD 1 i 2

Wokół testu Studenta 1. Wprowadzenie Rozkłady prawdopodobieństwa występujące w testowaniu hipotez dotyczących rozkładów normalnych

Metoda łączona. Wykład 7 Dwie niezależne próby. Standardowy błąd dla różnicy dwóch średnich. Metoda zwykła (niełączona) n2 2

Histogram: Dystrybuanta:

Estymacja przedziałowa - przedziały ufności

Wykład 11 ( ). Przedziały ufności dla średniej

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA. Spis pojȩċ teoretycznych

Statystyka. Katarzyna Chudy Laskowska

Statystyka matematyczna. Wykład II. Estymacja punktowa

Podstawowe pojęcia. Próba losowa. Badanie próby losowej

Estymatory nieobciążone o minimalnej wariancji

Estymacja przedziałowa:

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

ZSTA LMO Zadania na ćwiczenia

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Ćwiczenie nr 14. Porównanie doświadczalnego rozkładu liczby zliczeń w zadanym przedziale czasu z rozkładem Poissona

Prawdopodobieństwo i statystyka r.

Statystyka powtórzenie (I semestr) Rafał M. Frąk

ZADANIA NA ĆWICZENIA 3 I 4

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

STATYSTKA I ANALIZA DANYCH LAB II

Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2

Porównanie dwu populacji

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Statystyka w rozumieniu tego wykładu to zbiór metod służących pozyskiwaniu, prezentacji, analizie danych.

Prawdopodobieństwo i statystyka r.

Statystyka Matematyczna Anna Janicka

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Wydział Matematyki. Testy zgodności. Wykład 03

WYKŁAD 1. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

Statystyka opisowa. () Statystyka opisowa 24 maja / 8

1 Dwuwymiarowa zmienna losowa

Kurs Prawdopodobieństwo Wzory

Statystyka w analizie i planowaniu eksperymentu

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.

ZDARZENIE ELEMENTARNE to możliwy wynik doświadczenia losowego. Wszystkie takie możliwe wyniki tworzą zbiór zdarzeń elementarnych.

1 Podstawy rachunku prawdopodobieństwa

Statystyka w analizie i planowaniu eksperymentu

Statystyka Matematyczna Anna Janicka

STATYSTYKA I ANALIZA DANYCH

Powtórzenie wiadomości z rachunku prawdopodobieństwa i statystyki.

1 Twierdzenia o granicznym przejściu pod znakiem całki

0.1 ROZKŁADY WYBRANYCH STATYSTYK

Transkrypt:

1 STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr iż Krzysztof Bryś Pojȩcia wstȩpe populacja - ca ly zbiór badaych przedmiotów lub wartości. próba - skończoy podzbiór populacji podlegaj acy badaiu. próba losowa - próba losowaa (ajczȩściej) zgodie z rozk ladem rówomierym, tz. wylosowaie każdej próby jest jedakowo prawdopodobe. cechy: mierzale, iemierzale badaa cecha = zmiea losowa X Poszukiway: rozk lad cechy w populacji = rozk lad zmieej losowej X próba -elemetowa = ci ag iezależych zmieych losowych (X 1,..., X ) o jedakowym rozk ladzie (takim jak poszukiway rozk lad zmieej losowej X). Etapy badaia statystyczego 1) Przygotowaie (formatowaie) badaia (określeie celu, rodzaju, potrzebych parametrów wejściowych badaia). ) Przeprowadzeie badaia (wylosowaie próby i określeie wartości badaych cech w próbie). 3) Zebraie uzyskaych podczas badaia daych. 4) Opis i wioskowaie statystycze (obliczeie parametrów, estymacja, weryfikacja hipotez). 5) Przedstawieie wyików. Szeregi statystycze 1) Szereg wyliczaj acy uporz adkoway: (x 1, x,..., x ) przy czym x 1 x... x. ) Szereg rozdzielczy puktowy: (x 1, x,..., x k ), ( 1,,..., k ), gdzie x 1 < x <... < x k oraz dla każdego i = 1,,..., k: i -liczba realizacji (obserwacji) wartości x i, k i =. 3) Szereg rozdzielczy przedzia lowy: (y 0 ; y 1 >, (y 1 ; y >,..., (y k 1 ; y k ), ( 1,,..., k ), gdzie y 0 < y 1 < y <... < y k 1 < y k oraz dla każdego i = 1,,..., k: i -liczba realizacji (obserwacji) wartości ależ acej do przedzia lu (y i 1 ; y i ), k i =. Wszystkie wartości ależ ace do przedzia lu (y i 1 ; y i >, i = 1,,..., k utożsamia siȩ z jego środkiem x i. Regu ly wyzaczaia liczby przedzia lów (klas): k, k 5 log. Miary po lożeia rozk ladu 1) Średia z próby x Parametry empirycze x = 1 x i x = 1 k i x i ) Domiata (moda, wartość modala) D = pukt, w którym fukcja prawdopodobieństwa osi aga ajwiȩksz a wartość

ajczȩściej wystȩpuj aca wartość, - dla szeregu rozdzielczego puktowego: pukt, dla którego liczebość (czȩstość) osi aga ajwiȩksz a wartość, - dla szeregu rozdzielczego przedzia lowego (wzór iterpolacyjy): D = x 0d + d d 1 ( d d 1 ) + ( d d+1 ) h d, gdzie x 0d - pocz atek przedzia lu zawieraj acego domiatȩ (przedzia lu o ajwiekszej liczebości), h d - szerokość przedzia lu zawieraj acego domiatȩ (przedzia lu o ajwiekszej liczebości), d - liczebość przedzia lu zawieraj acego domiatȩ (ajwieksza liczebość), d 1 - liczebość przedzia lu poprzedzaj acego przedzia l zawieraj acy domiatȩ, d+1 - liczebość przedzia lu astȩpego po przedziale zawieraj acym domiatȩ. 3) Dystrybuata empirycza (czȩstość skumulowaa F (x) F (x) = 1 {i : x i < x, i = 1,..., } F (x) = i:x i <x 4) Kwatyl empiryczy rzȩdu p x p, : (pukt w którym dystrybuata empirycza po raz pierwszy osi aga wartość iemiejsz a iż p) x p, = x p - dla szeregu rozdzielczego puktowego: i x p, = x q gdzie q = mi{r : p - dla szeregu rozdzielczego przedzia lowego (wzór iterpolacyjy): r x p, = x 0p + (p i ) hp, x i <x 0p p gdzie x 0p - pocz atek przedzia lu zawieraj acego x p, (przedzia lu w którym dystrybuata empirycza po raz pierwszy osi aga wartość iemiejsz a iż p), h p -szerokość przedzia lu zawieraj acego x p,, p -liczebość przedzia lu zawieraj acego x p,, x i <x 0p i - liczebość skumulowaa dla przedzia lu poprzedzaj acego przedzia l zawieraj acy x p, (suma liczebości przedzia lów poprzedzaj acych) Mediaa: Me = kwatyl rzȩdu 1 Kwartyl doly: Q 1 = kwatyl rzȩdu 1 4 Kwartyl góry: Q 3 = kwatyl rzȩdu 3. 4 i } Miary rozproszeia rozk ladu 5) Wariacja z próby s s = 1 (x i x)

3 6) Odchyleie stadardowe z próby s = s. 7) Wspó lczyik zmieości V = s x 100%. s = 1 k i (x i x) 8) Rozstȩp R = różica miȩdzy ajwiȩksz a i ajmiejsz a wartości a w próbie. 9) Wspó lczyik asymetrii A s : A s = 1 s ( 1 (x 3 i x) 3 ) A s = 1 s ( 1 k 3 i (x i x) 3 ) 10) Kurtoza (wspó lczyik skupieia) A s : K = 1 s ( 1 (x 4 i x) 4 ) 11) Wspó lczyik skośości A 1 : K = 1 s ( 1 k 4 i (x i x) 4 ) A 1 = x D s Estymacja puktowa estymator parametru Θ - statystyka (fukcja próby), której wartość zależy od rzeczywistej wielkości parametru Θ rozk ladu populacji. estymacja puktowa - szacowaie iezaej wartości parametru Θ a podstawie próby; polega a wyzaczeiu z próby wartości u estymatora U parametru Θ i przyjmowaiu tej wartości za oszacowaie Θ. Estymatory wartości oczekiwaej: średia z próby x, mediaa z próby x 0.5,. Estymatory wariacji: wariacja z próby s, s 1 = 1 s (lepszy dla rozk ladu N(m, σ)). Estymacja przedzia lowa Przedzia lem ufości dla parametru θ a poziomie ufości 1 α azywamy przedzia l (θ 1, θ ) spe liaj acy waruki a) θ 1, θ s a fukcjami próby, b) P (θ 1 < θ < θ ) = 1 α Uwagi: 1) Przedzia l ufości zmieia siȩ wraz z prób a.

) Niezaa wartość parametru może być albo ie być w utworzoym przedziale ufości. 3) Moza stworzyć ieskończeie wiele przedzia lów ufości a daym poziomie ufości. 4) Czȩstość wystȩpowaia prób, dla których zbudoway przedzia l ufości a poziomie ufości 1 α zawiera ieza a wartość parametru θ wyosi w przybliżeiu 1 α (dla dużej liczby próbek). 4 Kostrukcja przedzia lu ufości: 1) Wybieramy estymator U = U (θ), którego rozk lad dok lady lub asymptotyczy jest zay. ) Dla daego α (0, 1) dobieramy liczby a, b tak aby P (a U b) = 1 α. (ajczȩściej dobieramy symetryczie tz. tak by P (U < a) = P (U > b) = α ) 3) Jeśli ierówość a U b da siȩ zast apić przez θ 1 θ θ, to przedzia l ufości jest postaci: (θ 1, θ ) Zagadieie miimalej liczości próby Niech -maksymaly dopuszczaly b l ad oszacowaia (maksymaly dopuszczaly promień przedzia lu ufości). - przy szacowaiu wartości oczekiwaej m Korzystamy z Modelu 3 (zak ladaly, ze 100): Promień przedzia lu ufości=u 1 α σ/ a zatem (u 1 α σ/ ) - przy szacowaiu wskaźika struktury p (prawdopodobieństwa sukcesu w schemacie Beroulliego) Promień przedzia lu ufości= u 1 α Przypuszczala wartość p: p 0 = Z badań lub przyjmuje siȩ p 0 = 1. Z (1 Z ) a zatem (u 1 α ) Z (1 Z ). jest wyzaczaa z badaia wstȩpego (pilotażowego), szacowaa a podstawie wyików poprzedich Weryfikacja hipotez statystyczych za pomoc a testów istotości. hipoteza statystycza- przypuszczeie dotycz ace iezaego rozk ladu badaej cechy populacji. hipoteza parametrycza- hipoteza statystycza dotycz aca wartości parametru rozk ladu badaej cechy. weryfikacja- odpowiedź a pytaie czy hipoteza statystycza jest prawdziwa. test statystyczy- regu la postȩpowaia, która daej próbie przyporz adkowuje decyzjȩ przyjȩcia lub odrzuceia badaej hipotezy H 0 - hipoteza zerowa (podlega badaiu) H 1 - hipoteza alteratywa test istotości- test statystyczy, w którym wioskowaie odbywa siȩ przy za lożeiu, że hipoteza H 0 jest prawdziwa. Pozwala jedyie odrzucić H 0 (tz. przyj ać H 1 ). W przypadku weryfikacji hipotez za pomoc a testów istotości wskazae jest stawiaie jako H 0 hipotez co do których zachodzi podejrzeie o ich fa lszywości! Typy b lȩdów pope liaych przy weryfikacji hipotez: b l ad 1-go rodzaju - odrzuceie prawdziwej hipotezy H 0 b l ad -go rodzaju - przyjȩcie fa lszywej hipotezy H 0 poziom istotości α - prawdopodobieństwo pope lieia b lȩdu 1-go rodzaju β - prawdopodobieństwo pope lieia b lȩdu -go rodzaju moc testu = 1 β - prawdopodobieństwo odrzuceia fa lszywej hipotezy H 0.

Jedyy b l ad jaki moża pope lić weryfikuj ac hipotezȩ za pomoc a testu istotości to b l ad 1-go rodzaju! Zbiór krytyczy W - zbiór wartości taki, że przy za lożeiu, że H 0 jest prawdziwa: P (u W ) = α, gdzie u -obliczoa wartość statystyki testowej W praktyce α < 0.01; 0.1 >. Uwagi: 1) Przy za lożeiu, że H 1 prawdziwa: P (u W ) > α ) Jeśli a poziomie istotości α 1 odrzucamy H 0, to a poziomie α < α 1 może ie być podstaw do odrzuceia H 0. Algorytm weryfikacji hipotez za pomoc a testu istotości: 1. Wybieramy model.. Obliczamy wartość statystyki testowej u. 3. Budujemy zbiór krytyczy W (w zależości od postaci H 1 ). 4. Jeśli u W, to odrzucamy H 0 a poziomie istotości α. W przeciwym przypadku mówimy, że ie ma podstaw do odrzuceia H 0. krytyczy poziom istotości α k - poziom istotości, przy którym astȩpuje zmiaa decyzji weryfikacyjej: jeśli α < α k to mówimy, że ie ma podstaw do odrzuceia H 0 a poziomie istotości α jeśli α > α k to odrzucamy H 0 a poziomie istotości α. Testy zgodości S luż a do weryfikacji zgodości pomiȩdzy rozk ladem zbioru wartości w próbie a pewym teoretyczym rozk ladem prawdopodobieństwa o dystrybuacie F 0 (gȩstości prawdopodobieństwa f 0 ). Weryfikowaa hipoteza ma postać: H 0 : F = F 0 albo H 0 : f = f 0 przeciw H 1 : F F 0 albo H 1 f f 0, gdzie F - iezaa dystrybuata (f - iezaa gȩstość prawdopodobieństwa) zmieej losowej X reprezetuj acej bada a cechȩ. Test zgodości chi-kwadrat Pearsoa 5 Dzielimy zbiór wartości daej próby a roz l acze przedzia ly I 1,..., I k. Przy za lożeiu, że hipoteza H 0 jest prawdziwa, p j = P (X I j ) = F 0 (α j ) F 0 (α j 1 ), gdzie I j = (α j 1 ; α j ) dla j = 1,..., k. Obliczamy wartość statystyki testowej: χ = k ( j p j ) p j, gdzie j jest liczb a obserwacji ależ acych do przedzia lu I j, które zaobserwao w próbie, = k j=1 j jest liczb a wszystkich obserwacji w próbie, p j azywamy hipotetycz a liczb a obserwacji z przedzia lu I j (jest to liczba obserwacji, które powiy ależeć do I j gdyby H 0 by la prawdziwa). Jeśli obliczoa wartość statystyki χ ależy do zbioru krytyczego W = (χ (α, k 1); + ), to odrzucamy H 0 : F = F 0 i przyjmujemy H 1 : F F 0. W przeciwym przypadku mówimy, że ie ma podstaw do odrzuceia H 0.