1 Podstawy rachunku prawdopodobieństwa

Podobne dokumenty
Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

1 Estymacja przedziałowa

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

Statystyka. Opisowa analiza zjawisk masowych

Pozyskiwanie wiedzy z danych

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Estymacja parametrów rozkładu cechy

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Parametry statystyczne

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste

W1. Wprowadzenie. Statystyka opisowa

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Estymacja punktowa i przedziałowa

Laboratorium 3 - statystyka opisowa

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

Próba własności i parametry

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Statystyka Matematyczna Anna Janicka

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

Miary statystyczne w badaniach pedagogicznych

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

Matematyka stosowana i metody numeryczne

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

1. szereg wyliczający (szczegółowy) - wyniki są uporządkowane wyłącznie według wartości badanej cechy, np. od najmniejszej do największej

WYKŁAD 5 TEORIA ESTYMACJI II

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

Biostatystyka, # 1 /Weterynaria I/

Wskaźnik asymetrii Jeżeli: rozkład jest symetryczny, to = 0, rozkład jest asymetryczny lewostronnie, to < 0. Kwartylowy wskaźnik asymetrii

Analiza struktury i przeciętnego poziomu cechy

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

Statystyczna analiza danych

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Opisowa analiza struktury zjawisk statystycznych

Matematyka z el. statystyki, # 1 /Geodezja i kartografia II/

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Ćwiczenia 1-2 Analiza rozkładu empirycznego

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Miary zmienności STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

Miary w szeregach. 1 Miary klasyczne. 1.1 Średnia Średnia arytmetyczna

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Podstawowe funkcje statystyki: informacyjna, analityczna, prognostyczna.

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Wnioskowanie statystyczne. Statystyka w 5

Statystyczne metody analizy danych

Wykład 5. Opis struktury zbiorowości. 1. Miary asymetrii.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Statystyka opisowa. Robert Pietrzykowski.

Estymacja przedziałowa. Przedział ufności

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Zmienne losowe. Statystyka w 3

Rachunek prawdopodobieństwa i statystyka

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Statystyka matematyczna dla leśników

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

Xi B ni B

ESTYMACJA PRZEDZIAŁOWA WYBRANYCH PARAMETRÓW

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

Rozkłady statystyk z próby. Statystyka

Statystyka. Magdalena Jakubek. kwiecień 2017

Komputerowa analiza danych doświadczalnych

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Rozkład normalny. Marcin Zajenkowski. Marcin Zajenkowski () Rozkład normalny 1 / 26

Rachunek prawdopodobieństwa i statystyka

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Wykład 5: Statystyki opisowe (część 2)

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

Statystyka Opisowa WK Andrzej Pawlak. Intended Audience: PWR

1.1 Wstęp Literatura... 1

Transkrypt:

1 Podstawy rachunku prawdopodobieństwa Dystrybuantą zmiennej losowej X nazywamy prawdopodobieństwo przyjęcia przez zmienną losową X wartości mniejszej od x, tzn. F (x) = P [X < x]. 1. dla zmiennej losowej skokowej (dyskretnej) F (x) = P [X < x] = P [X = x i ] = p i x i <x x i <x P [X < x] oblicza się przez sumowanie wszystkich prawdopodobieństw p i dla x i < x 2. dla zmiennej losowej ciągłej F (x) = x f(t) dt, gdzie f - funkcja gęstości Charakterystyki liczbowe zmiennej losowej: Zmienna losowa skokowa (dyskretna) Zmienna losowa ciągła EX = x i p i EX = xf(x)dx gdzie p i = P (X = x i ) gdzie f - funkcja gęstości D 2 X = E(X EX) 2 = D 2 X = E(X EX) 2 = = (x i EX) 2 p i = (x EX) 2 f(x)dx D 2 X = EX 2 (EX) 2 D 2 X = EX 2 (EX) 2 gdzie EX 2 = x 2 i p i gdzie EX 2 = x 2 f(x)dx DX = D 2 X DX = D 2 X Mo - jest to wartość x i o największym Mo - jest to wartość x, dla której prawdopodobieństwie wystąpienia funkcja gęstości f(x) lub wartość najczęściej występująca osiąga wartość największą w próbie (różna od wartości skrajnych) (osiąga maksimum) Me - jest to liczba spełniającą warunki: Me - jest to liczba x spełniająca P (X Me) 1 2 i P (X Me) 1 2 równanie F (x) = 1 2 kwantyl rzędu p, p (0, 1) kwantyl rzędu p, p (0, 1) - jest to liczba x p spełniającą warunki: - jest to liczba x spełniająca P (X x p ) p i P (X x p ) 1 p równanie F (x) = p 1

Podstawowe rozkłady zmiennej losowej ciągłej: 1. Rozkład normalny N(µ, σ) α = P [N(µ, σ) < x] x : P [N(µ, σ) < x] = α Excel 2016, LibreOffice ROZKŁ.NORMALNY(x;µ;σ;PRAWDA) ROZKŁ.NORMALNY.ODWR(α;µ;σ) α = P [N(µ, σ) < x] x : P [N(µ, σ) < x] = α Excel, OpenOffice, LibreOffice ROZKŁAD.NORMALNY(x;µ;σ;PRAWDA) ROZKŁAD.NORMALNY.ODW(α;µ;σ) 2

2. Rozkład chi-kwadrat χ 2 (n) α = P [χ 2 (n) < x] x : P [χ 2 (n) < x] = α Excel 2016, LibreOffice ROZKŁ.CHI(x;n;PRAWDA) ROZKŁ.CHI.ODWR(α;n) α = P [χ 2 (n) < x] α = P [χ 2 (n) > x] x : P [χ 2 (n) < x] = α x : P [χ 2 (n) > x] = α Excel, OpenOffice, LibreOffice 1-ROZKŁAD.CHI(x;n) ROZKŁAD.CHI(x;n) ROZKŁAD.CHI.ODW(1 α;n) ROZKŁAD.CHI.ODW(α;n) 3

3. Rozkład F Fishera-Snedecora F (m, n) α = P [F (m, n) < x] x : P [F (m, n) < x] = α Excel 2016, LibreOffice ROZKŁ.F(x;m;n;PRAWDA) ROZKŁ.F.ODWR(α;m;n) α = P [F (m, n) < x] α = P [F (m, n) > x] x : P [F (m, n) < x] = α x : P [F (m, n) > x] = α Excel, OpenOffice, LibreOffice 1-ROZKŁAD.F(x;m;n) ROZKŁAD.F(x;m;n) ROZKŁAD.F.ODW(1 α;m;n) ROZKŁAD.F.ODW(α;m;n) 4

4. Rozkład t Studenta t(n) α = P [t(n) < y] y : P [t(n) < y] = α Excel 2016, LibreOffice ROZKŁ.T(y;n;PRAWDA) ROZKŁ.T.ODWR(α;n) Excel, OpenOffice, LibreOffice α = P [t(n) < x] dla x 0 1-ROZKŁAD.T(x;n;1) α = P [t(n) > x] = P [t(n) < x] dla x 0 ROZKŁAD.T(x;n;1) α = P [t(n) > x] + P [t(n) < x] dla x 0 ROZKŁAD.T(x;n;2) x : P [t(n) > x] = α dla x 0 ROZKŁAD.T.ODW(2α;n) x : P [t(n) < x] = α dla x 0 ROZKŁAD.T.ODW(2-2α;n) y : P [t(n) < y] = α dla y < 0 -ROZKŁAD.T.ODW(2α;n) (x > 0) : P [t(n) < x] + P [t(n) > x] = ROZKŁAD.T.ODW(α;n) = 2P [t(n) > x] = 2P [t(n) < x] = α (x > 0) : P [ x < t(n) < x] = α ROZKŁAD.T.ODW(1-α;n) 5

2 Statystyka opisowa Etapy tworzenia szeregu rozdzielczego przedziałowego: 1. wyznaczamy x max oraz x min 2. wyznaczamy rozstęp z próby R = x max x min 3. wyznaczamy ilość przedziałów klasowych K (w zależności od liczebności próby n) K = n K = 1 + 3, 322 log n K 5 log n tabela: liczba pomiarów n liczba przedziałów klasowych K 30-60 6-8 60-100 7-10 100-200 9-12 200-500 11-17 500-1500 16-25 4. wyznaczamy długość przedziału klasowego h minimalna długość przedziału klasowego h min R + α, gdzie α jest dokładnością K pomiaru 5. wyznaczamy lewy koniec pierwszego przedziału klasowego x 0 = x min α 2, gdzie α jest dokładnością pomiaru Miary statystyczne można podzielić na: : 1. miary położenia - służą do określenia tej wartości cechy, wokół której skupiają się wszystkie pozostałe wartości; mierzą przeciętny poziom cechy 6

a) średnia z próby x = 1 n x = 1 n x = 1 n x i - dane niepogrupowane x i n i - szereg rozdzielczy punktowy x i n i - szereg rozdzielczy przedziałowy, gdzie x i - środek przedziału klasowego b) moda (dominanta) - wartość najczęstsza dane niepogrupowane i szereg rozdzielczy punktowy: moda to wartość najczęstsza, o ile nie jest to wartość skrajna szereg rozdzielczy przedziałowy: (n m n m 1 ) h Mo = x m + n m n m 1 + n m n m+1 gdzie x m - lewy koniec przedziału z modą (czyli przedziału o największej liczebności, ale różnego od przedziału pierwszego i ostatniego), h - długość przedziału z modą, n m - liczebność przedziału z modą, n m 1 - liczebność przedziału poprzedzającego przedział z modą, n m+1 - liczebność przedziału następującego po przedziale z modą c) mediana - wartość środkowa w uporządkowanej próbie dane niepogrupowane i szereg rozdzielczy punktowy: Me = x ( n+1 2 ), gdy n jest nieparzyste ( ) 1 x( n 2 2 ) + x ( n 2 +1), gdy n jest parzyste tzn. mediana jest to środkowa liczba, gdy n jest liczbą nieparzystą, albo średnia arytmetyczna dwóch środkowych liczb, gdy n jest liczbą parzystą szereg rozdzielczy przedziałowy: Me = x Me + h ( ) n k 1 n Me 2 n i 7

gdzie x Me - lewy koniec przedziału z medianą, h - długość przedziału z medianą, n Me - liczebność przedziału z medianą, k - numer przedziału zawierającego medianę; k 1 n i - sumujemy liczebności przedziałów poprzedzających przedział z medianą d) kwartyle (dolny Q 1 i górny Q 3 ) - wartości, które dzielą uporządkowaną próbę w stosunku 1:3 i 3:1 szereg rozdzielczy przedziałowy: Q 1 = x Q1 + h ( ) n k 1 n Q1 4 n i Q 3 = x Q3 + h ( ) 3n k 1 n Q3 4 n i gdzie x Q1 - lewy koniec przedziału zawierającego Q 1, h - długość przedziału zawierającego Q 1, n Q1 - liczebność przedziału zawierającego Q 1, k - numer przedziału zawierającego Q 1 e) kwantyle rzędu p, p (0, 1) - wartości, które dzielą uporządkowaną próbę w stosunku p : (1 p) f) inne średnie (geometryczna, harmoniczna) 2. miary rozproszenia (zmienności, rozrzutu) - służą do badania stopnia zróżnicowania jednostek populacji ze względu na wartość badanej cechy a) rozstęp R = x max x min b) wariancja s 2 = 1 n 1 s 2 = 1 n 1 s 2 = 1 n 1 c) odchylenie standardowe s = s 2 (x i x) 2 - dane niepogrupowane (x i x) 2 n i - szereg rozdzielczy punktowy (x i x) 2 n i - szereg rozdzielczy przedziałowy, gdzie typowy przedział zmienności (x s; x + s) x i - środek przedziału klasowego 8

d) odchylenie przeciętne od średniej d 1 = 1 n d 1 = 1 n d 1 = 1 n x i x - dane niepogrupowane x i x n i - szereg rozdzielczy punktowy x i x n i - szereg rozdzielczy przedziałowy, gdzie x i - środek przedziału klasowego e) odchylenie przeciętne od mediany d 2 = 1 n d 2 = 1 n d 2 = 1 n x i Me - dane niepogrupowane x i Me n i - szereg rozdzielczy punktowy x i Me n i - szereg rozdzielczy przedziałowy, gdzie x i - środek przedziału klasowego f) odchylenie ćwiartkowe Q = 1 2 (Q 3 Q 1 ) rozstęp kwartylowy Q = Q 3 Q 1 g) współczynnik zmienności V = s x 100% h) współczynnik nierównomierności H = d 1 x 100%, H 2 = d 2 Mo 100% 3. miary asymetrii - służą do badania kierunku zróżnicowania wartości badanej cechy; mierzą czy przeważająca liczba jednostek znajduje się powyżej czy poniżej przeciętnego poziomu badanej cechy a) wskaźnik asymetrii ws 1 = x Mo, ws 2 = x Me b) współczynnik asymetrii A = M 3 s 3, gdzie 9

M 3 = 1 (x i x) 3 - dane niepogrupowane n M 3 = 1 (x i x) 3 n i - szereg rozdzielczy punktowy n M 3 = 1 (x i x) 3 n i - szereg rozdzielczy przedziałowy, gdzie n c) współczynnik skośności x i - środek przedziału klasowego A 1 = x Mo, A 2 = x Mo, A 3 = Q 1 + Q 3 2Me s d 1 2Q 4. miary spłaszczenia (koncentracji) - służą do analizy stopnia skupienia poszczególnych jednostek wokół średniej a) kurtoza (współczynnik skupienia) K = M 4 s 4, gdzie M 4 = 1 n M 4 = 1 n M 4 = 1 n (x i x) 4 - dane niepogrupowane (x i x) 4 n i - szereg rozdzielczy punktowy (x i x) 4 n i - szereg rozdzielczy przedziałowy, gdzie x i - środek przedziału klasowego b) eksces q = K 3 Miary statystyczne można podzielić na: 1. miary pozycyjne - są niewrażliwe na obserwacje mocno odstające (moda, mediana, kwartyle, rozstęp kwartylowy) 2. pozostałe 10

3 Estymacja przedziałowa 1. PRZEDZIAŁY UFNOŚCI DLA ŚREDNIEJ (a) MODEL I Badana cecha ma rozkład normalny N(µ, σ) o nieznanym parametrze µ i znanym σ. Przedział ufności: [ ( µ x u 1 α ) ( σ n ; x + u 1 α ) ] σ n 2 2 gdzie u(1 α 2 ) jest kwantylem rzędu 1 α 2 - to średnia i liczebność próby. rozkładu normalnego N(0, 1); x, n (b) MODEL II Badana cecha ma rozkład normalny N(µ, σ) o nieznanych parametrach µ i σ. Przedział ufności: [ µ x t (1 α ) 2, n 1 s ; x + t (1 α ) ] n 1 2, n 1 s n 1 gdzie t(1 α, n 1) jest kwantylem rzędu 1 α rozkładu Studenta o n 1 2 2 stopniach swobody; x, s, n - to średnia, odchylenie standardowe i liczebność próby. (c) MODEL III Badana cecha ma dowolny rozkład (niekoniecznie normalny), o nieznanej wartości oczekiwanej µ i nieznanym odchyleniu standardowym σ, zaś liczebność próby jest duża (n 100). Przedział ufności: [ ( µ x u 1 α 2 ) ( s ; x + u 1 α ) ] s n 2 n gdzie u(1 α) jest kwantylem rzędu 1 α rozkładu normalnego N(0, 1); x, s, 2 2 n - to średnia, odchylenie standardowe i liczebność próby. Jeśli σ jest parametrem znanym, to zamiast s wstawiamy σ. 11

2. PRZEDZIAŁY UFNOŚCI DLA WARIANCJI (a) MODEL I Badana cecha ma rozkład normalny N(µ, σ) o nieznanych parametrach µ i σ, zaś próba jest mała (n 50). Przedział ufności: σ 2 ns 2 ( χ 2 1 α, n ; 2 1) ns 2 ( χ 2 α, n 2 1) gdzie χ 2 ( 1 α 2, n 1) i χ 2 ( α 2, n 1) są kwantylami rzędu 1 α 2 i α 2 (odpowiednio) rozkładu chi-kwadrat o n 1 stopniach swobody; s 2, n - to wariancja i liczebność próby. (b) MODEL II Badana cecha ma rozkład normalny N(µ, σ) o nieznanych parametrach µ i σ, zaś próba jest duża (n > 50). Przedział ufności: σ 2 2ns 2 ( 2n 3 + u(1 α 2 )) 2 ; 2ns 2 ( 2n 3 u(1 α 2 )) 2 gdzie u(1 α 2 ) jest kwantylem rzędu 1 α 2 rozkładu normalnego N(0, 1); s2, n - to wariancja i liczebność próby. 3. PRZEDZIAŁY UFNOŚCI DLA WSKAŹNIKA STRUKTURY Jeśli próba jest duża (n 100), to przedział ufności dla wskaźnika struktury p jest postaci: ( p q u 1 α ) q(1 q) 2 n ( ; q + u 1 α 2 ) q(1 q) n gdzie q = m ; m jest liczbą elementów w próbie, które posiadają badaną cechę; n u(1 α 2 ) jest kwantylem rzędu 1 α 2 rozkładu normalnego N(0, 1). 12