Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).

Podobne dokumenty
Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste

Miary położenia (tendencji centralnej) to tzw. miary przeciętne charakteryzujące średni lub typowy poziom wartości cechy.

Statystyka i Opracowanie Danych. W7. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej

Statystyczny opis danych - parametry

X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

Plan wykładu. Analiza danych Wykład 1: Statystyka opisowa. Literatura. Podstawowe pojęcia

Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)

Miary rozproszenia. Miary położenia. Wariancja. Średnia. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.

Podstawowe pojęcia. Próba losowa. Badanie próby losowej

Miary położenia. Miary rozproszenia. Średnia. Wariancja. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.

Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.

Parametryczne Testy Istotności

PODSTAWY BIOSTATYSTYKI ĆWICZENIA

STATYSTYKA OPISOWA PODSTAWOWE WZORY

Statystyka matematyczna dla leśników

STATYSTYKA OPISOWA PODSTAWOWE WZORY

ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA

Wybrane litery alfabetu greckiego

1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o

KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1

Lista 6. Estymacja punktowa

16 Przedziały ufności

Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja

Ćwiczenie 2 ESTYMACJA STATYSTYCZNA

Statystyka powtórzenie (I semestr) Rafał M. Frąk

STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr inż Krzysztof Bryś

STATYSTYKA I ANALIZA DANYCH

Estymacja przedziałowa

1 Testy statystyczne. 2 Rodzaje testów

Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w

L.Kowalski zadania ze statystyki matematycznej-zestaw 3 ZADANIA - ZESTAW 3

Ćwiczenie nr 14. Porównanie doświadczalnego rozkładu liczby zliczeń w zadanym przedziale czasu z rozkładem Poissona

Wykład 11 ( ). Przedziały ufności dla średniej

Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2

Wykład nr 2. Statystyka opisowa część 2. Plan wykładu

PRZEDZIAŁY UFNOŚCI. Niech θ - nieznany parametr rozkładu cechy X. Niech α będzie liczbą z przedziału (0, 1).

Histogram: Dystrybuanta:

ANALIZA DANYCH DYSKRETNYCH

Statystyka opisowa. () Statystyka opisowa 24 maja / 8

Statystyka opisowa - dodatek

Testowanie hipotez. H 1 : µ 15 lub H 1 : µ < 15 lub H 1 : µ > 15

Statystyka matematyczna. Wykład II. Estymacja punktowa

TESTY LOSOWOŚCI. Badanie losowości próby - test serii.

Estymacja: Punktowa (ocena, błędy szacunku) Przedziałowa (przedział ufności)

1 Dwuwymiarowa zmienna losowa

STATYSTYKA OPISOWA WYKŁAD 1 i 2

COLLEGIUM MAZOVIA INNOWACYJNA SZKOŁA WYŻSZA WYDZIAŁ NAUK STOSOWANYCH. Kierunek: Finanse i rachunkowość. Robert Bąkowski Nr albumu: 9871

θx θ 1, dla 0 < x < 1, 0, poza tym,

Statystyka Wzory I. Analiza struktury

Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

Rachunek prawdopodobieństwa i statystyka Wnioskowanie statystyczne. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

Metrologia: miary dokładności. dr inż. Paweł Zalewski Akademia Morska w Szczecinie

1 Podstawy rachunku prawdopodobieństwa

Estymacja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 7

(X i X) 2. n 1. X m S

STATYSTYKA MATEMATYCZNA

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Prawdopodobieństwo i statystyka r.

d wymiarowy wektor losowy Niech (Ω, S, P) przestrzeń probabilistyczna Definicja Odwzorowanie X: Ω R nazywamy 1-wymiarowym wektorem

Statystyka i rachunek prawdopodobieństwa

Elementy modelowania matematycznego

STATYSTYKA MATEMATYCZNA

INFORMATYKA W CHEMII Dr Piotr Szczepański

będą niezależnymi zmiennymi losowymi z rozkładu jednostajnego na przedziale ( 0,

Metoda łączona. Wykład 7 Dwie niezależne próby. Standardowy błąd dla różnicy dwóch średnich. Metoda zwykła (niełączona) n2 2

Obserwacje odstające mają duży wpływ na średnią średnia nie jest odporna.

Charakterystyki liczbowe zmiennych losowych: wartość oczekiwana i wariancja

Estymacja parametrów populacji

Prawdopodobieństwo i statystyka r.

0.1 ROZKŁADY WYBRANYCH STATYSTYK

Statystyka i opracowanie danych W3: Wprowadzenie do statystycznej analizy danych Podstawy wnioskowania statystycznego. Estymacja i estymatory

STATYSTKA I ANALIZA DANYCH LAB II

n n X n = σ σ = n n n Ponieważ zmienna losowa standaryzowana ma rozkład normalny N(0, 1), więc

Wokół testu Studenta 1. Wprowadzenie Rozkłady prawdopodobieństwa występujące w testowaniu hipotez dotyczących rozkładów normalnych

1 Zmienne losowe. Własności dystrybuanty F (x) = P (X < x): F1. 0 F (x) 1 dla każdego x R, F2. lim F (x) = 0 oraz lim F (x) = 1,

Rozkład normalny (Gaussa)

Rozkład χ 2 = + 2π 2. Niech zmienna losowa x ma rozkład normalnyn(x; µ,σ). Znajdziemy rozkład zmiennej:

Rozkłady statystyk z próby Twierdzenia graniczne

Komputerowa analiza danych doświadczalnych

Estymacja przedziałowa - przedziały ufności

Lista 5. Odp. 1. xf(x)dx = xdx = 1 2 E [X] = 1. Pr(X > 3/4) E [X] 3/4 = 2 3. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym

Statystyka. Katarzyna Chudy Laskowska

ZMIENNA LOSOWA I JEJ PARAMETRY -powtórzenie

Zestaw II Odpowiedź: Przeciętna masa ciała w grupie przebadanych szczurów wynosi 186,2 g.

Estymacja przedziałowa:

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.

ZDARZENIE ELEMENTARNE to możliwy wynik doświadczenia losowego. Wszystkie takie możliwe wyniki tworzą zbiór zdarzeń elementarnych.

Projekt ze statystyki

Opracowanie danych pomiarowych. dla studentów realizujących program Pracowni Fizycznej

ZADANIA NA ĆWICZENIA 3 I 4

Internetowe Kółko Matematyczne 2004/2005

Komputerowa analiza danych doświadczalnych

t - kwantyl rozkładu t-studenta rzędu p o f stopniach swobody

KADD Metoda najmniejszych kwadratów

Statystyka Opisowa. w2: podstawowe miary. Jerzy Stefanowski Instytut Informatyki Politechnika Poznańska. Poznań, 2015/16 aktualizacja 2017

Kurs Prawdopodobieństwo Wzory

2.1. Studium przypadku 1

WYKŁAD 1. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

Transkrypt:

Cetrale miary położeia Średia; Moda (domiata) Mediaa Kwatyle (kwartyle, decyle, cetyle) Moda (Mo, D) wartość cechy występującej ajczęściej (ajlicziej). Mediaa (Me, M) dzieli uporządkoway szereg liczbowy a połowę. Jest wartością środkową szeregu. Kwatyle dzielą szereg uporządkoway a części o jedakowej liczości. Q 1 Q 2 = M Q 3 0 25 50 75 100

Mediaa (Me) Dla szeregu statystyczego ieparzystego = środkowemu człoowi szeregu. Dla szeregu statystyczego parzystego = średiej arytmetyczej dwóch środkowych liczb. Mediaa jest ieczuła a wartości skraje. Stosuje się ją czasem do charakterystyki krótkich serii wyików (N<10), gdy pojedycze pomiary odbiegają od pozostałych. Moda (Mo) Wartość modala Miejsce a osi o ajwiększej liczebości. Moda jest ieczuła a wartości skraje. Jeśli pomiary są ciągłe to wyzaczamy przedział modaly.

Stosowae średie Średia arytmetycza; x= i=1 x i x i wyik i-tego pomiaru liczba pomiarów Średia ważoa (ogóla); X = k i=1 N x i i x i N średia i-tej grupy liczebość i-tej grupy suma liczebości wszystkich grup k N = i=1 i

Średia geometrycza; x g = i=1 x i 1/ = x 1 x 2... x x i wyik i-tego pomiaru liczba pomiarów Średia harmoicza; x h = k i=1 1 x i = 1 k i=1 1 x i 1 x i wyik i-tego pomiaru liczba pomiarów

Średia w szeregu rozdzielczym: k X = 1 N i=1 x i i gdzie: x i i - środek i-tej klasy - liczość i-tej klasy N = i Odchyleie stadardowe w szeregu rozdzielczym: k s= i=1 x i X 2 i N

Wskaźiki rozproszeia Rozstęp (x max - x mi ); Rozstęp międzykwartylowy (q = Q 3 - Q 1 ); Wariacja σ2 ; Odchyleie stadardowe (σ). 2 = N i=1 x i 2 N = 2

Parametry charakteryzujące populację: μ, σ. Statystyki charakteryzujące próbę: x, s. Średia (arytmetycza) próby: x= i=1 x i Wariacja i odchyleie stadardowe próby: s 2 = i=1 x i x 2 s= s 2

Oszacowaie iezaej wariacji populacji a podstawie wariacji z próby. s s 2 = 1 s2 = i=1 x i x 2 1 2 s s = i=1 x i x 2 1

Oszacowaie iezaej wariacji populacji a podstawie wariacji z próby. s s 2 = 1 s2 = i=1 x i x 2 1 2 S s jest ieobciążoym estymatorem odchyleia stadardowego w populacji. Tak aprawdę zawsze chodzi am o oszacowaie odchyleia stadardowego w populacji (czyli s s ) a podstawie próby, którą dyspoujemy. Wiele podręczików dokouje tu pewego skrótu (myślowego) rówoważąc odchyleie stadardowe próby z jego estymatorem ieobciążoym i używa wzoru a) dla małej próby lub wzoru b) dla dużej próby. MY TEŻ TAK BĘDZIEMY ROBIĆ. s 2 s = 1 s2 = x i x 2 a) i=1 b) 1 2 s= i=1 x i x 2 Odchyleie stadardowe dla małej próby (<30) Odchyleie stadardowe dla dużej próby (>30).

Oszacowaie iezaej średiej w populacji a podstawie średiej z próby: x Ale obliczoa średia jest obarczoa błędem. Oszacowaie błędu średiej z próby. Jeżeli pewa cecha posiada rozkład ormaly o parametrach μ i σ X N, to średia z elemetów posiada rozkład: X N, Zatem odchyleie stadardowe średiej z elemetów wyosi: s x= s = i=1 x i x 2 1

Zadaie Zmierzoo wysokość 10 przebiśiegów, które właśie rozkwitły a pewej polaie. Otrzymae wartości (w cm) to: 15, 13, 16, 14, 17, 15, 14, 12, 16, 15. Zajdź: a) rozstęp; b) mediaę; c) modę; d) wartość średią; e) wariację; f) odchyleie stadardowe. Odp: a) 5 b) 15 c) 15 d) 14,7 e) 2,2 f) 1,5

Zadaie Z populacji mężczyz, celem określeia ich masy, wybrao losowo próbę złożoą z 58 osób. Ich masę określoo z dokładością do 0.1 kg. Otrzymao astępujące dae liczbowe: 49,1 60,7 65,0 70,0 74,4 78,2 53,2 60,9 65,6 70,4 74,9 78,7 54,0 61,0 66,7 70,9 75,0 79,0 54,1 61,5 66,8 71,6 75,0 79,4 54,5 62,2 67,0 71,9 75,2 82,1 55,4 62,8 67,4 72,6 75,6 83,8 56,3 63,0 68,3 72,7 75,9 85,5 57,7 63,4 68,9 73,1 76,2 87,1 58,4 64,0 69,0 73,3 76,5 59,0 64,6 69,5 74,0 78,1 Oblicz średią masę ciała oraz odchyleie stadardowe. Następie, korzystając z daych uzyskaych a wcześiejszych zajęciach, oblicz średią w szeregu rozdzielczym oraz odchyleie stadardowe w szeregu rozdzielczym.

Na podstawie próby: x=68,6 s=8,8 Na podstawie szeregu rozdzielczego: x=68,3 s=8,7

Momety cetrale M 1 = 1 N x x =0 M 2 = 1 N x x 2 =s 2 M 3 = 1 N x x 3 M 4 = 1 N x x 4 Momet II-rzędu to wariacja. Momet III-rzędu służy do aalizy asymetrii rozkładu. Momet IV-rzędu służy do aalizy kurtozy rozkładu.

Skośość Skośość jest miarą asymetrii rozkładu cechy. Współczyik skośości Współczyik asymetrii A= M 3 A= X i X 3 A= X Mo / s = 3 X i X s 3 N s 3 s 3 N N 1 N 2 Estymator obciążoy Estymator ieobciążoy Ze względu a wartość współczyików rozkłady prawdopodobieństwa możemy podzielić a: Symetrycze A = 0 Prawoskośe A > 0 Lewoskośe A < 0

Przekształceia pozwalające zmiejszyć skośość rozkładu Liczeie średiej ruchomej Śr.ruch. = (2 śr -tej.kat. + śr -tej.kat.poprzediej + śr -tej.kat. Następej )/4 Rozkład prawoskośy: logarytmowaie pomiarów jeżeli skośość ie jest zbyt duża to pierwiastkowaie Rozkład lewoskośy: atylogarytmowaie pomiarów (e X, 10 X ) jeżeli skośość ie jest zbyt duża to podoszeie do potęgi (X 2, X 3 )

Kurtoza Kurtoza jest miarą kocetracji ( wypiętrzeia ) rozkładu wartości cechy. Kurt= 4 / 4 3 Ze względu a wartość kurtozy rozkłady prawdopodobieństwa możemy podzielić a: Mezokurtycze: Kurt = 0 spłaszczeie rozkładu podobe, jak w rozkładzie ormalym) Leptokurtycze: Kurt > 0 rozkład wypiętrzoy Platykurtycze: Kurt < 0 rozkład spłaszczoy Kurtozę z próby liczymy ze wzoru: Kurt= M 4 s 4 4 X 3= i X 3 s 4 Kurt= 1 1 2 3 X i X 4 s 4 3 2 2 2 3 Estymator obciążoy Estymator ieobciążoy

Badaia prowadzoe przez pewego studeta pozwoliły stwierdzić, że średia wysokość przebiśiegów w okolicach Wrocławia wyosi 12 cm. Czy 10 przebiśiegów o wysokości 15, 13, 16, 14, 17, 15, 14, 12, 16, 15cm zostało zerwae w okolicach Wrocławia?

Stadaryzacja rozkładu średich z próby Średia z elemetów posiada rozkład: X N 0, X 0 N 0, X 0 / N 0,1 t= X 0 s/ T df = 1 Statystyka testu t-studeta dla jedej grupy. Liczba stopi swobody: df = 1

Test t-studeta test o średiej arytmetyczej Średia elemetów pobraych z populacji o parametrach N(μ,σ) posiada rozkład: X 0 / N 0,1 W praktyce σ ajczęściej ie jest zae. Zamy jedyie s uzyskae z wybraej próby. Po zamiaie otrzymujemy parametr, którego rozkład ma charakter rozkładu t-studeta. t= X 0 s/ T df = 1 Liczba stopi swobody: df = 1 Statystyka testu t-studeta dla jedej grupy. Hipoteza H 0 : μ = μ 0 Hipoteza H A : μ μ 0 Dla rozkład t-studeta zbliża się do rozkładu ormalego (coraz miejszy błąd związay z oszacowaiem odchyleia stadardowego s).

Badaia prowadzoe przez pewego studeta pozwoliły stwierdzić, że średia wysokość przebiśiegów w okolicach Wrocławia wyosi 12 cm. Czy 10 przebiśiegów z poprzediego zadaia (o wysokości 15, 13, 16, 14, 17, 15, 14, 12, 16, 15cm) zostało zerwae w okolicach Wrocławia? s=1,49 x=14,7 X t= s/ =14,70 12 1,49/ 10 = 2,70 0,47 =5,73 t =0,05 ;df =9 =2,262 Odp: Przebiśiegi ie zostały zerwae w okolicach Wrocławia (p < 0,001).

Pytaie: Kiedy do testowaia hipotezy stosujemy test t-studeta dla jedej próby? Gdy: badaa cecha jest mierzala; dyspoujemy jedą próbą; chcemy porówać, czy wartość średiej z próby jest zgoda z wartością przewidywaą dla całej populacji; potrafimy wskazać wartość µ (p. a podstawie wcześiejszych badań a dużą skalę); Ograiczeia: uzyskaa próba musi być losowa i reprezetatywa; próba musi mieć rozkład ormaly. Gdy próba ie ma charakteru rozkładu ormalego ależy stosować tzw. testy ieparametrycze.

Iy studet zerwał rówież 10 przebiśiegów. Ich zmierzoa wysokość to 16, 15, 17, 17, 14, 15, 19, 13, 16, 18 cm. Czy zostały oe zerwae z tej samej populacji, co poprzedie egzemplarze?

Test t-studeta dla dwóch grup iezależych Statystyką testu jest wyrażeie: gdzie: t d = x 1 x 2 1 2 s 2 p 1 1 1 2 s 2 p = 1 1 1 s 2 2 1 2 1 s 2 i=1 = 1 2 2 x i1 x 1 2 i=1 2 x i2 x 2 2 1 2 2

Test t-studeta dla dwóch grup iezależych Zazwyczaj 1 = 2 = Daje to hipotezy w postaci: Hipoteza H 0 : μ 1 = μ 2 Hipoteza H A : μ 1 μ 2 I upraszcza statystykę testu do postaci: Liczba stopi swobody: 2 1 1 1 2 t d = x 1 x 2 s p df = 1 2 2

H 0 : 1 = 2 x 1 =14,7 x 2 =16,0 H A : 1 2 s 1 2 =2,2 s 2 2 =3,3 s p 2 =2,78 t d = 14,7 16,0 2,78 1 1 = 1,74 10 10 t =0,05; df =18 = 2,10 Odp: Hipotezy H 0 ie moża odrzucić a poziomie istotości α = 0,05.

Pytaie: Kiedy do testowaia hipotezy stosujemy test t-studeta dla dwóch prób iezależych Gdy: badaa cecha mierzala; dyspoujemy dwoma próbami; chcemy porówać, czy wartości średich z dwóch prób różią się w sposób istoty od siebie; Ograiczeia: uzyskae próby muszą być losowe i reprezetatywe; obydwie próby muszą mieć rozkład ormaly. wariacje obydwu prób muszą być rówe (ie mogą różić się od siebie w sposób istoty statystyczie) Gdy drugi waruek ie jest spełioy ależy stosować tzw. testy ieparametrycze.

Test a rówość wariacji test F (Fishera-Sedecora) F d = s 2 1 2 s 2 Obszar krytyczy dla H A : 1 2 2 2 F 1 1, 2 1, Liczba stopi swobody: df 1 = 1 1 df 2 = 2 1 Obszar krytyczy dla H A : 1 2 2 2 F /2 1 1, 2 1, Wartości krytycze spełiają waruek: F 1 1, 2 1 F 1 2 1, 1 1 =1

W aszym przypadku: F d = s 2 2 s = 3,33 2 1 2,23 =1,49 F /2 2 1, 1 1, =4,10 F d jest miejsze od wartości krytyczej, zatem hipotezy H 0 ie moża odrzucić a poziomie istotości α = 0,05. Wariacje ie różią się w sposób istoty statystyczie.