Statystyka opisowa- cd.

Podobne dokumenty
Wykład 3. Rozkład normalny

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.

Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła

Estymacja parametrów w modelu normalnym

METODY BADAŃ NA ZWIERZĘTACH ze STATYSTYKĄ wykład 3-4. Parametry i wybrane rozkłady zmiennych losowych

Wybrane rozkłady zmiennych losowych. Statystyka

6. Zmienne losowe typu ciagłego ( ) Pole trapezu krzywoliniowego

Rozkłady i ich dystrybuanty 16 marca F X (t) = P (X < t) 0, gdy t 0, F X (t) = 1, gdy t > c, 0, gdy t x 1, 1, gdy t > x 2,

Statystyka matematyczna

Wybrane rozkłady zmiennych losowych. Statystyka

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

Z Wikipedii, wolnej encyklopedii.

Testowanie hipotez statystycznych.

2.Wstępna analiza danych c.d.- wykład z Populacja i próba

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

PODSTAWY BIOSTATYSTYKI ĆWICZENIA

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

18. Obliczyć. 9. Obliczyć iloczyn macierzy i. 10. Transponować macierz. 11. Transponować macierz. A następnie podać wymiar powstałej macierzy.

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Generowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Zadania ze statystyki, cz.6

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Zmienne losowe ciągłe i ich rozkłady

Zmienne losowe ciągłe i ich rozkłady

PODSTAWOWE ROZKŁADY ZMIENNYCH LOSOWYCH

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Zmienne losowe. Statystyka w 3

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Rozdział 1. Zmienne losowe, ich rozkłady i charakterystyki. 1.1 Definicja zmiennej losowej

Przedmiot statystyki. Graficzne przedstawienie danych.

Pozyskiwanie wiedzy z danych

Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne losowe wielowymiarowe

Rozkłady zmiennych losowych

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Zmienna losowa i jej rozkład

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Statystyka i eksploracja danych

Ćwiczenia 1-2 Analiza rozkładu empirycznego

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

1 Podstawy rachunku prawdopodobieństwa

Wykłady 14 i 15. Zmienne losowe typu ciągłego

Wykład 13. Zmienne losowe typu ciągłego

WYKŁAD 2. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

Temat: Zmienna losowa. Rozkład skokowy. Rozkład ciągły. Kody kolorów: Ŝółty nowe pojęcie pomarańczowy uwaga. Anna Rajfura, Matematyka

Parametry statystyczne

Statystyka opisowa. Robert Pietrzykowski.

Statystyka Matematyczna Anna Janicka

Rachunek Prawdopodobieństwa MAP1181 Wydział Matematyki, Matematyka Stosowana Projekt - Czas dojazdu autobusem Opracowanie: Klaudia Karpińska

Podstawowe definicje statystyczne

Zmienne losowe. dr Mariusz Grzadziel. rok akademicki 2016/2017 semestr letni. Katedra Matematyki, Uniwersytet Przyrodniczy we Wrocławiu

Opisowa analiza struktury zjawisk statystycznych

Statystyka matematyczna i ekonometria

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Ćwiczenia 3 ROZKŁAD ZMIENNEJ LOSOWEJ JEDNOWYMIAROWEJ

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Zmienne losowe. dr Mariusz Grządziel Wykład 12; 20 maja 2014

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

g) wartość oczekiwaną (przeciętną) i wariancję zmiennej losowej K.

Rozkład materiału KLASA I

Wykład 5: Statystyki opisowe (część 2)

Komputerowa analiza danych doświadczalnych

KURS PRAWDOPODOBIEŃSTWO

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 4 Przekształcenia zmiennej losowej, momenty

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Agata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne.

Propozycja szczegółowego rozkładu materiału dla 4-letniego technikum

Wykład 4: Statystyki opisowe (część 1)

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Weryfikacja hipotez statystycznych

Matematyka 2. dr inż. Rajmund Stasiewicz

Kolokwium ze statystyki matematycznej

Statystyka. Wykład 5. Magdalena Alama-Bućko. 20 marca Magdalena Alama-Bućko Statystyka 20 marca / 26

Centralne twierdzenie graniczne

Zmienne losowe. Powtórzenie. Dariusz Uciński. Wykład 1. Instytut Sterowania i Systemów Informatycznych Universytet Zielonogórski

6.4 Podstawowe metody statystyczne

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

Rachunek Prawdopodobieństwa i Statystyka

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Prawdopodobieństwo i statystyka

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Matematyka z el. statystyki, # 3 /Geodezja i kartografia II/

Prawdopodobieństwo i statystyka

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA

You created this PDF from an application that is not licensed to print to novapdf printer (

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Transkrypt:

12.03.2017 Wydział Inżynierii Produkcji I Logistyki Statystyka opisowa- cd. Wykład 4 Dr inż. Adam Deptuła

HISTOGRAM UNORMOWANY Pole słupka = wysokość słupka x długość przedziału Pole słupka = n i n h h, i = 1, 2,..., k i - numer przedziału, k - liczba przedziałów ( słupków ) Pole histogramu unormowanego = suma pól słupków=1 i k 1 n n i h h 1

STATYSTYKA OPISOWA 40 30 20 10 0-3,7-1,7 0,3 2,3 4,3

STATYSTYKA OPISOWA (X 1000) 4 3 2 1 0-5 -3-1 1 3 5 7

STATYSTYKA OPISOWA 1600 1200 800 400 0-5 -3-1 1 3 5 7

GĘSTOŚCI ROZKŁADÓW. GĘSTOŚCI NORMALNE Niech x 1, x 2,..., x n oznaczają obserwacje cechy ciągłej X, otrzymywane niezależnie. Przy nieograniczenie rosnącej liczności próbki n, łamane częstości histogramów unormowanych ( takich, że suma pól słupków = 1, gdy wysokość słupka = częstość/h, h = długość przedziału ) zbliżają się do krzywej ciągłej, nazywanej krzywą gęstości lub gęstością cechy X

Gdy liczba przedziałów histogramu wzrasta, wysokości sąsiednich słupków są zbliżone, więc łamana częstości staje się coraz bardziej gładka, zbliża się nieograniczenie do pewnej idealnej krzywej ciągłej (gęstości). Zatem, dla dużej liczności próbki: częstość obserwacji w przedziale = wysokość słupka x h = w przybliżeniu pole pod wykresem gęstości dla tego przedziału. Pole pod krzywą gęstości = 1 7

Określenie Niech f(x), x- dowolna liczba rzeczywista, będzie funkcją, której wykres to krzywa gęstości. Wówczas funkcję f nazywamy gęstością rozkładu cechy X Gęstość spełnia warunki: f ( x) 0, x (, ), f ( x) dx 1. 8

Kształty gęstości opisujemy podobnie jak histogramu: np. gęstość prawostronnie skośna: gdy maleje wolniej do zera przy x zbliżającym się do prawego krańca zakresu wartości cechy niż przy x zbliżającym się do jego lewego krańca. Moda = argument gęstości f, w którym występuje maksimum lokalne Gęstość jednomodalna, dwumodalna, lub wielomodalna posiada jedno, dwa, lub wiele maksimów lokalnych, odpowiednio

Wykres gęstości jednomodalnej, prawostronnie skośnej 1,5 1,2 0,9 0,6 0,3 0 0 0,4 0,8 1,2 1,6 2 2,4 2,4

Dla próbki o dużej liczności i histogramu unormowanego: Częstość obserwacji q j ni n j i1 i1 ni nh h pole pod wykresem gęstości f(x) dla x q = q f ( x) dx

Definicja. Niech 0 < p <1. Kwantylem rzędu p nazywamy punkt q p na osi poziomej, taki że pole pod gęstością na lewo od niego wynosi p 0,4 0,3 0,2 0,1 0-5 -3-1 1 3 5 Pole zakreskowane = 0,84. Zatem kwantyl rzędu 0,84 = 1.

Mediana: q 0, 5 Pierwszy kwartyl: q 0, 25 Trzeci kwartyl: q 0, 75 Rozstęp mięzykwartylowy: q0,75 q0, 25 Wartość średnia gęstości : = środek ciężkości obszaru płaskiego pomiędzy gęstością a osią poziomą: xf ( x) dx

Mediana Liczba q 0,5, taka że pole pod wykresem gęstości na lewo od mediany wynosi 0,5. Zatem q 0,5 f ( x) dx = 0,5 = f ( x) dx. q 0,5

standardowe odchylenie: = Parametry próbki 2 ( x ) f ( x) dx Parametry gęstości Wartość średnia: x Wartość średnia: Odchylenie Odchylenie standardowe: s standardowe Pierwszy kwartyl: Q 1 Pierwszy kwartyl: q 0, 25 Mediana: x med Mediana: q 0, 5 Trzeci kwartyl: Q 3 Trzeci kwartyl: q 0, 75

GĘSTOŚĆ NORMALNA:, ( x) 1 e 2 ( x) 2 /(2 2 ) gdzie, są ustalonymi parametrami określającymi gęstość jednoznacznie, - dowolna liczba, > 0. Krzywa normalna: wykres gęstości normalnej

Własności gęstości normalnej: Symetryczna względem, ( x), ( x), dla wszystkich x Maksimum w punkcie Parametr jest modą, średnią i medianą Standardowe odchylenie =

GĘSTOŚĆ NORMALNA N(0,1) 0,4 0,3 0,2 0,1 0-5 -3-1 1 3 5

Wykresy gęstości normalnych N(2,2) oraz N(2,1) 0,4 0,3 2,1 2,2 0,2 0,1 0-8 -4 0 4 8 12

Wykresy gęstości normalnych 0,4 0,3 0,2 N(0,2) N(2,1) N(2,2) 0,1 0-10 -6-2 2 6 10 14

Określenie: Cecha X ma rozkład normalny z parametrami,, jeśli krzywa gęstości cechy jest wykresem gęstości normalnej:,. Zapis: X N (, ) Standardowa gęstość normalna: gęstość normalna z parametrami 0, 1: Oznaczenie:. 0,1 : =

Standaryzacja Niech X ~ N(, ). Wówczas ( X ) Z ~ N(0,1) Rozkład cechy Z nazywamy standardowym Reguła pięciu procent: rozkładem normalnym. Pole pod wykresem gęstości normalnej o parametrach, dla przedziału ( 2, 2 ) jest równe 0,95. Stąd pole pod wykresem na zewnątrz tego odcinka wynosi 0,05.

Interpretacja. Przy dużej liczności próbki, jeśli cecha ma rozkład normalny, to częstość obserwacji w ( - 2, + 2) 0,95: 95% elementów w ( - 2, + 2). Podobnie: częstość obserwacji w ( - 3, + 3) 0,9972 ( jest to tzw prawo trzech sigm ).

Jeśli X ~ N(, ), to częstość obserwacji w przedziale ( a, b) pole pod wykresem gęstości na ( a, b) = b a b, ( x ) dx 0, 1( z) dz. a 0 < x < b: (a - )/ < z = ( x - )/ < (b -)/

Przykład. Wiadomo, że wzrost dorosłych Polaków jest cechą ciągłą o rozkładzie N (176,6,5 ). Jaki procent dorosłych Polaków ma wzrost powyżej 195 cm? 176,6,5( x) dx ( z) dz = 195 195176 6,5 ( z) dz = 2,92 2,92 1 ( z) dz 1 (2,92) 1 0,9982 0,0018.

Definicja Dystrybuantą standardowej gęstości normalnej nazywamy funkcję: x ( x ) ( z) dz. Kwantyl rzędu p gęstości ( dystrybuanty )standardowej normalnej (0 < p <1 ) ( ) p. q p

Obliczanie kwantyla: Przy jakim wzroście x znajdziemy się wśród 10 % najniższych Polaków? Przy wzroście x q 0, 1 = kwantyl rzędu 0,1 dla N (176,6,5) : q 0,1 (1),6,5 q 0,1 6,5 176 176 ( x) dx ( z) dz 0, 1 1,29 (2) ( z) dz 0,1.

Ponieważ ( z) 0 mamy z (1) i (2): q 0,1 176 6,5 1,29, czyli q 167, 6 (cm). 0,1 10 % dorosłych Polaków ma nie więcej niż 167,6 cm wzrostu.

Zadanie. X ~ N(30,5) ( np. X = dochód w tys. zł. ). (a) Jaka jest w przybliżeniu częstość obserwacji nie przekraczających 20 ( w licznych próbkach)? Częstość obserwacji 20 (2) =1 (2) = 1-0,9772 = 0, 0228. 2030 20 5 30,5( x) dx = ( z) dz = (b) Znaleźć kwantyle: q 0, 25, q 0, 75

Zadanie. Wiadomo, że kwantyle rzędu 0,1 i 0,2 rozkładu standardowego normalnego wynoszą: z 1,285 i 0, 845 0,1 z 0,2. (a) Znaleźć kwantyle 0, 1 q i 0, 2 q rozkładu N(70,10). (b) Wiadomo, że waga dorosłego mężczyzny w danym rejonie ma rozkład N(70,10). Jaką wagę przekracza 20% dorosłych mężczyzn?.

WYKRESY KWANTYLOWE. X Niech X ~ N(, ). Wówczas Z ~ N(0,1) Niech x p oraz z p będą kwantylami rzędu p gęstości cech X oraz Z, odpowiednio. Zatem: x p (1), (x)dx = p = (z)dz x p z p (2), (x)dx = (z)dz x p

Z równości (1) i (2): (z) > 0, więc: równoważnie: x p z p ( z)dz = (z)dz = p x x p z p, p z p.

i n Dla p, i 1,2,..., n 1, Niech x 1 : n x2: n... xn: n elementami próbki x i n z i. n będą uporządkowanymi dużego n: x i:n x i /n. 1, x2 xn ( x i) x i : n x,..., Wykres kwantylowy:, z ) punktów (, z ) x i i, i 1,2,..., n 1 n n ( x i: n i, 1,2,..., n 1 n x z (, i = 1,..,n) Dla i bliski wykresowi, leżących na prostej, gdyż

x p z, p i p. n Zatem punkty wykresu kwantylowego są położone blisko prostej x z, przy założeniu że elementy próbki są obserwacjami cechy o rozkładzie normalnym N (, ), otrzymywanymi niezależnie.

99,9 99 95 80 50 20 5 0,1 1-2,2-1,2-0,2 0,8 1,8 2,8 3,8

99,9 99 95 80 50 20 5 0,1 1 0 1 2 3 4 5

99,9 99 95 80 50 20 5 0,1 1-1 -0,6-0,2 0,2 0,6 1

Wszystkie zadania dot. rozkładu normalnego w których należy policzyć prawdopodobieństwo sprowadzają się tak naprawdę do kilku przypadków, które tutaj omówimy. Do każdego przypadku będzie dołączony rysunek ilustrujący podane prawdopodobieństwo oraz wzór. Na kolokwium wystarczy pamiętać wzór jednak w stresie można zapomnieć wzoru więc warto przeanalizować obrazki i wyrobić sobie intuicję dotyczącą rozkładu normalnego.