Plan wykładu. Analiza danych Wykład 1: Statystyka opisowa. Literatura. Podstawowe pojęcia

Podobne dokumenty
Podstawowe pojęcia. Próba losowa. Badanie próby losowej

Podstawowe pojcia. Metody probabilistyczne i statystyka Wykład 7: Statystyka opisowa. Rozkłady prawdopodobiestwa wystpujce w statystyce.

Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)

Miary położenia (tendencji centralnej) to tzw. miary przeciętne charakteryzujące średni lub typowy poziom wartości cechy.

Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste

Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).

STATYSTYKA OPISOWA WYKŁAD 1 i 2

Statystyczny opis danych - parametry

3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej

Estymacja przedziałowa

Miary położenia. Miary rozproszenia. Średnia. Wariancja. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.

STATYSTYKA OPISOWA PODSTAWOWE WZORY

STATYSTYKA OPISOWA PODSTAWOWE WZORY

Wybrane litery alfabetu greckiego

Histogram: Dystrybuanta:

X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

d wymiarowy wektor losowy Niech (Ω, S, P) przestrzeń probabilistyczna Definicja Odwzorowanie X: Ω R nazywamy 1-wymiarowym wektorem

Miary rozproszenia. Miary położenia. Wariancja. Średnia. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.

Estymacja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 7

STATYSTYKA MATEMATYCZNA

Statystyka i Opracowanie Danych. W7. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

Statystyka i rachunek prawdopodobieństwa

COLLEGIUM MAZOVIA INNOWACYJNA SZKOŁA WYŻSZA WYDZIAŁ NAUK STOSOWANYCH. Kierunek: Finanse i rachunkowość. Robert Bąkowski Nr albumu: 9871

Elementy modelowania matematycznego

Statystyka powtórzenie (I semestr) Rafał M. Frąk

STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr inż Krzysztof Bryś

Charakterystyki liczbowe zmiennych losowych: wartość oczekiwana i wariancja

Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

Rozkład normalny (Gaussa)

Wykład nr 2. Statystyka opisowa część 2. Plan wykładu

Wykład 11 ( ). Przedziały ufności dla średniej

Statystyka opisowa. () Statystyka opisowa 24 maja / 8

Ćwiczenie 2 ESTYMACJA STATYSTYCZNA

1 Zmienne losowe. Własności dystrybuanty F (x) = P (X < x): F1. 0 F (x) 1 dla każdego x R, F2. lim F (x) = 0 oraz lim F (x) = 1,

1 Dwuwymiarowa zmienna losowa

Statystyka matematyczna. Wykład II. Estymacja punktowa

ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA

Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.

STATYSTYKA I ANALIZA DANYCH

Estymacja: Punktowa (ocena, błędy szacunku) Przedziałowa (przedział ufności)

STATYSTKA I ANALIZA DANYCH LAB II

W1. Wprowadzenie. Statystyka opisowa

Ćwiczenie nr 14. Porównanie doświadczalnego rozkładu liczby zliczeń w zadanym przedziale czasu z rozkładem Poissona

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Zdarzenia losowe, definicja prawdopodobieństwa, zmienne losowe

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o

Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja

PODSTAWY BIOSTATYSTYKI ĆWICZENIA

Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2

Kurs Prawdopodobieństwo Wzory

ANALIZA DANYCH DYSKRETNYCH

Zestaw II Odpowiedź: Przeciętna masa ciała w grupie przebadanych szczurów wynosi 186,2 g.

Statystyka Opisowa. w2: podstawowe miary. Jerzy Stefanowski Instytut Informatyki Politechnika Poznańska. Poznań, 2015/16 aktualizacja 2017

0.1 ROZKŁADY WYBRANYCH STATYSTYK

Metrologia: miary dokładności. dr inż. Paweł Zalewski Akademia Morska w Szczecinie

Statystyka w rozumieniu tego wykładu to zbiór metod służących pozyskiwaniu, prezentacji, analizie danych.

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

Prawdopodobieństwo i statystyka r.

TESTY LOSOWOŚCI. Badanie losowości próby - test serii.

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Materiały do wykładu 4 ze Statystyki

Estymacja przedziałowa:

Pojcie estymacji. Metody probabilistyczne i statystyka Wykład 9: Estymacja punktowa. Własnoci estymatorów. Rozkłady statystyk z próby.

Lista 6. Estymacja punktowa

1 Twierdzenia o granicznym przejściu pod znakiem całki

SIGMA KWADRAT LUBELSKI KONKURS STATYSTYCZNO- DEMOGRAFICZNY

Statystyka w pracy badawczej nauczyciela

ZDARZENIE ELEMENTARNE to możliwy wynik doświadczenia losowego. Wszystkie takie możliwe wyniki tworzą zbiór zdarzeń elementarnych.

1 Podstawy rachunku prawdopodobieństwa

Estymacja punktowa i przedziałowa

STATYSTYKA MATEMATYCZNA

WYKŁAD 1. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

Statystyka. Wykład 1. Magdalena Alama-Bućko. 20 lutego Magdalena Alama-Bućko Statystyka 20 lutego / 19

Laboratorium 3 - statystyka opisowa

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Prawdopodobieństwo i statystyka

Jak obliczać podstawowe wskaźniki statystyczne?

INFORMATYKA W CHEMII Dr Piotr Szczepański

Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w

1 Testy statystyczne. 2 Rodzaje testów

Statystyka Matematyczna Anna Janicka

Ćwiczenia nr 5. TEMATYKA: Regresja liniowa dla prostej i płaszczyzny

Parametryczne Testy Istotności

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Modele tendencji rozwojowej STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 18 listopada 2017

KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1

Statystyka opisowa - dodatek

Statystyka matematyczna dla leśników

Estymacja parametrów populacji

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Statystyka i opracowanie danych W3: Wprowadzenie do statystycznej analizy danych Podstawy wnioskowania statystycznego. Estymacja i estymatory

14. RACHUNEK BŁĘDÓW *

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Rozkłady statystyk z próby Twierdzenia graniczne

Podstawowe pojęcia statystyczne

O liczbach naturalnych, których suma równa się iloczynowi

Transkrypt:

Pla wykładu Aaliza daych Wykład : Statystyka opisowa. Małgorzata Krętowska Wydział Iformatyki Politechika Białostocka. Statystyka opisowa.. Estymacja puktowa. Własości estymatorów.. Rozkłady statystyk z próby.. Przedziały ufości.. Testy istotości. 6. Aaliza regresji. 7. Aaliza wariacji. 8. Testy ieparametrycze. Testy zgodości. e-mail: m.kretowska@pb.edu.pl stroa www: http://aragor.pb.bialystok.pl/~gkret Literatura Krysicki W., Bartos J., i ii., Rachuek prawdopodobieństwa i statystyka matematycza część II, Wydawictwo Naukowe PWN, Warszawa 997. Sobczyk Mieczysław: Statystyka, Wydawictwo Naukowe PWN, Warszawa, 996. Plucińska A., Pluciński E.: Probabilistyka, Wydawictwo Naukowo- Techicze, Warszawa Koroacki J, Mieliczuk J., Statystyka dla studetów kieruków techiczych i przyrodiczych, Wydawictwo Naukowo- Techicze, Warszawa Podstawowe pojęcia Populacja geerala - zbiór elemetów mający przyajmiej jedą właściwość wspólą dla wszystkich jego elemetów kwalifikującą je do tego zbioru oraz przyajmiej jedą właściwość, ze względu a którą elemety tego zbioru mogą się różić między sobą. komplete dostarcza pełej iformacji o badaej cesze, często jest iewykoale, czasochłoe (badaie % populacji) Badaie cechy populacji częściowe wiskowaie o właściwościach populacji a podstawie iformacji z pewego skończoego podzbioru tzw. próby losowej

Próba losowa Próba losowa prosta elemetowa to ciąg iezależych zmieych losowych X, X,.., X o jedakowym rozkładzie, takim jak rozkład zmieej losowej X w populacji. Przykład badaia częściowego? Typy daych Dae ilościowe (mierzale) uzyskae w wyiku pomiaru, wyrażae w skali liczbowej; mogą być ciągłe tz. przyjmują dowole wartości z pewego przedziału liczbowego (p. wiek, wzrost, stężeie cholesterolu całkowitego we krwi) lub dyskrete, gdy przyjmują wartości liczb całkowitych (p. liczba dzieci w rodziie, liczba zachorowań a grypę w roku) Dae jakościowe (iemierzale) określae przez azwę; wyrażae w skali omialej (p. płeć, sta cywily) lub porządkowej (p. wykształceie, samoocea stau zdrowia) Skale pomiarowe omiala dae są azywae (p.: kobiety-męzczyźi, samoti-żyjący w parach); ie ma określoego porządku; etykiety adawae są arbitralie porządkowa ustaloy jest aturaly porządek, ale różica pomiędzy wartościami ie ma zaczeia (p.: samoocea stau zdrowia, poziom wykształceia) iterwałowa ustaloy jest aturaly porządek, ale skala jest stała i ie występuje aturale zero; różica między wartościami ma ses, ale iloraz dwóch wartości ie (p. temperatura zero ustaloe jest arbitralie) (p.: - = -, ale / ie ozacza trzykrotego wzrostu temperatury) ilorazowa ustaloy jest aturaly porządek, skala jest stała i występuje aturale zero (p.:wiek, ciężar ciała, wzrost) Badaie próby losowej Niech x, x,..., x będzie elemetową próbą losową. Gdy wartości próby grupuje się w tzw. klasy - są to przedziały ajczęściej jedakowej długości. Przyjmuje się upraszczające założeie, że wszystkie wartości zajdujące się w daej klasie są idetycze ze środkiem klasy. Liczbę wartości próby zawartych w i-tej klasie azywamy liczością i-tej klasy i. K =, i gdzie K liczba klas W wyiku podziału próbki a klasy otrzymuje się SZEREG ROZDZIELCZY, który staowią pary liczb: środki klas oraz ich liczości. x i, ) ( i

Szereg rozdzielczy Liczba klas zależy od liczby pomiarów : - liczość K- liczba klas -6 6-8 6-7- - 9- Rozkłady empirycze Rozkłady empirycze cechy skokowej cechy ciagłej wielomodale jedomodale jedomodale wielomodale Graficza reprezetacja szeregu rozdzielczego: i histogram Wielobok czestosci symetrycze Rozkłady jedomodale umiarkowaie asymetrycze skrajie asymetrycze ormale leptokurtycze (wysmukłe) platokurtycze (spłaszczoe) prawoskośe lewoskośe prawoskośe lewoskośe x x x x i Modalość Symetria liczosc liczosc liczosc liczosc........ rozklad jedomodaly.......... rozklad dwumodaly....... rozklad symetryczy....... rozklad umiarkowaie asymetryczy prawoskosy liczosc liczosc liczosc........... 6. rozklad wielomodaly..... rozklad amodaly..... rozklad skrajie asymetryczy lewoskosy

Współczyik asymetrii (ag. skewess) Współczyik spłaszczeia (kurtoza) A = ( ( xi s = ( x i )( ) s ( + ) ( xi K = ( )( )( ) s ( ) ( )( ) A= - rozkład symetryczy A> - asymetria prawostroa (rozkład prawoskośy) A< - asymetria lewostroa (rozkład lewoskośy) A > - rozkład skrajie asymetryczy K= - rozkład ormaly K> - rozkład leptokutryczy K< - rozkład platokutryczy leptokutryczy ormaly platokurtyczy x mi - wartość miimala x max - wartość maksymala R=x max - x mi - rozstęp (ag. rage) Miary cetrale: średia arytmetycza - wartość średia z próby x = x i - miary cetrale mediaa -środkowa liczba w uporządkowaej iemalejąco próbce, gdy ieparzyste lub średia arytmetycza dwóch środkowych liczb, gdy parzyste Iterpretacja: x () x ()... x () x( + )/ ieparzyste me = ( x( / ) + x(( / ) + ) ) parzyste co ajmiej % wartości cechy jest me lub co ajmiej % wartości cechy jest me

- miary cetrale domiata (moda, wartość modala) - ajczęściej powtarzająca się wartość w próbce, o ile istieje ie będąca x mi ai x max. Miary zróżicowaia wariacja s = ( x i sˆ = ( x i W przypadku rozkładów symetryczych x śr =me=do. odchyleie stadardowe s = im zróżicowaie elemetów jest większe tym s jest większe. s określa o ile wszystkie jedostki daej zbiorowości różią się średio od średiej arytmetyczej badaej zmieej. s s ˆ = sˆ Możemy wykorzystać je do budowy typowego obszaru zmieości: x s < xtyp < x + s mieści się w im około / wszystkich jedostek. kwartyl doly Q P(X Q ). i P(X Q ).7 Iterpretacja: co ajmiej % wartości cechy jest Q lub co ajmiej 7% wartości cechy jest Q kwartyl góry Q P(X Q ).7 i P(X Q ). Iterpretacja: co ajmiej 7% wartości cechy jest Q lub co ajmiej % wartości cechy jest Q