Statystyka Matematyczna Anna Janicka

Podobne dokumenty
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Agata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne.

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

1 Podstawy rachunku prawdopodobieństwa

Pozyskiwanie wiedzy z danych

W1. Wprowadzenie. Statystyka opisowa

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Próba własności i parametry

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

POJĘCIA WSTĘPNE. STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych.

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Statystyka matematyczna i ekonometria

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

Rachunek Prawdopodobieństwa Anna Janicka

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Ćwiczenia 1-2 Analiza rozkładu empirycznego

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Wykład ze statystyki. Maciej Wolny

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Wykład 4: Statystyki opisowe (część 1)

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

Analiza struktury i przeciętnego poziomu cechy

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

Wprowadzenie Pojęcia podstawowe Szeregi rozdzielcze STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP.

Statystyka Opisowa WK Andrzej Pawlak. Intended Audience: PWR

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2013/2014

Miary statystyczne w badaniach pedagogicznych

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

Laboratorium 3 - statystyka opisowa

Statystyka matematyczna SYLABUS

przedmiot podstawowy obowiązkowy polski drugi

Transport II stopień (I stopień / II stopień) Ogólnoakademicki (ogólno akademicki / praktyczny) Studia stacjonarne (stacjonarne / niestacjonarne)

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0

Z-ZIPN1-004 Statystyka. Zarządzanie i Inżynieria Produkcji I stopień Ogólnoakademicki Niestacjonarne Wszystkie Katedra Matematyki dr Zdzisław Piasta

Rachunek Prawdopodobieństwa Anna Janicka

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2012/2013

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Estymacja parametrów rozkładu cechy

Statystyczne metody analizy danych

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

You created this PDF from an application that is not licensed to print to novapdf printer (

Statystyczne metody analizy danych. Agnieszka Nowak - Brzezińska

Z-LOGN1-006 Statystyka Statistics

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyka opisowa. Robert Pietrzykowski.

Statystyka. Wykład 1. Magdalena Alama-Bućko. 20 lutego Magdalena Alama-Bućko Statystyka 20 lutego / 19

Przedmiot statystyki. Graficzne przedstawienie danych.

Z-0033z Statystyka. Zarządzanie i Inżynieria Produkcji I stopień Ogólnoakademicki. Stacjonarne Wszystkie Katedra Matematyki dr Zdzisław Piasta

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2012/2013

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Podstawowe funkcje statystyki: informacyjna, analityczna, prognostyczna.

Miary w szeregach. 1 Miary klasyczne. 1.1 Średnia Średnia arytmetyczna

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

MATEMATYKA3 Mathematics3. Elektrotechnika. I stopień ogólnoakademicki. studia stacjonarne. Katedra Matematyki dr Zdzisław Piasta

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY

zbieranie porządkowanie i prezentacja (tabele, wykresy) analiza interpretacja (wnioskowanie statystyczne)

Estymacja punktowa i przedziałowa

Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła

Podstawowe pojęcia statystyczne

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO

Spis treści 3 SPIS TREŚCI

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

STATYSTYKA MATEMATYCZNA

Statystyka. Šukasz Dawidowski. Instytut Matematyki, Uniwersytet l ski

Statystyka. Opisowa analiza zjawisk masowych

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Matematyka z el. statystyki, # 1 /Geodezja i kartografia II/

Opis programu studiów

STATYSTYKA Statistics. Inżynieria Środowiska. II stopień ogólnoakademicki

WYŻSZA SZKOŁA MENEDŻERSKA W WARSZAWIE WYDZIAŁ ZARZĄDZANIA W CIECHANOWIE KARTA PRZEDMIOTU - SYLABUS

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

Inżynieria danych I stopień Praktyczny Studia stacjonarne Wszystkie specjalności Katedra Ekonomii i Finansów Dr Katarzyna Brzozowska-Rup

Transkrypt:

Statystyka Matematyczna Anna Janicka wykład I, 22.02.2016 STATYSTYKA OPISOWA, cz. I

Kwestie techniczne Kontakt: ajanicka@wne.uw.edu.pl Dyżur: strona z materiałami z przedmiotu: wne.uw.edu.pl/azylicz akson.sgh.waw.pl/~aborata Podręczniki: Niemiro, Kornacki & Mielniczuk, Jóźwiak & Podgórski zbiory zadań: Boratyńska +info w sylabusie

Reguły zaliczenia 1. Dowolny z wykładów. Obecność ZALECANA. Za obecności (3/4 sprawdzonych) dodatkowy punkt na egzaminie. 2. na egzaminie zakres materiału z wykładu + ćw. 3. Ćwiczenia OBOWIĄZKOWE(max. 3 nieobecności) 4. Zaliczenie ćwiczeń: połowa punktów z 2 kolokwiów i 3 niezapowiedzianych kartkówek. 5. Ocena z ćwiczeń: punkty + ew. aktywność (w gestii ćwiczeniowca) 6. Do egzaminu dopuszczeni wszyscy, którzy chodzili na ćw. 7. Egzamin: 8 zadań, każde po 2 pkt. Ocena z egzaminu =liczba zdobytych punktów (tu punkt za obecność) /3 8. Ocena końcowa= max{ocena z egzaminu, 1/3* ocena z cwiczeń+2/3* ocena z egzaminu}, zaokrąglona. Przy czym osoba mająca 2 z ćwiczeń musi mieć >= 9 pkt z egz. 9. Gdy w I terminie >=7 pkt z egz., zaliczone ćwiczenia.

Czego można się spodziewać Materiały do wykładu, przykłady etc. na stronie www Pod koniec semestru info, jaki zakres materiału obowiązuje na egzaminie

Tematyka zajęć plan semestru Indeksy Statystyka opisowa Model statystyczny, wnioskowanie statystyczne, pojęcie statystyki Estymacja, własności estymatorów Weryfikacja hipotez statystycznych, różne rodzaje testów Estymacja Bayesowska

Plan na dzisiaj 1. Wstęp 2. Statystyka opisowa: podstawowe pojęcia prezentacja danych charakterystyki próbkowe miary położenia

Czym się różni Statystyka od Statystyki Matematycznej? Statystyka: nauka, której przedmiotem jest pozyskiwanie i analizowaniedanych dotyczących zjawisk masowych historycznie: już starożytność, potem różne spisy, opis stanu państwa Statystyka Matematyczna: statystyka z matematycznego punktu widzenia, tj. dział matematyki stosowanej w którym opisuje się zjawiska przy pomocy narzędzi m.in. rachunku prawdopodobieństwa historycznie: wraz z początkami rachunku pstwa: Pascal, Fermat, Gauss

Statystyka opisowa Opis danych w kategoriach ilościowych. Dane dotyczą próbyz pewnej populacji, badanych pod kątem cechy(lub cech) Cechy mierzalne niemierzalne ciągłe skokowe quasi-ciągłe

Badanie pełne dotyczy całej populacji reprezentacyjne dotyczy wybranej części populacji; próba populacja w takim przypadku wnioskowanie wymaga założeń oraz wykorzystania narzędzi rachunku prawdopodobieństwa

Prezentacja danych Cel: jak największa przejrzystość Zależy od rodzaju cechy tabelaryczna graficzna

Przykład 1 cecha skokowa Oceny z egzaminu z RP w roku 2015/2016 (168 osób piszących w I terminie) 3,5 3 3 2 2 3 2 3 2 2 2 3 2 3,5 3 3,5 4 2 2 2 3,5 2 3 3 2 2 3 3 2 4,5 4,5 3 2 2 2 2 2 2 4,5 3 3,5 3 2 4 2 4,5 3 2 3,5 4 2 3,5 2 3 2 3,5 2 3 3,5 3,5 2 2 4 3 2 3,5 3 2 3 3,5 2 2 2 2 3 3,5 3,5 2 3,5 3,5 2 4 3,5 3 3 2 2 3 5 3,5 2 3,5 3,5 4,5 3 3,5 5 5 3 4 2 3 2 2 4,5 2 2 3 2 3 3 2 3 2 3,5 2 3 2 3 2 2 3,5 3 4 3 2 2 2 2 2 3,5 4 2 3,5 4 2 3,5 2 3,5 2 2 2 3 5 2 2 2 3 4,5 4 3 3,5 3,5 3 2 4 2 3 3,5 3 3,5 2 3 3,5 2 2 3 2

Tablica kontyngencji Szereg rozdzielczy punktowy Wartość cechy Liczebność Częstość x 1 n 1 f 1 =n 1 /n x 2 n 2 f 2 =n 2 /n x 3 n 3 f 3 =n 3 /n......... x k n k f k =n k /n Razem n 1

Przykład 1 cd. Ocena Liczebność Częstość 2 72 0,429 3 42 0,250 3,5 32 0,190 4 11 0,065 4,5 7 0,042 5 4 0,024 Razem 168 1,000 Średnia arytmetyczna przykłady Mediana przykłady Moda przykłady Kwartyle przykłady Wariancja przykłady

Przykład 1 cd. (2). Wykresy słupkowe liczebności i częstości

Przykład 2 cecha niemierzalna Wykształcenie ojca dla próby 32 studentów III roku WNE Wykształcenie ojca Liczebność Częstość zasadnicze zawodowe 5 0,16 średnie ogólnokształcące 4 0,13 średnie zawodowe 6 0,19 wyższe 17 0,53 Razem 32 1,00

Przykład 2 cd. Wykres kołowy Wykształcenie ojca 53% 16% 12% 19% zasadn. zaw. śr. ogóln. śr. zawod. wyższe

Przykład 3 cecha ciągła lub quasi-ciągła Powierzchnia mieszkań na pewnym osiedlu, n=100 32,45 33,21 34,36 35,78 37,79 38,54 38,91 38,96 39,5 39,67 39,8 41,45 41,55 42,27 42,4 42,45 44,25 44,5 44,7 44,83 44,9 45,1 45,9 46,52 47,65 48,1 48,55 48,9 49 49,24 49,55 49,65 49,7 49,9 50,9 51,4 51,5 51,65 51,7 51,8 51,98 52 52,1 52,3 53,65 53,89 53,9 54 54,1 55,2 55,3 55,56 55,62 56 56,7 56,8 56,9 56,95 57,13 57,45 57,7 57,9 58 58,5 58,67 58,8 59,23 63,4 63,7 64,2 64,3 64,6 65 66,29 66,78 67,8 68,9 69 69,5 73,2 76,8 77,1 77,8 78,9 79,5 82,7 83,4 84,5 84,9 85 86 89,1 89,6 93 96,7 98,78 103 107,9 112,7 118,9 Źródło: A. Boratyńska, Wykłady ze statystyki matematycznej

Szereg rozdzielczy przedziałowy Przedział Liczebność Środek przedziału Liczebność Częstość skumulowana cn i Częstość skumulowana cf i c 1 (c 0,c 1 ] n 1 f 1 =n 1 /n n 1 f 1 (c 1, c 2 ] c 2 n 2 f 2 =n 2 /n n 1 +n 2 f 1 +f 2 (c 2, c 3 ] c 3 n 3 f 3 =n 3 /n n 1 +n 2 +n 3 f 1 +f 2 +f 3......... (c k-1, c k ] n k f k =n k /n Σ n i =n Σ f i =1 c k Razem n 1 Dobór klas (granic przedziałów): najczęściej jednakowej długości lub zbliżonej liczności

Przykład 3 cd. Przedział Środek przedziału Liczebność Częstość Liczebność skumulowana Częstość skumulowana (30,40] 35 11 0,11 11 0,11 (40,50] 45 23 0,23 34 0,34 (50,60] 55 33 0,33 67 0,67 (60,70] 65 12 0,12 79 0,79 (70,80] 75 6 0,06 85 0,85 (80,90] 85 8 0,08 93 0,93 (90,100] 95 3 0,03 96 0,96 (100,110] 105 2 0,02 98 0,98 (110,120] 115 2 0,02 100 1 Razem 100 1 Średnia arytmetyczna przykłady Mediana przykłady Moda przykłady Kwartyle przykłady Wariancja przykłady

Przykład 3 cd. (2) Histogram liczebności i histogram częstości

Przykład 3 cd. (3) Histogram częstości i łamana częstości

Przykład 3 cd. (4) Histogram częstości skumulowanej i łamana częstości skumulowanej 1,2 1 Częstość 0,8 0,6 0,4 0,2 0 25 35 45 55 65 75 85 95 105 115 Powierzchnia Częstość 1,2 1 0,8 0,6 0,4 0,2 0 30 40 50 60 70 80 90 100 110 120 Powierzchnia

Przykład 1 cd. (3) Dystrybuanta empiryczna Częstość 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5

Charakterystyki próbkowe Opisują różne własności rozkładów mierzalnych Miary położenia zróżnicowania (zmienności, rozproszenia, dyspersji) asymetrii koncentracji Typy: klasyczne (oparte o momenty) pozycyjne

Miary położenia Klasyczne: średnia arytmetyczna Pozycyjne: mediana moda (dominanta) kwantyle

Średnia arytmetyczna dane surowe: X = 1 n i= 1 dane z szeregu rozdzielczego punktowego: k dane z szeregu rozdzielczego przedziałowego: k X X = 1 n 1 n n i= 1 i= 1 X i x i n i c i n i

Średnia arytmetyczna przykłady Przykład 1 cd. Przykład 1: X = 2 72+ 3 42+ 3,5 32+ 168 4 11+ 4,5 7+ 5 4 2,842 Przykład 3: Przykład 3 cd. X 35 11+ 45 23 + 55 33 + 65 12+ 75 6+ 85 8 100 + 95 3 + 105 2+ 115 2 = 58,7 a naprawdę: X =59,58 tylko jeśli nie ma danych surowych!

Mediana Mediana(wartość środkowa) taka wartość, że co najmniej 50% wartości w próbie nie mniejsze i co najmniej 50% wartości w próbie nie większe od niej dane surowe, szereg rozdzielczy punktowy: Med = 1 2 ( X n 2 X : n n+ 1 2 + : n X n 2 + 1: n parzyste gdzie X i:n jest i-tą statystyką pozycyjną, tj. i-tą wartością uszeregowanej rosnąco próby ) n nieparzyste n

Mediana cd. dla szeregu rozdzielczego przedziałowego: gdzie: Med c M numer klasy mediany c L dolny koniec klasy mediany L + b rozpiętość (długość) klasy mediany n b M n 2 M 1 i= 1 n i

Mediana przykłady Przykład 1: Med Przykład 3: 1 1 = X X 2 2 + = 84 :168 85:168 M=3, n 3 =33, c L =50, b=10 3 Przykład 1 cd. Przykład 3 cd. Med 50+ 33 10 (50 34) 54,85 a naprawdę: Med = 55,25

Moda Moda(dominanta, wartość modalna) wartość najczęściej pojawiająca się w próbie dla szeregu rozdzielczego punktowego: Mo = wartość najczęstsza dla szeregu rozdzielczego przedziałowego Mo c L + n n n Mo n ) + ( n Mo 1 gdzie n Mo liczebność klasy dominanty, c L, b dla dominanty analogicznie do mediany n ( Mo Mo 1 Mo Mo+ 1 b )

Moda przykłady Przykład 1: Mo = 2 Przykład 3: Przykład 1 cd. Przykład 3 cd. przedział dominanty to (50,60], o liczebności 33 n Mo = 33, c L = 50, b = 10, n Mo-1 = 23, n Mo+1 = 12 Mo 33 23 50+ 10 (33 23) + (33 12) 53,23

Którą miarę stosować? Średnia arytmetyczna: do szeregów typowych (jedno max, częstości monotoniczne) Dominanta: do szeregów typowych, danych pogrupowanych, długości przedziału dominanty i sąsiednich powinny być równe Mediana: nie ma ograniczeń. Najbardziej odporna na zaburzenia, niedokładności pomiaru, zmiany, wartości odstające

Kwantyle, kwartyle p-ty kwantyl (kwantyl rzędu p): odsetek wartości nie większych niż on wynosi co najmniej p, a wartości nie mniejszych co najmniej 1-p Q 1 : Pierwszy kwartyl = kwantyl rzędu ¼ Drugi kwartyl = mediana = kwantyl rzędu ½ Q 3 : Trzeci kwartyl = kwantyl rzędu ¾

Kwantyle cd. Kwantyl próbkowy rzędu p: Q p = X np: n X + 2 X [ np] + 1: n np+ 1: n np np Z Z

Kwartyle cd. Kwantyle dla p= ¼ i p= ¾. Dla szeregu rozdzielczego przedziałowego: wzór jak dla mediany Q k c dla k=1 lub 3, odpowiednio gdzie M 1, M 3 numer klasy kwartyla b szerokość klasy kwartyla L c L dolny koniec klasy kwartyla + b n M k k n 4 Mk 1 i= 1 n i

Q Kwartyle przykłady Przykład 1: 168 42 168 3 4= 4 a więc 1 = Przykład 3: 100 25 100 3 4= 4 126 ( ) 1 X + X =, Q = ( X + ) 3, 5 1 1 = 2 2 42:168 43:168 3 2 126:168 X127: 168 = 1 = M1 = 2, M3 = 4 a więc 75 Przykład 1 cd. Przykład 3 cd. 10 10 Q1 40+ (25 11) 40,09 Q3 60+ (75 67) 66,67 23 12