Statystyka stosowana. Podreczniki. Oceny. Przygotowanie do zajęć



Podobne dokumenty
Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

Oceny. Podreczniki. Dane. Statystyka matematyczna i stosowana

Schemat oceniania: Wstęp do statystyki praktycznej. Zalecane podręczniki: Dodatkowe uwagi: Przygotowanie studenta do zajęć:

Oceny. Statystyka stosowana. Podreczniki. Przygotowanie do zajęć. Dane

Oceny: Wstęp do statystyki praktycznej. Zalecane podręczniki: Dodatkowe uwagi:

Oceny: Statystyka stosowana. Zalecane podręczniki: Dane. Dodatkowe uwagi: Przygotowanie studenta do zajęć:

Wstęp do statystyki praktycznej. Semestr zimowy 2019/2020 Wykładowca: dr Damian Brzyski Strona internetowa:

Nowoczesne techniki matematyczne, statystyczne i informatyczne

Y \ X , 2 0, 1 0, 1 1 0, 1 0, 3 0, 2. E(XY ) = i,j. x i y j p ij. i wtedy. x i y j p (X) = i,j. y j p (Y ) i wtedy

2.Wstępna analiza danych c.d.- wykład z Populacja i próba

Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Przedmiot statystyki. Graficzne przedstawienie danych.

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Agata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne.

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

1 Podstawy rachunku prawdopodobieństwa

Wykład 4: Statystyki opisowe (część 1)

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Wykład 5: Statystyki opisowe (część 2)

Statystyka Matematyczna Anna Janicka

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Laboratorium 3 - statystyka opisowa

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Wykład Ćwiczenia Laboratorium Projekt Seminarium 30

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

Zadania ze statystyki, cz.6

Wykład 9 Wnioskowanie o średnich

Wykład 12: Tablice wielodzielcze

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Statystyka opisowa- cd.

Pozyskiwanie wiedzy z danych

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Badanie zależności zmiennych kolumnowej i wierszowej:

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

W1. Wprowadzenie. Statystyka opisowa

WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

dev = y y Miary położenia rozkładu Wykład 9 Przykład: Przyrost wagi owiec Odchylenia Mediana próbkowa: Przykłady Statystyki opisowe Σ dev i =?

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Estymacja parametrów w modelu normalnym

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka matematyczna i ekonometria

Z poprzedniego wykładu

Statystyczne metody analizy danych

MODELE LINIOWE. Dr Wioleta Drobik

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

1.1 Wstęp Literatura... 1

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Wykład 3: Statystyki opisowe - miary położenia, miary zmienności, miary asymetrii

Analiza statystyczna w naukach przyrodniczych

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład Przedmiot statystyki

Statystyczne metody analizy danych. Agnieszka Nowak - Brzezińska

Przedmiot statystyki. Graficzne przedstawienie danych.

Inżynierskie zastosowania statystyki Czyli co i jak andrzej.rusiecki.staff.iiar.pwr.wroc.pl s.

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Miary zmienności STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.

Biostatystyka, # 1 /Weterynaria I/

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Generowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport

Wprowadzenie Pojęcia podstawowe Szeregi rozdzielcze STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP.

STATYSTYKA MATEMATYCZNA

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

STATYSTYKA MATEMATYCZNA

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Statystyki opisowe i szeregi rozdzielcze

Estymacja punktowa i przedziałowa

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

STATYSTYKA MATEMATYCZNA WYKŁAD grudnia 2009

You created this PDF from an application that is not licensed to print to novapdf printer (

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Wykład 10: Elementy statystyki

Metody Statystyczne. Metody Statystyczne.

Podstawowe definicje statystyczne

Transkrypt:

Statystyka stosowana Kurs dla Budownictwa Lądowego Semestr zimowy /9 Strona internetowa: http://im.pwr.wroc.pl/~mbogdan Wykładowca : Małgorzata Bogdan Biuro: C-, p.. Godziny konsultacji: pon. :-6:, wt. : : Telefon: Email: Malgorzata.Bogdan@pwr.wroc.pl Oceny Dwa kolokwia: 7 listopad, 9 styczeń (na wykładzie) +=pt Trzy kartkowki (6 X, 6 XI, I) = pt pt: dst, 7pt: db, 9pt: bdb. Kolokwium poprawkowe ( II) - zalicza kurs na ocenę najwyżej dst + Podreczniki Statystyka dla studentów kierunków technicznych i przyrodniczych, J. Koronacki, J. Mielniczuk, WNT, wyd. II Introduction to the Practice of Statistics, D. Moore, G. McCabe, Freeman, wyd. III Statistics for the Life Sciences, M. Samuels, J. Witmer,, wyd. III Listy zadań dostępne w internecie Część zadań pochodzi ze skryptu H. Jasiulewicz i W. Kordeckiego Rachunek prawdopodobieństwa i statystyka matematyczna. Przykłady i zadania", wyd. II. Proszę zaopatrzyć się w kalkulator Przygotowanie do zajęć Przeczytać ostatni wykład Rozwiązać obowiązującą listę zadań Można wydrukować bieżącą prezentację z Internetu, żeby ułatwić sobie śledzenie wykładu i notowanie Zachęcam do zadawania pytań

Dane Używamy danych, aby odpowiedzieć na pytania dotyczące badanych populacji Na ogół dane charakteryzują się losową zmiennością Oceniamy informację zawartą w danych Czym jest statystyka? Nauka rozumienia danych i podejmowania decyzji w obliczu losowości Zbiór metod do planowania eksperymentu i analizy danych tak, aby uzyskać maksimum informacji i ilościową ocenę ich wiarygodności Przykład Pewne badania dotyczą wpływu aktywności fizycznej na poziom cholesterolu. Jedna grupa ćwiczy, druga nie. Pytanie: Czy poziom cholesterolu jest niższy u osób, które ćwiczą? Czynniki mogące wpłynąć na wynik eksperymentu: Ludzie mają naturalnie różne poziomy cholesterolu Reagują różnie na ten sam reżimćwiczeń Różny stopień zaangażowania w realizacjęćwiczeń Wpływ diety Ćwiczenia mogą wpływać na inne czynniki, np. apetyt Przykład Eksperyment mikromacierzowy porównujący komórki rakowe i normalne. Czy dwukrotnie wyższy zaobserwowany poziom ekspresji genu dowodzi faktycznie różnej ekspresji? Czy mamy powtórzenia eksperymentu? Czy w powtórzeniach wyniki są podobne? Dlaczego dwukrotna zmiana, a nie trzy lub czterokrotna? Jak ustalić właściwą wartość krytyczną? Przykład Przykład Reakcja owiec na bakterie wąglika W artykule prasowym czytamy, że % pieszych będących ofiarami nocnych wypadków samochodowych nosiło ciemne ubrania, a % jasne ubrania. Wyciągnięto wniosek, że w nocy bezpiecznie jest nosić jasne ubrania. Czy przeprowadzone badania upoważniają do takiej konkluzji? Reakcja Śmierć Przeżycie Procent przetrwania Szczepione % Nie szczepione %

Przykład Rozwój raka wątroby u myszy Rak wątroby Zdrowa Suma Procent myszy z rakiem wątroby E. coli 6 % Wolne od zarazków 9 9 9 % Sygnał i szum Przykład brak zmienności (??): mocna konkluzja Przykład duża zmienność: słaba konkluzja Jak duża musi być próba, abyśmy w oparciu o nią mogli wywnioskować, że badany czynnik ma wpływ na wynik eksperymentu? Losowość Dane na ogół charakteryzują się zmiennością Matematycznie modelujemy tą zmienność używając rachunku prawdopodobieństwa Przykłady Prognoza pogody- prawdopodobieństwo deszczu wynosi % Prawdopodobieństwo urodzenia dziewczynki wynosi,9 Schemat badań naukowych Pytanie naukowe Planowanie eksperymentu Eksperyment / zbieranie danych Analiza danych Wnioski statystyczne Wnioski naukowe Próba, Zmienna Próba: Obserwacje lub wyniki eksperymentu Reprezentuje konkretną realizację eksperymentu Przykłady: Wysokość kłosów żyta ( obserwacji) Poziom(y) hemoglobiny u dawców Kolor i kształt ziaren grochu

Próba, Zmienna cd. Rozmiar próby: n np. n=, n=, n=6 Zmienna: to co mierzymy tu: wysokość, poziom hemoglobiny, kolor i kształt Rodzaje zmiennych Zmienne Jakościowe Ilościowe Porządkowe Nie porządkowe Ciągłe Dyskretne Zmienne jakościowe (kategoryczne) Jakościowe kwalifikujące do kategorii Porządkowe, np. wybory w ankiecie: nigdy, rzadko, czasami, często, zawsze Nie porządkowe, np.: kolor i kształt Zmienne ilościowe (liczbowe) Ilościowe wynik jest liczbą Ciągłe, np. wzrost, waga, stężenie Dyskretne, np. liczba wadliwych elementów, liczba gładkich i żółtych groszków Oznaczenia Zmienne: X,Y,Z; np.y=wzrost (pojęcie) Obserwacja: x,y,z; np. y=cm (wynik) Próba: y,y,,y n (wielokrotne obserwacje) Rozmiar próby: n, czasem n,n Próba a próbka Biolog mierzy poziom glukozy we krwi ludzi. próbek krwi? (biolog) Jedna próba pomiarów glukozy. (statystyk) Będziemy używali pomiar tam, gdzie biolog użyłby słowa próba.

Statystyki opisowe: Tabela częstości Wykres słupkowy (dane jakościowe) Groszki:gładkie/pomarszczone, zielone/żółte Klasy Liczba Gładkie, żółte Gładkie, zielone Pomarszczone, żółte Pomarszczone, zielone liczność round, yellow groszki generacji F round, green wrinkled, yellow wrinkled, green Wykres słupkowy Wykształcenie Podstawowe lub zawodowe Szkoła średnia Liczba (*).7. Procent..7 Szkoła policealna Licencjat.9... Wykształcenie wyższe. 6.6 Wykres kołowy Dane ilościowe dyskretne Liczba potomstwa u n=6 macior. Liczność miotu jest liczbą całkowitą (zmienna dyskretna).

Dane Rozkład liczebności 9 7 9 7 9 Liczba potomstwa 6 7 9 Liczba macior 9 Liczba (macior) 9 7 6 Histogram liczebności 6 7 9 Liczność miotu Histogram (liczebności) Grupowanie podobnych obserwacji zwykle jest pomocne Prawie zawsze postępujemy tak z danymi ciągłymi Definiujemy klasy (przedziały) obserwacji i zliczamy liczbę obserwacji wpadających do każdej klasy Jak wybierać klasy: Każda obserwacja musi wpadać do dokładnie jednej klasy (klasy rozłączne, pokrywają wszystkie możliwe wyniki) Rozmiar (szerokość) klas (przedziałów) jest zwykle taki sam Używamy wygodnych granic przedziałów, np. -9, a nie 9. 9.6 Używamy do klas dla umiarkowanych zbiorów danych (n ); więcej, gdy próba jest duża Przykład Dane : długość łodygi papryki (n=)....9......7..6.9. 6

Tabela liczebności (klas) Min=.9, max=., zakres=max-min=. Wybieramy szerokość klasy, np.. i początek., aby pokryć zakres... Zliczamy liczby wystąpień i rysujemy histogram. Ew. zmieniamy szerokość klas, aby uzyskać pożądany kształt Za mała szerokość klas=dużo szumu, za duża = utrata informacji. -. -. -. -. -. - Klasa.99.9.99.9.99.9 Liczność. -.99. -.9 Histogram liczebności Przykład: Stężenia serum CK Liczność 6. -. -. -. -. -. -. -. -,99,9,99,9,99,9,99,9 Klasa 9 9 6 7 6 9 67 6 9 6 7 9 6 9 7 9 Min=, max= Rozstęp =7 Szerokość klasy = Punkt początkowy= Serum CK - 9-9 6-79 - 99-9 - 9-9 6-79 - 99-9 Suma Liczność 7 6 7

Opis histogramu: Centralny szczyt (moda) w okolicach J/L Zasadnicza masa rozkładu między a J/L Niesymetryczny skośny na prawo Interpretacja pola powierzchni pod histogramem (przy równej szerokość klas) Nad odcinkiem 6 - J/L leży: % całkowitej powierzchni histogramu Do tego odcinka wpada: % ( z 6) wartości CK Nierówna szerokość klas Powierzchnia pod histogramem nie jest proporcjonalna do liczności W tak spaczonym histogramie (patrz dalej) powierzchnia między a J/L stanowi 9% całkowitej powierzchni (mimo, że te stężenia stanowią tylko % obserwacji) Rozwiązanie podzielić liczności przez długość odcinka (liczbę zgrupowanych klas) Oś Y na przekształconym histogramie średnia liczność (w zgrupowanych klasach)

Histogram częstości Często rysujemy histogram tak, że na osi pionowej zaznaczamy częstość (względną) =liczba wystąpień / n Histogram częstości jest użyteczny, zwłaszcza dla porównania zbiorów danych o różnych rozmiarach n L ic z n ość Histogram liczebności 6. -. -. -. -. -. -. -. -,99,9,99,9,99,9,99,9 Klasa C zę s tość Histogram częstości,,,,,,,. -. -. -. -. -. -. -. -,99,9,99,9,99,9,99,9 Długość łodygi Diagram łodygi i liścia (Stem and leaf plot) Jest to inny sposób podsumowania danych; zachowuje prawie wszystkie informacje. Wybieramy łodygę ( pień ) liczbyzwykle opuszczając jedną lub dwie ostatnie cyfry w zapisie dziesiętnym Zapisujemy wszystkie łodygi w jednej kolumnie w kolejności rosnącej, i rysujemy pionową linię oddzielającą (od liści ) Diagram łodygi i liścia (Stem and leaf plot) cd. Znajdujemy ``pień odpowiadający każdej obserwacji. Za linią pionową zapisujemy pozostałe (bez pnia) cyfry danej obserwacji. Ta część zapisu obserwacji nazywana jest liściem. Dostajemy obrócony histogram Ograniczenie: trudniej manipulować liczbą klas Przykład: Stężenie glukozy w przedniej komorze prawego oka u zdrowych psów 9 9 99 76 7 7 9 96 7 7 6 7 7 9 79 6 9

Opis histogramu (rozkładu) Symetryczny / asymetryczny W kształcie dzwonu (normalny) / ciężkie ogony (spłaszczony) Skośny na prawo lub lewo Jednomodalny (jeden główny wierzchołek) Dwumodalny (dwa główne wierzchołki) Wykładniczy (malejący) Rozrzut (duży lub mały) Statystyka Statystyka liczbowa charakterystyka danych Przykłady statystyk: próba: y =,y =, y =6,y =6 min=, max=6, rozstęp= 6-= Opis danych: kształt, centrum, rorzut Miary położenia rozkładu Średnia z próby: symbol y oznacza liczbę; arytmetyczną średnią z obserwacji Symbol Y oznacza pojęcie średniej z próby Średnia jest środkiem ciężkości zbioru danych 6 i= Przykład: Przyrost wagi owiec Dane :,, 9,,, y =, y =,, y 6 = y = y + y +... + y = + +... + = 6 i 6 y = 6 / 6 = 9. Odchylenia dev = y y i i dev = y y = 9. =.67 Σ dev i =? Mediana próbkowa: Środkowa obserwacja jeżeli n jest nieparzyste Średnia z dwóch środkowych wartości gdy n jest parzyste

Przykłady Przykład (n = ) Dane: 6..9 7. 6.9.9 Średnia z próby = / = 6. Mediana = Przykład (n = 6) Dane: 66 7 7 9 7 Średnia z próby = 9. Mediana = Średnia a mediana Przykład cd. (n = ) Dane: 6..9 7. 6.9.9 Średnia = / = 6. Mediana = 6. Błąd w zapisie danych: Dane: 6..9 7 6.9.9 Średnia = 9 Mediana = 6. Średnia a mediana Mediana dzieli powierzchnię histogramu na połowę Jest odporna nie mają na nią wpływu obserwacje odstające Średnia to środek ciężkości histogramu Obserwacje odstające mają duży wpływ na średnią średnia nie jest odporna Średnia a mediana Jeżeli histogram jest w przybliżeniu symetryczny, to średnia i mediana są zbliżone. Jeżeli histogram jest skośny na prawo, to średnia jest zwykle większa niż mediana. Obie te miary położenia są jednakowo ważne. Średnia jest częściej wykorzystywana do testowania i estymacji (o czym później). Miary położenia cd.:kwartyle Kwartyle dzielą zbiór danych na cztery grupy. Drugi kwartyl (Q) to mediana. Pierwszy kwartyl (Q) to mediana grupy obserwacji mniejszych niż Q. Trzeci kwartyl (Q) to mediana grupy obserwacji większych niż Q. Przykład Dane: 6 7

Przykład (n=) Rozstęp międzykwartylowy 7 IRQ=Q-Q (inter-quartile range) 6 9 Wykres ramkowy (Boxplot) BoxPlot Boxplot graficzna reprezentacja: mediany, kwartyli, maximum i minimum z danych. Ramka ( pudełko ) powstaje z obrysowania kwartyli Linie ( wąsy ) ciągą się do wartości najmniejszej i największej. 6 Zmodyfikowany Boxplot Obserwacja odstająca: błąd w zapisie danych, błąd maszyny, zmiana warunków eksperymentu itp. Kryterium do identyfikacji obserwacji odstających: Dolna granica = Q -.*IQR Górna granica = Q +.*IQR Dane : 6 6 7 6

Przykładowy zmodyfikowany wykres ramkowy (boxplot) Miary rorzutu: Rozstęp (max min) bardzo wrażliwy na obserwacje odstające, nieprzydatny do testowania Rozstęp międzykwartylowy (IRQ=Q-Q) rozstęp środkowych % obserwacji Standardowe odchylenie / Wariancja Współczynnik zmienności (CV) Próbkowe odchylenie standardowe (SD, s) Wyrażone w jednostkach pomiarowych Informuje o ile przeciętnie odległe od średniej są obserwacje. n ( i ) /( ) (definition) i= s = y y n W mianowniku jest n-: SS s =,where n n n ( i ) i i= i= SS = y y = y ny n ( yi ny ) /( n ) (calculations) i= = Próbkowa wariancja: s Przeciętny kwadrat odległości od średniej próbkowej: s Mierzona w jednostkach będących kwadratem jednostek, w których wyrażone są dane Dlaczego n-? s jest nieobciążonym estymatorem wariancji w populacji (te pojęcia wyjaśnimy później) n Σ dev i = stąd dev dev i= n- stopni swobody = n- jednostek informacji n = i

Miary rozrzutu, cd. Współczynnik zmienności (CV) CV = s / Przykład Dane :.,.6, 6.9, 9. (n=) Rozstęp = y Suma obserwacji: Σy =. +.6 + 6.9 + 9. =. średnia: y s z definicji: SS = wariancja: s = s= Uwaga: Proszę zachowywać dużo cyfr znaczących przy rachunkach. Zaokrąglamy dopiero na koniec. Współczynnik zmienności: CV= Ogólne uwagi Duże s=duży rozrzut. Małe s=mały rozrzut. Jeżeli histogram (rozkład ) jest w kształcie dzwonu ( normalny ), to około: 6% obserwacji jest w odległości ± s od średniej 9% obserwacji jest w odległości ± s od średniej 99% obserwacji jest w odległości ± s od średniej Nawet, gdy rozkład nie jest normalny to co najmniej 7% obserwacji jest w odległości ± s od średniej co najmniej 9% obserwacji jest w odległości ± s od średniej. (Wniosek z nierówności Czebyszewa) Przykład 7 9

Przykład cd Średnia s =.9. y =., odchylenie standardowe Ocena s z histogramu Odcinek I = ( y s, y + s) zawiera około 9 % danych. Ocena s = (długość I) /. Reguła działa najlepiej, gdy histogram jest w kształcie dzwonu (bliski normalnemu). Przykład (puls po ćwiczeniach) 9 % pomiarów jest pomiędzy 7 a Faktyczne s =. Porównanie miar rozrzutu i położenia Miary rozrzutu służą do oszacowania zmienności w danych. Odporność: Załóżmy, że mamy dość skupiony dzwonowy (normalny) zbiór danych. Co się stanie, gdy jedną dużą obserwację zastąpimy bardzo dużą wartością? Praca własna: Mediana Rozstęp Średnia Kwartyle i rozstęp międzykwartylowy Standardowe odchylenie Przeczytać ponownie obecny wykład Przeczytać i przygotować listę zadań, zapisać w zeszycie wszystkie rozwiązania Przejrzeć, ew. wydrukować następny wykład (www, za kilka dni) Powtórzyć.-. po każdym wykładzie.