HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Podobne dokumenty
ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Weryfikacja hipotez statystycznych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Rozkład Gaussa i test χ2

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

Statystyka matematyczna dla leśników

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Prawdopodobieństwo i rozkład normalny cd.

Prawdopodobieństwo i statystyka

Analiza niepewności pomiarów

Testowanie hipotez statystycznych.

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Ważne rozkłady i twierdzenia

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Zawartość. Zawartość

Spis treści 3 SPIS TREŚCI

Rozkłady statystyk z próby

Wprowadzenie do analizy korelacji i regresji

PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA. Piotr Wiącek

Wykład 3 Hipotezy statystyczne

Estymacja punktowa i przedziałowa

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

1 Podstawy rachunku prawdopodobieństwa

Zwiększenie wartości zmiennej losowej o wartość stałą: Y=X+a EY=EX+a D 2 Y=D 2 X

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Kolokwium ze statystyki matematycznej

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

Często spotykany jest również asymetryczny rozkład gamma (Г), opisany za pomocą parametru skali θ i parametru kształtu k:

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Pytanie: Kiedy do testowania hipotezy stosujemy rozkład normalny?

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Prawdopodobieństwo i statystyka r.

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski

Rozkłady zmiennych losowych

Testowanie hipotez statystycznych

INFORMATYKA W CHEMII Dr Piotr Szczepański

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Komputerowa Analiza Danych Doświadczalnych

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Statystyka. Magdalena Jakubek. kwiecień 2017

Estymacja przedziałowa. Przedział ufności

Testowanie hipotez statystycznych

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

KORELACJE I REGRESJA LINIOWA

Komputerowa Analiza Danych Doświadczalnych

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

Wydział Matematyki. Testy zgodności. Wykład 03

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

PRAWDOPODOBIEŃSTWO. ZMIENNA LOSOWA. TYPY ROZKŁADÓW

Rachunek Prawdopodobieństwa i Statystyka

Oszacowanie i rozkład t

Statystyka matematyczna dla leśników

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Ważne rozkłady i twierdzenia c.d.

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Ekonometria. Zajęcia

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki

Weryfikacja hipotez statystycznych

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

OPIS MODUŁ KSZTAŁCENIA (SYLABUS)

Rozkłady prawdopodobieństwa

Pochodna i różniczka funkcji oraz jej zastosowanie do obliczania niepewności pomiarowych

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Transkrypt:

HISTOGRAM W pewnych przypadkach interesuje nas nie tylko określenie prawdziwej wartości mierzonej wielkości, ale także zbadanie całego rozkład prawdopodobieństwa wyników pomiarów. W takim przypadku wyniki serii N pomiarów przedstawiamy za pomocą histogramu. W tym celu obszar zmienności mierzonej wielkości x dzielimy na m przedziałów (zwanych przedziałami klasowymi), a następnie dla każdego przedziału określamy ile wartości x i wyników pomiarów mieści się w tym przedziale. Rezultat możemy przedstawić w formie wykresu słupkowego Oczywiście histogram jest tylko przybliżeniem kształtu rozkładu, a wysokość słupków (liczebność przedziałów) jest zmienną losową, co oznacza, że po powtórzeniu serii histogram będzie inny. Wskazane jest takie dobranie wielkości i liczby przedziałów, aby na każdy z nich przypadało co najmniej kilka (5-8) pomiarów.5 N = 5 15.5 N = 5 1 Prawdopodobieństwo.4.3..1 1 5 Liczba pomiarów - n k Prawdopodobieństwo.4.3..1 5 Liczba pomiarów - n -4-3 - -1 1 3 4-4 -3 - -1 1 3 4 Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH 11 1

DYSPERSJA LICZEBNOŚCI PRZEDZIAŁÓW HISTOGRAMU Przyjmijmy, że przeprowadzono N pomiarów wielkości x, a wyniki przedstawiono w formie histogramu. Rozważmy jeden, dowolny przedział histogramu określony jako (x, x + x). Zastanówmy się ile wynosi prawdopodobieństwo P(n,N) tego, że liczebność rozważanego przedziału będzie wynosiła n (tzn. z ogólnej liczby N pomiarów w serii wartości z zakresu od x do x + x będzie miało n pomiarów). Prawdopodobieństwo tego, że w wyniku pojedynczego pomiaru uzyska się wartość z zakresu (x, x + x) można wyznaczyć z gęstości rozkładu prawdopodobieństwa f(x) zmiennej x. Wynosi ono: x + x p = x f(x)dx Ponieważ kolejne wyniki uzyskano niezależnie od siebie prawdopodobieństwo uzyskania n wyników z przedziału (x, x + x) oraz N-n wyników spoza tego przedziału określane jest iloczynem p n (1-p) N-n. Jednakże n rozważanych wyników można uzyskać w dowolnej kolejności, zatem powyższy iloczyn należy jeszcze pomnożyć przez liczbę możliwych kolejności otrzymania w serii N pomiarów n wyników z rozważanego przedziału. Ostatecznie zatem uzyskujemy wyrażenie: N! n P(n,N) = p ( 1 n! (N n)! Jest to rozkład dwumianowy Bernoulliego. N n Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH 11 p)

Widać zatem, że liczebność przedziału histogramu - n, jest zmienną losową opisywaną rozkładem Bernoulliego. Wartość oczekiwana jest zatem równa E(n) = N p a wariancja V(n) = N p (1-p) Pierwiastek tej ostatniej daje nam dyspersję D(n), którą możemy traktować jako miarę rozrzutu zmiennej n, a zatem możliwych wahań liczebności przedziału histogramu (wysokości słupka). W praktyce wartość n jest estymatorem E(n), zatem wartość prawdopodobieństwa p możemy oszacować jako: n p est = N Zatem dyspersja D(n) może być oszacowana za pomocą wzoru n s n = n 1, N który może być traktowany jako wzór określający niepewność liczebności przedziału histogramu (wysokości słupka). Dla dużej liczby przeprowadzonych pomiarów tzn. N możliwe jest podzielenie obszaru zmienności wielkości x na wiele przedziałów klasowych, a co za tym idzie prawdopodobieństwo p maleje (p ). W takim przypadku rozkład prawdopodobieństwa zmiennej n przechodzi w rozkład Poissona, a następnie w rozkład Gaussa. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH 11 3

Jeżeli przedstawimy niepewności liczebności poszczególnych przedziałów klasowych histogramu na wykresie zauważymy, że możliwe wahania wysokości słupka są dość znaczne..5 N = 5 15 Prawdopodobieństwo.4.3..1 1 5 Liczba pomiarów - n k -4-3 - -1 1 3 4 Optymalny efekt otrzymuje się zmierzając do minimalizacji niepewności względnej wysokości słupka histogramu s n /n. n n n 1 n n 1 1 s n N N N 1 1 = = = = n n n n n N Łatwo zauważyć, że s n /n maleje ze wzrostem n. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH 11 4

TEST χ ZGODNOŚCI ROZKŁADÓW W wielu przypadkach interesować nas będzie odpowiedź na pytanie, czy otrzymany rozkład empiryczny (histogram) badanej wielkości jest zgodny rozkładem wnikającym z teorii lub założonym na innej podstawie. Przykładowo - niezgodność rozkładu wyników pomiarów z rozkładem Gaussa może świadczyć o tym, że w trakcie trwania serii pomiarów nastąpiła systematyczna zmiana warunków, w jakich były one dokonywane. W celu sprawdzenia zgodności rozkładów porównujemy liczebność poszczególnych przedziałów histogramu otrzymanego w oparciu o wyniki pomiarów z wartością oczekiwaną liczebności jaka wynika z założonej postaci rozkładu poprzez wyznaczenie sumy kwadratów różnic pomiędzy tymi wielkościami..6 N = 5 8 Prawdopodobieñstwo.4. 6 4 Liczba pomiarów - n -4-3 - -1 1 3 4 Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH 11 5

Załóżmy, że na podstawie wyników N pomiarów konstruujemy histogram składający się z m przedziałów klasowych, których granice mają wartości X, X 1,..., X m. Wyznaczone doświadczalnie liczebności poszczególnych przedziałów wynoszą n i, gdzie i = 1,,..., m, a m n i=1 i = Wartość oczekiwana liczebności przedziału i wynosi E(n i ) = N p i gdzie prawdopodobieństwo p i wyznacza się w oparciu o zakładaną postać rozkładu gęstości prawdopodobieństwa f(x) na postawie zależności: p i X = i X i 1 N f ( x ) dx W celu przeprowadzenia testu zgodności rozkładów wyznaczamy wartość wyrażenia: ( ) = m ni Npi z Np i= 1 Wielkość z jako funkcja zmiennych losowych n i również jest zmienną losową. Jak pokazano wcześniej zmienne n i mają rozkład dwumianowy, ale dla dużych N rozkłady te zmierzają do rozkładów Gaussa N(Np i,(np i ) 1/ ). Zatem każdy z elementów sumy będzie wówczas charakteryzował rozkładem normalnym N(,1). Rozkład prawdopodobieństwa zmiennej wyznaczonej jako suma kwadratów zmiennych losowych o rozkładzie normalnym N(,1) jest w statystyce matematycznej nazywany rozkładem χ. i Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH 11 6

Rozkład χ Zmienna losowa χ otrzymana poprzez zsumowanie ν kwadratów niezależnych zmiennych x i o rozkładach normalnych N(,1) χ = ν x i i= 1 ma rozkład zwany, którego funkcja gęstości prawdopodobieństwa opisana jest wzorem: f ( χ, ν ) = ν / 1 ( ) ( χ χ e ) Γ( ν ν / ) Wielkość ν nosi nazwę ilości stopni swobody, a funkcja Γ(x) jest uogólnieniem silni na zbiór liczb rzeczywistych tzn. Γ(x) = (x-1) Γ(x-1)..18 / / f(χ,ν).16.14.1.1.8.6.4 5 stopni swobody 1 stopni swobody Wartość oczekiwana zmiennej χ jest równa liczbie stopni swobody E(χ ) = ν a wariancja wynosi V(χ ) = ν. 4 6 8 1 1 14 16 18 χ Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH 11 7

Procedura testowania hipotezy, że rozkład (histogram) otrzymany doświadczalnie jest zgodny z założoną postacią rozkładu przebiega następująco: ( ) 1. W oparciu o histogram z danych pomiarowych wyznaczamy wartość = m ni Npi z Np Jeżeli testowane rozkłady ze sobą zgodne zmienna z ma rozkład χ. Jednakże ilość stopni swobody tego rozkładu jest mniejsza od m i wynosi ν= m - b 1 gdzie b oznacza ilość parametrów rozkładu (np.µ i σ dla rozkładu Gaussa), które wyznaczyliśmy na podstawie danych pomiarowych. (Zmienne n i nie są od siebie niezależne, gdyż ich suma jest ściśle określona i równa N).. Przyjmujemy wartość poziomu istotności α (określającą prawdopodobieństwo tego, że w wyniku testu odrzucimy hipotezę mimo, iż jest ona prawdziwa). 3. Wyznaczamy wartość krytyczną χ kr odpowiadającą przyjętemu poziomowi istotności α. Jeżeli testowane rozkłady nie są ze sobą zgodne to zmienna z powinna mieć dość dużą wartość, gdyż liczebność każdego z przedziałów klasowych (wysokość każdego ze słupków histogramu) n i istotnie różni się od wartości oczekiwanej N p i wynikającej z założonej postaci rozkładu. Zatem obszar krytyczny jest w tym przypadku obszarem wartości zmiennej χ większych od χ kr takim, że P(χ > χ kr ) = α. 4. Porównujemy wartość z z wartością χ kr. Jeżeli z > χ kr to z prawdopodobieństwem pomyłki równym poziomowi istotności możemy uznać, że testowane rozkłady nie są ze sobą zgodne. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH 11 8 i= 1 i