Jan Rusinek. Elementy statystyki matematycznej. dla studentów zarządzania
|
|
- Janina Halina Król
- 5 lat temu
- Przeglądów:
Transkrypt
1 Jan Rusinek Elementy statystyki matematycznej dla studentów zarządzania UWAGA! Ten tekst jest cały czas w trakcie przygotowania i sprawdzania. Może zawierać błędy. Jest sukcesywnie poprawiany i umieszczany pod aktualną datą! Obecna data
2
3 Część 1. Elementy statystyki matematycznej
4 8 1. Elementy statystyki matematycznej 1.1. Wprowadzenie Zaczniemy od kilku przykładowych sytuacji. 1. Przypuśćmy, że rzucamy 100 razy monetą i za każdym razem wypada orzeł. Co nam wówczas przychodzi na myśl. To, że moneta jest oszukana np. po obu stronach ma orły (tak jak w starym filmie z Adolfem Dymszą w głównej roli). A co jeśli orzeł wypadnie 70, a reszka 30 razy? Czy i wówczas podejrzewamy, że moneta jest niesymetryczna? Z jakim prawdopodobieństwem jest ona niesymetryczna? 2. Gramy w karty i przeciwnik za każdym razem otrzymuje 4 asy. Zaczynamy go podejrzewać (przeważnie słusznie), że oszukuje. A jeśli otrzymuje za każdym razem tylko 3 asy. Czy i wówczas też mamy podstawy podejrzewać go o oszustwo? 3. Testujemy w komputerze generator liczb losowych z przedziału [0; 1]. Po wylosowaniu 100 liczb okazało się, że w przedziale [0; 0.25] znalazło się 20 wylosowanych liczb, w przedziale (0.25; 0.50], 52 wylosowane liczby, w przedziale (0.50; 0.75] 9 liczb, a w przedziale (0.75; 1] 19 liczb. Czy powinniśmy na tej podstawie wnioskować, że generator ten nie pracuje zgodnie z rozkładem jednostajnym na przedziale [0; 1]? 4. Przypuszczamy, że wzrost dorosłych mieszkańców Polski ma rozkład normalny ze średnią µ i odchyleniem standardowym σ. Wybieramy losowo n osób. Oznaczmy ich wzrost przez x 1, x 2,..., x n. Wówczas odpowiednie twierdzenia rachunku prawdopodobieństwa sugerują, że powinniśmy otrzymać 1 n x i µ n oraz 1 n i=1 n (x i µ) 2 σ 2. i=1 Jeśli przy kilku próbnych losowaniach wyniki powyższe będą istotnie inne od oczekiwanych, to można wyciągnąć wniosek,
5 1.1. Wprowadzenie 9 że nasza hipoteza była niesłuszna. Czy można również na tej podstawie przypuszczać, że rozkład nie jest normalny? Jeśli dodatkowo w wielu próbach wyniki wyjdą za każdym razem odpowiednio zbliżone do µ 1 i σ 1, to czy możemy wyciągnąć wniosek: hipotezę trzeba poprawić - rozkład jest prawdopodobnie normalny, ale wartości oczekiwane i odchylenia standardowe są nie takie jak początkowo przypuszczaliśmy, są raczej zbliżone do µ 1 i σ 1. Z takimi sytuacjami spotykamy się na każdym kroku korzystając z rezultatów doświadczeń wyciągamy ogólne wnioski o całej populacji. Tym się zajmuje statystyka matematyczna. Na podstawie pewnego skończonego zbioru informacji zwanego próbkami albo próbami wykorzystując teorię prawdopodobieństwa buduje informację o rozkładzie opisującym dane zjawisko. Przykład typowego zadania statystyki matematycznej mieliśmy już przy omawianiu rozkładu hipergeometrycznego (liczenie ryb w jeziorze). Metody Monte Carlo, to również w rzeczywistości metody statystyki matematycznej. W tej części usystematyzujemy i uściślimy podstawowe metody. Badane zjawisko ma zwykle wiele parametrów go charakteryzujących; najważniejsze z nich to: wartość średnia, wariancja czy odchylenie standardowe, ale możemy rozważać i wiele innych np. największa wartość, najmniejsza wartość, najczęstsza wartość itp. DEFINICJA 1. Funkcję g(x 1,..., x n ) będącą funkcją próby losowej x 1,..., x n nazywamy statystyką.. Najważniejsze statystyki: Wartość oczekiwana empiryczna (średnia) x = 1 n x i, n Wariancja empiryczna i=1
6 10 1. Elementy statystyki matematycznej ŝ 2 = 1 n (x i x) 2. n i=1 Poprawiona wariancja empiryczna albo wariancja z próby. s 2 = 1 n 1 n (x i x) 2 = n 1ŝ2. n i=1 Statystykę θ(x 1,..., x n ), której wartości używamy do oceny nieznanego parametru θ nazywamy estymatorem parametru θ. Uzyskaną z próbki wartość estymatora nazywamy oceną albo oszacowaniem tego parametru. Żeby estymator spełniał swoją rolę, to powinien on mieć pewne istotne własności. Po pierwsze chcielibyśmy, aby przy wzroście liczności próby rosła dokładność oceny, czyli, że dla każdego ε > 0 lim P ( θ n θ < ε) = 1. (2.1) n Oznacza, to że przy dużej liczności próby prawdopodobieństwo tego, że wartość oszacowania będzie się różnić od rzeczywistej wielkości parametru o mniej niż ε będzie bliskie jedności, czyli będzie to prawie pewne. DEFINICJA 2. Estymator spełniający powyższy warunek nazywamy estymatorem zgodnym. PRZYKŁAD 1. Rzucamy n razy symetryczną monetą. Niech X będzie zmienną losową odpowiadającą jednokrotnemu rzutowi przyjmującą 1 dla orła oraz 0 dla reszki. Wiemy, że θ, czyli wartość oczekiwana jest równa 0.5. Niech θ n = k n, gdzie k jest liczbą wyrzuconych orłów. Wtedy twierdzenie graniczne gwarantuje nam, że średnia empiryczna jest zgodnym estymatorem wartości oczekiwanej 1 2.
7 1.1. Wprowadzenie 11 PRZYKŁAD 2. Niech f będzie funkcją ciągłą w przedziale [a; b], a X rozkładem jednostajnym w przedziale [a; b]. Niech θ oznacza cechę θ = sup f(x). Oznaczmy dla próby x 1,..., x n estymator θ n jako θ n (x 1,..., x n ) = max(f(x 1 ),..., f ( x n ) ). Wówczas rozważania, które przeprowadzaliśmy przy metodzie Monte Carlo wyznaczania ekstremów pokazują, że estymator ten jest zgodny. Ważną własnością estymatora jest nieobciążoność. DEFINICJA 3. Estymator θ n nazywamy nieobciążonym, jeśli E( θ n ) = θ. Różnicę B n ( θ n ) = E( θ n ) θ nazywamy obciążeniem estymatora. PRZYKŁAD 3. Estymator maksimum z poprzedniego przykładu nie jest nieobciążony. Np. dla f(x) = x oraz [a; b] = [0; 1] mamy θ = 1 natomiast θ 1 = 1 2 i dla każdego ε > 0 wiemy, że max(x 1,..., x n ) 1 ε, jeśli dla każdego i, x i < 1 ε. Wiemy też, że dla każdego i Ponieważ próbki są niezależne, to Stąd P (x i 1 ε) = 1 ε. P (max(x 1,..., x n ) 1 ε) = (1 ε) n. P (max(x 1,..., x n ) > 1 ε) = 1 (1 ε) n, co jest dla każdego n mniejsze od jedynki. skąd E( θ n ) < 1.
8 12 1. Elementy statystyki matematycznej DEFINICJA 4. Estymator nazywamy asymptotycznie nieobciążonym, jeśli lim n B n = 0. PRZYKŁAD 4. Sprawdzimy, czy wariancja empiryczna ŝ 2 jako estymator wariancji σ 2 jest nieobciążona i obliczymy jej obciążenie. Sprawdzimy też, czy jest asymptotycznie nieobciążona. Rozwiązanie: Niech µ = EX. Mamy ŝ 2 = 1 n (x i x) 2 = 1 n (x i µ + µ x) 2 = n n i=1 = 1 n i=1 n (x i µ) 2 (x µ) 2. i=1 Ale wartość oczekiwana i wariancja x i jest taka sama jak wartość oczekiwana i wariancja x, skąd ( ) E(x µ) 2 = D 2 (x) = D 2 1 n x i n Stąd i=1 i=1 i=1 ( = 1 n ) n 2 D2 x i = 1 n n 2 D 2 x = σ2 n. E(ŝ 2 ) = 1 n nσ2 σ2 n = n 1 n σ2 σ 2. Widzimy zatem, że ŝ 2 jest obciążony i jego obciążenie jest równe B n (σ 2 ) = n 1 n σ2 σ 2 = 1 n σ2. Z wzoru na B n widzimy od razu, że ŝ 2 jest asymptotycznie nieobciążona. Z wzoru na s 2 wynika, że s 2 jest nieobciążonym estymatorem wariancji. Z tego powodu od tego momentu będziemy za wieloma podręcznikami za wariancję empiryczną przyjmować s 2,
9 1.1. Wprowadzenie 13 a nie ŝ 2, 1 a wielkość s będziemy nazywać odchyleniem standardowym empirycznym. 1 W niektórych źródłach za wariancję empiryczną przyjmuje się ŝ 2 i oznacza s 2.
10 14 1. Elementy statystyki matematycznej 1.2. Estymacja punktowa Ten sposób estymacji polega na przyjęciu, że parametr jest równy estymatorowi. Można też uzupełnić wartość estymatora o jego błąd standardowy. Najczęściej za błąd standardowy wartości średniej przyjmujemy s n. PRZYKŁAD 5. Pewien działkowicz zbadał ilość jabłek, które zebrał ze swoich 7 jabłonek. Uzyskał rezultaty w kilogramach: 8, 11, 13, 15, 12, 11, 16. Oszacuj punktowo średni zbiór z jednego drzewka. Rozwiązanie: Mamy x 1 = 8, x 2 = 11, x 3 = 13, x 4 = 15, x 5 = 12, x 6 = 11, x 7 = 16 Liczymy x = 1 7 x i = Błąd standardowy s 2 = 1 6 n=1 7 (x n x) 2 = n=1 s = 7.33 = B = = 1.02.
11 1.3. Weryfikacja hipotez Weryfikacja hipotez Przeprowadzamy pewne doświadczenie, które ma potwierdzić lub odrzucić jakąś hipotezę. Na przykład: czy wypadnięcie 505 orłów na 1000 rzutów monetą każe nam podejrzewać, że moneta jest niesymetryczna? A co w wypadku 600 orłów na 1000 rzutów? Czy stwierdzenie wśród losowo zbadanych 20 osób średniego wzrostu 165 cm, każe nam kwestionować hipotezę, że średni wzrost jest 172 cm? Czy na podstawie szczegółowych danych z próbki możemy kwestionować, że rozkład jest normalny? Z podobnymi pytaniami spotykamy się na każdym kroku. Poniżej przedstawimy najważniejsze modele służące do weryfikacji tego typu hipotez. Ogólna zasada testów jest następująca. Krok 1. Stawiamy pewną bardzo prawdopodobną hipotezę. Krok 2. Dobieramy jakąś liczbę α bliską zeru (w praktyce 0.1, 0.05, 0.02, 0.01, 0.005) zwaną poziomem istotności testu. Krok 3. Wybieramy pewien zbiór zdarzeń, którego prawdopodobieństwo jest równe α. Krok 4. Przeprowadzamy doświadczenie. Jeśli w wyniku doświadczenia otrzymamy zdarzenie wpadające w wybrany zbiór, to wnioskujemy że ponieważ wypadło zdarzenie mało prawdopodobne, przeczy ono założonej hipotezie. W przeciwnym wypadku hipotezy nie odrzucamy. Sytuację ilustruje rysunek. Zakładamy, ża zjawisko, które testujemy daje się opisać liczbami od 0 do, ma ono rozkład ciągły z gęstością, której wykres widzimy na rysunku. Interesuje nas hipoteza, że zjawisko to przyjmuje wartości mniejsze lub równe od S 0. Zdarzenie zaprzeczające postawionej hipotezie będzie miało miejsce wtedy, gdy jego wartość otrzymana w doświadczeniu będzie istotnie większa od S 0.
12 16 1. Elementy statystyki matematycznej S 0 Rys. 1. g Chcemy, aby zdarzenie to było bardzo mało prawdopodobne, bo tylko wtedy jego wystąpienie w mocny sposób poda w wątpliwość naszą hipotezę. Na rysunku pole zakreskowanej figury jest równe α, pole pozostałej figury pod wykresem jest równe 1 α. Oznacza to, że prawdopodobieństwo tego, że doświadczenie da wynik większy od g jest równe α. I wtedy na poziomie istotności α hipotezę odrzucamy. Jeśli zmniejszymy α, to liczba g przesunie się w prawo, czyli wynik doświadczenia musi być jeszcze bardziej odległy od wartości najbardziej oczekiwanej, aby hipotezę odrzucić. Testy dzielimy na testy nieparametryczne (tzw. testy zgodności) i testy parametryczne. Testy zgodności dotyczą dotyczą hipotez: czy dana próbka pochodzi z ustalonego rozkładu? i nimi się zajmiemy w pierwszej kolejności. Testami parametrycznymi zajmiemy się w dalszej części.
13 1.4. Testy zgodności Testy zgodności Jak się przekonamy w następnych rozdziałach, wybór właściwego modelu, lub wręcz możliwość przeprowadzenie wiarygodnego testu zależy od tego, czy badana cecha ma rozkład normalny czy nie. Dotyczy to niewielkich próbek, przy próbkach dużej liczności centralne twierdzenie graniczne gwarantuje nam, że zawsze rozkład sumy (a zatem i wartści średniej) można traktować jako normalny. Natomiast przy próbkach niewielkich i nieznanym rozkładzie nic nie możemy powiedzieć o rozkładzie sumy. A nawet gdy rozkład jest znany, to suma takich niezależnych rozkładów zwykle jest bardzo skomplikowana i nie zawsze możliwa do wyznaczenia. Natomiast jeśli badana cecha ma rozkład normalny, to sytuacja się mniej lub bardziej upraszcza. Czasami też chcemy stwierdzić, że dana próbka pochodzi z rozkładu np. jednostajnego, dwumianowego lub jakiegoś innego. Dokładniej mówiąc nigdy nie da się stwierdzić tego ze 100% pewnością, można tylko stwierdzić, że prawdopodobieństwo tego, że dana próbka pochodzi z danego rozkładu jest większe od 1 α. Oczywiście 1 α przyjmujemy bliskie jedności - w praktyce 0.9, 0, 95, Takich testów jest bardzo dużo. Poznamy kilka najprostszych i najważniejszych. Test χ 2 Test χ 2 jest jednym z najbardziej wszechstronnych testów służących do porównywania różnego rodzaju rozkładów. Może służyć do sprawdzania jakiego typu jest dany rozkład, czy dwa rozkłady mają podobny (choć nieznany) typ, czy dwie zmienne losowe są niezależne itp. Zanim przejdziemy do konkretnych metod podajmy jego główną ideę. Zasadza sie ona na ogólnej statystyce: χ 2 obl = (wartość zaobserwowana wartość spodziewana) 2. wartość spodziewana
14 18 1. Elementy statystyki matematycznej Sumujemy po wszystkich możliwych wartościach z próbki. Po podliczeniu sprawdzamy nierówność χ 2 obl > χ 2 (1 α, k 1), gdzie k 1 oznacza liczbę stopni swobody (jak wyznacza się k w różnych sytuacjach, poznamy przy okazji rozważania konkretnych modeli), a χ 2 (1 α, k 1) jest odpowiednim kwantylem rozkładu χ 2. Znajdujemy go w tablicy 4 lub wyznaczamy przy pomocy komputera (np. w programie calc darmowego pakietu Openoffice). Odrzucamy hipotezę badana sytuacja jest zgodna z oczekiwaniami, jeśli nierówność jest spełniona. Przechodzimy do konkretnych zastosowań. PRZYKŁAD 6. Rzucamy 30 razy kostką. Otrzymaliśmy wyniki otrzymane w tabelce: liczba oczek liczba rzutów Stawiamy hipotezę: Kość jest uczciwa na poziomie istotności α = Jeśli kość jest uczciwa, to należy spodziewać się, że wypadnie po pięć razy każda liczba oczek. Oznacza to, że mamy do czynienia z rozkładem punktowym danym tabelką. x k p k 1/6 1/6 1/6 1/6 1/6 1/6 Wynika stąd, że przy 30 rzutach oczekujemy, każda liczba oczek wypadnie po 30/6 = 5 razy. Zatem nasza statystyka testowa przyjmuje wartość χ 2 obl = (8 5)2 5 + (4 5)2 5 + (7 5)2 5 + (3 5)2 (3 5)2 + + = = 4.4. (5 5)2 5
15 1.4. Testy zgodności 19 W naszym wypadku k jest równe 6 (jest to liczba możliwych wyników próbki). Znajdujemy w tablicy kwantyli χ 2 wartość χ 2 (0.99, 5) = Nierówność nie jest spełniona. Nie ma powodu do odrzucenia hipotezy. PRZYKŁAD 7. Rzucamy sto razy monetą. Ile razy powinna paść reszka, aby na poziomie istotności α = 0.05 odrzucić hipotezę Moneta jest symetryczna? Rozwiązanie: Niech m oznacza liczbę wyrzuconych reszek, w takim razie orzeł wypadł 100 m razy. Jeśli moneta jest symetryczna, to oczekiwana liczba wyrzuconych zarówno reszek jak i orłów jest równa 50. Stosujemy test χ 2. Otrzymujemy χ 2 obl = (m 50) (100 m 50)2 50 = (m 50)2. 25 W naszym przypadku k = 2 (2 możliwe wyniki - orzeł i reszka) i w tablicach kwantyli rozkładu χ 2 znajdujemy χ 2 (1 α, k 1) = χ 2 (0.95, 1) = Interesuje nas dla jakich m (m 50) 2 > Rozwiązując tę nierówność otrzymujemy m 50 > = Ostatecznie otrzymujemy rezultat. Hipotezę odrzucamy, jeśli reszka wypadnie więcej niż 59 razy lub mniej niż 41 razy. Test χ 2 stosujemy najczęściej dla rozkładu dyskretnego. Poznamy później zastosowanie testu χ 2 do innych zagadnień, a teraz podamy test charakterystyczny dla badania rozkładów typu ciągłego. Test Kołmogorowa. Spodziewamy się, że badana populacja ma rozkład ciągły z dystrybuantą F (x). Test opiera się na statystyce Kołmogorowa danej wzorem D n = sup x IR S n (x) F (x),
16 20 1. Elementy statystyki matematycznej gdzie S n jest skokową dystrybuantą opartą na próbce x 1 x 2... x n i zdefiniowaną następująco: 0 dla x < x 1 i S n (x) = n dla x i x < x i+1 (2.2) 1 dla x x n. Idea testu jest analogiczna, jak przy teście χ 2. Rozważamy nierówność D n > d n (1 α), gdzie d n (1 α) bierzmy z tablicy 8 kwantyli statystyki Kołmogorowa. Hipotezę o równości rozkładu na poziomie istotności α odrzucamy, jeśli nierówność jest spełniona. W praktyce D n obliczamy w dwóch krokach: Najpierw liczymy oraz D + n = D n = a następnie liczymy max i=1,...,n max i=1,...,n i n F (x i), i 1 n F (x i), D n = max(d + n, D n ). 2 PRZYKŁAD 8. Zastosujmy test Kołmogorowa do testowania generatora liczb losowych. W 8 próbach (oczywiście w praktyce losuje się dużo większą ilość, ale chodzi o to aby zademonstrować metodę) otrzymano następujące liczby (z dokładnością 0.01): 0.40, 0.11, 0.03, 2 Jeśli formalnie zastosujemy wzór na S n, to w wypadku, gdy ta sama wartość pojawi się w próbce kilkakrotnie, S n będzie miała skoki większe niż 1/n. Ale gdy rozkład jest ciągły prawdopodobieństwo tego, że powtórzy się ten sam wynik w próbce jest równe 0. Tak że w rzeczywistości to są inne wyniki, a to, że otrzymaliśmy je jako takie same wynika z przybliżenia! Dlatego ustawiamy je w ciągu jako inne rezultaty i w ten sposób dystrybuanta S n ma wszystkie skoki wielkości 1/n.
17 1.4. Testy zgodności , 0.75, 0.79, 0.46, Sprawdzimy, czy generator działa zgodnie z rozkładem jednostajnym na przedziale [0; 1] na poziomie istotności α = Dystrybuanta rozkładu jednostajnego na przedziale [0; 1] wyraża się wzorem F (x) = x. Ustawiając wartości x n w ciąg rosnący zapisujemy nasze dane w postaci tabelki x i = F (x i) i 1 i 8 F (xi) i 1 i F (x i) max Stąd D 8 = 0.25, D+ 8 = 0.14, skąd D 8 = W tablicy 6 znajdujemy d n (1 α) = d 8 (0.95) = Nierówność 0.25 > nie jest spełniona. Zatem nie ma powodu, aby kwestionować poprawność działania generatora liczb losowych. PRZYKŁAD 9. Firma handlująca używaną odzieżą na wagę dostarcza do sklepów towar w paczkach. Wylosowano 6 paczek i zważono je. Otrzymano wagi w kilogramach: 6.5, 6.7, 7.1, 7.2, 6.8, 7.1. Zweryfikuj na poziomie istotności α = 0.05, że próbka pochodzi z rozkładu normalnego N(7, 0.45) Rozwiązanie: Tworzymy analogiczną tabelkę jak w poprzednim zadaniu korzystając z wzoru F (x i ) = Φ( xi µ σ ), gdzie Φ jest dystrybuantą standardowego rozkładu normalnego.
18 22 1. Elementy statystyki matematycznej i 1 i 6 F (xi) x i F (x i) i 1 i F (x i) max Stąd D 6 = 0.16, D+ 6 = 0.33, skąd D 6 = W tablicy 6 znajdujemy d n (1 α) = d 6 (0.95) = Nierówność 0.33 > nie jest spełniona. Zatem nie ma powodu aby kwestionować postawioną hipotezę. Test serii Test serii stosuje się do badania czy dwie próbki szacujące tę samą cechę wyznaczają ten sam typ rozkładu (nie zawsze znany). Jego idea polega na tym, że jeśli np. rzucamy wielokrotnie dwiema kostkami, to mało prawdopodobne jest, że w jednej kostce wypadną same małe liczby, a w drugiej same duże. Jeśli obie kostki są uczciwe, to wyniki powinny być wymieszane. Oznaczmy próbki pierwszego doświadczenia przez x 1,..., x n, a drugiego y 1..., y k. Ustawiamy wyniki obu doświadczeń w rosnący ciąg. Serią nazwiemy zbiór w tym ciągu kolejnych elementów z tej samej próbki. Ważna będzie liczba serii. Na przykład jeśli wylosowaliśmy w pierwszej próbce liczby 5, 7, 9, a w drugiej próbce liczby 4, 3, 6, 10, to ustawiając je w ciąg rosnący otrzymamy tabelkę (w drugiej linijce zapisujemy z jakiej próbki jest liczba): y y x y x x y
19 1.4. Testy zgodności 23 Serie są rozdzielone potrójną linią. Pierwsza seria składa się z dwóch kolejnych y-ów, druga z jednego x-a, trzecia z jednego y-a, czwarta z dwóch kolejnych x-ow i piąta z jednego y-a. Razem mamy więc pięć serii. Oznaczmy liczbę otrzymanych serii przez K. Następnie sprawdzamy nierówność K > k(α, n 1, n 2 ), gdzie k(α, n 1, n 2 ) bierzemy z tablicy 8. Jeśli nierówność jest prawdziwa, to nie ma powodu, aby odrzucić hipotezę o jednakowych rozkładach. Należy jeszcze powiedzieć, co zrobić jeśli w obu próbkach występują te same wartości. Należy wtedy kolejność w ciągu losować. PRZYKŁAD 10. Dwa różne algorytmy służące do sortowania danych przetestowano ośmiokrotnie tych samych zbiorach i uzyskano następujące czasy w sekundach: Pierwszy algorytm: 24, 27, 54, 23, 11, 19, 22, 21. Drugi algorytm: 65, 63, 18, 13, 12, 73, 55, 58. Czy na poziomie istotności α = 0.05 należy odrzucić hipotezę, że oba algorytmy mają podobny rozkład? Rozwiązanie: Oznaczmy próbki pierwszego algorytmu przez x i, drugiego przez y i. Tworzymy tabelkę: x y y y x x x x x x x y y y y y Mamy K = 4, Znajdujemy k(0.05, 8, 8) = 5. Nierówność K > k(0.05, 8, 8) = 5 jest fałszywa. Hipotezę odrzucamy.
20 24 1. Elementy statystyki matematycznej 1.5. Estymacja przedziałowa DEFINICJA 5. Przedziałem ufności dla parametru θ na poziomie ufności 1 α (0 < α < 1) nazywamy przedział [θ 1 ; θ 2 ] spełniający warunki: θ 1 i θ 2 są funkcjami próby losowej; P (θ 1 < θ < θ 2 ) = 1 α. Liczbę 1 α nazywamy współczynnikiem ufności. Liczbę 1 α wybiera się bliską jedynce najczęściej w praktycznych zastosowaniech 0.9, 0.95 lub Dla danego α jest bardzo dużo przedziałów ufności. Często (ale nie zawsze) konstruuje się przedział ufności, dla którego parametr z próby (np. x) θ 0 jest środkiem. Wtedy przedział ufności jest postaci (θ 0 l; θ 0 + l) i należy go rozumieć następująco: Prawdopodobieństwo tego, że θ 0 nie oddali się od θ o więcej niż l wynosi 1 α Do konstrukcji przedziałów ufności używa się różnych statystyk, przy czym odpowiednie modele zależą od naszej wiedzy o danym rozkładzie i od liczności próbki. Poniżej omówimy najważniejsze z nich. Opierają się one na poniższym twierdzeniu oraz twierdzeniach granicznych. Ze względu na zdecydowanie aplikacyjny charakter tej części podręcznika skupimy się głównie na sformułowaniu odpowiednich modeli i podanie przykładów je ilustrujących. TWIERDZENIE 1. Jeśli badana zmienna ma rozkład normalny N(µ, σ) to: a) Zmienna losowa x = 1 n (X X n ) ma rozkład normalny N µ, n (jest to konsekwencja twierdzenia ( ) σ ), b) Zmienna losowa n 1 σ 2 s 2 ma rozkład χ 2 (n 1),
21 1.5. Estymacja przedziałowa 25 c) Zmienna losowa n(x µ) s ma rozkład t(n 1). d) Zmienne x i s 2 są niezależne. 3 3 Ta własność jest bardzo ciekawa i charakterystyczna dla rozkładu normalnego
22 26 1. Elementy statystyki matematycznej 1.6. Wyznaczanie przedziałów ufności Przedziały ufności dla nieznanej wartości średniej Model A1 stosujemy go, gdy rozkład jest normalny o nieznanym µ i znanym σ: Zwykle badamy populację i dopiero wyniki tych badań pozwolą nam postawić jakąś hipotezę. Dlatego z sytuacją, kiedy σ jest znane w praktyce rzadko mamy do czynienia. Może to mieć miejsce wtedy, gdy są dostępne jakieś wcześniejsze badania dające w miarę pewne wyniki. Warto podkreślić, że jeśli mamy godne zaufania dane dotyczące wariancji, to ten model jest najdokładniejszy. Przedział ufności w tym modelu jest dany wzorem (patrz punkt a) twierdzenia 1): P = [x l; x + l], gdzie l = u ( 1 α 2 ) σ n, (2.3) a u jest kwantylem rozkładu normalnego (tabelki 2 i 2.5). PRZYKŁAD 11. Producent pewnego napoju zakupił maszynę napełniającą litrowe butelki, o której wiadomo, że napełnia butelki zgodnie z rozkładem normalnym o odchyleniu standardowymd 0.04 litra. Nastawiono maszynę na 1 litr, wylosowano 8 butelek i otrzymano następujące ilości napoju w tych butelkach: 0.98, 0.97, 1.02, 1.03, 0.95, 0.97, 1.02, 1.01 litra. Oszacuj przedziałowo średnią objętość butelki przyjmując współczynnik ufności Rozwiązanie: Spełnione są warunki potrzebne do zastosowania powyższego modelu. Liczymy x = 0.99, W tabeli kwantyli rozkładu normalnego znajdujemy u ( 1 α 2 ) = u(0.975) = Zatem l = =
23 1.6. Wyznaczanie przedziałów ufności 27 Stąd przedział ufnosci jest równy P = [0.966; 1.021]. Model A2 stosujemy go, gdy rozkład jest normalny o nieznanych µ i σ: Przedział ufności dany jest wzorem P = [x l; x + l], gdzie l = t ( 1 α 2, n 1) s n, (2.4) a t jest kwantylem rozkładu Studenta (tabela 3) (patrz punkt c) twierdzenia 1). PRZYKŁAD 12. Rozwiążemy poprzednie zadanie przy założeniu, że wariancja nie jest znana, przy tym samym współczynniku ufności. Rozwiązanie: Dodatkowo obliczamy s 2 = , s = W tablicach kwantyli rozkładu t Studenta znajdujemy t(0.975, 7) = Stąd l = = Zatem P = [0.969; 1.019]. Model A3 stosujemy go, gdy rozkład jest nieznany o nieznanych µ i σ, próba powinna być duża (n 30). Model ten opiera się na twierdzeniu granicznym, z którego wynika, że statystyka x µ σ n ma asymptotyczny rozkład N(0, 1). Stosujemy zatem wzór analogiczny do modelu A1 zastępując nieznaną wartość σ estymatorem s z próbki. Otrzymujemy po przekształceniu wzór P = [x l; x + l], gdzie l = u ( 1 α 2 ) s n. (2.5)
24 28 1. Elementy statystyki matematycznej PRZYKŁAD 13. Pewna firma komputerowa chce ustalić średnią wielkość sprzedaży na klienta. Wylosowano 120 klientów i obliczono dla nich średnią 532 złote i odchylenie standardowe empiryczne s = 321 złotych. Oszacujemy średnią wielkość sprzedaży przy współczynniku ufności 1 α = 0.9. Rozwiązanie: Znajdujemy u ( 1 α 2 ) = u(0.95) = Stąd l = = P = [484; 580]. Zrobimy też to zadanie wykorzystując model A2. Mamy α = 0.1, n = 120, s = 321, x = 532. W tablicach rozkładu Studenta znajdujemy l = = Stąd t ( 1 α 2, n 1) = t(0.95, 119) P = [483; 581]. Zauważmy jak niewiele się różnią wyniki przy obu modelach. Jest tak, dlatego, że próbka jest dostatecznie duża. PRZYKŁAD 14. Pewien algorytm przetestowano na 5 programach i otrzymano czasy w sekundach: 45, 23, 31, 56, 29. Wyznacz przedział ufności na poziomie ufności 1 α = 0.95 przy założeniu, że rozkład jest normalny. Rozwiązanie: Obliczając otrzymujemy x = 36.8, s = Możemy stosować model A2. Znajdujemy t(0.975, 4) = Stąd l = = Ostatecznie P = [20.14; 53.46]. Nasuwa się pytanie (dotyczy to nie tylko wyznaczania przedziałów ufności), co zrobić, gdy próba jest niewielka i rozkład
25 1.6. Wyznaczanie przedziałów ufności 29 jest nieznany lub znany, ale nie normalny. W takich sytuacjach w zasadzie pogodzić się z tym, że niezależnie od wyboru modelu, wynik może być bardzo niedokładny. Demonstruje to kolejny przykład. PRZYKŁAD 15. Weźmy takie dane jak w zadaniu 13, ale przyjmijmy, że rozkład nie jest normalny i że próbka jest liczności 10. Rozwiązanie: Ponieważ rozkład nie jest normalny i próbka nie jest duża, to ani model A3 ani A2 nie są dobre. Stosujemy model A3. Stosujemy model A2. l = = P = [365; 698]. t ( 1 α 2, n 1) = t(0.95, 9) l = = Stąd P = [346; 718]. Przykład ten w połączeniu z zadaniem 13 pokazuje, że przy dużych próbkach możemy wybierać różne modele, a wyniki będą prawie identyczne, natomiast przy niedużych próbkach wynik zależy od wyboru modelu. Przedziały ufności dla frakcji elementów wyróżnionych (rozkład dwupunktowy) Często chcemy oszacować procent tych elementów w populacji, które spełniają jakiś warunek. Oznacza to, że cecha, którą badamy, ma rozkład dwupunktowy z prawdopodobieństwm sukcesu p. Próbka powinna być dostatecznie duża, przy małych próbkach wyniki mogą być mało wiarygodne. Oznaczmy przez k liczbę wyróżnionych elementów w próbie n-elementowej.
26 30 1. Elementy statystyki matematycznej Model B1: stosujemy raczej dla próby liczności większej od 30. Oparty jest on na twierdzeniu Moivre a - Laplace a, które k np głosi, że dla dużej próby statystyka ma w przybliżeniu np(1 p) rozkład N(0, 1). Stąd ( ) k np P < u(1 α np(1 p) 2 ) = 1 α. Rozwiązując powyższą nierówność (kwadratową względem p) otrzymamy wzór na przedział ufności: [ u(1 α 2 )2 + 2k 2(n + u(1 α 2 )2 ) l; u(1 α ] 2 )2 + 2k 2(n + u(1 α 2 )2 ) + l, (2.6) gdzie l = u u(1 α 2 )2 4 + k(n k) n n + u(1 α 2 )2. Zauważmy, że przedział nie jest symetryczny wględem k n, ale jest symetryczny względem co dla n, dąży do k n. u 2 + 2k 2(n + u 2 ), Dlatego dla dużych n możemy przyjąć, że u(1 α 2 )2 n 0 otrzymując wzór nieco prostszy i przedział symetryczny względem k n [ k P = n l; k ] n + l, gdzie l = u ( 1 α ) k n 2 ( ) 1 k n n. (2.7)
27 1.6. Wyznaczanie przedziałów ufności 31 PRZYKŁAD 16. Dwieście wylosowanych osób z danej miejscowości zapytano, czy byliby zainteresowani bezprzewodowym internetem. Zainteresowanie taką ofertą wykazało 160 osób. Oszacuj z 95%-ową wiarygodnością procent osób zainteresowanych w tej miejscowości bezprzewodowym internetem. Rozwiązanie: Mamy n = 200, k = 160, 1 α = W tablicach rozkładu normalnego znajdujemy u ( 1 α 2 ) = u(0.975) = Stosując pierwszy z powyższych wzorów otrzymujemy u(1 α 2 )2 + 2k 2(n + u(1 α = = 79.4%, 2 )2 ) natomiast l = u u(1 α 2 )2 4 + k(n k) n n + u(1 α = = 5.5%. 2 )2 Stąd P = [73.9%; 85.5%] Możemy też zastosować uproszczony wzór. Wtedy mamy k n = , a l = 1.96 = = 5.54%. 200 Stąd P = [74.5%; 85.5%]. 200 = Przedziały ufności dla odchylenia standardowego (lub wariancji) Przy szacowaniu wariancji lub odchylenia standardowego wiarygodne rezultaty można w zasadzie otrzymać tylko przy założeniu, że rozważana cecha ma rozkład normalny (ewentualnie przy dużej próbie zbliżony do normalnego). Jeśli rozkład jest inny niż normalny, to aby skorzystać z centralnego twierdzenia granicznego trzeba by mieć dodatkowe informacje o rozkładzie (np. inne momenty).
28 32 1. Elementy statystyki matematycznej Model C1 stosujemy go, gdy rozkład jest normalny o nieznanych µ i σ; (n 50) W tym modelu stosuje się statystykę opartą na rozkładzie χ 2 o n 1 stopniach swobody. Przedziały ufności dla odchylania standardowego otrzymujemy z wzoru (patrz punkt b) twierdzenia 1: [ ] n 1 n 1 P = s χ 2 ( 1 α 2, n 1); s χ 2 ( α 2, n 1). (2.8) PRZYKŁAD 17. Pewna firma ślusarska zakupiła automat do pomiaru średnicy produkowanych śrub. Wybrano 10 śrub i uzyskano następujące rezultaty w mm: 5.02, 5.01, 5.02, 5.01,4.99, 4.98, 5.00, 5.00, 5.02, Zakładając, że rozkład średnicy śrub jest normalny oszacuj przedziałowo wartość odchylenia standardowego średnicy śrub przy współczynniku ufności Rozwiązanie: Obliczamy s 2 = 1 9 x = i=1 10 i=1 x i = (x i 5.006) 2 = s = = Mamy 1 α = 0.99, skąd α = W tablicy kwantyli rozkładu χ 2 znajdujemy Stąd P = χ 2 ( 1 2 α, n 1) = χ 2 (0.005, 9) = χ 2 ( α, n 1) = χ 2 (0.995, 9) = [ ] ; = [0.0083; ].
29 1.6. Wyznaczanie przedziałów ufności 33 Model C2 stosujemy gdy rozkład jest normalny lub zbliżony do normalnego o nieznanych µ i σ dla dużej próby. Dla n > 50 wartości kwantyli rozkładu χ 2 nie są stablicowane. W takiej sytuacji korzystamy z faktu, że statystyka 2χ 2 (n 1) = 2 (n 1)s2 σ dla dużych n ma w przybliżeniu rozkład normalny 2 N( 2n 3, 1). To daje wzór na przedział ufności P = [ s 2(n 1) s 2(n 1) 2n 3 + u(1 α 2 ); 2n 3 u(1 α 2 ) ]. (2.9) PRZYKŁAD 18. W celu sprawdzenia, czy automat do produkcji lodów dokładnie porcjuje lody nastawiono go na 10 dkg i wyprodukowano 100 lodów. Po dokładnym zważeniu i dokonaniu obliczeń otrzymano średnią odchylenie standardowe z próbki s = dkg. Wyznacz przedział ufności przy założeniu, że rozważana cecha ma rozkład normalny i współczynniku 1 α = Rozwiązanie: Zastosujemy model C2. Mamy α = 0.05, 1 α 2 = W tablicy rozkładu normalnego znajdujemy u ( 1 α 2 ) = Stąd P = [ ] 198 ; = [ ; ] UWAGA. Obecnie modele A3 i C2, podobnie jak rozważane w następnym rozdziale modele D3 i E2 straciły na znaczeniu dzięki dostępności kwantyli rozkładów t i χ 2 dla dowolnych danych (między innymi dla dużych n). Wspomagając się komputerem możemy rozwiązać powyższe zadanie przy pomocy modelu C1. Otrzymujemy wtedy przedział ufności P = [ ; ].
30 34 1. Elementy statystyki matematycznej 1.7. Minimalna liczność próby We wszystkich modelach długość przedziału ufności dąży do 0, gdy liczność próbki n dąży do. Możemy więc rozwiązując odpowiednią nierówność znaleźć takie n, dla którego przedział ufności będzie krótszy od z góry zadanej długości. Przedział ufności dla wartości oczekiwanej ma zwykle postać [x l; x+l] jest więc długości 2l. Otrzymujemy zatem następujące rezultaty: Jeśli rozkład jest normalny o znanym σ, to z modelu A1 otrzymamy ( ( ) ) u 1 α 2 2 σ n. (2.10) l Najczęściej jednak nie znamy σ, a nawet nie potrafimy nic powiedzieć o innych parametrach rozkładu. Dlatego w takich przypadkach stosuje się metodę dwustopniową (tzw. metodę Steina). Najpierw pobiera się próbkę wstępną x 1,..., x n0. Oblicza się z tej próbki parametry x 0 i s 2 0. Wzór na minimalną liczebność próby dla rozkładu noralnego wygląda następująco: gdzie ( n t ( 1 α 2, n 0 1 ) s 0 l ) 2 n 0 1 n 0 + 1, (2.11) x 0 = 1 n 0 x i, s 2 0 = 1 (x i x 0 ) 2. n 0 n i=1 0 1 i=1 Po wyznaczeniu n i zrobieniu dodatkowych n n 0 prób wyznaczamy przedział ufności stosując wzór: P = [x l; x + l], gdzie l = t ( 1 α 2, n 0 1 ) n s 0. Dla rozkładu dwupunktowego (czyli frakcji elementów wyróżnionych) sprawa jest nieco inna, bo tu w zasadzie już próbka n 0
31 1.7. Minimalna liczność próby 35 wstępna powinna być (patrz model B1) dostatecznie duża. Możemy zastosować poniższy wzór (pamiętając, że nie jest on przy małej próbce w pełni wiarygodny!) ( ) ) k 0 2 n (u(1 α 2 ) n 0 1 k 0 n 0 l 2, (2.10 ) gdzie n 0 liczebność wstępnej próbki, k 0 liczba sukcesów we wstępnej próbce Możemy na szczęście w tym przypadku obyć się bez wstępnej próbki od razu zakładając, że będziemy mieli próbek więcej (np. n 30) przyjmując najmniej korzystne p = 0.5, co prowadzi do wzoru n u(1 α 2 )2 4l 2. (2.12) Jeśli okaże się, że otrzymane p jest istotnie inne niż 0.5, to otrzymane oszacowanie będzie precyzyjniejsze niż sobie założyliśmy! PRZYKŁAD 19. Geodeta ma zmierzyć odległość pomiędzy dwoma punktami otrzymując na poziomie ufności 1 ]alpha = 0.95, przedział ufności [x l; x + l] długości 10 m. Specjalistyczny przyrząd którym dysponuje ma rozkład błędów normalny z wariancją 100 m 2. Ile niezależnych pomiarów powinien wykonać? Rozwiązanie: Mamy l = 10 2 = 5 m, σ2 = 40m 2, u(1 1 2α) = u(0.975) = Stąd ( ( ) ) 2 u 1 α 2 σ n = (1.96)2 100 = l 25 Trzeba więc wykonać 16 pomiarów. PRZYKŁAD 20. Pewien program kompresujący dane został przetestowany na 6 losowo wybranych różnego rodzaju plikach i otrzymano wyniki wielkości pliku po kompresji w stosunku do wielkości pliku przed kompresją. 60%, 72%, 42%, 79%, 71%, 63%. Ile jeszcze nale-
32 36 1. Elementy statystyki matematycznej ży dodatkowo dokonać pomiarów, aby otrzymać na poziomie ufności 1 α = 0.95 przedział ufności nie dłuższy niż 20%?. Rozwiązanie: Obliczamy x = 64.5, s 2 = t(1 α 2, 5) = , l = 20 2 % = 10%. Stąd n = Powinno być zatem razem 11 prób. Trzeba jeszcze dołożyć 5 prób. PRZYKŁAD 21. Pewien informatyk skonstruował program rozpoznający sfilmowane kamerą twarze z odległości 200 m. Przeprowadzono wstępną próbę programu, który na 16 osób rozpoznał 12. Ile jeszcze prób należy przeprowadzić, aby na poziomie ufności 1 α = 0.95 otrzymać oszacowanie z dokładnością l = 10%? Rozwiązanie: Mamy u(1 α 2 ) = u(0.975) = 1.96., n 0 = 16, k 0 = 12, l = 0.1. Stąd n = Odpowiedź trzeba jeszcze przeprowadzić = 56 dodatkowych prób. PRZYKŁAD 22. Pewien sklep komputerowy chce przeprowadzić badanie, jaki procent klientów wchodzących do sklepu dokonuje zakupu. Ilu klientów powinien uwzględnić w badaniu aby na poziomie ufności 1 α = 0.99 otrzymać dokładność l = 5%? Rozwiązanie: Mamy u(1 α 2 ) = u(0.995) = 2.58., l = Stąd n = Powinno się sprawdzić 666 klientów.
33 1.8. Parametryczne testy istotności Parametryczne testy istotności W parametrycznych testach istotności stawiamy hipotezę, że dany parametr np. średnia, wariancja itp. pewnej populacji przyjmuje określoną wartość. Przeciwko tej hipotezie stawiamy hipotezę przeciwną, która może przybierać jedną z 3 form: parametr jest większy od tej wartości, parametr jest mniejszy od tej wartości lub parametr jest różny od tej wartości. Przeprowadzamy eksperyment, czyli bierzemy próbkę z populacji i na jej podstawie albo odrzucamy hipotezę, albo twierdzimy, że doświadczenie nie przeczy hipotezie tzn. nie ma podstaw do jej odrzucenia. Podkreślamy, że jedno doświadczenie nie jest jeszcze podstawą do twierdzenia, że potwierdzamy hipotezę, możemy tylko jej nie odrzucać! W jaki sposób dokonujemy obliczeń? Zademonstrujemy to na prostym przykładzie. Przypuśćmy, że losujemy 10 liczb z przedziału [0; 1] zakładając, że prawdopodobieństwo wylosowania każdej liczby jest takie same. Zatem średnia wylosowanych liczb powinna wynieść około 0.5. Jeśli ta średnia wypadnie 0.45 lub 0.55, to gotowi jesteśmy przyjąć, że różni się to niewiele od tego, czego oczekiwaliśmy i hipotezy, że µ = 0.5 nie powinniśmy odrzucać. A jeśli średnia wypadnie 0.9, to z całą pewnością będziemy podejrzewać, że coś jest nie tak i hipotezę µ = 0.5 jesteśmy skłonni odrzucić, bowiem prawdopodobieństwo tego, że x > 0.9 jest bardzo małe, czyli zaistniała sytuacja jest mało prawdopodobna. Należy zadać pytanie gdzie leży ta graniczna wartość g, przy której odrzucimy hipotezę, jeśli wypadnie wynik x > g. Ale to, czy ją odrzucimy zależy nie tylko od tego jaki wynik otrzymamy, ale z jakim stopniem pewności tzn. z jakim współczynnikiem istotności ją odrzucimy, czyli jakie jest prawdopodobieństwo tego, że przy losowym wyborze 10 liczb z przedziału [0; 1] ich średnia wartość x wypadnie większa lub równa g. Innymi
34 38 1. Elementy statystyki matematycznej słowy wybieramy α, (bardzo małe) takie, że P ( X 0.5 > g) = α. Przypominamy, że liczbę α nazywamy poziomem istotności testu. Test będzie zależał od kilku czynników: od współczynnika istotności α, od typu rozkładu, od liczności próbki, od opartego na teorii i praktyce odpowiedniego modelu, który zastosujemy. Schemat budowy takiego testu dla pewnego parametru θ będzie następujący: Krok 1. Stawiamy hipotezę θ = θ 0 i hipotezę przeciwną. Krok 2. Dobieramy odpowiedni model, stosujemy statystykę z tego modelu i obliczamy wartość statystyki testowej dla danej próbki Krok 3. Budujemy tzw. zbiór krytyczny W. Krok 4. Jeśli ta wartość znajdzie się w zbiorze krytycznym W, to hipotezę odrzucamy, w przeciwnym wypadku nie ma podstaw do jej odrzucenia. Hipoteza przeciwna może przybierać trzy formy w zależności od konkretnej sytuacji. Opiszemy je. Przypuśćmy, że badana cecha θ może przyjmować wartości w przedziale (a; b). Sytuacja pierwsza. Mamy z nią do czynienia np. kiedy interesuje nas czy jakiś algorytm jest wystarczająco szybki. To oznacza, że średni czas jego pracy na pewnych danych nie przekracza θ 0 minut. Niekorzystna sytuacja pojawia się wtedy, gdy
35 1.8. Parametryczne testy istotności 39 θ będzie istotnie większe od θ 0. Zatem hipoteza przeciwna będzie miała postać θ > θ 0, a zbiór krytyczny W = [g; b), g > θ 0. Sytuacja druga. Pojawia się wtedy, gdy nie chcielibyśmy, aby nasza badana cecha była zbyt mała. Na przykład średnie zarobki. Wtedy hipoteza przeciwna do hipotezy θ = θ 0 będzie postaci θ < θ 0, a zbiór krytyczny będzie postaci W = (a; g], g < θ 0. Sytuacja trzecia. Mamy z nią do czynienia wtedy, gdy niekorzystne jest odchylenie od wartości θ 0 zarówno w jedną jak i w drugą stronę. Na przykład zbyt małe ceny jakiegoś towaru mogą spowodować nieopłacalność produkcji i upadek gałęzi przemysłu, a z kolei zbyt duże ceny spowodują gwałtowny spadek popytu. Wtedy hipoteza przeciwna do hipotezy θ = θ 0 ma postać θ θ 0, a zbiór krytyczny jest postaci W = (a; g 1 ] [g 1 ; b), g 1 < θ 0 < g 2. Schemat postępowania w wypadku rozkładu normalnego dla hipotezy dotyczącej wartości średniej µ = µ 0 = 0.8 i hipotezy przeciwnej µ > µ 0 = 0.8 widzimy na rysunku. W tym wypadku a =, b =. Zbiorem krytycznym jest zbiór W = [g; ). Poziom istotności α jest to pole zakropkowanej figury i oznacza prawdopodobieństwo tego, że µ > µ 0. Jest ono bardzo małe, czyli zdarzenie µ > µ 0 jest mało prawdopodobne. Zatem jeśli takie zdarzenie zaszło, to skłonni jesteśmy uważać, że µ nie jest równe µ 0. Poprzez standardową zamianę zmiennej doprowadzamy do sytuacji, kiedy zbiór krytyczny jest symetryczny względem punktu 0.
36 40 1. Elementy statystyki matematycznej µ 0 g Rys. 2. Hipotezy dotyczące wartości średniej Będziemy weryfikować hipotezę µ = µ 0. Model D1 stosujemy dla rozkładu normalnego o znanym σ. Oparty jest na statystyce u = x µ 0 n. (2.13) σ Zbiór krytyczny: W = ( ; u(1 α)] dla hipotezy przeciwnej µ < µ 0 ; W = [u(1 α); ) dla hipotezy przeciwnej µ > µ 0 ; W = ( ; u(1 α 2 )] [u(1 α 2 ); ) dla hipotezy przeciwnej µ µ 0 ; PRZYKŁAD 23. Wcześniejsze badania wykazały, że automatyczne urządzenie, które produkuje gwoździe zadanej długości pracuje z odchyleniem standardowym 0.1mm. Aby sprawdzić, czy dostarczone nam gwoździe 4 centymetrowe, są takie jak zamówiliśmy, przebadaliśmy 100 losowo wybranych gwoździ i otrzymaliśmy wartość średnią 3.99 cm. Czy na poziomie istotności α = 0.05 możemy mieć do producenta gwoździ zastrzeżenia? Rozwiązanie: Ponieważ zarówno gwoździe za długie jak i za krótkie nas nie satysfakcjonują, stawiamy hipotezę:
37 1.8. Parametryczne testy istotności 41 H 0 : µ = µ 0 = 4 cm = 40 mm wobec hipotezy przeciwnej dwustronnej H 1 : µ µ 0. Obliczamy wartość statystyki testowej. Mamy (liczymy w mm). u obl = x µ n = 100 = 10 σ 0.1 Zbiorem krytycznym będzie suma dwóch przedziałów W = ( ; u(1 α 2 )] [u(1 α 2 ); ). Z tablic kwantyli rozkładu normalnego znajdujemy u(1 α 2 ) = u(0.975) = 1.96, skąd W = ( ; 1.96] [1.96; ). Zatem u obl W, skąd hipotezę H 0 odrzucamy. Wniosek: powinniśmy zakwestionować zakupioną partię gwoździ. Model D2 stosujemy go przy rozkładzie normalnym o nieznanym σ. Używamy statystyki: t obl = x µ 0 n. (2.14) s Zbiór krytyczny: W = ( ; t(1 α, n 1)] dla hipotezy przeciwnej µ < µ 0 ; W = [t(1 α, n 1); ) dla hipotezy przeciwnej µ > µ 0 ; W = ( ; t(1 α 2, n 1)] [t(1 α 2, n 1); ) dla hipotezy przeciwnej µ µ 0 ; gdzie t jest odpowiednim kwantylem rozkładu t Studenta. PRZYKŁAD 24. Autor programu szachowego rozwiązującego zadania szachowe reklamuje swój program twierdząc, że program rozwiązuje na procesorze pentium 4, 2GHZ zadania mat w 10 posunięciach w średnim czasie około 2 godziny przy odchyleniu standardowym 1 godzina i twierdzi, że rozkład jest normalny. Przetestowano go na 6 zadaniach i uzyskano czasy: 1 godz. 35 min, 2 godz., 2 godz. 18 min, 2 godz 55 min, 1 godz. 12 min. 4 godz. 25 min. Sprawdzimy na poziomie istotności α = 0.01 czy autor programu się nie przechwala.
38 42 1. Elementy statystyki matematycznej Rozwiązanie: Sposób I. Przeliczymy wszystko na minuty i zastosujemy test Kołmogorowa aby sprawdzić, czy próbka rzeczywiście pochodzi z rozkładu normalnego N(120, 60), przyjmując dane sugerowane przez autora µ = 2 godz., σ = 1 godz. Ustawiamy w tym celu dane w ciąg rosnący. Otrzymujemy w minutach. x 1 = 72, x 2 = 95, x 3 = 120, x 4 = 138, x 5 = 175, x 6 = 265. Tworzymy tabelę: i 1 i 6 F (xi) x i F (x i) i 1 i F (x i) max Zatem maksimum=0.49. W tablicach znajdujemy d 6 (0.99) = Jest to liczba większa od 0.49, zatem hipotezy nie odrzucamy. Sposób II. Uwierzymy autorowi w to, że rozkład jest normalny (bo tego nie można zaliczyć do przechwalania się!) i zastosujemy model D2. Obliczamy. x = 144.2, s = Mamy µ 0 = 120. Niekorzystna sytuacja jest tylko wtedy, gdy program pracuje za wolno, zatem stawiamy hipotezę: H 0 : µ 120 przeciwko hipotezie H 1 : µ > 120. W takim razie zbiór krytyczny jest postaci W = [t(1 α, n 1); ). Możemy połączyć obie metody traktując rozważania w sposobie pierwszym tylko jako potwierdzenie tego, że rozkład jest normalny, a jako test zasadniczy uznać sposób drugi.
39 1.8. Parametryczne testy istotności 43 Znajdujemy w tablicach rozkładu Studenta t(0.99, 5) = Stąd Obliczamy statystykę W = [4.032; ). t obl = x µ 0 n = s Widzimy, że t obl W, zatem nie powinniśmy zarzucać twórcy programu, że się przechwala. Jeśli rozkład jest nieznany, to testy można przeprowadzać tylko dla dużych prób (n 30). Stosujemy wówczas model D3 rozkład dowolny o nieznanym σ. Model ten jest analogiczny jak model D1, opiera się na fakcie (wynikającym z twierdzenia granicznego), że dla dużej próbki rozkład jest granicznie normalny i że możemy nieznaną wartość σ 2 zastąpić wartością empiryczną s 2. Prowadzi to do wzorów: u obl = x µ 0 n. 4 (2.15) s Zbiór krytyczny: W = ( ; u(1 α)] dla hipotezy przeciwnej µ < µ 0 ; W = [u(1 α); ) dla hipotezy przeciwnej µ > µ 0 ; W = ( ; u(1 α 2 )] [u(1 α 2 ); ) dla hipotezy przeciwnej µ µ 0, PRZYKŁAD 25. Producent baterii do laptopów twierdzi, że czas pracy naładowanej baterii wynosi co najmniej 2 godziny. Przebadano 100 baterii i uzyskano średni czas pracy 110 minut i odchylenie standardowe 35 minut. Na poziomie istotności α = 0.05 sprawdź czy producent ma rację. Rozwiązanie: 4 W niektórych źródłach w tym wzorze zamiast s podaje się ŝ.
40 44 1. Elementy statystyki matematycznej Niepokojąca sytuacja jest wówczas, gdy bateria pracuje za krótko dlatego stawiamy hipotezę: H 0 ; µ = µ 0 = 120 przeciwko hipotezie H 1 : µ < 120. W takim razie zbiór krytyczny jest postaci W = ( ; u(1 α)]. Znajdujemy w tablicach kwantyli rozkładu normalnego u(0.95) = Stąd W = ( ; 1.64]. Obliczamy statystykę u obl = x µ 0 s 10 n = 100 = Widzimy, że u obl W, zatem powinniśmy odrzucić hipotezę H 0 na rzecz hipotezy przeciwnej. Producent nie ma racji. Hipotezy dotyczące wariancji (odchylenia standardowego) Model E1. - stosujemy go, gdy rozkład jest normalny o nieznanych µ i σ, n 50. Stosujemy statystykę χ 2 obl = (n 1)s2 σ0 2. (2.16) Zbiór krytyczny: W = (0; χ 2 (α, n 1)] dla hipotezy przeciwnej σ < σ 0 ; W = [χ 2 (1 α, n 1); ) dla hipotezy przeciwnej σ > σ 0 ; W = (0; χ 2 ( α 2, n 1)] [χ2 (1 α 2, n 1); ) dla hipotezy przeciwnej σ σ 0 ; PRZYKŁAD 26. Aby oszacować dokładność pomiarów wykonywanych elektroniczną wagą ośmiokrotnie zważono ten sam obiekt i otrzymano wyniki (w gramach): 12.13, 12, 25, 12.11, 12.19, 12.14,
41 1.8. Parametryczne testy istotności 45 12, 21, 12.18, Zakładając, że cecha ma rozkład normalny a poziomie istotności α = 0.05 zweryfikować hipotezę σ = 0.04 g. przeciwko hipotezie σ > 0.04 g. Rozwiązanie:Obliczona wartość średniej empirycznej x wynosi , wariancji empirycznej s 2 = , a odchylenia standardowego s, Zatem wartość statystyki χ 2 obl = Zbiór krytyczny ma postać (8 1) = 9.1. W = [χ 2 (1 α, n 1); ). Z tablic kwantyli rozkładu χ 2 otczytujemy χ 2 (0.95, 7) = Ponieważ 9.1 W, nie ma podstaw do odrzucenia hipotezy. Model E2 - stosujemy dla rozkładu normalnego o nieznanych µ i σ (n 50). Opiera się on na wniosku z odpowiedniego twierdzenia granicznego, który powiada, że statystyka 2(n 1)s 2 σ 2 0 asymptotycznie ma rozkład N( 2n 3, 1). (porównaj model C2) W takim razie stosujemy statystykę u obl = 2(n 1)s 2 σ 2 0 2n 3. (2.17) która ma asymptotyczny rozkład N(0, 1). Zbiór krytyczny: W = ( ; u(1 α)] dla hipotezy przeciwnej µ < µ 0 ; W = [u(1 α); ) dla hipotezy przeciwnej µ > µ 0 ; W = ( ; u(1 α 2 )] [u(1 α 2 ); ) dla hipotezy przeciwnej µ µ 0 ; PRZYKŁAD 27. Aby zbadać dokładność pracy elektronicznego mikrometra zmierzono 50 razy grubość włosa i uzyskano empiryczne
42 46 1. Elementy statystyki matematycznej odchylenie standardowe mm. Zbadać na poziomie istotności α = 0.05 hipotezę, że mikrometr mierzy z dokładnością mm. Rozwiązanie: Stawiamy hipotezę: H 0 : σ = σ 0 = przeciwko hipotezie H 1 : σ > σ 0. Obliczamy statystykę u obl = = Zbiór krytyczny W = (u(1 α); ) = u(0.95; ) = (1.64; ). Widzimy, że liczba u obl jest nieznacznie większa od 1.64 jest na granicy zbioru krytycznego, czyli raczej hipotezę należy odrzucić. Rozwiążemy to samo zadanie z wykorzystaniem modelu E1. Mamy χ 2 obl = Zbiór krytyczny jest równy 49 (0.0023)2 (0.0020) 2 = W = [χ 2 (0.95, 49); ) = [66.34; ). Tym razem wartość statystyki testowej leży (minimalnie) poza zbiorem krytycznym, a więc hipotezy nie odrzucamy. Przykład ten pokazuje, że w granicznych sytuacjach rezultat może zależeć od wyboru modelu! Tu sytuacja była graniczna podwójnie, bo i liczność próbki była na granicy dużej i małej. W takich sytuacjach lepiej stosować model E1 i kwantyle rozkładu χ 2 obliczać przy pomocy komputera (patrz uwaga na stronie 33). Hipotezy o równości frakcji elementów wyróżnionych Badana cecha ma rozkład dwupunktowy z nieznanym parametrem p. Oznaczmy przez k liczbę wyróżnionych elementów
43 1.8. Parametryczne testy istotności 47 w próbie n-elementowej. Próbka powinna raczej być duża. Jeśli nie ma możliwości testowania hipotezy na dużej próbce, to można hipotezę przeprowadzić, ale przy wynikach bliskich granicznym podchodzić do nich bardzo ostrożnie. Model G1. Stosujemy statystykę u obl = k np 0 np0 (1 p 0 ) 5. (2.18) Zbiory krytyczne są dane wzorami: W = ( ; u(1 α)] dla hipotezy przeciwnej p < p 0 ; W = [u(1 α); ) dla hipotezy przeciwnej p > p 0 ; W = ( ; u(1 α 2 )] [u(1 α 2 ); ) dla hipotezy przeciwnej p p 0 ; PRZYKŁAD 28. Policzono pewnego dnia klientów internetowego sklepu komputerowego i okazało się, że na 45 klientów tego dnia 13 było z małych miejscowości. Na poziomie istotności α = 0.05 zweryfikujemy hipotezę, że procent klientów z małych miejscowości korzystających z zakupów przez internet wynosi 35%. Rozwiązanie: Stawiamy hipotezę H 0 : p = p 0 = 0.35 przeciwko hipotezie H 1 : p 0.3. Nasze dane n = 45, k = 13. Liczymy u obl = = Gdy liczność próby nie jest dostatecznie duża niektóre źródła zalecają zastosowanie statystyki: ( u obl = 2 arc sin ) k n 2 arc sin p 0 n. W praktyce otrzymane wyniki przy zastosowaniu obu statystyk różnią się nieznacznie.
44 48 1. Elementy statystyki matematycznej Zbiór krytyczny W = ( ; u(0.975)] [u(0.975); ) = ( ; 1.96] [1.96; ). Ponieważ u obl nie należy do zbioru krytycznego, nie ma podstaw do odrzucenia hipotezy. PRZYKŁAD 29. Pewien sklep z odzieżą chce sprawdzić, czy również na terenie jego działalności potwierdzą się dane, że co najmniej 80% klientów stanowią panie. Przez pewien czas skrupulatnie liczono klientów i okazało się, że na 427 osób, pań było 301. Czy dane te przeczą ogólnej statystyce na poziomie istotności α = 0.05? Rozwiązanie: Stawiamy hipotezę H 0 : p = p 0 = 0.8 przeciwko hipotezie H 1 : p < 0.8. Nasze dane n = 427, k = 304. Liczymy u obl = = (1 0.8) Zbiór krytyczny W = ( ; u(0.95)] = ( ; 1.64]. Ponieważ u obl nie należy do zbioru krytycznego, nie ma podstaw do odrzucenia hipotezy. PRZYKŁAD 30. Rozwiążemy zadanie 7 przy pomocy tego modelu. Przypomnijmy: rzucamy sto razy monetą. Ile razy powinna paść reszka, aby odrzucić hipotezę moneta jest symetryczna? Przyjmujemy α = 0.05 Rozwiązanie: Stawiamy hipotezę H 0 : p = p 0 = 0.5 przeciwko hipotezie H 1 : p 0.5. Niech m oznacza liczbę reszek. Liczymy m 50 u obl = = m (1 0.5) 5
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Bardziej szczegółowoBłędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa
Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie
Bardziej szczegółowoWeryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Bardziej szczegółowoWeryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Bardziej szczegółowoStatystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
Bardziej szczegółowoUwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu, z którego pochodzi próbka. Hipotezy dzielimy na parametryczne i nieparametryczne. Parametrycznymi
Bardziej szczegółowoStatystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych
Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej
Bardziej szczegółowoTestowanie hipotez statystycznych
Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom
Bardziej szczegółowoWykład 3 Hipotezy statystyczne
Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza
Bardziej szczegółowoWykład 10 Estymacja przedziałowa - przedziały ufności dla średn
Wykład 10 Estymacja przedziałowa - przedziały ufności dla średniej Wrocław, 21 grudnia 2016r Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja 10.1 Przedziałem
Bardziej szczegółowoRozkłady statystyk z próby
Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny
Bardziej szczegółowoStatystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
Bardziej szczegółowo166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
Bardziej szczegółowoWYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 7 i 8 1 / 9 EFEKTYWNOŚĆ ESTYMATORÓW, próba
Bardziej szczegółowoWykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
Bardziej szczegółowoStatystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28
Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych
Bardziej szczegółowoIdea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
Bardziej szczegółowoStatystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
Bardziej szczegółowoEstymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014
Estymacja przedziałowa - przedziały ufności dla średnich Wrocław, 5 grudnia 2014 Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja Przedziałem ufności dla paramertu
Bardziej szczegółowoTestowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
Bardziej szczegółowoWYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
Bardziej szczegółowob) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:
ROZWIĄZANIA I ODPOWIEDZI Zadanie A1. Można założyć, że przy losowaniu trzech kul jednocześnie kolejność ich wylosowania nie jest istotna. A więc: Ω = 20 3. a) Niech: - wśród trzech wylosowanych opakowań
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.
STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z
Bardziej szczegółowoTestowanie hipotez statystycznych. Wnioskowanie statystyczne
Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy
Bardziej szczegółowoWstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów
Wstęp do probabilistyki i statystyki Wykład 4. Statystyki i estymacja parametrów dr hab.inż. Katarzyna Zakrzewska, prof.agh, Katedra Elektroniki, WIET AGH Wstęp do probabilistyki i statystyki. Wykład 4
Bardziej szczegółowo), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0
Testowanie hipotez Każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy nazywamy hipotezą statystyczną. Hipoteza określająca jedynie wartości nieznanych parametrów liczbowych badanej cechy
Bardziej szczegółowoWnioskowanie statystyczne i weryfikacja hipotez statystycznych
Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.
Bardziej szczegółowoStatystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Bardziej szczegółowoMatematyka z el. statystyki, # 6 /Geodezja i kartografia II/
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl
Bardziej szczegółowoStatystyka w przykładach
w przykładach Tomasz Mostowski Zajęcia 10.04.2008 Plan Estymatory 1 Estymatory 2 Plan Estymatory 1 Estymatory 2 Własności estymatorów Zazwyczaj w badaniach potrzebujemy oszacować pewne parametry na podstawie
Bardziej szczegółowoZad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:
Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności
Bardziej szczegółowoLABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
Bardziej szczegółowoTESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy
Bardziej szczegółowoVI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15
VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady
Bardziej szczegółowoZadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
Bardziej szczegółowoTestowanie hipotez statystycznych. Wprowadzenie
Wrocław University of Technology Testowanie hipotez statystycznych. Wprowadzenie Jakub Tomczak Politechnika Wrocławska jakub.tomczak@pwr.edu.pl 10.04.2014 Pojęcia wstępne Populacja (statystyczna) zbiór,
Bardziej szczegółowoTESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy
Bardziej szczegółowoSTATYSTYKA
Wykład 1 20.02.2008r. 1. ROZKŁADY PRAWDOPODOBIEŃSTWA 1.1 Rozkład dwumianowy Rozkład dwumianowy, 0 1 Uwaga: 1, rozkład zero jedynkowy. 1 ; 1,2,, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym
Bardziej szczegółowoRACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA
RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA LISTA 10 1.Dokonano 8 pomiarów pewnej odległości (w m) i otrzymano: 201, 195, 207, 203, 191, 208, 198, 210. Wiedząc,że błąd pomiaru ma rozkład normalny
Bardziej szczegółowoLABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
Bardziej szczegółowoHipotezy statystyczne
Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej próbki losowej. Hipotezy
Bardziej szczegółowoHipotezy statystyczne
Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej
Bardziej szczegółowoTESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne.
Bardziej szczegółowoLISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów
LISTA 4 1.Na pewnym obszarze dokonano 40 pomiarów grubości warstwy piasku otrzymując w m.: 54, 58, 64, 69, 61, 56, 41, 48, 56, 61, 70, 55, 46, 57, 70, 55, 47, 62, 55, 60, 54,57,65,60,53,54, 49,58,62,59,55,50,58,
Bardziej szczegółowoWYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Było: Estymacja parametrów rozkładu teoretycznego punktowa przedziałowa Przykład. Cecha X masa owocu pewnej odmiany. ZałoŜenie: cecha X ma w populacji rozkład
Bardziej szczegółowoPobieranie prób i rozkład z próby
Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.
Bardziej szczegółowoStatystyka matematyczna. Wykład III. Estymacja przedziałowa
Statystyka matematyczna. Wykład III. e-mail:e.kozlovski@pollub.pl Spis treści Rozkłady zmiennych losowych 1 Rozkłady zmiennych losowych Rozkład χ 2 Rozkład t-studenta Rozkład Fischera 2 Przedziały ufności
Bardziej szczegółowoMetody Statystyczne. Metody Statystyczne.
gkrol@wz.uw.edu.pl #4 1 Sprawdzian! 5 listopada (ok. 45-60 minut): - Skale pomiarowe - Zmienne ciągłe i dyskretne - Rozkład teoretyczny i empiryczny - Miary tendencji centralnej i rozproszenia - Standaryzacja
Bardziej szczegółowoPrzykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych
Rozdział 1 Zmienne losowe, ich rozkłady i charakterystyki 1.1 Definicja zmiennej losowej Niech Ω będzie przestrzenią zdarzeń elementarnych. Definicja 1 Rodzinę S zdarzeń losowych (zbiór S podzbiorów zbioru
Bardziej szczegółowoODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW
ODRZUCANIE WYNIKÓW OJEDYNCZYCH OMIARÓW W praktyce pomiarowej zdarzają się sytuacje gdy jeden z pomiarów odstaje od pozostałych. Jeżeli wykorzystamy fakt, że wyniki pomiarów są zmienną losową opisywaną
Bardziej szczegółowoGdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).
PRZYKŁADY TESTÓW NIEPARAMETRYCZNYCH. Test zgodności χ 2. Ten test służy testowaniu hipotezy, czy rozważana zmienna ma pewien ustalony rozkład, czy też jej rozkład różni się od tego ustalonego. Tym testem
Bardziej szczegółowoWykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu
Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotności, p-wartość i moc testu Wrocław, 01.03.2017r Przykład 2.1 Właściciel firmy produkującej telefony komórkowe twierdzi, że wśród jego produktów
Bardziej szczegółowoStatystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Bardziej szczegółowoTestowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.
Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ
Bardziej szczegółowoTestowanie hipotez statystycznych cd.
Temat Testowanie hipotez statystycznych cd. Kody znaków: żółte wyróżnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Przykłady testowania hipotez dotyczących:
Bardziej szczegółowoTESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.
TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe
Bardziej szczegółowoWYKŁAD 5 TEORIA ESTYMACJI II
WYKŁAD 5 TEORIA ESTYMACJI II Teoria estymacji (wyznaczanie przedziałów ufności, błąd badania statystycznego, poziom ufności, minimalna liczba pomiarów). PRÓBA Próba powinna być reprezentacyjna tj. jak
Bardziej szczegółowo50 zadań ze statystyki matematycznej dla studentów ZARZĄDZANIA z rozwiązaniami
Jan Rusinek 50 zadań ze statystyki matematycznej dla studentów ZARZĄDZANIA z rozwiązaniami UWAGA! Ten tekst jest w trakcie przygotowania i sprawdzania. Może zawierać błędy. Jest sukcesywnie poprawiany
Bardziej szczegółowoa. opisać badaną cechę; cechą X jest pomiar średnicy kulki
Maszyna ustawiona jest tak, by produkowała kulki łożyskowe o średnicy 1 cm. Pomiar dziesięciu wylosowanych z produkcji kulek dał x = 1.1 oraz s 2 = 0.009. Czy można uznać, że maszyna nie rozregulowała
Bardziej szczegółowoSpis treści 3 SPIS TREŚCI
Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe
Bardziej szczegółowo... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).
Egzamin ze Statystyki Matematycznej, WNE UW, wrzesień 016, zestaw B Odpowiedzi i szkice rozwiązań 1. Zbadano koszt 7 noclegów dla 4-osobowej rodziny (kwatery) nad morzem w sezonie letnim 014 i 015. Wylosowano
Bardziej szczegółowoMATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ
MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ Opracowała: Milena Suliga Wszystkie pliki pomocnicze wymienione w treści
Bardziej szczegółowoRachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Weryfikacja hipotez dotyczących postaci nieznanego rozkładu -Testy zgodności.
Bardziej szczegółowoZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.
Opracowała: Joanna Kisielińska ZMIENNE LOSOWE Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R tzn. X: R. Realizacją zmiennej losowej
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów
STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów
Bardziej szczegółowoZadania ze statystyki, cz.6
Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z
Bardziej szczegółowoESTYMACJA PRZEDZIAŁOWA WYBRANYCH PARAMETRÓW
ESTYMACJA PRZEDZIAŁOWA WYBRANYCH PARAMETRÓW POPULACJI Szkic wykładu Wprowadzenie 1 Wprowadzenie 2 3 4 Przypomnienie dotychczasowych rozważań Przedziałem ufności nazywamy przedział losowy, o którym przypuszczamy
Bardziej szczegółowoWYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 3 1 / 8 ZADANIE z rachunku
Bardziej szczegółowoWnioskowanie statystyczne. Statystyka w 5
Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających
Bardziej szczegółowoMetody probabilistyczne
Metody probabilistyczne 13. Elementy statystki matematycznej I Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 17.01.2019 1 / 30 Zagadnienia statystki Przeprowadzamy
Bardziej szczegółowoRÓWNOWAŻNOŚĆ METOD BADAWCZYCH
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych
Bardziej szczegółowo4.Zmienne losowe X 1, X 2,..., X 100 są niezależne i mają rozkład wykładniczy z α = 0.25 Jakie jest prawdopodobieństwo, że 1
LISTA 7 W rozwiązaniu zadań 1-4 wykorzystać centralne twierdzenie graniczne. 1.Prawdopodobieństwo, że aparat zepsuje się w czasie jego konserwacji wynosi 0.02. Jakie jest prawdopodobieństwo, że w trakcie
Bardziej szczegółowoW rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:
W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: Zmienne losowe skokowe (dyskretne) przyjmujące co najwyżej przeliczalnie wiele wartości Zmienne losowe ciągłe
Bardziej szczegółowoTestowanie hipotez statystycznych
Temat Testowanie hipotez statystycznych Kody znaków: Ŝółte wyróŝnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Idea i pojęcia teorii testowania hipotez
Bardziej szczegółowoVII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15
VII WYKŁAD STATYSTYKA 30/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 7 (c.d) WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności,
Bardziej szczegółowoLABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.
LABORATORIUM 4 1. Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz. I) WNIOSKOWANIE STATYSTYCZNE (STATISTICAL INFERENCE) Populacja
Bardziej szczegółowoEstymacja punktowa i przedziałowa
Temat: Estymacja punktowa i przedziałowa Kody znaków: żółte wyróżnienie nowe pojęcie czerwony uwaga kursywa komentarz 1 Zagadnienia 1. Statystyczny opis próby. Idea estymacji punktowej pojęcie estymatora
Bardziej szczegółowoStatystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria Wykład 5 dr inż. Anna Skowrońska-Szmer zima 2017/2018 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją
Bardziej szczegółowoStatystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.
Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde
Bardziej szczegółowoBADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO
Zakład Metrologii i Systemów Pomiarowych P o l i t e c h n i k a P o z n ańska ul. Jana Pawła II 24 60-965 POZNAŃ (budynek Centrum Mechatroniki, Biomechaniki i Nanoinżynierii) www.zmisp.mt.put.poznan.pl
Bardziej szczegółowoStatystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski
Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW STATYSTYKA to nauka, której przedmiotem
Bardziej szczegółowoEstymacja parametrów rozkładu cechy
Estymacja parametrów rozkładu cechy Estymujemy parametr θ rozkładu cechy X Próba: X 1, X 2,..., X n Estymator punktowy jest funkcją próby ˆθ = ˆθX 1, X 2,..., X n przybliżającą wartość parametru θ Przedział
Bardziej szczegółowoStatystyka Matematyczna Anna Janicka
Statystyka Matematyczna Anna Janicka wykład IX, 25.04.2016 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Plan na dzisiaj 1. Hipoteza statystyczna 2. Test statystyczny 3. Błędy I-go i II-go rodzaju 4. Poziom istotności,
Bardziej szczegółowoStatystyka w analizie i planowaniu eksperymentu
29 marca 2011 Przestrzeń statystyczna - podstawowe zadania statystyki Zdarzeniom losowym określonym na pewnej przestrzeni zdarzeń elementarnych Ω można zazwyczaj na wiele różnych sposobów przypisać jakieś
Bardziej szczegółowoDokładne i graniczne rozkłady statystyk z próby
Dokładne i graniczne rozkłady statystyk z próby Przypomnijmy Populacja Próba Wielkość N n Średnia Wariancja Odchylenie standardowe 4.2 Rozkład statystyki Mówimy, że rozkład statystyki (1) jest dokładny,
Bardziej szczegółowoZestaw 2: Zmienne losowe. 0, x < 1, 2, 2 x, 1 1 x, 1 x, F 9 (x) =
Zestaw : Zmienne losowe. Które z poniższych funkcji są dystrybuantami? Odpowiedź uzasadnij. Wskazówka: naszkicuj wykres. 0, x 0,, x 0, F (x) = x, F (x) = x, 0 x
Bardziej szczegółowoWERYFIKACJA HIPOTEZ STATYSTYCZNYCH
WERYFIKACJA HIPOTEZ STATYSTYCZNYCH I. TESTY PARAMETRYCZNE II. III. WERYFIKACJA HIPOTEZ O WARTOŚCIACH ŚREDNICH DWÓCH POPULACJI TESTY ZGODNOŚCI Rozwiązania zadań wykonywanych w Statistice przedstaw w pliku
Bardziej szczegółowoTablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Bardziej szczegółowoStatystyka w analizie i planowaniu eksperymentu
31 marca 2014 Przestrzeń statystyczna - podstawowe zadania statystyki Zdarzeniom losowym określonym na pewnej przestrzeni zdarzeń elementarnych Ω można zazwyczaj na wiele różnych sposobów przypisać jakieś
Bardziej szczegółowoPrawdopodobieństwo i rozkład normalny cd.
# # Prawdopodobieństwo i rozkład normalny cd. Michał Daszykowski, Ivana Stanimirova Instytut Chemii Uniwersytet Śląski w Katowicach Ul. Szkolna 9 40-006 Katowice E-mail: www: mdaszyk@us.edu.pl istanimi@us.edu.pl
Bardziej szczegółowoSIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY
SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY Weryfikacja hipotez statystycznych Statystyka i demografia PROJEKT DOFINANSOWANY ZE ŚRODKÓW NARODOWEGO BANKU POLSKIEGO URZĄD STATYSTYCZNY
Bardziej szczegółowoOdchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi
Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska D syst D śr m 1 3 5 2 4 6 śr j D 1
Bardziej szczegółowoWeryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1
Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie
Bardziej szczegółowoEstymacja parametrów w modelu normalnym
Estymacja parametrów w modelu normalnym dr Mariusz Grządziel 6 kwietnia 2009 Model normalny Przez model normalny będziemy rozumieć rodzine rozkładów normalnych N(µ, σ), µ R, σ > 0. Z Centralnego Twierdzenia
Bardziej szczegółowo1 Podstawy rachunku prawdopodobieństwa
1 Podstawy rachunku prawdopodobieństwa Dystrybuantą zmiennej losowej X nazywamy prawdopodobieństwo przyjęcia przez zmienną losową X wartości mniejszej od x, tzn. F (x) = P [X < x]. 1. dla zmiennej losowej
Bardziej szczegółowo1.1 Wstęp Literatura... 1
Spis treści Spis treści 1 Wstęp 1 1.1 Wstęp................................ 1 1.2 Literatura.............................. 1 2 Elementy rachunku prawdopodobieństwa 2 2.1 Podstawy..............................
Bardziej szczegółowoTestowanie hipotez statystycznych.
Bioinformatyka Wykład 6 Wrocław, 7 listopada 2011 Temat. Weryfikacja hipotez statystycznych dotyczących proporcji. Test dla proporcji. Niech X 1,..., X n będzie próbą statystyczną z 0-1. Oznaczmy odpowiednio
Bardziej szczegółowoLABORATORIUM 6 ESTYMACJA cz. 2
LABORATORIUM 6 ESTYMACJA cz. 2 TEORIA ESTYMACJI I 1. ODRZUCANIE WYNIKÓW WĄTPLIWYCH PRÓBA P (m) (m-elementowa) Obliczenie: ; s bez wyników wątpliwych Odrzucenie wyników z poza przedziału: 3s PRÓBA LOSOWA
Bardziej szczegółowoNa A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)
MODELE STATYSTYCZNE Punktem wyjścia w rozumowaniu statystycznym jest zmienna losowa (cecha) X i jej obserwacje opisujące wyniki doświadczeń bądź pomiarów. Zbiór wartości zmiennej losowej X (zbiór wartości
Bardziej szczegółowo