Statystyka matematyczna

Wielkość: px
Rozpocząć pokaz od strony:

Download "Statystyka matematyczna"

Transkrypt

1 Statystyka matematyczna dla kierunku Zarządzanie na studiach drugiego stopnia Wojciech Kordecki Wyższa Szkoła Handlowa we Wrocławiu Wrocław 2012

2 Materiał wyłącznie do użytku edukacyjnego. Reprodukcja do użytku komercyjnego jest zabroniona. Skład komputerowy w systemie L A TEX wykonał autor c Wyższa Szkoła Handlowa we Wrocławiu, 2012 ISBN: Wydanie I Wyższa Szkoła Handlowa we Wrocławiu ul. Ostrowskiego Wrocław

3 Spis treści Wstęp 4 1. Podstawy rachunku prawdopodobieństwa Zdarzenia i prawdopodobieństwo Zmienne losowe Parametry zmiennych losowych Zadania Rozkłady zmiennych losowych Rozkłady dyskretne Rozkłady typu ciągłego Populacja, próba i statystyki Twierdzenia graniczne Zadania Estymacja i testowanie hipotez Estymacja Testowanie hipotez Zadania A. Elementy statystyki opisowej 35 A.1. Opracowanie materiału statystycznego A.2. Parametry Odpowiedzi 42 Odpowiedzi do wykładu Odpowiedzi do wykładu Odpowiedzi do wykładu Tablice statystyczne 52 Literatura 55 Skorowidz 56 3

4 Wstęp Przedmiot Statystyka matematyczna jest wykładany w Wyższej Szkole Handlowej we Wrocławiu na studiach drugiego stopnia na kierunku Zarządzanie. Przedstawiony materiał podzielony jest na trzy wykłady. Taki bowiem układ trzy trzygodzinne wykłady, przewidziany jest w programie studiów niestacjonarnych w Wyższej Szkole Handlowej we Wrocławiu. Niemniej, zakres materiału jest nieco szerszy od programu obowiązującego na tych studiach, może być więc wykorzystany również na studiach stacjonarnych drugiego stopnia na kierunku Zarządzanie lub na innych kierunkach mających podobne programy ze statystyki. Materiały do tego wykładu mają charakter pomocniczy i ich celem jest ułatwienie słuchaczom samodzielnego studiowania literatury. Podstawowym źródłem na którym te materiały są oparte, są podręczniki S. Ostasiewicz, Z. Rusnak i U. Siedleckiej [7] oraz J. Wawrzynka [9]. Przeznaczone dla studentów kierunków technicznych skrypty H. Jasiulewicz i W. Kordeckiego [2, 5] mogą być uzupełniającym źródłem wiadomości. Chętnym do znacznego poszerzenia wiedzy polecam książki J. Jakubowskiego i R. Sztencla [1] oraz S. M. Kota, J. Jakubowskiego i A. Sokołowskiego [6]. Podręcznikiem do przedmiotu Statystyka opisowa wykładanego na studiach pierwszego stopnia jest skrypt [8] pod red. M. Rymarczyka. Najważniejsze wiadomości są skrótowo przedstawione w dodatku A. Nie mogą one jednak zastąpić podręcznika. Brakujące wiadomości z matematyki można uzupełnić korzystając na przykład ze skryptu [4] lub standardowych podręczników z matematyki dla szkół wyższych. 4

5 Wykład 1 Podstawy rachunku prawdopodobieństwa 1.1. Zdarzenia i prawdopodobieństwo Niech ω będzie doświadczeniem eksperymentem lub obserwacją, którego wyniku nie jesteśmy w stanie przewidzieć. Zbiór wszystkich możliwych wyników doświadczeń nazywamy przestrzenią zdarzeń elementarnych Ω, a poszczególne wyniki ω Ω nazywamy zdarzeniami elementarnymi. Podzbiory przestrzeni zdarzeń elementarnych nazywamy zdarzeniami losowymi. Zwyczajowo oznacza się je dużymi literami z początku alfabetu: A, B, C, Ω. Działania na zdarzeniach: A B suma zdarzeń zajdzie zdarzenie A lub zdarzenie B, A B iloczyn zdarzeń zajdzie zdarzenie A i zdarzenie B, A \ B różnica zdarzeń zajdzie zdarzenie A, ale nie zajdzie zdarzenie B, A = Ω \ A zdarzenie przeciwne do A, nie zajdzie zdarzenie A. Zdarzenie A = Ω nazywa się zdarzeniem pewnym, a zdarzenie A = zdarzeniem niemożliwym. Jeżeli A B =, to zdarzenia A i B są rozłączne, czyli wykluczające się. Zdarzenia losowe {A 1, A 2,... } są parami rozłączne, gdy dla każdej pary i j zachodzi A i A j =. Przykład Rzut monetą: przestrzenią zdarzeń elementarnych jest Ω = {O, R} gdzie O zdarzenie polegające na wyrzuceniu orła, a R zdarzenie polegające na wyrzuceniu reszki. Przykład Rzut kostką do gry: Ω = {ω 1,..., ω 6 }, gdzie ω i jest zdarzeniem elementarnym polegającym na wyrzuceniu i oczek. Przykładem zdarzenia losowego jest zbiór A zdarzeń elementarnych odpowiadających wyrzuceniu parzystej liczby oczek: A = {ω 2, ω 4, ω 6 } oraz zbiór B odpowiadający wyrzuceniu mniej niż czterech oczek: B = {ω 1, ω 2, ω 3 }. Wtedy A B = {ω 1, ω 2, ω 3, ω 4, ω 6 }, A B = {ω 2 }, A \ B = {ω 4, ω 6 }, B = {ω 4, ω 5, ω 6 }. 5

6 WYKŁAD 1. PODSTAWY RACHUNKU PRAWDOPODOBIEŃSTWA 6 Zauważmy, że {ω 5 } = A B. Na zbiorze zdarzeń losowych określa się funkcję P o własnościach: a dla każdego zdarzenia A jest 0 PA 1, b PΩ = 1, P = 0, c PA 1 A 2... = PA 1 + PA dla zdarzeń parami rozłącznych. Taka funkcja nazywa się prawdopodobieństwem. Z własności a c można wyprowadzić dalsze pożyteczne własności: d PA = 1 PA, e jeśli B A to PA \ B = PA PB, f dla dowolnych niekoniecznie wykluczających się zdarzeń A i B: PA B = PA + PB PA B. Niech A 1, A 2,..., A n będą zdarzeniami parami rozłącznymi i równoprawdopodobnymi, takimi że A 1 A 2 A n = Ω. Przykładem takich zdarzeń mogą być zdarzenia losowe jednoelementowe A 1 = {ω 1 },..., A n = {ω n }, gdy Ω = {ω 1, ω 2,..., ω n }. Wtedy PA i = 1/n, a każde inne zdarzenie A, które jest sumą k takich rozłącznych zdarzeń, ma prawdopodobieństwo PA = k n Zdarzenia A i wchodzące do zdarzenia A, tzn. takie, że A i A nazywamy zdarzeniami sprzyjającymi zdarzeniu A. Wzór mówi wtedy, że prawdopodobieństwo zdarzenia A jest stosunkiem liczby zdarzeń sprzyjających zdarzeniu A do liczby wszystkich zdarzeń A i. Wzór nazywa się często klasyczną definicją prawdopodobieństwa. Należy jednak pamiętać, że wzór1.1.1 jest prawdziwy tylko dla zdarzeń A i równoprawdopodobnych! Przykład Obliczyć prawdopodobieństwo wygrania czwórki w totolotka. Losowanych jest 6 numerów spośród 49 numerów. Jest 49 n = = takich możliwości. Niech A 4 oznacza zdarzenie polegające na wylosowaniu czwórki. Jest 6 43 k = = = takich zdarzeń. Stąd P A 4 = k n = = = < Oznaczając przez A 5 i A 6 wylosowanie piątki i szóstki, otrzymujemy w ten sam sposób P A 5 = = < , P A 6 = 6 0 = < Ponieważ zdarzenia A 4, A 5 i A 6 są parami rozłączne, to prawdopodobieństwo wylosowania co najmniej czwórki wynosi P A 4 + P A 5 + P A 6 i jest mniejsze od

7 WYKŁAD 1. PODSTAWY RACHUNKU PRAWDOPODOBIEŃSTWA 7 Prawdopodobieństwo warunkowe zdarzenia A, jeśli wiadomo, że zaszło zdarzenie B pod warunkiem zdarzenia B, oznaczamy symbolem PA B i obliczamy następująco: PA B = PA B PB, o ile PB > 0. Zwróćmy uwagę, że prawdopodobieństwa: bezwarunkowe P A i warunkowe P A B są prawdopodobieństwami tego samego zdarzenia A. Prawdopodobieństwa te mogą być różne, gdyż fakt zajścia zdarzenia B może być dodatkową informacją o zdarzeniu A i jego znajomość może zmienić prawdopodobieństwo tego zdarzenia. Z tego powodu zdarzenie B nazywane jest często przyczyną, a zdarzenie A skutkiem. Ze wzoru wynika często używany wzór P A B = P A B P B = P B A P A. Jest on pożyteczny w sytuacji gdy znamy prawdopodobieństwo przyczyny, tzn. znamy P B i znamy prawdopodobieństwo z jakim przyczyna B wywołuje skutek A, tzn. znamy P A B. Zdarzenia A i B określamy jako niezależne, gdy P A B = P A P B Porównując wzory i 1.1.3, otrzymujemy wniosek, że jeśli zdarzenia A i B są niezależne, to P A B = P A i P B A = P B, czyli jeśli A i B są niezależne, to prawdopodobieństwo warunkowe jest równe prawdopodobieństwu bezwarunkowemu. Załóżmy, że zdarzenie A może zajść, jeśli zajdzie jedno z wykluczających się zdarzeń B 1, B 2,..., B n, tzn. gdy dla dowolnej pary i j jest B i B j = oraz załóżmy, że B 1 B 2 B n = Ω. Wtedy prawdziwe są dwa wzory: P A = P A B 1 P B 1 + P A B 2 P B P A B n P B n, P B i A = P A B i P B i, P A gdzie PA we wzorze można obliczyć ze wzoru Wzór nosi nazwę wzoru na prawdopodobieństwo całkowite, a wzór wzoru Bayesa. Przykład Dla zdarzeń określonych w przykładzie mamy P A = 3 6 = 1 2. Ponieważ to P A B = 1 6, P B = 3 6 = 1 2, P A B = P A B P B = 1 3 < P A = Zmienne losowe Zmienną losową X jest funkcja określona na przestrzeni zdarzeń elementarnych Ω o wartościach w zbiorze liczb rzeczywistych R, tzn. X : Ω R. Zwyczajowo zmienne losowe oznacza się dużymi literami z końca alfabetu: X, Y,..., a ich wartości małymi x, y,..., tzn. piszemy x = X ω, y = Y ω itd. Wartość x zmiennej losowej X ω nazywamy realizacją zmiennej losowej.

8 WYKŁAD 1. PODSTAWY RACHUNKU PRAWDOPODOBIEŃSTWA 8 Przykład Przy rzucie monetą przykład można określić zmienne losowe X i Y w następujący sposób: XO = 1, XR = 1 oraz YR = 1, YO = 1. Taka para zmiennych losowych jest modelem matematycznym dwuosobowej gry o następujących regułach: gracz A rzuca monetą, gdy wypadnie orzełek, gracz A płaci graczowi B złotówkę, gdy wypadnie reszka, gracz B płaci graczowi A złotówkę. Zmienna losowa X jest więc zyskiem lub stratą gracza A, a zmienna losowa Y jest więc zyskiem lub stratą gracza B. Między tymi zmiennymi zachodzi czysto deterministyczny związek X = Y. Przykład Zmienną losową może być liczba oczek przy rzucie jedną kostką do gry przykład 1.1.2: X ω i = i. Zmienna losowa może też wskazywać, czy wyrzucono np. szóstkę, czy też inną liczbę oczek: Y ω 6 = 1 oraz Y ω i = 0 dla i = 1,..., 5. Zmienne losowe wyznaczają zdarzenia, np. {ω : Xω < x} oznacza zbiór tych zdarzeń elementarnych, dla których wartość zmiennej losowej X jest mniejsza od liczby x. Zwykle zamiast kompletnego wzoru {ω : Xω < x} stosuje się skrócony zapis {X < x}. Dystrybuantą zmiennej losowej X nazywamy funkcję o argumentach i wartościach rzeczywistych określoną wzorem Fx = P{ω : Xω < x} = PX < x dla każdego x. Oznacza to również, że Z definicji wynika, że a 0 F x 1, b F = lim F x = 0, F = lim F x = 1, x x c F x jest funkcją niemalejącą. P a X < b = F b F a Mówimy, że znamy rozkład zmiennej losowej, jeżeli znamy jej dystrybuantę lub inne równoważne dalej omówione charakterystyki. Wśród zmiennych losowych wyróżnia się zmienne losowe skokowe dyskretne i zmienne losowe typu ciągłego. Zmienne losowe skokowe przybierają tylko skończoną liczbę wartości albo ich wartości dają się ustawić w ciąg. Dystrybuanta zmiennej losowej skokowej jest przedziałami stała, a na granicach przedziałów ma skoki. Dla zmiennych losowych skokowych zamiast dystrybuanty wystarczy tylko znać prawdopodobieństwa PX = x i = p i, gdzie x i są ustawionymi w ciąg wartościami, które zmienna losowa X przyjmuje, a p i są wartościami skoków dystrybuanty w punktach x i. Prawdopodobieństwa p k mają następujące własności: a p k 0 dla każdego k, b p 1 + p 2 + = p k = 1 k Zmienna losowa typu ciągłego ma ciągłą dystrybuantę, którą ponadto można przedstawić w postaci F x = x f t dt Funkcję fx ze wzoru nazywa się gęstością. W tych punktach, w których dystrybuanta ma pochodną, gęstość wyraża się wzorem fx = F x = dfx dx

9 WYKŁAD 1. PODSTAWY RACHUNKU PRAWDOPODOBIEŃSTWA 9 Z definicji gęstości wynika, że ma ona własności: a f x 0, b f x dx = 1. Własność b geometrycznie oznacza, że pole pod wykresem gęstości jest równe jeden. Za pomocą gęstości zmiennej losowej typu ciągłego obliczamy P a < X < b: P a < X < b = F b F a = b a f x dx. Dla zmiennej losowej X typu ciągłego, P X = x 0 = 0 dla dowolnej ustalonej liczby x 0. Wtedy też P X < x = P X x. Przykład Określmy gęstość wzorem { 2 1 x dla 0 < x < 1, f x = 0 dla pozostałych x. Wykres gęstości jest przedstawiony na rys. 1.1a. Oczywiście f x 0. Jak widać na wykresie, spełniony jest również warunek b, gdyż obszar pod wykresem tworzy trójkąt o polu równym 1. Dystrybuanta dla 0 < x < 1 jest określona wzorem x x F x = P X < x = 2 1 t dt = 2 1 t 2 = x 2 x. Wykres F x jest przedstawiony na rys. 1.1b a 1.2 b 2 1 fx Fx x x Rysunek 1.1: Gęstość i dystrybuanta zmiennej losowej z przykładu Para zmiennych losowych X i Y ma rozkład dwuwymiarowy. Dystrybuanta tej pary nazywa się dystrybuantą łączną i wyraża się wzorem Dystrybuanty zmiennych losowych X i Y noszą nazwę dystrybuant brzegowych. F x, y = P X < x, Y < y F X x = P X < x, F Y y = P Y < y

10 WYKŁAD 1. PODSTAWY RACHUNKU PRAWDOPODOBIEŃSTWA 10 Zmienne losowe X i Y są niezależne, gdy P {ω : X < x} {ω : Y < y} = P {ω : X < x} P {ω : Y < y}, czyli gdy dystrybuanta łączna jest iloczynem dystrybuant brzegowych: F x, y = F X x F Y y Rozkład dwuwymiarowy jest dyskretny, gdy obie zmienne losowe X i Y są dyskretne. Przyjmiemy oznaczenia p ij = P X = x i, Y = y j, p i = P X = x i, p j = P Y = y j. Prawdopodobieństwa p ij i p j obliczamy ze wzorów: p i = P X = x i = j p ij, p j = P Y = y j = p ij Przykład Rzucamy dwiema kostkami do gry. Niech X będzie liczbą oczek na pierwszej kostce, Z na drugiej, a Y większym z tych wyników, czyli Y = max{x, Z} Rozkład dwuwymiarowy, czyli prawdopodobieństwa p ij, można przedstawić w postaci macierzy 1/36 1/36 1/36 1/36 1/36 1/36 0 2/36 1/36 1/36 1/36 1/ /36 1/36 1/36 1/ /36 1/36 1/ /36 1/ /36 Sposób otrzymania tej macierzy objaśnimy na przykładzie. Wynik 2, 4 otrzymamy wtedy, gdy na pierwszej kostce wypadną dwa oczka, a na drugiej cztery. Prawdopodobieństwo tego wynosi 1/61/6 = 1/36. Wynik 4, 2 jest niemożliwy, a wynik 2, 2 otrzymamy wtedy, gdy na pierwszej kostce będą dwa oczka, a na drugiej jedno lub dwa oczka. Prawdopodobieństwo tego wynosi 1/62/6 = 2/36. Korzystając ze wzoru 1.2.7, otrzymujemy p i = 1/6, co jest oczywiste, bo X jest liczbą oczek na pierwszej kostce, a ze wzoru otrzymujemy p j = 2j 1/36. Widać, że relacja nie jest spełniona, więc zmienne losowe X i Y nie są niezależne. Rozkład dwuwymiarowy typy ciągłego posiada gęstość łączną analogicznie do wzoru 1.2.4: f x, y = 2 F x, y x y i Gęstości f X x i f Y y zmiennych losowych są gęstościami brzegowymi. Zmienne losowe typu ciągłego są niezależne, gdy f x, y = f X x f Y y

11 WYKŁAD 1. PODSTAWY RACHUNKU PRAWDOPODOBIEŃSTWA Parametry zmiennych losowych Kwantylem rzędu p, p 0, 1 rozkładu zmiennej losowej X nazywamy liczbę ξ p spełniającą nierówności PX ξ p p, PX ξ p 1 p Nierówności nie wyznaczają kwantyli jednoznacznie. Gdy dystrybuanta F x jest ciągła, to kwantyl ξ p jest rozwiązaniem równania Fx = p. Rozwiązanie to też nie musi być jednoznaczne. Mediana oznaczana symbolem Me jest kwantylem rzędu p = 1/2, czyli Me = ξ 1/2. Kwantyle rzędów p = 1/4 i p = 3/4 nazywa się kwartylami rzędu 1 i 3 i oznacza Q 1 i Q 3, czyli Q 1 = ξ 1/4 i Q 3 = ξ 3/4. Mediana jest kwartylem rzędu 2: Q 2 = ξ 2/4 = Me. Do wskaźników rozrzutu zmiennej losowej zalicza się odchylenie ćwiartkowe Q = ξ 3/4 ξ 1/4 /2. Wartość oczekiwana EX zmiennej losowej X zwana również średnią teoretyczną jest określona osobno dla zmiennych skokowych, a osobno dla zmiennych typu ciągłego. Dla zmiennych skokowych jest to wzór EX = x 1 p 1 + x 2 p 2 + = x k p k, k a dla zmiennych losowych typu ciągłego wzór EX = xfx dx Gdy chcemy obliczyć wartości oczekiwane potęg zmiennych losowych, to wzory i przybierają postać odpowiednio EX n = x n 1 p 1 + x n 2 p 2 + = k x n k p k oraz EX n = x n fx dx Ważnym parametrem zmiennej losowej X jest wariancja teoretyczna D 2 X określona wzorem oraz odchylenie standardowe σ określone wzorem σ = D 2 X. Odchylenie standardowe nazywane jest również dyspersją. D 2 X = EX EX 2 = EX 2 EX Uwaga. Wariancja D 2 X jest również często oznaczana przez VX lub VarX. Przykład Niech zmienne losowe X i Y będą takie, jak w przykładzie Ponieważ P X = 1 = P Y = 1 = 1/2 oraz P X = 1 = P Y = 1 = 1/2, zmienne X i Y mają ten sam rozkład, mimo że są różne: X = Y. Wobec tego mają te same parametry, wartość oczekiwaną określoną wzorem i wariancję określoną wzorem 1.3.6, gdzie EX 2 obliczamy ze wzoru EX = EY = 0, D 2 X = D 2 Y = 1. Medianą Me = ξ 1/2 jest dowolna liczba 1 ξ 1/2 1. Można więc przyjąć ξ 1/2 = 0, ale można też przyjąć ξ 1/2 = 1 lub ξ 1/2 = 1. Widać, że w tym przypadku mediana nie jest pożytecznym parametrem.

12 WYKŁAD 1. PODSTAWY RACHUNKU PRAWDOPODOBIEŃSTWA 12 Przykład Niech zmienna losowa X będzie taka jak w przykładzie Ponieważ P X = i = 1/6 dla i = 1, 2,..., 6, to korzystając z tych samych wzorów co w przykładzie i w ten sam sposób, otrzymujemy EX = = 6 6 = 7 2 = 3.5, EX 2 = = , D 2 X = EX 2 EX 2 = = , 35 σ = D 2 X = Medianą może być dowolna liczba 3 ξ 1/2 4, a więc w szczególności można przyjąć ξ 1/2 = EX = 3.5. Pozostałe kwartyle odchylenie i ćwiartkowe są wyznaczone jednoznacznie ze wzoru dla p = 1/4 i p = 3/4. Q 1 = 2, bo P X 2 = 1/3 1/4, P X 2 = 5/6 3/4, Q 3 = 4, bo P X 4 = 5/6 3/4, P X 4 = 1/3 1/4, Q = Q 3 Q 1 = 2 > σ. Wartość oczekiwana i wariancja mają następujące własności: Dla niezależnych X, Y: EaX = aex, EX + Y = EX + EY, D 2 ax = a 2 D 2 X, D 2 X + Y = D 2 X + D 2 Y Jeśli zmienne losowe X i Y nie są niezależne, to równość może nie zachodzić. Kowariancja jest określona wzorem Cov X, Y = E X EX Y EY = E XY EX EY Jeśli zmienne losowe X i Y są niezależne, to Cov X, Y = 0. Nie zachodzi wynikanie w drugą stronę: jeśli Cov X, Y = 0, to X i Y nie muszą być niezależne. Korzystając z kowariancji, można obliczyć wariancję sumy zmiennych losowych, które nie muszą być niezależne: D 2 X + Y = D 2 X + D 2 Y + 2Cov X, Y Przykład Rozważmy zmienne losowe X i Y z przykładu Oczywiście EX = 3.5 i D 2 X 2.92 tak, jak w przykładzie Obliczamy tylko parametry zmiennej losowej Y. Ponieważ kolejne prawdopodobieństwa P Y = i są następujące: 1/36, 3/36, 5/36, 7/36, 9/36, 11/36, to Me = 5, gdyż = > 1 2, = > 1 2 i żadna inna liczba nie spełnia warunków dla p = 1/2. Obliczamy wartość oczekiwaną: EY = =

13 WYKŁAD 1. PODSTAWY RACHUNKU PRAWDOPODOBIEŃSTWA 13 Następnie obliczymy EY 2 = = , skąd otrzymujemy wariancję i odchylenie standardowe: D 2 Y = EY 2 EY 2 = σ = D 2 Y = , Widać, że EY > EX, co jest oczywiste, gdyż zawsze Y X. Wartości Y są też bardziej skupione wokół swojej wartości oczekiwanej, więc D 2 Y < D 2 X. Łatwo otrzymujemy E X + Y = EX + EY = = Ponieważ X i Y nie są niezależne, to nie można skorzystać ze wzoru Współczynnik korelacji jest określony wzorem CovX, Y ρ = ρx, Y = D 2 X D 2 Y Współczynnik korelacji ma kilka charakterystycznych, sformułowanych poniżej własności. a ρ 1, b jeżeli X i Y są niezależne, to ρx, Y = 0, c ρ = 1 wtedy i tylko wtedy, gdy istnieją stałe a 0 i b takie, że PY = ax + b = Jeżeli współczynnik korelacji zmiennych losowych X i Y jest równy zeru, to mówimy, że są one nieskorelowane. Jeżeli zmienne losowe są niezależne, to są nieskorelowane, ale nie na odwrót. Wyrażenie E Y αx + β 2 osiąga najmniejszą wartość, gdy współczynniki α i β są określone wzorami α = ρ σ 2, β = m 01 ρ σ 2 m 10, σ 1 σ 1 gdzie σ 2 1 = D2 X, σ 2 2 = D2 Y, m 10 = EX oraz m 01 = EY. Prostą o równaniu y m 01 = ρ σ 2 σ 1 x m 10 nazywa się prostą regresji, a współczynniki α i β nazywają się współczynnikami regresji Zadania 1. Rzucamy trzema monetami. Jakie jest prawdopodobieństwo, że wyrzucimy co najmniej dwie reszki? 2. Jest n + m losów, spośród których n wygrywa. Kupiono k losów. Obliczyć prawdopodobieństwo, że wśród nich jest s s n losów wygrywających.

14 WYKŁAD 1. PODSTAWY RACHUNKU PRAWDOPODOBIEŃSTWA Na kartce egzaminacyjnej jest pięć pytań i trzy możliwe odpowiedzi na każde z nich, z których dokładnie jedna jest poprawna. Należy wybrać poprawną odpowiedź na każde pytanie. Ile wynosi prawdopodobieństwo otrzymania czterech poprawnych odpowiedzi, jeżeli egzaminowany zgaduje odpowiedzi? 4. Wytwórca czekoladek zaplanował ich promocję za pomocą małych bombonierek nazwanych Premium, w których znajdowało się pięć nieróżniących się wyglądem czekoladek. Trzy z nich miały smak wiśniowy, a dwie nijaki. Wobec powodzenia akcji, wytwórca wprowadził do obrotu bombonierki Super Premium, nieróżniące się wyglądem od bombonierek Premium, ale mające jedną czekoladkę o smaku wiśniowych i cztery o smaku nijakim. Obecnie w handlu znajduje się 20% bombonierek Premium i 80% bombonierek Super Premium. Jakie jest prawdopodobieństwo, że poczęstowana przez nas koleżanka wyjmie z promocyjnej bombonierki czekoladkę o smaku wiśniowym? 5. Czekoladka z promocyjnej bombonierki z zadania 4 okazała się czekoladką o smaku nijakim. Jakie jest prawdopodobieństwo, że znajdowała się w bombonierce Super Premium? 6. Wiemy, że 95% produkcji jest dobrej jakości, a pozostałe 5% jest złej jakości. Kontrola przepuszcza przedmioty dobrej jakości z prawdopodobieństwem 0.98, a przedmioty złej jakości z prawdopodobieństwem Obliczyć prawdopodobieństwo tego, że przedmiot przepuszczony przez kontrolę będzie dobrej jakości % klientów drogerii wybiera tani proszek do prania XYZ, a pozostali klienci wybierają droższy proszek do prania innej wiodącej marki. Wiadomo, że proszek XYZ usuwa plamy w 20% przypadków, a proszek innej wiodącej marki w 95%. Jakie jest prawdopodobieństwo, że proszek kupiony przez losowo wybranego klienta usunie plamę? 8. W urnie są dwie białe i trzy czerwone litery X oraz trzy białe i dwie czerwone litery Y. Określamy zdarzenia: A wylosowano literę czerwoną, B wylosowano literę Y. Czy zdarzenia A i B są niezależne? 9. Zmienna losowa X przyjmuje cztery wartości z prawdopodobieństwami określonymi w tabeli: Wartość Prawdopodobieństwo Wyznaczyć medianę. Obliczyć wartość oczekiwaną i wariancję. 10. Zmienna losowa X przyjmuje pięć wartości z prawdopodobieństwami określonymi w tabeli: Wartość Prawdopodobieństwo p q 0.1 Wyznaczyć wartości p i q tak, aby Me = 2.5, a następnie tak, aby Me = 2.0. W obu przypadkach obliczyć wartość oczekiwaną i wariancję. 11. Sprzedawca tanich, niemarkowych t-shirtów ma pięciu dostawców. Kupując produkt od i-tego dostawcy, ponosi w porównaniu z kupnem produktu markowego zysk lub stratę, czyli zysk ujemny s i. Procentowy udział dostawców i zyski podane są w tabeli. Dostawca A B C D E Udział procentowy 40% 15% 20% 5% 20% Zysk

15 WYKŁAD 1. PODSTAWY RACHUNKU PRAWDOPODOBIEŃSTWA 15 Wszystkie t-shirty są wymieszane i mają taką samą cenę. Obliczyć średni zysk ze sprzedaży 100 t-shirtów i określić jego średnie odchylenie. 12. Zmienne X i Y są niezależne oraz EX = 1.2, EY = 2.5, D 2 X = D 2 Y = 0.5. Określamy zmienną losową Z wzorem Z = 0.5 X Y. Korzystając z własności wartości oczekiwanej i wariancji sumy niezależnych zmiennych losowych, obliczyć EZ oraz D 2 Z. 13. Prawdopodobieństwo wylosowania głównej nagrody wartości 1000 zł w promocji pewnego towaru wynosi , prawdopodobieństwo wygrania nagrody pocieszenia wartości 3 zł wynosi 0.2. Warunkiem wzięcia udziału w jednokrotnym losowaniu nagrody jest zakup jednej sztuki towaru za cenę 25 zł o rzeczywistej wartości 22 zł. Niech X będzie zyskiem lub stratą powstałą w wyniku zakupu 5 sztuk tego towaru, wliczając w to ewentualny zysk z losowania nagrody. Obliczyć EX i zakładając, że zakupy są niezależne, obliczyć D 2 X oraz odchylenie standardowe. 14. Prawdopodobieństwo wygrania w jednej grze w automacie do gry wynosi Ile trzeba wykupić gier aby prawdopodobieństwo wygrania choć raz w serii wykupionych gier, przekroczyło poziom 0.3? 15. Rzucamy trzema monetami. Niech Z i = 1 gdy wyrzucimy reszkę na i-tej monecie oraz Z i = 0 w przeciwnym przypadku, i = 1, 2, 3. Określamy Z = Z 1 + Z 2 suma reszek na dwóch pierwszych monetach i Y = Z 2 + Z 3 suma reszek na monecie drugiej i trzeciej. Znaleźć prawdopodobieństwa p ij = P X = m, Y = n, P X = m, P Y = n, EX, EY, D 2 X, D 2 Y, Cov X, Y i ρ X, Y.

16 Wykład 2 Rozkłady zmiennych losowych 2.1. Rozkłady dyskretne Rozkład dwupunktowy Zmienna losowa X ma rozkład dwupunktowy, gdy z prawdopodobieństwem 1 przyjmuje tylko dwie wartości, tzn. jeśli PX = x 1 = p i PX = x 2 = q, to p + q = 1. Łatwo policzyć, że EX = x 1 p + x 2 q, co w przypadku p = q = 1/2 daje m = x 1 + x 2 /2, czyli średnią arytmetyczną, natomiast wariancja D 2 X = x 2 x 1 2 pq. Szczególnym przypadkiem rozkładu dwupunktowego jest rozkład zero jedynkowy, gdy x 1 = 0 i x 2 = 1. Wtedy EX = p oraz D 2 X = pq. Rozkład dwumianowy Dokonujemy n niezależnych doświadczeń, a w każdym z nich możemy otrzymać tylko dwa wyniki sukces lub porażkę. Prawdopodobieństwo sukcesu w każdym doświadczeniu jest takie samo i jest równe p, więc prawdopodobieństwo porażki jest równe q = 1 p. Prawdopodobieństwo, że w ustalonych k doświadczeniach spośród wszystkich n wykonanych, jest równe p k. Prawdopodobieństwo, że w pozostałych n k doświadczeniach odniesiemy porażkę, jest równe 1 p n k n. W n doświadczeniach można k miejsc na sukces wybrać na sposobów. Stąd k oznaczając przez X liczbę sukcesów w n doświadczeniach, otrzymujemy n PX = k = p k = p k 1 p n k. k Jest to rozkład dwumianowy. Łatwo policzyć, że gdy q = 1 p, to oraz wszystkie p k > 0. n k=1 n p k q n k = p + q n = 1 n = 1 k Jeżeli X i, i = 1, 2,..., n są niezależnymi zmiennymi losowymi o takich samych rozkładach zerojedynkowych, to zmienna losowa X = X 1 +X 2 + +X 2 ma rozkład dwumianowy. Ponieważ EX i = p i D 2 X = pq, to rozkład dwumianowy ma wartość oczekiwaną EX = np i wariancję D 2 X = npq. 16

17 WYKŁAD 2. ROZKŁADY ZMIENNYCH LOSOWYCH 17 Rozkład Poissona Zmienna losowa X ma rozkład Poissona, gdy λ λk p k = P X = k = e k!, gdzie k = 0, 1,..., λ > 0. Parametry: EX = λ, D 2 X = λ. Rozkład Poissona ma ścisły związek z rozkładem dwumianowym. Związek ten pokażemy w paragrafie 2.4 na str Rozkłady typu ciągłego Rozkład jednostajny Niech zmienna losowa X ma gęstość f x = { 1 b a dla x [a, b], 0 dla x / [a, b]. Jest to rozkład jednostajny na odcinku [a, b]. Parametry: EX = b + a /2, D 2 X = b a 2 /12. Rozkład wykładniczy Niech zmienna losowa X ma gęstość f x = { λe λx dla x 0, 0 dla x < 0, dla λ > 0. Wtedy F x = { 1 e λx dla x 0, 0 dla x < 0. Parametry: EX = 1/λ, D 2 X = 1/λ 2 Rozkład normalny Wśród rozkładów typu ciągłego jednym z najważniejszych jest rozkład normalny o parametrach m i σ. Fakt, że zmienna losowa X ma taki właśnie rozkład oznacza się przez X Nm, σ, gdzie EX = m, D 2 X = σ 2. Ma to miejsce wtedy, gdy zmienna losowa Y = X m σ ma rozkład N 0, 1, czyli ma gęstość wyrażającą się wzorem f x = 1 2π e x2 /

18 WYKŁAD 2. ROZKŁADY ZMIENNYCH LOSOWYCH b 0.4 Fx x Rysunek 2.1: Gęstość rozkładu normalnego. Gęstość rozkładu normalnego N0, 1 przedstawiona jest na rys Dystrybuanta zmiennej losowej X o rozkładzie normalnym N 0, 1 jest oznaczana przez Φ x = P X < x, a jej wartości są podane w tablicach rozkładu normalnego. Do korzystania z nich przydatna jest znajomość następujących zależności: a P X > x = 1 Φ x, b Φ x = 1 Φ x, c P X > x = 2 1 Φ x. Aby zaś obliczyć PX < x, gdy X Nm, σ, należy skorzystać z zależności X m PX < x = P < x m x m = Φ. σ σ σ Spotykane często tablice rozkładu normalnego podają zamiast wartości dystrybuanty Φx takie tablice są na str. 52, wartości funkcji Φx 0.5, czyli wartości P 0 < X < x takie tablice są w [7, 8, 9]. Rozkład normalny dwuwymiarowy ma postać fx, y = 1 2πσ 1 σ exp 1 x m ρ 2 21 ρ 2 σ1 2 2ρ x m 1y m 2 2 σ 1 σ 2 + y m 2 2 σ Parametr ρ występujący we wzorze jest współczynnikiem korelacji zmiennych losowych X i Y, natomiast parametry m 1, m 2, σ 1 i σ są odpowiednio wartościami oczekiwanymi i odchyleniami standardowymi zmiennych losowych X i Y. Z porównania wzorów i widać, że gęstość dwuwymiarowego rozkładu normalnego jest iloczynem gęstości normalnych jednowymiarowych wtedy i tylko wtedy, gdy ρ = 0. Wynika stąd, że jeśli zmienne losowe X i Y mają dwuwymiarowy rozkład normalny, to są niezależne wtedy i tylko wtedy, gdy są nieskorelowane. Jest to szczególna cecha rozkładu normalnego por. uwagę na str. 13.

19 WYKŁAD 2. ROZKŁADY ZMIENNYCH LOSOWYCH Populacja, próba i statystyki Cecha w populacji generalnej jest zmienną losową oznaczmy ją X. Część populacji, powiedzmy że n-elementowa i dostępna bezpośredniej obserwacji, nazywana jest próbą losową. Element próby o numerze i jest też zmienną losową oznaczmy ją X i. Zakładać będziemy dalej zawsze, że zmienne losowe X i są niezależne o takiej samej dystrybuancie o takim samym rozkładzie, co cecha X. Próbę taką będziemy nazywać próbą prostą. Statystyka T n = T n X 1, X 2,..., X n jest funkcją zmiennych losowych X 1, X 2,..., X n. Poniżej podanych jest kilka najważniejszych statystyk. 1. Średnia empiryczna: 2. Wariancja empiryczna: X = 1 n n X i, S 2 = 1 n n Xi X 2 = 1 n n Xi 2 X 2, Odchylenie standardowe empiryczne: S = S Zauważmy, że powyżej podane statystyki są zmiennymi losowymi oznaczamy je dużymi literami, natomiast ich zaobserwowane wartości oznaczamy małymi literami. Niech x = x x n n s 2 = 1 n n x i x lub dla danych pogrupowanych wzorem s 2 = 1 n k xi 2 x ni, gdzie x i jest środkiem i-tego przedziału klasowego. Zaobserwowaną wartością statystyki jest więc liczba określona wzorem 2.3.4, a wartością jest liczba określona wzorem Wartość oczekiwana EX określona wzorem lub jest teoretycznym odpowiednikiem średniej empirycznej x określonej wzorem 2.3.4, natomiast wariancja D 2 X określona wzorem jest teoretycznym odpowiednikiem wariancji empirycznej s 2 określonej wzorem Wariancję empiryczną określa się też nieco innym wzorem S 2 z daszkiem : Ŝ 2 = 1 n 1 n Xi X 2 = 1 n 1 n X 2 i n X

20 WYKŁAD 2. ROZKŁADY ZMIENNYCH LOSOWYCH 20 n Jeśli n jest duże, to n 1 jest bliskie jedynki, a więc s2 i ŝ 2 różnią się nieznacznie. Ważne są następujące własności: EX = EX, EŜ 2 = D 2 X. Oznacza to, że przeciętna wartość średniej empirycznej z próby jest równa średniej teoretycznej patrz str. 11 cechy w populacji generalnej, a przeciętna wartość wariancji empirycznej z daszkiem z próby jest równa wariancji teoretycznej cechy w populacji generalnej. Wynika stąd, że statystyki określone wzorami mogą służyć do oszacowania odpowiednich parametrów teoretycznych. Ogólnie: statystyki służące do szacowania nieznanych parametrów rozkładu cechy w populacji generalnej na podstawie próby, nazywa się estymatorami. O estymatorach będzie mowa w wykładzie 3. Dla porównania estymatorów z prawdziwymi wartościami parametrów służą statystyki: U = X EX n, σ t = X EX n 1, S χ 2 = ns2 σ Wzoru używamy, gdy znane jest σ, a wzoru 2.3.9, gdy σ jest nieznane. Dalej potrzebne będzie jeszcze pojęcie rozkładu chi-kwadrat Pearsona. Zmienna losowa o tym rozkładzie tradycyjnie oznaczana jest symbolem χ 2. Zmienna losowa χ 2 ma rozkład chi-kwadrat o n stopniach swobody, gdy jest sumą kwadratów niezależnych zmiennych losowych o rozkładzie normalnym N0, 1, tzn. χ 2 = X X X2 n, gdzie X i są niezależne i mają rozkłady normalne N0, 1. Wtedy Eχ 2 = n oraz D 2 χ 2 = 2n. Tablice rozkładu chi-kwadrat ułożone są tak, że dla danych n i α, 0 < α < 1 podawane są wartości liczb χα 2 takie, że P χ 2 > χα 2 = α. Wartości te są podawane dla n 30. Dla większych n rozkład chi-kwadrat jest zbliżony do rozkładu normalnego N n, 2n. Przy pomocy rozkładu chi-kwadrat i rozkładu normalnego N0, 1 definiuje się rozkład t-studenta. Zmienna losowa o tym rozkładzie tradycyjnie oznaczana jest symbolem t lub T. Zmienna losowa t ma rozkład Studenta o n stopniach swobody, gdy wyraża się wzorem t = X χ 2 /n, gdzie X ma rozkład N0, 1, a χ 2 ma rozkład chi-kwadrat o n stopniach swobody oraz X i χ 2 są niezależne. Tablice rozkładu Studenta ułożone są tak, że dla danych n i α, 0 < α < 1 podawane są wartości liczb t α takie, że P t > t α = α.

21 WYKŁAD 2. ROZKŁADY ZMIENNYCH LOSOWYCH 21 Wartości te są podawane dla n 30. Dla większych n rozkład Studenta jest zbliżony do rozkładu normalnego N 0, 1. Założymy teraz, że cecha w populacji generalnej ma rozkład normalny Nm, σ. W tym przypadku rozkłady statystyk określonych wzorami i są następujące. a Statystyka X ma rozkład normalny Nm, σ/ n. b Statystyka U określona wzorem ma rozkład normalny N0, 1. c Statystyka t określona wzorem ma rozkład Studenta o n 1 stopniach swobody. d Statystyka χ 2 określona wzorem ma rozkład chi-kwadrat o n 1 stopniach swobody. Statystyką związaną z rozkładem dwuwymiarowym jest empiryczny współczynnik korelacji R określony wzorem n X i XY i Y R = n X i X 2 n Y i Y Twierdzenia graniczne Dla dużych i bardzo dużych prób, wyznaczenie dokładnych rozkładów statystyk może być trudne. Można wtedy skorzystać z twierdzeń granicznych. Podamy tutaj trzy najważniejsze. Prawo wielkich liczb Jeżeli X 1, X 2,..., X n niezależnymi zmiennymi losowymi o tym samym rozkładzie, EX i = m, D 2 X i = σ 2, to P lim X = m = 1. n Oznacza to, że dla dużych prób średnia empiryczna jest z dobrą dokładnością równa w przybliżeniu średniej teoretycznej EX określonej wzorami lub Centralne Twierdzenie Graniczne Jeżeli X 1, X 2,..., X n niezależnymi zmiennymi losowymi o tym samym rozkładzie, EX i = m, D 2 X i = σ 2, to lim P X1 + X X n nm n σ < x = Φx, n gdzie Φx jest dystrybuantą rozkładu normalnego N0, 1. Konsekwencją centralnego twierdzenia granicznego jest to, że dla dużych prób rozkłady statystyk i mają rozkład w przybliżeniu normalny N0, 1 nawet wtedy, gdy rozkład cechy X nie jest normalny. Wystarczy tylko, by istniała skończona wariancja, tzn. D 2 X <. Również własność, że zmienne losowe o rozkładzie chi-kwadrat i t-studenta mają dla n > 30 rozkład zbliżony do normalnego jest konsekwencją Centralnego Twierdzenia Granicznego. Twierdzenie Poissona Prostym, ale użytecznym twierdzeniem granicznym jest twierdzenie Poissona. Załóżmy w nim, że zmienne losowe X n o rozkładzie dwumianowym mają prawdopodobieństwo p malejące wraz z n w taki sposób, że λ = pn jest stałe. Wtedy P X n = k e λ λk k!.

22 WYKŁAD 2. ROZKŁADY ZMIENNYCH LOSOWYCH 22 Oznacza to, że rozkład dwumianowy dla dostatecznie dużych n można przybliżyć rozkładem Poissona. W praktyce przyjmuje się, że n powinno być równe około 100 lub większe, natomiast p takie, że 0.1 < λ < 10. Przykład Załóżmy, że prawdopodobieństwo sukcesu w jednej próbie wynosi p. Niech X będzie liczbą sukcesów w n niezależnych próbach. a Jeśli n = 10 i p = 0.2, to P X = 2 = b Jeśli n = 100 i p = 0.02, to λ = 2 wartość oczekiwana EX = 2 jest taka sama jak w poprzednim przypadku. Korzystamy z tw. Poissona str. 21 i otrzymujemy 2 22 P X = 2 = e 2! c Jeśli n = 100 i p = 0.2, m = p = 0.2 teraz EX = 20, σ = pq = 0.16 = 0.4. Korzystamy z Centralnego Twierdzenia Granicznego str. 21 i otrzymujemy X 20 P X < 22 = P < 0.5 Φ 0.5 = Zadania 1. Zmienna losowa X ma rozkład normalny N 0, 1. Korzystając z tablic, wyznaczyć P X < 1.3, P X > 2.1, P X < 0.9, P X Zmienna losowa X ma rozkład normalny N 0.3, Korzystając z tablic, wyznaczyć P X > 0.13, P X < 1.34, P X 0.1, P X > Zmienna losowa X ma rozkład wykładniczy ze średnią τ = Wyznaczyć medianę, kwartyle i odchylenie ćwiartkowe. 4. Zmienna losowa X ma rozkład wykładniczy ze średnią τ = 1.5. Niech Y = 1.4 X Wyznaczyć P Y > 0.05 oraz P Y < Wiadomo, że cecha X ma rozkład jednostajny na przedziale [1, 3]. Dokonano n = 10 niezależnych obserwacji. Obliczyć dla takiej próby statystycznej EX, EŜ 2 oraz ES Autobus z WSH na ul. Fabrycznej jeździ na Plac Grunwaldzki co 30 minut, ale rozkładu jazdy nie znamy. Czekamy na autobus w padającym deszczu przez czas T. Nasze straty S z tego powodu rosną z kwadratem czasu czekania wg wzoru S = αt 2, gdzie α jest pewną stałą. Obliczyć średnią stratę, odchylenie standardowe, medianę, kwartyle i odchylenie ćwiartkowe. Porównać średnią z medianą oraz odchylenie standardowe z odchyleniem ćwiartkowym. 7. Zmienna losowa t ma rozkład t-studenta o k stopniach swobody. Korzystając z tablic, wyznaczyć wartość t α dla danego α, gdy a P t > t α = α, b P t > t α = α, c P t < t α = α, dla k = 5, k = 11, oraz α = 0.1, α = 0.05.

23 WYKŁAD 2. ROZKŁADY ZMIENNYCH LOSOWYCH Zmienna losowa χ 2 ma rozkład chi-kwadrat o k stopniach swobody. Korzystając z tablic, wyznaczyć wartość χ 2 α dla danego α, gdy a P χ 2 > χ 2 α = α, b P χ 2 < χ 2 α = α, dla k = 5, k = 11, oraz α = 0.1, α = Powtórzyć obliczenia dla k = 41, k = Prawdopodobieństwo wyprodukowania jednej sztuki wyrobu drugiego gatunku wynosi 0.3. Jakie jest prawdopodobieństwo, że w partii 100 sztuk wyrobów znajdzie się mniej niż 30 sztuk drugiego gatunku? Jakie jest prawdopodobieństwo, że liczba wyrobów drugiego gatunku będzie większa od 10? Jakie jest prawdopodobieństwo, że liczba wyrobów drugiego gatunku jest zawarta pomiędzy 10 a 30? 10. Tygodniowe wypłaty z pewnego funduszu są niezależnymi zmiennymi losowymi o rozkładzie wykładniczym z tym samym parametrem λ = zł. Obliczyć prawdopodobieństwo, że łączna wypłata z tego funduszu w okresie roku, tzn. 52 tygodni, przekroczy zł.

24 Wykład 3 Estymacja i testowanie hipotez 3.1. Estymacja Szacowanie nieznanego parametru na podstawie próby statystycznej 1 za pomocą jednej liczby nazywamy estymacją punktową. Zmienna losowa T n będąca funkcją próby X 1, X 2,..., X n T n = T n X 1, X 2,..., X n szacująca nieznany parametr θ nazywa się estymatorem parametru θ. Znane ze statystyki opisowej parametry empiryczne średnia empiryczna i wariancja empiryczna, są estymatorami punktowymi odpowiednich parametrów teoretycznych, omówionych w wykładzie 1. Estymator T n pewnego parametru θ jest a nieobciążony, gdy ET n = θ, b asymptotycznie nieobciążony, gdy lim n ET n = θ, c zgodny, gdy lim n P T n = θ = 1. Statystyki X i Ŝ 2 są estymatorami nieobciążonymi i zgodnymi parametrów EX i D 2 X, natomiast S 2 jest estymatorem asymptotycznie nieobciążonym i zgodnym parametru D 2 X. Idea estymacji przedziałowej polega na tym, aby zamiast szacowania nieznanego parametru θ za pomocą jednej liczby, znaleźć przedział zwany przedziałem ufności, w którym nieznany parametr znajdzie się z zadowalającym nas prawdopodobieństwem, bliskim 1. Bliskość jedynki określa się liczbą 1 α i nazywa poziomem ufności. Inaczej mówiąc, wyznaczamy takie dwa estymatory T n i T n, aby P T n < θ < T n = 1 α, czyli wyznaczamy przedział o losowych końcach, w którym nieznana nam wartość parametru θ znajdzie się z prawdopodobieństwem 1 α. Dla danej realizacji przedział ufności ma więc postać T n x 1, x 2,..., x n, T n x 1, x 2,..., x n = θ, θ Sens wyznaczenia przedziału θ, θ określonego wzorem jest następujący: po podstawieniu zaobserwowanego ciągu danych x 1, x 2,..., x n do wzorów określających θ = T n x 1, x 2,..., x n oraz θ = T n x 1, x 2,..., x n, prawdziwa wartość parametru θ powinna się znaleźć w tym przedziale średnio w 1 α 100% przeprowadzonych obserwacji doświadczeń. Średnio tylko w α100% obserwacji nasze oszacowanie nie będzie prawdziwe. 1 Zawsze zakładamy, że to próba prosta patrz str

25 WYKŁAD 3. ESTYMACJA I TESTOWANIE HIPOTEZ 25 Łatwo jest zauważyć, że im mniejsze α, tym dłuższy jest przedział ufności. Zazwyczaj α przybiera jedną z wartości 0.1, 0.05, 0.01, przy czym wartość α = 0.05 jest najczęściej używana mówimy wtedy o 95 procentowym przedziale ufności. W następnych punktach omówimy szerzej trzy typowe przypadki: przedziały ufności dla parametrów m = EX i σ = D 2 X, wskaźnika struktury p, a także współczynnika korelacji ρ. Przedziały ufności dla średniej Rozpatrywane są trzy przypadki, przy czym dla każdego z nich przedział ufności jest symetryczny względem średniej empirycznej X określonej wzorem Przypadek I. Populacja generalna ma rozkład Nm, σ, odchylenie standardowe jest znane. Nieznany jest parametr m, dla którego szukamy przedziału ufności. Dla próby o liczebności n przedział ufności wygląda następująco: σ σ P X u α n < m < X + u α n = 1 α, gdzie u α jest takie, że P U > u α = α oraz U N0, 1. Wtedy otrzymanych już danych, czyli dla ustalonej realizacji przedział ufności ma postać m, m σ σ = x u α n, x + u α n, Przykład Cecha X ma rozkład normalny o nieznanej wartości oczekiwanej i znanym odchyleniu standardowym σ = 0.1. Oszacować m na poziomie ufności 1 α = 0.95 na podstawie pięcioelementowej próby prostej: 1.2, 1.3, 1.1, 1.1, 1.2. Najpierw średnia: x = = = 1.2. Ponieważ P U > u α = 2 1 Φ u α = α, więc Φ u α = 1 α/2 = Stąd odczytujemy z tablicy rozkładu normalnego u α = Podstawiamy obliczone wielkości do wzoru i otrzymujemy przedział ufności po zaokrągleniu 1.11, Analogiczne obliczenia dają dla poziomu ufności 1 α = 0.9 węższy przedział 1.13, 1.27, gdyż wtedy u α = Przyjęcie z kolei poziomu ufności 1 α = 0.99 daje szerszy przedział 1.09, 1.31, gdyż wtedy u α = Przypadek II. Populacja generalna ma rozkład N m, σ, odchylenie standardowe jest nieznane. Nieznany jest też parametr m, dla którego szukamy przedziału ufności. Dla próby o liczebności n, przedział ufności wygląda następująco: S S P X t α < m < X + t α = 1 α, n 1 n 1 gdzie t α jest takie, że P t > t α = α oraz t ma rozkład t-studenta o n 1 stopniach swobody. Statystyka S = S 2 określona jest wzorem Wtedy m, m S S = x t α, x + t α, n 1 n 1 lub równoważnie przy pomocy statystyki Ŝ = Ŝ2 Ŝ Ŝ P X t α n < m < X + t α n = 1 α

26 WYKŁAD 3. ESTYMACJA I TESTOWANIE HIPOTEZ 26 Wtedy m, m ŝ ŝ = x t α, x + t α n n Tablice rozkładu t-studenta podają wartości tylko dla liczby stopni swobody do trzydziestu. Dla większej liczby stopni swobody statystyka ma rozkład w przybliżeniu normalny patrz str. 20. Takie też tablice należy stosować lub od razu przejść do przypadku III. Ponieważ we wzorach 3.1.3, i znamy dokładne rozkłady statystyk, to można je stosować nawet przy małych próbach. Przykład Dane, cel i poziom ufności jak w przykładzie 3.1.1, ale teraz przypuśćmy, że nie znamy odchylenia standardowego, jednak wiemy, że X N m, σ. Ze wzoru obliczamy s 2 = = 0.008, skąd s = Z tablic rozkładu t-studenta odczytujemy dla α = 0.05 i czterech stopni swobody, t α = Po podstawieniu do wzoru otrzymujemy przedział ufności po zaokrągleniu 1.06, Zwróćmy uwagę, że otrzymany w tym przykładzie przedział ufności jest szerszy, czyli oszacowanie jest mniej dokładne niż oszacowanie otrzymane w przykładzie Jest to zrozumiałe, gdyż teraz mamy mniej informacji nie jest znane σ. Przypadek III. Rozkład dowolny, ale n musi być duże co najmniej kilkadziesiąt oraz istnieje wariancja σ 2 = D 2 X <, która może być nieznana. Wtedy przedziały ufności wyznaczane są ze wzoru 3.1.3, przy czym zamiast σ można podstawić S lub Ŝ dla dużego n różnica między S i Ŝ jest nieznaczna, gdy σ nie jest znane. Przedziały ufności dla wariancji Przedział ufności dla wariancji nie zależy od wartości oczekiwanej m = EX. Stąd tylko dwa rozważane przypadki. Przypadek I. Populacja generalna ma rozkład normalny. Nieznany jest parametr σ, dla którego szukamy przedziału ufności. Próba jest mała n < 30. Dla próby o liczebności n, przedział ufności wygląda następująco: ns 2 P c 2 gdzie c 1 < c 2 spełniają równania P χ 2 < c 1 < σ 2 < ns2 = 1 α, c 1 = P χ 2 > c 2 = α/ dla zmiennej losowej χ 2 o rozkładzie chi-kwadrat o n 1 stopniach swobody. Wtedy σ 2, σ 2 ns 2 =, ns c 2 c 1 Równoważnie przedział ufności można określić wzorem n 1 Ŝ 2 P < σ 2 n 1 Ŝ2 < = 1 α c 2 c 1

27 WYKŁAD 3. ESTYMACJA I TESTOWANIE HIPOTEZ 27 Wtedy σ 2, σ 2 n 1 Ŝ 2 = c 2 gdzie c 1 i c 2 są takie same jak poprzednio. < σ 2 < n 1 Ŝ2, c 1 Zwróćmy uwagę, że przedział ufności otrzymany ze wzorów lub nie jest symetryczny względem s 2. Założenie, że próba jest mała ma charakter czysto rachunkowy dla n > 30 rozkład chi-kwadrat jest na tyle zbliżony do normalnego, że tablice zawierają na ogół wartości tylko do n = 30. Przykład Oszacujmy σ 2 na poziomie ufności 0.9 dla danych jak w przykładzie Wartość statystyki s 2 = została obliczona w przykładzie 3.1.2: s 2 = Z tablicy rozkładu chi-kwadrat odczytujemy bezpośrednio patrz wzór parametr c 2 = dla α/2 = Parametr c 1 odczytujemy z zależności P χ 2 < c 1 = 1 P χ 2 > c 1 = 0.05, czyli P χ 2 > c 1 = 0.95, więc c1 = Przedział ufności , Przypadek II. Populacja generalna ma rozkład normalny lub zbliżony do normalnego i próba jest duża, n 30. Przedział ufności dla odchylenia standardowego wyraża się wzorem P S 1 + u < σ < α 2n S 1 u α 2n gdzie u α jest takie, że P U > u α = α oraz U N 0, 1. Wtedy σ, σ = s 1 + u, α 2n 1 α, s 1 u α 2n Przedziały ufności dla wskaźnika struktury Załóżmy, że w populacji znajdują się elementy dwóch rodzajów, oznaczone jako 0 i 1, przy czym elementy oznaczone jako 1 stanowią p 100% populacji. Parametr p jest wskaźnikiem struktury procentu. Z populacji pobieramy próbę n elementową, w której M oznacza liczbę elementów oznaczonych jako 1. m jest oczywiście zmienną losową. Przedział ufności dla p jest postaci P M n u α M n 1 M n < p < M n n + u α M n 1 m n n 1 α, gdzie u α jest takie, że P U > u α = α oraz U N0, 1. Próba musi mieć dostatecznie dużą liczbę elementów co najmniej 100. Dla pobranej próby, więc dla ustalonego już m, mamy p, p = m m n u n 1 m n α, m m n n + u n 1 m n α n Przykład Spośród 100 wylosowanych elementów, 80 było klasy I, a 20 klasy II. Na poziomie ufności 1 α = 0.95 oszacować procent elementów klasy I w całej populacji. Podstawiamy we wzorze , n = 100 i m = 80 obliczamy: m n 1 m n = = n 100

28 WYKŁAD 3. ESTYMACJA I TESTOWANIE HIPOTEZ 28 Ponieważ patrz przykład u α = 1.96, to podstawiając otrzymane wartości do wzoru , otrzymujemy przedział ufności dla procentu w zaokrągleniu do całych procentów elementów klasy I: 80% %, 80% % = 72%, 88%. Przedział ufności dla współczynnika korelacji Przedział ufności dla współczynnika korelacji podamy tylko przy szczególnych założeniach, a mianowicie, że rozkład łączny wektora X i Y jest normalny lub zbliżony do normalnego oraz próba jest duża n kilkaset. Przedział ufności dany jest tu wzorem 1 R P R 2 1 R 2 u α < ρ < R + u α = 1 α, n n gdzie P U < u α = 1 α dla U N 0, 1. Statystyka R wyraża się wzorem Wtedy przedział ufności dla współczynnika korelacji ρ jest postaci: ρ, ρ 1 r = r 2 1 R 2 u α < ρ < +u α, n n gdzie por. str. 40 n x i xy i y r = n x i x 2 n y i y 2 Jeśli próba jest liczna i dane są podzielone na klasy w tablicę wielodzielczą, to wtedy r = k j=1 l n ij x i x y j y k n i x i x 2 l j=1 n j y j y 2, gdzie x i, y j są środkami odpowiednich klas, n ij jest liczbą danych, które ze względu na cechę X są w klasie o numerze i, a ze względu na cechę Y, są w klasie o numerze j. n i jest liczbą wszystkich danych, które ze względu na cechę X są w klasie o numerze i, a y j jest liczbą wszystkich danych, które ze względu na cechę Y są w klasie o numerze j. Przykład Przypuśćmy, że empiryczny współczynnik korelacji między dwiema cechami, obliczony z próby 100 elementowej, wynosi r = 0.3. Zgodnie z tabelą A.2 na str. 40, oznacza to zależność niską. Przedział ufności dla współczynnika korelacji na poziomie ufności 1 α = 0.95 jak poprzednio u α = 1.96 jest zgodnie ze wzorem postaci: , , Jest to przedział szerszy niż przedział podany w tabeli A.2 dla zależności niskiej. Oznacza to, że prawdziwy współczynnik korelacji może mieć wartość oznaczającą zarówno zależność umiarkowaną, jak i brak zależności. Jeśli jednak ta sama wartość r = 0.3 była otrzymana z próby 400 elementowej, to analogicznie obliczony przedział ufności będzie miał postać 0.21, Oznacza to w tym przypadku, że z prawdopodobieństwem nie mniejszym od 0.95, zależność jest niska zależność jest, ale mniejsza niż umiarkowana.

29 WYKŁAD 3. ESTYMACJA I TESTOWANIE HIPOTEZ Testowanie hipotez Test statystyczny ma za zadanie weryfikację pewnej hipotezy, na podstawie danych statystycznych. Testy parametryczne służą do weryfikacji hipotez o wartościach parametrów w rozkładach badanych cech. Testy nieparametryczne będą sprawdzać prawdziwość hipotez, w których nie są, bądź nie muszą być, sprecyzowane wartości parametrów rozkładów populacji, np. hipotez o normalnym rozkładzie populacji lub że dwie cechy w populacji są niezależne. Testowanie hipotez statystycznych ma w każdym razie w zakresie tego wykładu charakterystyczną postać hipoteza ma postać równości θ = θ 0, gdzie θ jest prawdziwą, a nam nieznaną wartością parametru rozkładu, natomiast θ 0 jest hipotetyczną wartością tego parametru. Oznacza to, że taka równość jest sprawdzaną weryfikowaną hipotezą, którą należy odrzucić i w zamian przyjąć inną np. θ θ 0 albo postanowić, że nie ma podstaw do jej odrzucenia. To postanowienie nie oznacza przyjęcia hipotezy, może jednak oznaczać konieczność przeprowadzenia dalszych badań. Kiedy jesteśmy skłonni hipotezę odrzucić? Intuicyjnie zrobimy to wtedy, gdyby jej przyjęcie oznaczałoby, że zaszło zdarzenie bardzo mało prawdopodobne, na przykład zdarzenie, którego prawdopodobieństwo byłoby mniejsze od α = 0.05, czyli takie, które zdarzałoby się średnio rzadziej niż 5 razy na 100. Rozumowanie to sprecyzujemy następująco. Niech θ będzie parametrem w pewnym rozkładzie o dystrybuancie F θ x. Niech H 0 : θ = θ 0 przeciw H 1 : θ θ 0 oznacza, że stawiamy hipotezę H 0 : θ = θ 0 zwaną hipotezą zerową, którą możemy odrzucić na korzyść hipotezy H 1 : θ θ 0 zwanej hipotezą alternatywną. Innymi możliwościami są: H 0 : θ = θ 0 przeciw H 1 : θ < θ 0, H 0 : θ = θ 0 przeciw H 1 : θ > θ 0. Z rozkładem F θ x, i parametrem θ wiążemy statystykę Z = Z X 1, X 2,..., X n, której rozkład dokładny lub przybliżony jest znany przy założeniu prawdziwości hipotezy H 0. Następnie wyznaczamy obszar Q, służący do weryfikacji hipotezy H 0 w ten sposób, aby przy założeniu prawdziwości H 0 była spełniona równość Wtedy odrzucamy H 0 i przyjmujemy H 1, o ile istotnie zdarzy się, że PZ Q = α z = Z ω = z x 1, x 2,..., x n Q, czyli, gdy zajdzie zdarzenie mało prawdopodobne. W praktyce statystycznej przyjmuje się zwykle, że α = 0.05, czasem α = 0.01 lub ewentualnie α = 0.1. Obszar Q nazywa się obszarem krytycznym, a liczbę α nazywa się poziomem istotności. Hipotezę zerową odrzucamy na korzyść alternatywnej, gdy wartość z statystyki Z znajdzie się w obszarze krytycznym. Może się oczywiście zdarzyć, że z Q, mimo że hipoteza H 0 jest prawdziwa. Zdarzy się to jednak z małym prawdopodobieństwem α. Popełniamy wtedy błąd polegający na odrzuceniu hipotezy prawdziwej, zwany błędem pierwszego rodzaju. Przyjęcie fałszywej hipotezy H 0 stanowi błąd drugiego rodzaju. W przyjętej tutaj procedurze nie ma jednak przyjmowania H 0, co najwyżej postanawia się, że nie ma podstaw do jej przyjęcia. Taką procedurę postępowania przyjęto, gdyż nie precyzuje się tu prawdopodobieństwa popełnienia błędu drugiego rodzaju. W następnych trzech punktach omówimy przykłady testów statystycznych, gdzie nieznanymi parametrami próby będą wartość oczekiwana i wariancja lub wskaźnik struktury.

Statystyka matematyczna

Statystyka matematyczna Statystyka matematyczna dla kierunku Zarządzanie na studiach drugiego stopnia Wojciech Kordecki Wyższa Szkoła Handlowa we Wrocławiu Wrocław 2013 Recenzenci: prof. dr hab. Tadeusz Galanc dr hab. Jerzy Wawrzynek

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych Rozdział 1 Zmienne losowe, ich rozkłady i charakterystyki 1.1 Definicja zmiennej losowej Niech Ω będzie przestrzenią zdarzeń elementarnych. Definicja 1 Rodzinę S zdarzeń losowych (zbiór S podzbiorów zbioru

Bardziej szczegółowo

Rozkłady statystyk z próby

Rozkłady statystyk z próby Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny

Bardziej szczegółowo

III. ZMIENNE LOSOWE JEDNOWYMIAROWE

III. ZMIENNE LOSOWE JEDNOWYMIAROWE III. ZMIENNE LOSOWE JEDNOWYMIAROWE.. Zmienna losowa i pojęcie rozkładu prawdopodobieństwa W dotychczas rozpatrywanych przykładach każdemu zdarzeniu była przyporządkowana odpowiednia wartość liczbowa. Ta

Bardziej szczegółowo

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie

Bardziej szczegółowo

4,5. Dyskretne zmienne losowe (17.03; 31.03)

4,5. Dyskretne zmienne losowe (17.03; 31.03) 4,5. Dyskretne zmienne losowe (17.03; 31.03) Definicja 1 Zmienna losowa nazywamy dyskretna (skokowa), jeśli zbiór jej wartości x 1, x 2,..., można ustawić w ciag. Zmienna losowa X, która przyjmuje wszystkie

Bardziej szczegółowo

STATYSTYKA

STATYSTYKA Wykład 1 20.02.2008r. 1. ROZKŁADY PRAWDOPODOBIEŃSTWA 1.1 Rozkład dwumianowy Rozkład dwumianowy, 0 1 Uwaga: 1, rozkład zero jedynkowy. 1 ; 1,2,, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym

Bardziej szczegółowo

Rachunek prawdopodobieństwa i statystyka

Rachunek prawdopodobieństwa i statystyka Rachunek prawdopodobieństwa i statystyka Przestrzeń probabilistyczna Niech Ω będzie dowolnym zbiorem, zwanym przestrzenią zdarzeń elementarnych. Elementy ω tej przestrzeni nazywamy zdarzeniami elementarnymi.

Bardziej szczegółowo

Rozdział 1. Zmienne losowe, ich rozkłady i charakterystyki. 1.1 Definicja zmiennej losowej

Rozdział 1. Zmienne losowe, ich rozkłady i charakterystyki. 1.1 Definicja zmiennej losowej Rozdział 1 Zmienne losowe, ich rozkłady i charakterystyki 1.1 Definicja zmiennej losowej Zbiór możliwych wyników eksperymentu będziemy nazywać przestrzenią zdarzeń elementarnych i oznaczać Ω, natomiast

Bardziej szczegółowo

Dyskretne zmienne losowe

Dyskretne zmienne losowe Dyskretne zmienne losowe dr Mariusz Grządziel 16 marca 2009 Definicja 1. Zmienna losowa nazywamy dyskretna (skokowa), jeśli zbiór jej wartości x 1, x 2,..., można ustawić w ciag. Zmienna losowa X, która

Bardziej szczegółowo

Przestrzeń probabilistyczna

Przestrzeń probabilistyczna Przestrzeń probabilistyczna (Ω, Σ, P) Ω pewien niepusty zbiór Σ rodzina podzbiorów tego zbioru P funkcja określona na Σ, zwana prawdopodobieństwem. Przestrzeń probabilistyczna (Ω, Σ, P) Ω pewien niepusty

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta

Bardziej szczegółowo

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)

Bardziej szczegółowo

WYKŁAD 2. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

WYKŁAD 2. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady WYKŁAD 2 Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady Metody statystyczne metody opisu metody wnioskowania statystycznego syntetyczny liczbowy opis właściwości zbioru danych ocena

Bardziej szczegółowo

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA Zadanie 0.1 Zmienna losowa X ma rozkład określony funkcją prawdopodobieństwa: x k 0 4 p k 1/3 1/6 1/ obliczyć EX, D X. (odp. 4/3;

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

Zestaw 2: Zmienne losowe. 0, x < 1, 2, 2 x, 1 1 x, 1 x, F 9 (x) =

Zestaw 2: Zmienne losowe. 0, x < 1, 2, 2 x, 1 1 x, 1 x, F 9 (x) = Zestaw : Zmienne losowe. Które z poniższych funkcji są dystrybuantami? Odpowiedź uzasadnij. Wskazówka: naszkicuj wykres. 0, x 0,, x 0, F (x) = x, F (x) = x, 0 x

Bardziej szczegółowo

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna. Wykład 4 Rozkłady i ich dystrybuanty Dwa typy zmiennych losowych Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x, x 2,...}, to mówimy, że jest to zmienna dyskretna.

Bardziej szczegółowo

Wykład 3 Jednowymiarowe zmienne losowe

Wykład 3 Jednowymiarowe zmienne losowe Wykład 3 Jednowymiarowe zmienne losowe Niech (Ω, F, P ) będzie ustaloną przestrzenią probabilistyczną Definicja 1 Jednowymiarowa zmienna losowa (o wartościach rzeczywistych), określoną na przestrzeni probabilistycznej

Bardziej szczegółowo

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Jednowymiarowa zmienna losowa

Jednowymiarowa zmienna losowa 1 Jednowymiarowa zmienna losowa Przykład Doświadczenie losowe - rzut kostką do gry. Obserwujemy ilość wyrzuconych oczek. Teoretyczny model eksperymentu losowego - przestrzeń probabilistyczna (Ω, S, P ),

Bardziej szczegółowo

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: Zmienne losowe skokowe (dyskretne) przyjmujące co najwyżej przeliczalnie wiele wartości Zmienne losowe ciągłe

Bardziej szczegółowo

Biostatystyka, # 3 /Weterynaria I/

Biostatystyka, # 3 /Weterynaria I/ Biostatystyka, # 3 /Weterynaria I/ dr n. mat. Zdzisław Otachel Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, p. 221 bud. CIW, e-mail: zdzislaw.otachel@up.lublin.pl

Bardziej szczegółowo

Wykład 3 Hipotezy statystyczne

Wykład 3 Hipotezy statystyczne Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza

Bardziej szczegółowo

Rachunek Prawdopodobieństwa i Statystyka

Rachunek Prawdopodobieństwa i Statystyka Rachunek Prawdopodobieństwa i Statystyka W 2. Probabilistyczne modele danych Zmienne losowe. Rozkład prawdopodobieństwa i dystrybuanta. Wartość oczekiwana i wariancja zmiennej losowej Dr Anna ADRIAN Zmienne

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28 Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych

Bardziej szczegółowo

Wnioskowanie statystyczne. Statystyka w 5

Wnioskowanie statystyczne. Statystyka w 5 Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających

Bardziej szczegółowo

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ Opracowała: Milena Suliga Wszystkie pliki pomocnicze wymienione w treści

Bardziej szczegółowo

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl

Bardziej szczegółowo

Rozkłady i ich dystrybuanty 16 marca F X (t) = P (X < t) 0, gdy t 0, F X (t) = 1, gdy t > c, 0, gdy t x 1, 1, gdy t > x 2,

Rozkłady i ich dystrybuanty 16 marca F X (t) = P (X < t) 0, gdy t 0, F X (t) = 1, gdy t > c, 0, gdy t x 1, 1, gdy t > x 2, Wykład 4. Rozkłady i ich dystrybuanty 6 marca 2007 Jak opisać cały rozkład jedną funkcją? Aby znać rozkład zmiennej X, musimy umieć obliczyć P (a < X < b) dla dowolnych a < b. W tym celu wystarczy znać

Bardziej szczegółowo

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1. Opracowała: Joanna Kisielińska ZMIENNE LOSOWE Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R tzn. X: R. Realizacją zmiennej losowej

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z

Bardziej szczegółowo

Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa

Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa Marek Kubiak Instytut Informatyki Politechnika Poznańska Plan wykładu Podstawowe pojęcia rachunku prawdopodobieństwa Rozkład

Bardziej szczegółowo

Spis treści 3 SPIS TREŚCI

Spis treści 3 SPIS TREŚCI Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie

Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie Jarosław Kotowicz Instytut Matematyki Uniwersytet w

Bardziej szczegółowo

II WYKŁAD STATYSTYKA. 12/03/2014 B8 sala 0.10B Godz. 15:15

II WYKŁAD STATYSTYKA. 12/03/2014 B8 sala 0.10B Godz. 15:15 II WYKŁAD STATYSTYKA 12/03/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 2 Rachunek prawdopodobieństwa zdarzenia elementarne zdarzenia losowe zmienna losowa skokowa i ciągła prawdopodobieństwo i gęstość prawdopodobieństwa

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału Magdalena Frąszczak Wrocław, 22.02.2017r Zasady oceniania Ćwiczenia 2 kolokwia (20 punktów każde) 05.04.2017 oraz 31.05.2017 2 kartkówki

Bardziej szczegółowo

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas: ROZWIĄZANIA I ODPOWIEDZI Zadanie A1. Można założyć, że przy losowaniu trzech kul jednocześnie kolejność ich wylosowania nie jest istotna. A więc: Ω = 20 3. a) Niech: - wśród trzech wylosowanych opakowań

Bardziej szczegółowo

Ćwiczenia 7 - Zmienna losowa i jej rozkład. Parametry rozkładu.

Ćwiczenia 7 - Zmienna losowa i jej rozkład. Parametry rozkładu. Ćwiczenia 7 - Zmienna losowa i jej rozkład. Parametry rozkładu. A Teoria Definicja A.1. Niech (Ω, F, P) będzie przestrzenią probabilistyczną. Zmienną losową określoną na przestrzeni Ω nazywamy dowolną

Bardziej szczegółowo

Wydział Matematyki. Testy zgodności. Wykład 03

Wydział Matematyki. Testy zgodności. Wykład 03 Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy

Bardziej szczegółowo

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,

Bardziej szczegółowo

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015 Zmienne losowe, statystyki próbkowe Wrocław, 2 marca 2015 Zasady zaliczenia 2 kolokwia (każde po 20 punktów) projekt (20 punktów) aktywność Zasady zaliczenia 2 kolokwia (każde po 20 punktów) projekt (20

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

STATYSTYKA wykład 5-6

STATYSTYKA wykład 5-6 TATYTYKA wykład 5-6 Twierdzenia graniczne Rozkłady statystyk z próby Wanda Olech Twierdzenia graniczne Jeżeli rozpatrujemy ciąg zmiennych losowych {X ; X ;...; X n }, to zdarza się, że ich rozkłady przy

Bardziej szczegółowo

Ważne rozkłady i twierdzenia

Ważne rozkłady i twierdzenia Ważne rozkłady i twierdzenia Rozkład dwumianowy i wielomianowy Częstość. Prawo wielkich liczb Rozkład hipergeometryczny Rozkład Poissona Rozkład normalny i rozkład Gaussa Centralne twierdzenie graniczne

Bardziej szczegółowo

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Bardziej szczegółowo

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 7 i 8 1 / 9 EFEKTYWNOŚĆ ESTYMATORÓW, próba

Bardziej szczegółowo

12DRAP - parametry rozkładów wielowymiarowych

12DRAP - parametry rozkładów wielowymiarowych DRAP - parametry rozkładów wielowymiarowych Definicja.. Jeśli h : R R, a X, Y ) jest wektorem losowym o gęstości fx, y) to EhX, Y ) = hx, y)fx, y)dxdy. Jeśli natomiast X, Y ) ma rozkład dyskretny skupiony

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW STATYSTYKA to nauka, której przedmiotem

Bardziej szczegółowo

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1 Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie

Bardziej szczegółowo

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Magdalena Frąszczak Wrocław, 21.02.2018r Tematyka Wykładów: Próba i populacja. Estymacja parametrów z wykorzystaniem metody

Bardziej szczegółowo

Statystyka i eksploracja danych

Statystyka i eksploracja danych Wykład II: i charakterystyki ich rozkładów 24 lutego 2014 Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa, cz. II Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa,

Bardziej szczegółowo

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia. Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia. D A R I U S Z P I W C Z Y Ń S K I 2 2 ROZKŁAD ZMIENNEJ LOSOWEJ Polega na przyporządkowaniu

Bardziej szczegółowo

Lista 5. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym

Lista 5. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym Lista 5 Zadania na zastosowanie nierównosci Markowa i Czebyszewa. Zadanie 1. Niech zmienna losowa X ma rozkład jednostajny na odcinku [0, 1]. Korzystając z nierówności Markowa oszacować od góry prawdopodobieństwo,

Bardziej szczegółowo

Ważne rozkłady i twierdzenia c.d.

Ważne rozkłady i twierdzenia c.d. Ważne rozkłady i twierdzenia c.d. Funkcja charakterystyczna rozkładu Wielowymiarowy rozkład normalny Elipsa kowariacji Sploty rozkładów Rozkłady jednostajne Sploty z rozkładem normalnym Pobieranie próby

Bardziej szczegółowo

Dokładne i graniczne rozkłady statystyk z próby

Dokładne i graniczne rozkłady statystyk z próby Dokładne i graniczne rozkłady statystyk z próby Przypomnijmy Populacja Próba Wielkość N n Średnia Wariancja Odchylenie standardowe 4.2 Rozkład statystyki Mówimy, że rozkład statystyki (1) jest dokładny,

Bardziej szczegółowo

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej

Bardziej szczegółowo

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4. Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ

Bardziej szczegółowo

P (A B) = P (A), P (B) = P (A), skąd P (A B) = P (A) P (B). P (A)

P (A B) = P (A), P (B) = P (A), skąd P (A B) = P (A) P (B). P (A) Wykład 3 Niezależność zdarzeń, schemat Bernoulliego Kiedy dwa zdarzenia są niezależne? Gdy wiedza o tym, czy B zaszło, czy nie, NIE MA WPŁYWU na oszacowanie prawdopodobieństwa zdarzenia A: P (A B) = P

Bardziej szczegółowo

Rozdział 1. Wektory losowe. 1.1 Wektor losowy i jego rozkład

Rozdział 1. Wektory losowe. 1.1 Wektor losowy i jego rozkład Rozdział 1 Wektory losowe 1.1 Wektor losowy i jego rozkład Definicja 1 Wektor X = (X 1,..., X n ), którego każda współrzędna jest zmienną losową, nazywamy n-wymiarowym wektorem losowym (krótko wektorem

Bardziej szczegółowo

Prawdopodobieństwo i statystyka

Prawdopodobieństwo i statystyka Wykład II: Zmienne losowe i charakterystyki ich rozkładów 13 października 2014 Zmienne losowe Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa, cz. II Definicja zmiennej losowej i jej

Bardziej szczegółowo

Metody Statystyczne. Metody Statystyczne.

Metody Statystyczne. Metody Statystyczne. gkrol@wz.uw.edu.pl #4 1 Sprawdzian! 5 listopada (ok. 45-60 minut): - Skale pomiarowe - Zmienne ciągłe i dyskretne - Rozkład teoretyczny i empiryczny - Miary tendencji centralnej i rozproszenia - Standaryzacja

Bardziej szczegółowo

Metody probabilistyczne opracowane notatki 1. Zdefiniuj zmienną losową, rozkład prawdopodobieństwa. Przy jakich założeniach funkcje: F(x) = sin(x),

Metody probabilistyczne opracowane notatki 1. Zdefiniuj zmienną losową, rozkład prawdopodobieństwa. Przy jakich założeniach funkcje: F(x) = sin(x), Metody probabilistyczne opracowane notatki 1. Zdefiniuj zmienną losową, rozkład prawdopodobieństwa. Przy jakich założeniach funkcje: Fx sinx, Fx a e x mogą być dystrybuantami?. Podaj twierdzenie Lindeberga

Bardziej szczegółowo

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0 Testowanie hipotez Każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy nazywamy hipotezą statystyczną. Hipoteza określająca jedynie wartości nieznanych parametrów liczbowych badanej cechy

Bardziej szczegółowo

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej 7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach

Bardziej szczegółowo

Estymacja parametrów w modelu normalnym

Estymacja parametrów w modelu normalnym Estymacja parametrów w modelu normalnym dr Mariusz Grządziel 6 kwietnia 2009 Model normalny Przez model normalny będziemy rozumieć rodzine rozkładów normalnych N(µ, σ), µ R, σ > 0. Z Centralnego Twierdzenia

Bardziej szczegółowo

1 Podstawy rachunku prawdopodobieństwa

1 Podstawy rachunku prawdopodobieństwa 1 Podstawy rachunku prawdopodobieństwa Dystrybuantą zmiennej losowej X nazywamy prawdopodobieństwo przyjęcia przez zmienną losową X wartości mniejszej od x, tzn. F (x) = P [X < x]. 1. dla zmiennej losowej

Bardziej szczegółowo

6. Zmienne losowe typu ciagłego ( ) Pole trapezu krzywoliniowego

6. Zmienne losowe typu ciagłego ( ) Pole trapezu krzywoliniowego 6. Zmienne losowe typu ciagłego (2.04.2007) Pole trapezu krzywoliniowego Przypomnienie: figurę ograniczoną przez: wykres funkcji y = f(x), gdzie f jest funkcją ciągłą; proste x = a, x = b, a < b, oś OX

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie

Bardziej szczegółowo

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego Statystyka Wydział Zarządzania Uniwersytetu Łódzkiego 2017 Podstawowe rozkłady zmiennych losowych Rozkłady zmiennych skokowych Rozkład zero-jedynkowy Rozpatrujemy doświadczenie, którego rezultatem może

Bardziej szczegółowo

Prawdopodobieństwo i statystyka

Prawdopodobieństwo i statystyka Wykład VII: Rozkład i jego charakterystyki 22 listopada 2016 Uprzednio wprowadzone pojęcia i ich własności Definicja zmiennej losowej Zmienna losowa na przestrzeni probabilistycznej (Ω, F, P) to funkcja

Bardziej szczegółowo

Rozkłady prawdopodobieństwa zmiennych losowych

Rozkłady prawdopodobieństwa zmiennych losowych Rozkłady prawdopodobieństwa zmiennych losowych Rozkład dwumianowy Rozkład normalny Marta Zalewska Zmienna losowa dyskretna (skokowa) jest to zmienna, której zbór wartości jest skończony lub przeliczalny.

Bardziej szczegółowo

Zmienne losowe i ich rozkłady. Momenty zmiennych losowych. Wrocław, 10 października 2014

Zmienne losowe i ich rozkłady. Momenty zmiennych losowych. Wrocław, 10 października 2014 Zmienne losowe i ich rozkłady. Momenty zmiennych losowych. Wrocław, 10 października 2014 Zmienne losowe i ich rozkłady Doświadczenie losowe: Rzut monetą Rzut kostką Wybór losowy n kart z talii 52 Gry losowe

Bardziej szczegółowo

METODY BADAŃ NA ZWIERZĘTACH ze STATYSTYKĄ wykład 3-4. Parametry i wybrane rozkłady zmiennych losowych

METODY BADAŃ NA ZWIERZĘTACH ze STATYSTYKĄ wykład 3-4. Parametry i wybrane rozkłady zmiennych losowych METODY BADAŃ NA ZWIERZĘTACH ze STATYSTYKĄ wykład - Parametry i wybrane rozkłady zmiennych losowych Parametry zmiennej losowej EX wartość oczekiwana D X wariancja DX odchylenie standardowe inne, np. kwantyle,

Bardziej szczegółowo

Rachunek prawdopodobieństwa

Rachunek prawdopodobieństwa Rachunek prawdopodobieństwa Sebastian Rymarczyk srymarczyk@afm.edu.pl Tematyka zajęć 1. Elementy kombinatoryki. 2. Definicje prawdopodobieństwa. 3. Własności prawdopodobieństwa. 4. Zmienne losowe, parametry

Bardziej szczegółowo

Podstawy nauk przyrodniczych Matematyka

Podstawy nauk przyrodniczych Matematyka Podstawy nauk przyrodniczych Matematyka Elementy rachunku prawdopodobieństwa dr inż. Małgorzata Szeląg Zakład Genetyki Molekularnej Człowieka tel. 61 829 59 04 malgorzata.szelag@amu.edu.pl Pokój 1.118

Bardziej szczegółowo

Wybrane rozkłady zmiennych losowych. Statystyka

Wybrane rozkłady zmiennych losowych. Statystyka Wybrane rozkłady zmiennych losowych Statystyka Rozkład dwupunktowy Zmienna losowa przyjmuje tylko dwie wartości: wartość 1 z prawdopodobieństwem p i wartość 0 z prawdopodobieństwem 1- p x i p i 0 1-p 1

Bardziej szczegółowo

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( ) Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału

Bardziej szczegółowo

Wykład 3 Momenty zmiennych losowych.

Wykład 3 Momenty zmiennych losowych. Wykład 3 Momenty zmiennych losowych. Wrocław, 19 października 2016r Momenty zmiennych losowych Wartość oczekiwana - przypomnienie Definicja 3.1: 1 Niech X będzie daną zmienną losową. Jeżeli X jest zmienną

Bardziej szczegółowo

Wykład 3 Momenty zmiennych losowych.

Wykład 3 Momenty zmiennych losowych. Wykład 3 Momenty zmiennych losowych. Wrocław, 18 października 2017r Momenty zmiennych losowych Wartość oczekiwana - przypomnienie Definicja 3.1: 1 Niech X będzie daną zmienną losową. Jeżeli X jest zmienną

Bardziej szczegółowo

Statystyczna analiza danych

Statystyczna analiza danych Statystyczna analiza danych Marek Ptak 21 października 2013 Marek Ptak Statystyka 21 października 2013 1 / 70 Część I Wstęp Marek Ptak Statystyka 21 października 2013 2 / 70 LITERATURA A. Łomnicki, Wprowadzenie

Bardziej szczegółowo

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych 1. [E.A 5.10.1996/zad.4] Funkcja gęstości dana jest wzorem { 3 x + 2xy + 1 y dla (x y) (0 1) (0 1) 4 4 P (X > 1 2 Y > 1 2 ) wynosi:

Bardziej szczegółowo

1.1 Wstęp Literatura... 1

1.1 Wstęp Literatura... 1 Spis treści Spis treści 1 Wstęp 1 1.1 Wstęp................................ 1 1.2 Literatura.............................. 1 2 Elementy rachunku prawdopodobieństwa 2 2.1 Podstawy..............................

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 55 jacek.mercik@pwr.wroc.pl (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW Elementy wykładu.

Bardziej szczegółowo

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Spis treści Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Romuald Kotowski Katedra Informatyki Stosowanej PJWSTK 2009 Spis treści Spis treści 1 Wstęp Bardzo często interesujący

Bardziej szczegółowo

Prawa wielkich liczb, centralne twierdzenia graniczne

Prawa wielkich liczb, centralne twierdzenia graniczne , centralne twierdzenia graniczne Katedra matematyki i ekonomii matematycznej 17 maja 2012, centralne twierdzenia graniczne Rodzaje zbieżności ciągów zmiennych losowych, centralne twierdzenia graniczne

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =. Prawdopodobieństwo i statystyka 3..00 r. Zadanie Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX 4 i EY 6. Rozważamy zmienną losową Z. X + Y Wtedy (A) EZ 0,

Bardziej szczegółowo

Własności statystyczne regresji liniowej. Wykład 4

Własności statystyczne regresji liniowej. Wykład 4 Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności

Bardziej szczegółowo

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz. LABORATORIUM 4 1. Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz. I) WNIOSKOWANIE STATYSTYCZNE (STATISTICAL INFERENCE) Populacja

Bardziej szczegółowo

Zmienna losowa. Rozkład skokowy

Zmienna losowa. Rozkład skokowy Temat: Zmienna losowa. Rozkład skokowy Kody kolorów: żółty nowe pojęcie pomarańczowy uwaga * - materiał nadobowiązkowy Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo SGGW 1 Zagadnienia

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 2013/2014 Wykład 3 Zmienna losowa i jej rozkłady Zdarzenia losowe Pojęcie prawdopodobieństwa

Bardziej szczegółowo