Zaliczenie. Ćwiczenia (zaliczenie = min. 15 punktów)

Podobne dokumenty
Przedziały ufności. Poziom istotności = α (zwykle 0.05) Poziom ufności = 1 α Przedział ufności dla parametru μ = taki przedział [a,b], dla którego

Generatory takie mają niestety okres, po którym sekwencja liczb powtarza się.

Kolokwium ze statystyki matematycznej

Estymacja parametrów rozkładu cechy

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych.

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

ESTYMACJA PRZEDZIAŁOWA WYBRANYCH PARAMETRÓW

1 Estymacja przedziałowa

Elektrotechnika II [ Laboratorium Grupa 1 ] 2016/2017 Zimowy. [ Laboratorium Grupa 2 ] 2016/2017 Zimowy

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Zadanie 1 Odp. Zadanie 2 Odp. Zadanie 3 Odp. Zadanie 4 Odp. Zadanie 5 Odp.

Statystyka matematyczna

a. opisać badaną cechę; cechą X jest pomiar średnicy kulki

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Monte Carlo, bootstrap, jacknife

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Metody Statystyczne. Metody Statystyczne.

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

STATYSTYKA MATEMATYCZNA

Estymacja punktowa i przedziałowa

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD STATYSTYK Z PRÓBY

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski

Porównanie dwóch rozkładów normalnych

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Wykład 9 Wnioskowanie o średnich

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

I jest narzędziem służącym do porównywania rozproszenia dwóch zmiennych. Używamy go tylko, gdy pomiędzy zmiennymi istnieje logiczny związek

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Spis treści 3 SPIS TREŚCI

Rozkłady statystyk z próby

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Statystyka matematyczna

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

WYKŁAD 5 TEORIA ESTYMACJI II

Rozkłady statystyk z próby. Statystyka

O ŚREDNIEJ ARYTMETYCZNEJ I MEDIANIE

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Zadanie Punkty Ocena

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Statystyka matematyczna Testowanie hipotez dla średnich w rozkładzie normalnym. Wrocław, r

1 Podstawy rachunku prawdopodobieństwa

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

STATYSTYKA MATEMATYCZNA, LISTA 3

1.1 Wstęp Literatura... 1

Pobieranie prób i rozkład z próby

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka matematyczna dla leśników

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

4.Zmienne losowe X 1, X 2,..., X 100 są niezależne i mają rozkład wykładniczy z α = 0.25 Jakie jest prawdopodobieństwo, że 1

Oszacowanie i rozkład t

Próbkowanie. Wykład 4 Próbkowanie i rozkłady próbkowe. Populacja a próba. Błędy w póbkowaniu, cd, Przykład 1 (Ochotnicy)

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Wnioskowanie statystyczne. Statystyka w 5

Estymatory i testy statystyczne - zadania na kolokwium

Statystyka w analizie i planowaniu eksperymentu

Estymacja przedziałowa. Przedział ufności

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

L.Kowalski zadania ze statystyki matematycznej-zestaw 2 ZADANIA - ZESTAW 2

STATYSTYKA MATEMATYCZNA WYKŁAD grudnia 2009

Statystyka matematyczna i ekonometria

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Testowanie hipotez statystycznych.

Drugie kolokwium z Rachunku Prawdopodobieństwa, zestaw A

Elektrotechnika II [ Ćwiczenia ] 2016/2017 Zimowy

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO czȩść I

ESTYMACJA PARAMETRYCZNA I WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH

STATYSTYKA I DOŚWIADCZALNICTWO

Problem dwóch prób: porównywanie średnich i wariancji z populacji o rozkładach normalnych. Wrocław, 23 marca 2015

Estymacja parametro w 1

ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

Opis przedmiotu: Probabilistyka I

dr Jerzy Pusz, st. wykładowca, Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej B. Ogólna charakterystyka przedmiotu

Statystyka w analizie i planowaniu eksperymentu

Hipotezy statystyczne

Transkrypt:

Zaliczenie Ćwiczenia (zaliczenie = min. 15 punktów) Kolokwium (8/10 czerwca) = maks. 30 punktów Dwa zadania z listy pod linkiem = maks. 1 punkt http://www.fuw.edu.pl/~prozanski/ws/upload/20150415-zadania.php do ustalenia = maks. 1 punkt Projekt (maks. 2 punkty) Do oddania i ocenienia przed egzaminem

Python Proszę pamiętać: ułamki dziesiętne piszemy z kropką (0.3) a nie przecinkiem (0,3) jeśli dzielimy przez siebie dwie liczby, przynajmniej jedna powinna być wartością typu float nie N/2 tylko 0.5*N jeśli N jest całkowite Nie N/M tylko N/float(M) jeśli obie są całkowite nie x**(1/2) tylko x**0.5 a jeszcze lepiej numpy.sqrt(x) do metody numpy.concatenate potrzebny jest dodatkowy nawias numpy.concatenate([x,y]) albo ((X,Y))

Bootstrap Startujemy z pojedynczej próby lub z rozkładu Powtarzamy wiele razy: generujemy z próby próbę syntetyczną Losując ze zwracaniem Y = X[numpy.random.randint(len(X), size=rozmiar)] lub Losując bez zwracania Y = numpy.random.permutation(x) dla każdej próby (Y) obliczamy wartość statystyki lub zliczamy te, które spełniają warunek

(rozkład normalny ze znaną wariancją) Importer win musi zbadać średnią zawartość alkoholu w nowej partii win francuskich. Z doświadczenia z poprzednimi gatunkami wina, przyjmuje on, że standardowe odchylenie w populacji wynosi 1,2%. Importer wybrał losową próbę 60 butelek nowego wina i otrzymał średnią z próby 9,3%. Znaleźć przedział ufności 90% dla średniej zawartości alkoholu w nowej partii win.

(rozkład normalny ze znaną wariancją) Importer win musi zbadać średnią zawartość alkoholu w nowej partii win francuskich. Z doświadczenia z poprzednimi gatunkami wina, przyjmuje on, że standardowe odchylenie w populacji wynosi 1,2%. Importer wybrał losową próbę 60 butelek nowego wina i otrzymał średnią z próby 9,3%. Znaleźć przedział ufności 90% dla średniej zawartości alkoholu w nowej partii win. x=9.3 σ=1.2 N =60 α=0.1

(rozkład normalny ze znaną wariancją) Importer win musi zbadać średnią zawartość alkoholu w nowej partii win francuskich. Z doświadczenia z poprzednimi gatunkami wina, przyjmuje on, że standardowe odchylenie w populacji wynosi 1,2%. Importer wybrał losową próbę 60 butelek nowego wina i otrzymał średnią z próby 9,3%. Znaleźć przedział ufności 90% dla średniej zawartości alkoholu w nowej partii win. x=9.3 σ=1.2 N =60 α=0.1 Znajdujemy kwantyl rozkładu normalnego z = scipy.stats.norm.ppf(α/2) # uwaga, będzie ujemny Przedział ufności dla średniej z rozkładu normalnego x z α/2 σ N z α/2

(rozkład normalny z nieznaną wariancją) Lekarz chce zbadać średni czas trwania kuracji tj. od podania leku do ustąpienia objawów w pewnej chorobie. Losowa próba 15 pacjentów dała średni czas 10,37 dnia i odchylenie standardowe 3,5 dnia. Zakładając normalny rozkład w populacji czasów trwania kuracji znaleźć 95% przedział ufności dla średniego czasu trwania kuracji.

(rozkład normalny z nieznaną wariancją) Lekarz chce zbadać średni czas trwania kuracji tj. od podania leku do ustąpienia objawów w pewnej chorobie. Losowa próba 15 pacjentów dała średni czas 10,37 dnia i odchylenie standardowe 3,5 dnia. Zakładając normalny rozkład w populacji czasów trwania kuracji znaleźć 95% przedział ufności dla średniego czasu trwania kuracji. x=10.37 s=3.5 N =15 α=0.05

(rozkład normalny z nieznaną wariancją) Lekarz chce zbadać średni czas trwania kuracji tj. od podania leku do ustąpienia objawów w pewnej chorobie. Losowa próba 15 pacjentów dała średni czas 10,37 dnia i odchylenie standardowe 3,5 dnia. Zakładając normalny rozkład w populacji czasów trwania kuracji znaleźć 95% przedział ufności dla średniego czasu trwania kuracji. x=10.37 s=3.5 N =15 α=0.05 Znajdujemy kwantyl rozkładu t o N 1 stopniach swobody t = scipy.stats.t(n-1).ppf(α/2) # uwaga, będzie ujemny Przedział ufności dla średniej z rozkładu t t α/2 x t α/2 s N

(nieznany rozkład lub dziwna statystyka) Ogrodnik eksperymentuje z nowym gatunkiem drzew. Posadził 20 sztuk i po dwóch latach zmierzył następujące średnice pni (w cm): 8,5 7,6 9,3 5,5 11,4 6,9 6,5 12,9 8,7 4,8 4,2 8,1 6,5 5,8 6,7 2,4 11,1 7,1 8,8 7,2 Proszę znaleźć średnią średnicę i 90% przedział ufności dla średniej. Proszę znaleźć medianę średnic i 90% przedział ufności dla mediany.

(nieznany rozkład lub dziwna statystyka) Ogrodnik eksperymentuje z nowym gatunkiem drzew. Posadził 20 sztuk i po dwóch latach zmierzył następujące średnice pni (w cm): 8,5 7,6 9,3 5,5 11,4 6,9 6,5 12,9 8,7 4,8 4,2 8,1 6,5 5,8 6,7 2,4 11,1 7,1 8,8 7,2 Proszę znaleźć średnią średnicę i 90% przedział ufności dla średniej. Proszę znaleźć medianę średnic i 90% przedział ufności dla mediany. α=0.1

(nieznany rozkład lub dziwna statystyka) Obliczamy wartości statystyki dla wielu syntetycznych prób. X = [ ] ile_powtorzen = srednie = numpy.zeros(ile_powtorzen) for i in range(ile_powtorzen) : Y = losujemy z X próbę ze zwracaniem srednie[i] = numpy.mean(y) Rozdzielamy α/2 najczęściej i najrzadziej występujących, czyli znajdujemy odpowiednie kwantyle. xl = scipy.stats.scoreatpercentile(srednie, 100.0*alpha/2) xp = scipy.stats.scoreatpercentile(srednie, 100.0*(1-alpha/2))

(nieznany rozkład lub dziwna statystyka) Obliczamy wartości statystyki dla wielu syntetycznych prób. X = [ ] ile_powtorzen = mediany = numpy.zeros(ile_powtorzen) for i in range(ile_powtorzen) : Y = losujemy z X próbę ze zwracaniem srednie[i] = numpy.median(y) Rozdzielamy α/2 najczęściej i najrzadziej występujących, czyli znajdujemy odpowiednie kwantyle. xl = scipy.stats.scoreatpercentile(mediany, 100.0*alpha/2) xp = scipy.stats.scoreatpercentile(mediany, 100.0*(1-alpha/2))

(zadania dotyczące proporcji) W próbce 200 osób 7 procent jest bezrobotnych. Określić 95% przedział ufności dla odsetka bezrobotnych w populacji. Mamy tylko jedną wartość! (0.07). Jak z tego zrobić przedział ufności?

(zadania dotyczące proporcji) W próbce 200 osób 7 procent jest bezrobotnych. Określić 95% przedział ufności dla odsetka bezrobotnych w populacji. Mamy tylko jedną wartość! (0.07). Jak z tego zrobić przedział ufności? Tworzymy próbę o długości 200 zawierający 14 jedynek i 186 zer. X = numpy.concatenate([numpy.ones(14),numpy.zeros(186)]) Zauważmy, że średnia z tej próby = 0.07 Widzimy, że zadanie można rozwiązać poprzez wyznaczenie przedziału ufności dla średniej metodą bootstrap

(zadania dotyczące proporcji) Możemy również zauważyć, że: Zamiast tworzyć początkowy wektor i losować z niego, możemy za każdym razem losować bezpośrednio z rozkładu zero-jedynkowego (Bernoulliego) Y = scipy.stats.bernoulli(0.07).rvs(size=200) srednie[i] = numpy.mean(y) Ponieważ interesuje nas tylko średnia z Y, możemy tę średnią obliczyć bezpośrednio z rozkładu dwumianowego srednie[i] = scipy.stats.binom(200, 0.07).rvs() / 200 Skoro tak, to nie musimy w ogóle przeprowadzać symulacji! Wystarczy wyciągnąć kwantyle z rozkładu dwumianowego scipy.stats.binom(200, 0.07).ppf([alpha/2, 1-alpha/2]) / 200