Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 55 jacek.mercik@pwr.wroc.pl (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW
Elementy wykładu. Zmienne losowe i ich parametry. Dystrybuanta, wybrane rozkłady i ich parametry 3. Rozkład normalny, centralne tw. Graniczne, korzystanie z tablic 4. Przedziały ufności. Estymacja przedziałowa dla małych próbek 5. Przedziały ufności. Estymacja przedziałowa dla dużych próbek 6. Testowanie hipotez parametrycznych. Wybrane testy parametryczne dla małych i dużych próbek 7. Porównywanie dwóch populacji Porównywanie parametrów, porównywanie rozkładów 8. Testowanie hipotez nieparametrycznych. Test chi-kwadrat, test serii zastosowania 9. Podstawy ekonometrii. Modele ekonomiczne 0. Założenia Gaussa-Markowa. Metoda najmniejszych kwadratów. Pakiety statystyczne. Weryfikacja modeli ekonometrycznych.. Przykłady modeli liniowych. 3. Przykłady modeli nieliniowych 4. Modele ekonometryczne wielorównaniowe. 5. Kolokwium zaliczeniowe
Literatura: A. Aczel: Statystyka w zarządzaniu, PWN, Warszawa, 000. M. Fisz: Rachunek prawdopodobieństwa i statystyka matematyczna. Z. Hellwig: Elementy rachunku prawdopodobieństwa i statystyki matematycznej. J. Greń: Statystyka matematyczna. Modele i zadania. S. Ostasiewicz, Z. Rusnak, U. Siedlecka: Statystyka. M. Berenson, D. Levine: Basic business statistics. J. Kowal: Metody statystyczne w badaniach sondażowych rynku. J. Podgórski: Statystyka z komputerem (statgraphics). G. Krzykowski: Statystyczna analiza pomiarów (statgraphics). i wiele innych tego typu. H. Jasiulewicz, W. Kordecki: Rachunek prawdopodobieństwa i statystyka matematyczna. Przykłady i zadania. Oficyna Wydawnicza GiS, Wrocław, 00
Pojęcia podstawowe: Populacja generalna: zbiorowość elementów, z których będziemy dokonywać losowania i których cechy będą badane. Zazwyczaj cecha oznaczana jest podobnie jak zmienna losowa: X, Y, Z, W,... Populacja generalna może być skończona (o niewielkiej lub znacznej liczbie elementów) lub nieskończona. Populacja ma rozkład wyznaczony poprzez dystrybuantę F(x) jeżeli cecha X tej populacji ma rozkład o dystrybuancie F(x). Dystrybuanta ta nazywana jest dystrybuantą (rozkładem) teoretycznym.
Przykład: średni wzrost sportowców Pan A Pani B Pan C Pan D Pan E 9 cm 65 cm 83 cm 70 cm 75 cm x x x 3 x 4 x 5 Statystyczny sportowiec X Kolumna Średnia 77 Błąd stand 4,785394446 Mediana 75 Odchylenie 0,7004678 Wariancja 4,5 Kurtoza -0,840507 Skośność 0,540093 Zakres 7 Minimum 65 Maksimum 9 Suma 885 Licznik 5 Wartości zaobserwowane: x, x, x 3, x 4 oraz x 5 to realizacje tej samej zmiennej: X statystyczny sportowiec
X statystyczny wzrost sportowca X X X 3 X 4 X 5 Realizacje x x x 3 x 4 x 5 Pan A Pani B Pan C Pan D Pan E 9 cm 65 cm 83 cm 70 cm 75 cm
Próba prosta: Zakładamy, że poszczególne elementy próby wybrane są w sposób niezależny. Taka próba nazywana jest próbą prostą. X ~ ( X, X,..., X n ) ( x, x,..., x n ) Realizacje zmiennych losowych Każda ze zmiennych losowych X,X,...,X n ma taki sam rozkład prawdopodobieństwa jak X (badana cecha)
Średnia z próby średnia z populacji Populacja: badana cecha X (wartość średnia) Próba: obserwowana wartość x (średnia z próby) X = n n X x= i n n i= i= x i Średnia w populacji jest zmienną losową Średnia z próby jest liczbą (realizacją X)
Statystyka (w węższym sensie): dowolna funkcja n zmiennych losowych. Statystyki są zatem zmiennymi losowymi i jako takie posiadają rozkłady prawdopodobieństwa: dokładne lub przybliżone.
Parametry charakteryzujące próbkę Cechy statystyczne mierzalne niemierzalne ciągłe skokowe Geograficzne, Inne (płeć itp.)
Operacje na obserwacjach:. Porządkowanie: Zbiór obserwacji x j x... x x,...,, x x porządkujemy zazwyczaj rosnąco: n x, x,..., x jest j j n. Dla uproszczenia zakładamy, że n uporządkowana.
. Szereg rozdzielczy: Zbiorowość statystyczna podzielona na części (klasy) według określonej cechy jakościowej lub ilościowej z podaniem liczebności każdej z nich. Np. szereg rozdzielczy liczby usterek: Numer klasy Liczba usterek Liczba wyrobów Wskaźnik struktury i x i n i ω i 3 4 5 0 3 4 30 8 6 4 0,60 0,6 0, 0,08 0,04 Szeregi budowane dla badanych cech z nielicznymi obserwacjami są zazwyczaj szeregami punktowymi (jak w przykładzie powyższym).
Dla innych (z licznymi wartościami lub dla cech ciągłych) zazwyczaj są to szeregi rozdzielcze z przedziałami klasowymi: Np. szereg obserwacji temperatury w styczniu roku 000: Numer klasy temperatura Liczba dni i x i n i 3 4 5 poniżej -5 od 5 do 0 od 0 do +5 od +5 do +0 powyżej +0 8 30 6 4
. Dystrybuanta empiryczna: Def. Dystrybuantą empiryczną S n (x) nazywamy wyrażenie: jeśli S x < 0 dla x x k dla x < x k n dla x> xn ( x) = x n k+, k =,,..., n < x <... x (oznacza to, że żadna z wartości obserwowanych n nie powtórzyła się).
Dla szeregów klasowych dystrybuanta empiryczna wyznaczana jest przez częstości skumulowane: Numer klasy Liczba usterek Liczba wyrobów Wskaźnik Częstość struktury skumulowana i x i n i ω i ω isk 3 4 5 0 3 4 30 8 6 4 0,60 0,6 0, 0,08 0,04 0,60 0,76 0,88 0,96,00 Sposoby ustalania ilości klas: a) k n, b) k + 3,3 log n.
Prezentacja graficzna ) Histogram rozkład liczby usterek ilość obserwacji 35 30 5 0 5 0 5 0 3 4 5 liczba usterek
) Diagram diagram liczby usterek liczba obserwacji 35 30 5 0 5 0 5 0 3 4 5 liczba usterek
) Np. wykres kołowy: klasy usterek % 6% 8% 4% 60% 3 4 5