Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja

Podstawowe ozaczeia i wzory stosowae a wykładzie i laboratorium Część I: estymacja 1 Ozaczeia Zmiee losowe (cechy) ozaczamy a wykładzie dużymi literami z końca alfabetu. Próby proste odpowiadającymi im literami pogrubioymi. Jesli X jest cechą, to X = (X 1, X,.., X ) T jest próbą prostą rozmiaru. 1.1 Podstawowe statystki Szereg statystyk pozycyjych (ragowych) X (1), X (),.., X () to szereg uporzadkowaych (od ajmiejszej do ajwiekszej) wartości obserwacji w próbie. Średia arytmetycza: Wariacja empirycza: X = 1 X i S = 1 (X i X) = 1 Wariacja probkowa S 0 = 1 1 Xi ( X) = X X (X i X) Empirycze odchyleie stadardowe : S = S Próbkowe odchyleie stadardowe : S = S 0 Momet zwykły rzędu Momet cetraly rzędu A = 1 X i

m = 1 (X i X) Estymacja przedzialowa - podstawowe wzory We wszystkich omawiaych w tym rozdziale przypadkach wspołczyik ufości jest rówy (co ajmiej) q..1 Przedziały ufości dla wartości oczekiwaej Cecha X ma iezaą wartośc oczekiwaą m. Przypadek I. Cecha ma rozklad ormaly N(m, σ ) i wariacja σ jest zaa. [ X σu β, X + σu β zas u β jest kwatylem rzedu β z rozkladu ormalego N(0,1) Przypadek II. Cecha ma rozklad ormaly N(m, σ ) ale wariacja σ jest iezaa. [ X S t β S t, X + β 1 1 zas t β jest kwatylem rzedu β z rozkladu Studeta o 1 stopiach swobody. Przypadek III. Cecha ma rozkład iezay lub iy iż ormaly. Dla kostrukcji przedziału ufości w tym przypadku musimy mieć próbę dużego rozmiaru. Zwykle zakłada się, że > 30. [ X S u β S u, X + β 1 1 zas u β jest kwatylem rzedu β z rozkladu ormalego N(0,1) UWAGA Jeśli za oszacowaie puktowe wartości oczekiwaej cechy X przyjmiemy wartość średiej z próby ( X), to błędem stadardowym tego oszacowaia azywamy wartość statystyki S X = ˆσ

gdzie ˆσ jest oszacowaiem odchyleia stadardowego badaej cechy X. Jeśli atura stochastycza cechy (jej rozkład :) jest iezaa lub jesli jest to cecha o rozkładzie zbliżoym do ormalego, to możemy przyjąć w powyższym wzorze ˆσ = 0. W różych szczególych przypadkach moża użyć lepszego estymatora odchyleia stadardowego. Np. jesli cecha X ma rozkład wykładiczy, to lepsze oszacowaie tego odchyleia otrzymamy przyjmując ˆσ = X. Podobie w przypadku rozkładu Poissoa lepiej przyjąć ˆσ = X... Dlaczego?. Przedział ufości dla wskaźika struktury Daa jest próba z rozkładu zero-jede, tj. obserwowaa cecha X ma rozkład: P (X = 1) = p = 1 P (X = 0) Niech N ozacza sumę wartości zaobserwowaych w próbie rozmiaru. Zatem - iaczej - N jest liczba jedyek w próbie. Wspolczyik ufości wyosi q. Wartość prawdopodobiestwa p w wielu zastosowaich (p. w ekoomii czy demografii) azywamy wskazikiem struktury p dla elemetow populacji o zadaej wlasości. W iych zastosowaiach azywamy go frakcją (elemetow populacji o zadaej wlasości), tak jest p. problemach kotroli jakości produkcji. Przedziałem ufości dla p jest: [B β1 (N, N + 1), B β (N + 1, N) gdzie B β ( 1, ) ozacza kwatyl rzędu β z rozkładu Beta z parametrami 1 i. Rzędy β 1 oraz β kwatyli pojawiających sie w przedziale ufości są, odpowiedio, rówe (1 q)/ oraz (1 + q)/. Poday wzór jest modyfikoway gdy N = 0 oraz gdy N =. Jeżeli N = 0, to lewy koiec przedziału ufości jest rówy 0, a jeżeli N =, to prawy koiec przedziału ufości jest rówy 1. Kwatyle rozkładu Beta zajdujemy z wykorzystaiem pakietów komputerowych takich jak Excel,Maple czy Mathematica. Powyzszy dokłady przedział został wyprowadzoy przez Jerzego Spławę - Neymaa, twórcę idei przedziałów ufości. W przypadku proby dużego rozmiaru wielu autorów zaleca stosowaie astepujacego przybliżoego (asymptotyczego) i prostszego(?) przedziału ufości (którego idea pochodzi od Walda): [ˆp u β, ˆp + u β gdzie ˆp = N, β = 1+q zas u β jest kwatylem rzedu β z rozkladu ormalego N(0,1). Różi autorzy różie okreslają waruki zapewiające, że próba jest wystarczająco duża. Zajdziemy wśród ich astępujące: 0 3

gdzie 0 jest rówe wg. jedych 50, wg. iych 100 (od czego to de facto zależy?). Iy waruek jest fromułoway w postaci p c, (1 p) c gdzie zowu u jedych autorów c jest rówe 5 a u iych p. 50. Wszystkie te zaleceia mają a celu zapewieie wystarczająco dobrego przybliżeia rozkładu statystyki ˆp p / rozkładem ormalym stadaryzowaym N(0, 1) Podawae są rówież ieco dokładiejsze ale bardziej skomplikowae i adal tylko asymptotyczie poprawe przedziały ufości wyprowadzae w oparciu o asymtotyczą ormalość rozkładu statystyki ˆp p p(1 p)/ W dobie komputerów wydaje się, że wszysytkie te upraszczające pomysły są zbytecze, gdyż wyzaczeie przedziału Neymaa ie astręcza teraz takich kłopotów jak w czasach Walda. UWAGA Wartość statystyki Sˆp = praktycy azywają często błędem stadardowym oszacowaia wskaźika stryktury.3 Przedział ufości dla wariacji Estymujemy wariację rozkładu cechy. Przypadek: cecha ma rozklad ormaly [ S χ, S χ 1 gdzie χ 1 jest kwatylem rzedu (1 q)/ z rozkladu χ o 1 stopiach swobody, zas χ jest kwatylem rzedu (1 + q)/ z tego samego rozkladu. 3 Aaliza korelacji - estymacja Kowariacja empirycza C X,Y = (X i X)(Y i Ȳ ) 4

Współczyik korelacji Pearsoa Dla prób dotyczacych badaia zwiazkow dwoch cech X i Y C X,Y r xy = S X S Y gdzie S X, S Y są empiryczymi odchyleiami stadardowymi dla próby z cechy X i Y, odpowiedio. Współczyik korelacji cześciowej pomiedzy cechami X 1 i X przy elimiacji wpływu cech X 3,..., X r 1.3... = R 1 R11 R gdzie R ij są dopełieiami algebraiczymi wyzaczika r 1 r 1... r 1 R = r 1 r r... r 1 r r Współczyik korelacji wielorakiej pomiędzy cechą X 1 X,..., X r1(3...) = a cechami 1 R R 11 5