Estymacja parametrów populacji
Estymacja parametrów populacji Estymacja polega a szacowaiu wartości parametrów rozkładu lub postaci samego rozkładu zmieej losowej, a podstawie próby statystyczej.
Estymacje moża podzielić a: estymację puktową - wyzaczaie a podstawie próby statystyczej kokretych wartości parametrów dla całej zbiorowości geeralej (mogą to być takie parametry jak wartość oczekiwaa, mediaa, czy odchyleie stadardowe), estymację przedziałową polegającą a kostruowaiu przedziału liczbowego, który z ustaloym z góry, wysokim prawdopodobieństwem pokrywa iezaą wartość szacowaego parametru. Przedział taki azywa się przedziałem ufości, a prawdopodobieństwo, z jakim pokrywa o szacoway parametr - współczyikiem ufości.
Przedział ufości Graice przedziału ufości są losowe, a więc dla kokretych prób będziemy uzyskiwać róże wartości. Uzyskay kokrety przedział będziemy iterpretować astępująco: w 1- procetach przypadków przedział (a, b) pokrywa iezaą wartość parametru. Ozacza to jedocześie, że średio w procetach przypadków wyzaczoy przedział ie pokrywa szacowaego parametru. 4
Przedział ufości (c.d.) Dokładość estymacji parametru określa rozpiętość przedziału ufości będąca różicą między jego górą i dolą graicą: d = b - a. Rozpiętość przedziału ufości zależy między iymi od przyjętego poziomu ufości 1-: im to prawdopodobieństwo jest bliższe jedości, tym rozpiętość przedziału jest większa (a precyzja ocey miejsza). W zastosowaiach praktyczych ajczęściej stosujemy poziomy ufości rzędu 0.90, 0.95 czy 0.99 ( odpowiedio 0.10, 0.05 czy 0.01) 5
Przedział ufości dla wartości oczekiwaej zae odchyleie stadardowe Jeśli zamy odchyleie stadardowe zbiorowości, to wartość szacowaej średiej, z prawdopodobieństwem rówym 1-α, zajduje się w przedziale daym wzorem: P x u m x u 1 x u m gdzie: -średia arytmetycza, -wartość odczytaa z tablicy rozkładu t-studeta dla liczby stopi swobody r=, - odchyleie stadardowe, - liczebość próby, - wartość oczekiwaa.
Przykład Zakładając, że cey jedostkowe lokali mieszkalych z daego przykładu w miejscowości A w pierwszym kwartale 017 r. mają rozkład zbliżoy do rozkładu ormalego N(3460,41) oraz, że zae jest odchyleie stadardowe zbiorowości 41, oszacować przedział ufości dla iezaej wartości średiej zbiorowości. Przyjmijmy współczyik ufości 1-α = 0,95 Rozwiązaie Podstawiając powyższe dae do daego wzoru oraz odczytując z tablicy zmieej losowej t-studeta wartość krytyczą, dla liczby stopi swobody r= (albowiem odchyleie stadardowe zbiorowości jest zae) i α = 0,05 otrzymujemy: 41 41 P3460 1,96 m 3460 1,96 30 30 0,95 3373,76 m 3546,4 0, 95 Ozacza to, że przedział liczbowy prawdopodobieństwem 1-α = 0,95 pokrywa iezaą wartość m. P z
Przedział ufości dla wartości oczekiwaej odchyleie stadardowe ie jest zae Jeżeli odchyleie stadardowe zbiorowości ie jest zae, to przedział ufości dla wartości oczekiwaej m ależy skostruować w oparciu o rozkład t-studeta: P x t ; r s m x t ; r s 1 gdzie: r = -1 stopi swobody, s - odchyleie stadardowe.
Przykład Zakładając, że cey jedostkowe lokali mieszkalych z daego przykładu w miejscowości A w pierwszym kwartale 017 r. mają rozkład zbliżoy do rozkładu ormalego N(3460,41), oszacować przedział ufości dla iezaej wartości średiej. Przyjmijmy współczyik ufości 1-α = 0,95 Rozwiązaie Podstawiając powyższe dae do wzoru oraz odczytując z tablicy zmieej losowej t-studeta wartość, dla liczby stopi swobody r = -1=9 i α = 0,05 otrzymujemy: 41 41 P3460,045 m 3460,045 30 30 0,95 P 3370,0 m 3549,98 0, 95 Moża zatem stwierdzić, że z prawdopodobieństwem 95% średia cea jedostkowa lokali mieszkalych w miejscowości A zawiera się w przedziale liczbowym o końcach 3370 zł/m i 3550 zł/m.
Jeżeli liczba obserwacji dąży do ieskończoości, to różica między wyżej podaymi przedziałami jest bardzo mała. Dzieje się tak dlatego, że rozkład t-studeta jest zbieży do rozkładu ormalego. Występuje to wtedy, gdy liczba stopi swobody (-1) wzrasta ieograiczeie. Począwszy od =30 różicę między tymi przedziałami moża praktyczie zaiedbać.
Przedział ufości dla wariacji w populacji ormalej X ~ N( m, ) Niech zmiea losowa oraz iech x i (i = 1,,..., ) ozacza -elemetową próbę losową. Statystyka s ma rozkład z liczbą stopi swobody v = - 1. Dla ustaloego moża określić takie dwie wartości i, dla których spełioe są rówości:,1 1,1 P( ) P, 1 1, 1 ( ) 1 11
Przedział ufości dla wariacji w populacji ormalej (c.d.) Z obu wzorów wyika, że P( ) 1, 1, 1 1 Po odpowiedich przekształceiach otrzymujemy przedział ufości dla wariacji: s s P(, 1 1, 1 ) 1 1
Przedział ufości dla odchyleia stadardowego w populacji ormalej. Pierwiastkując krańce przedziału ufości dla wariacji otrzymujemy poszukiway przedział dla odchyleia stadardowego: s s P(, 1 1, 1 ) 1 13
Przedział ufości dla odchyleia stadardowego w populacji ormalej dla dużej próby P S S S z S z 1 Gdzie: z - wartość odczytaa z tablicy dystrybuaty rozkładu ormalego N(0,1) w taki sposób, aby przy daym współczyiku ufości 1-α spełioa była rówość P z Z z 1
Przedział ufości dla prawdopodobieństwa w populacji ormalej P m m m m m 1 1 m z p z 1 Gdzie: m - liczba jedostek w próbie mających wyróżioą cechę, - liczebość próby, m W - wskaźik struktury w próbie, który jest estymatorem prawdopodobieństwa p w populacji geeralej z - wartość odczytaa z tablicy dystrybuaty rozkładu ormalego N(0,1) w taki sposób, aby przy daym współczyiku ufości 1-α spełioa była rówość P z Z z 1
Uzasadieie wielkości próby d u d s t 0 1 0 ) ( 1 1 i x i x s gdzie: (wariacja jest zaa) (wariacja jest iezaa)
u d pq Zbiorowość geerala ma rozkład dwupuktowy z parametrem p (p jest frakcją jedyek lub elemetów wyróżioych w zbiorowości.) Jeżeli ie zamy rzędu wielkości szacowaego wskaźika struktury p, to przyjmując za iloczy pq jego ajwiększą wartość ¼, otrzymujemy poiższy wzór: gdzie: u 4d d - dopuszczaly, ustaloy z góry maksymaly błąd szacuku wartości m.
WERYFIKACJA HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczą rozumie się dowole przypuszczeie a temat wartości parametrów lub postaci fukcyjej zbiorowości geeralej. Z hipotezą parametryczą mamy do czyieia gdy przypuszczeie to dotyczy wartości parametrów rozkładu, atomiast pozostałe hipotezy azywae są hipotezami ieparametryczymi. W testach istotości hipotezę H 0 formułuje się jako hipotezę o rówości atomiast hipotezę alteratywą H 1 jako hipotezę o różości, większości lub miejszości.
Q - parametr zbiorowości geeralej oszacoway a podstawie próby, Q 0 porówywaa z im wartość hipotetycza. H 0 : Q = Q 0 H 1 : Q Q 0 H 1 : Q > Q 0 H 1 : Q < Q 0 H 0 : Q = Q 0 H 1 : Q Q 0 H 0 : Q Q 0 H 1 : Q > Q 0 H 0 : Q Q 0 H 1 : Q < Q 0
Hipoteza zerowa Prawdziwa Fałszywa Decyzja Przyjąć Odrzucić Decyzja prawidłowa Błąd I. rodzaju Błąd II. rodzaju Decyzja prawidłowa
Ozaczmy przez D pewą charakterystykę, która jest miarą odchyleia między rozkładem z próby a rozkładem hipotetyczym. Miara ta azywa się zwykle sprawdziaem hipotezy i określa się ją jako fukcję wyików próby, a podstawie której podejmuje się decyzję przyjęcia lub odrzuceia hipotezy zerowej.
Obszarem krytyczym, zwaym iaczej obszarem odrzuceń lub zbiorem krytyczym azywamy podzbiór przestrzei prób, który ma tę własość, że jeżeli wartość charakterystyki D zostaie zakwalifikowaa do iego, to wtedy hipotezę zerową ależy odrzucić.
Obszar krytyczy zbudoway z dwóch rozłączych przestrzei prób w rozkładzie charakterystyki osi azwę obszaru krytyczego testu dwustroego. Obszar krytyczy testu w zależości od hipotezy alteratywej może być jedostroy, lewo- lub prawostroy. Test jest dwustroy w zależości od tego, czy odrzuca się hipotezę zerową dla wartości charakterystyki testu, która przypada a dwa przedziały lub tez a jede przedział rozkładu z próby.
Wprowadzeie podziału testów a jedostroy i dwustroy ma swoje uzasadieie w przypadku odczytywaia z tablic statystyczych wartości krytyczych D α. Jeżeli, a przykład, sprawdzamy hipotezę stosując test jedostroy, a tablice statystycze zbudowae dla testu dwustroego, to wtedy D α odczytujemy ie dla poziomu istotości α, ale dla podwojoego poziomu istotości, tz. dla α.
A f(d) D k = (-, D d ) (D g, +) D d E(D) D g D
f(d) B D k = (D g, +) E(D) D g D
f(d) C D k = (-, D d ) D d E(D) D
Weryfikacja hipotez dotyczących wartości oczekiwaej Zmiea X w zbiorowości geeralej ma rozkład N(m,) lub zbliżoy do ormalego i wartość m jest iezaa: H 0 : m=m 0 H 1 : mm 0 H 1 : m>m 0 H 1 : m<m 0 1) - zae ) - iezae, >30 3) - iezae, 30 u u x m 0 u : N (0;1) x m0 u N(0;1) s Statystyka t ma rozkład Studeta z -1stopiami swobody t x m0 1 s
Przyjmijmy, że zbiorowość geerala ma rozkład ormaly N(m,σ ) o iezaej wartości średiej. Ze zbiorowości tej wylosowao -elemetową próbę statystyczą w celu zweryfikowaia hipotezy H 0, że wartość oczekiwaa z próby rówa jest wartości oczekiwaej zbiorowości. W tym przypadku hipoteza alteratywa H 1 mówi o istotej różicy pomiędzy tymi wartościami. H 0 : m = m 0 H 1 : m m 0 Wartość statystyki testującej obliczamy a podstawie wzoru: x m 0 gdzie: - średia arytmetycza - wartość oczekiwaa _ x 0 u m s
Jeśli zae jest odchyleie stadardowe: u x m 0 x m 0 gdzie: - średia arytmetycza - wartość oczekiwaa
Procedura podejmowaia decyzji dotyczących przyjęcia lub odrzuceia H 0 przebiega astępująco: a) w przypadku testu dwustroego (H 1 : m m 0 ) t t ; jeśli wartość obliczoa t spełia ierówość - ależy odrzucić H 0 a r korzyść H 1, jeśli atomiast: t t ; r - ie ma podstaw do odrzuceia H 0. b) w przypadku testu jedostroego (H 1 : m < m 0 lub H 1 : m > m 0 ) t t ; jeśli wartość obliczoa t spełia ierówość - ależy odrzucić r H 0 a korzyść H 1, jeśli atomiast: t - ie ma podstaw do odrzuceia H 0. t ; r
W przypadku, gdy odchyleie stadardowe ie jest zae, ależy posłużyć się odchyleiem stadardowym z próby. Wartość sprawdziau hipotezy obliczamy wykorzystując astępujący wzór: t x m s 0. 1 Graicę obszaru krytyczego dla zadaego poziomu istotości α odczytujemy z tablicy rozkładu t-studeta dla r =-1 stopi swobody. W przypadku testu dwustroego (H 1 : m m 0 ) obszar krytyczy ma postać: D k t ] [ t ; ;
W przypadku testów jedostroych (H 1 : m < m 0 lub H 1 : m > m 0 ) mamy atomiast: D k ( ; t ] lub D k [ t ; ) Jeżeli obliczoa wartość t zajdzie się w obszarze krytyczym, to wtedy H 0 ależy odrzucić a korzyść hipotezy alteratywej H 1. W przeciwym razie ie ma podstaw do jej odrzuceia. Hipoteza zerowa może rówież przyjąć postać H 0 : m m 0 lub H 0 : m m 0. W pierwszym przypadku hipoteza H 1 : m > m 0 a w drugim: H 1 : m < m 0. Taki zapis jedozaczie określa sposób wyzaczeia obszaru krytyczego.
Przykład Na podstawie badań ryku ieruchomości przeprowadzoych w pierwszym kwartale zeszłego roku obliczoo, że średia cea lokali mieszkalych w miejscowości B wyosi 3500 zł/m. W drugim kwartale zeszłego roku specjalista w pewej firmie zajmującej się sprzedażą ieruchomości przeprowadził a 5 elemetowej próbie podobe badaie i stwierdził, że średia cea lokali mieszkalych wyiosła 3560 zł/m a odchyleie stadardowe 50 zł/m. Czy ozacza to, że cey ieruchomości wzrosły? Należy przyjąć poziom istotości α = 0,05.
Rozwiązaie Formułujemy hipotezy: H 0 : m = 3500 średia cea ieruchomości dalej wyosi 3500 zł/m H 1 : m > 3500 średia cea ieruchomość wzrosła Poieważ ie zamy odchyleia stadardowego zbiorowości posłużymy się wzorem: W przypadku testu jedostroego odczytujemy z tablicy rozkładu t-studeta, dla r = 5-1=4 stopi swobody i α = 0,1 wartość t 0,1;4 1,711. Poieważ - ie ma podstaw do odrzuceia H 0, mówiącej o rówości ce jedostkowych lokali mieszkalych w badaych okresach. Moża zatem stwierdzić z 95% pewością, że średia cea jedostkowa została a tym samym poziomie. t _ t t ; r x m s 0 1 3560 3500 50 4 60 51,0 1,18
WERYFIKACJA ISTOTNOŚCI RÓŻNICY MIĘDZY WARTOŚCIAMI OCZEKIWANYMI DWÓCH ZMIENNYCH LOSOWYCH Weryfikacji poddawaa jest ajczęściej hipoteza H 0 mówiąca, że ie ma istotej różicy między wartościami oczekiwaymi, wobec hipotezy alteratywej H 1 sugerującej istotą różicę między tymi wartościami. H 0 : m 1 = m H 1 : m 1 m Sprawdzia hipotezy zerowej w takiej sytuacji ma postać: t s p x 1 1 x 1 s p ( 1 1) s ( 1 1 1) ( ( 1) s 1)
Jeśli próby są rówe 1 = =, to: t x 1 s p x s p s 1 s Jeśli wartość obliczoa t spełia ierówość r, gdzie r = ( 1-1)+ ( -1) stopi swobody - ależy odrzucić H 0 a korzyść H 1, t t ; r t t ; Jeżeli atomiast: - przeto ie ma podstaw do odrzuceia H 0.
Przykład Przykład te dotyczy losowego zbioru ce jedostkowych sprzedaych lokali mieszkalych o liczebości = 8, a którym przeprowadzoo pomiar cechy X. W tym przypadku rozważamy zbiór wartości z dwóch okresów badań. Na podstawie daych przedstawioych w daej tablicy określić, czy różice miedzy wartościami średich moża uzać za ieistote. Sformułowaą hipotezę ależy zweryfikować a poziomie istotości =0,05. WARTOŚCI OBLICZONYCH CHARAKTERYSTYK x 1 x x 387,5 3575 s 81093,8 146875 s 84,8 383, Źródło: Obliczeia włase.
Rozwiązaie Formułujemy hipotezę zerową (H 0 ), mówiącą, że ie ma istotej różicy między średimi ceami dla dwóch badaych okresów, wobec hipotezy alteratywej (H 1 ), mówiącej o istotej różicy między tymi średimi. H 0 : m 1 = m H 1 : m 1 m Poieważ wielkości prób są sobie rówe ( = 8), stosuje się wzory: s p s 1 s 337,6 t x 1 x s p 387,5 3575 337,6 4 1,703 Wartość t r jest realizacją zmieej losowej t-studeta o r = 1 + stopiach swobody. Dla =0,05 oraz r=14, odczytaa z tablicy rozkładu zmieej losowej t-studeta wartość krytycza t 0,05;14 =,145. Poieważ t < t 0,05;14 przeto ie ma podstaw do odrzuceia hipotezy zerowej, o istotej różicy między średimi ceami sprzedaży lokali mieszkalych dla obydwu badaych okresów.
Testowaie hipotezy o wariacji Niech cecha X ma w zbiorowości geeralej rozkład N(m,σ). Należy zweryfikować hipotezę H 0 :σ =σ 0 przeciwko H 1 :σ >σ 0. Taką hipotezę alteratywą przyjmuje się ajczęściej, gdyż zwykle sytuacja, gdy wariacja cechy w zbiorowości jest duża, jest iekorzysta. Jeśli m jest zae, to sprawdzia hipotezy H 0 ma postać: Przy założeiu prawdziwości H 0 statystyka ta ma rozkład χ o stopiach swobody. S S 1 X i m. i1
Jeśli m jest iezae, sprawdziaem H 0 hipotezy jest: 1 S Statystyka ta ma rozkład χ o -1 stopiach swobody. Z uwagi a postać H 1 relacja P(χ >χ α)=α wyzacza prawostroy zbiór krytyczy, gdzie χ α jest wartością krytyczą odczytaą z x1 tablic rozkładu χ dla odpowiediej liczby stopi swobody i P=α. Jeśli dla daej próby losowej relacja wyzaczająca zbiór krytyczy jest spełioa, to H 0 ależy odrzucić a korzyść H 1.
postaci: Jeśli >30, sprawdzia hipotezy przyjmuje jedą z poiższych Jeśli m jest zae w zbiorowości geeralej, to S T 1 Jeśli m jest iezae, wówczas S T 3 Statystyka T ma rozkład zbliżoy do N(0,1), zatem dalsze postępowaie jest idetycze jak w opisaych wcześiej testach istotości wykorzystujących statystyki o rozkładzie N(0,1).
Testowaie hipotezy o dwóch wariacjach Badamy dwie zbiorowości o rozkładzie ormalym N(m 1,σ 1 ) i N(m,σ ). Należy zweryfikować hipotezę: H 0 : σ 1=σ przy H 1 : σ 1>σ. Z obydwu populacji losuje się próby proste o liczebości 1 i. Niech S (1) i S () ozaczają wariację S. Ze względu a postać hipotezy H 1 tak umerujemy zbiorowości, aby S (1)>S (). Sprawdziaem hipotezy jest statystyka: S(1) F. S Statystyka ta ma rozkład F-Sedecora o r 1 =( 1-1) i r =( -1) stopiach swobody. Relacja wyzaczająca prawostroy zbiór krytyczy jest postaci: P(F>F α )=α, Gdzie F α odczytujemy z tablic rozkładu F-Sedecora dla r 1 i r stopi swobody. ()
Testowaie hipotezy o wskaźiku struktury Niech populacja geerala ma rozkład dwupuktowy z parametrem p ozaczającym prawdopodobieństwo, że badaa cecha przyjmie wyróżioą wartość. Chcemy zweryfikować a podstawie -elemetowej próby (>100) hipotezę zerową H 0 :p=p 0 Hipoteza alteratywa może przyjmować jedą z astępujących postaci: H 1 :p p 0, H 1 :p<p 0 lub H 1 :p>p 0 Sprawdziaem hipotezy zerowej jest statystyka: X p0 T p0q0 która przy prawdziwości H 0 ma w przybliżeiu rozkład N(0,1), przy czym X ozacza ilość jedostek o wyróżioej wartości cechy w -elemetowej próbie.
Testowaie hipotezy o dwóch wskaźikach struktury Zakładamy, że badaa cecha ma w dwóch populacjach rozkład dwupuktowy z parametrami p 1 i p. Należy zweryfikować hipotezę H 0 :p 1 =p. Hipoteza alteratywa może mieć postać H 1 :p 1 p lub H 1 :p 1 <p, albo H 1 :p 1 >p. Z obu populacji losujemy próby proste o liczebości 1 i, przy czym obydwie próby muszą być duże, tz. 1 100 i 100. Sprawdziaem hipotezy zerowej jest statystyka: X 1 X 1 T pq gdzie: p X 1 1 X, q 1 p, 1 1. Statystyka ta, przy założeiu prawdziwości hipotezy H 0, ma rozkład zbliżoy do N(0,1).