Badania sondażowe. Estymacja parametrów Minimalna liczebność próby. Agnieszka Zięba



Podobne dokumenty
Estymacja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 7

Estymacja: Punktowa (ocena, błędy szacunku) Przedziałowa (przedział ufności)

Ćwiczenie 2 ESTYMACJA STATYSTYCZNA

3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej

Statystyka i Opracowanie Danych. W7. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

Projekt ze statystyki

X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste

Estymacja przedziałowa

ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA

Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.

Wykład 13: Zbieżność według rozkładu. Centralne twierdzenie graniczne.

Wykład 8: Zbieżność według rozkładu. Centralne twierdzenie graniczne.

Estymacja przedziałowa - przedziały ufności

1 Dwuwymiarowa zmienna losowa

Metody statystyczne w naukach biologicznych

Estymatory nieobciążone o minimalnej wariancji

Statystyka matematyczna. Wykład II. Estymacja punktowa

Przykłady 8.1 : zbieżności ciągów zmiennych losowych

Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja

STATYSTYKA MATEMATYCZNA

Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

Histogram: Dystrybuanta:

Modele tendencji rozwojowej STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 18 listopada 2017

Estymacja parametrów populacji

Estymacja przedziałowa:

Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2

2.1. Studium przypadku 1

Badania sondażowe. Schematy losowania. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa

Rachunek prawdopodobieństwa i statystyka Wnioskowanie statystyczne. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

Estymacja przedziałowa - przedziały ufności

Metrologia: miary dokładności. dr inż. Paweł Zalewski Akademia Morska w Szczecinie

Miary położenia (tendencji centralnej) to tzw. miary przeciętne charakteryzujące średni lub typowy poziom wartości cechy.

Porównanie dwu populacji

Statystyczny opis danych - parametry

ANALIZA DANYCH DYSKRETNYCH

Testowanie hipotez. H 1 : µ 15 lub H 1 : µ < 15 lub H 1 : µ > 15

1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o

θx θ 1, dla 0 < x < 1, 0, poza tym,

STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr inż Krzysztof Bryś

PRZEDZIAŁY UFNOŚCI. Niech θ - nieznany parametr rozkładu cechy X. Niech α będzie liczbą z przedziału (0, 1).

16 Przedziały ufności

Pobieranie prób i rozkład z próby

Statystyka matematyczna dla leśników

Plan wykładu. Analiza danych Wykład 1: Statystyka opisowa. Literatura. Podstawowe pojęcia

PODSTAWY BIOSTATYSTYKI ĆWICZENIA

STATYSTYKA OPISOWA WYKŁAD 1 i 2

Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

Statystyka opisowa. () Statystyka opisowa 24 maja / 8

Estymacja punktowa i przedziałowa

STATYSTYKA MATEMATYCZNA

KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

SIGMA KWADRAT LUBELSKI KONKURS STATYSTYCZNO- DEMOGRAFICZNY

Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)

Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w

MIANO ROZTWORU TITRANTA. Analiza statystyczna wyników oznaczeń

Modelowanie i Analiza Danych Przestrzennych

Charakterystyki liczbowe zmiennych losowych: wartość oczekiwana i wariancja

będą niezależnymi zmiennymi losowymi z rozkładu jednostajnego na przedziale ( 0,

0.1 ROZKŁADY WYBRANYCH STATYSTYK

Pojcie estymacji. Metody probabilistyczne i statystyka Wykład 9: Estymacja punktowa. Własnoci estymatorów. Rozkłady statystyk z próby.

STATYSTYKA I ANALIZA DANYCH

Statystyczna kontrola procesu karty kontrolne Shewharta.

Prawdopodobieństwo i statystyka r.

Lista 6. Estymacja punktowa

O nauczaniu oceny niepewności standardowej

są niezależnymi zmiennymi losowymi o jednakowym rozkładzie Poissona z wartością oczekiwaną λ równą 10. Obliczyć v = var( X

Statystyka i opracowanie danych W3: Wprowadzenie do statystycznej analizy danych Podstawy wnioskowania statystycznego. Estymacja i estymatory

1 Testy statystyczne. 2 Rodzaje testów

Statystyka. Katarzyna Chudy Laskowska

Analiza wyników symulacji i rzeczywistego pomiaru zmian napięcia ładowanego kondensatora

Opracowanie danych pomiarowych. dla studentów realizujących program Pracowni Fizycznej

1 Zmienne losowe. Własności dystrybuanty F (x) = P (X < x): F1. 0 F (x) 1 dla każdego x R, F2. lim F (x) = 0 oraz lim F (x) = 1,

PODSTAWY PROBABILISTYKI Z PRZYKŁADAMI ZASTOSOWAŃ W INFORMATYCE

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.

Ćwiczenie nr 14. Porównanie doświadczalnego rozkładu liczby zliczeń w zadanym przedziale czasu z rozkładem Poissona

3. Regresja liniowa Założenia dotyczące modelu regresji liniowej

COLLEGIUM MAZOVIA INNOWACYJNA SZKOŁA WYŻSZA WYDZIAŁ NAUK STOSOWANYCH. Kierunek: Finanse i rachunkowość. Robert Bąkowski Nr albumu: 9871

POLITECHNIKA OPOLSKA

Statystyka Wzory I. Analiza struktury

Liczebnośd (w tys.) n

n n X n = σ σ = n n n Ponieważ zmienna losowa standaryzowana ma rozkład normalny N(0, 1), więc

INFORMATYKA W CHEMII Dr Piotr Szczepański

ZDARZENIE ELEMENTARNE to możliwy wynik doświadczenia losowego. Wszystkie takie możliwe wyniki tworzą zbiór zdarzeń elementarnych.

Statystyka powtórzenie (I semestr) Rafał M. Frąk

WYKŁAD 1. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

Modele probabilistyczne zjawisk losowych

Podstawy opracowania wyników pomiarów z elementami analizy niepewności pomiarowych (w zakresie materiału przedstawionego na wykładzie organizacyjnym)

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

STATYSTYKA OPISOWA PODSTAWOWE WZORY

ZMIENNA LOSOWA I JEJ PARAMETRY -powtórzenie

Wadliwość rzeczywista złączy obwodowych w rurociągach

Wykład 11 ( ). Przedziały ufności dla średniej

Parametryczne Testy Istotności

Prawdopodobieństwo i statystyka r.

Miary rozproszenia. Miary położenia. Wariancja. Średnia. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.

Transkrypt:

Baaia soażowe Estymacja parametrów Miimala liczebość próby Agieszka Zięba Zakła Baań Marketigowyc Istytut Statystyki i Demografii Szkoła Główa Halowa

Estymacja parametrów

Cel baaia soażowego to określeie wartości wybrayc parametrów populacji geeralej Parametry ajczęściej szacowae: Śreia (p. śreie wyatki miesięcze firm w Polsce a telefoy komórkowe) Frakcja (p. osetek firm w Polsce mającyc zarejestrowae telefoy komórkowe) Wartość globala (p. liczba telefoów komórkowyc posiaayc przez firmy w Polsce) Meiaa (p. wielkość miesięczyc wyatków firm a telefoy komórkowe zieląca zbiorowość a wie rówe części) Wariacja (p. zróżicowaie wielkości miesięczyc wyatków firm a telefoy komórkowe) Współczyik korelacji Współczyik regresji liiowej (p. zależość mięzy liczbą telefoów komórkowyc w firmie a śreim miesięczym wyagrozeiem pracowika) 3

Estymacja parametrów Statystyka fukcja rzeczywista zbuowaa a wyikac z próby -elemetowej T Q - Estymator parametru wyliczay jest a postawie próby, jest to statystyka pozwalająca ustalić wartość szacowaego parametru, p. śreia: - Wartość szacowaego parametru w populacji T = X = µ i= X i CEL: ustalić wartość parametru Q obliczając T 4

Własości estymatorów T - Estymator parametru wyliczay a postawie próby powiie być:. zgoy (w miarę zwiększaia liczebości próby wariacja estymatora maleje) lim E( T ) Q = 0 oraz lim D ( T ) = 0. ieobciążoy (ie wykazuje teecji o oce zaiżoyc lub zawyżoyc) E( T ) = Q 3. ajefektywiejszy o ajmiejszej wariacji D ( T ) [ E( T )] = mi = E T 5

Błą systematyczy estymatora Obciążeie estymatora gy estymator wykazuje teecje o oce zaiżoyc lub zawyżoyc B = E( T ) Q Obciążeia zazwyczaj ie a się wyzaczyć poieważ w praktyce baań soażowyc ie zamy wartości rzeczywistej szacowaego parametru. 6

Błęy w baaiac ilościowyc ie a się ustalić wielkości błęu całkowitego! BŁĘDY W BADAIACH ILOŚCIOWYCH Losowe gy próba jest losowaa (kosekwecja ecyzji o losowaiu) ielosowe każy rozaj próby (czyik luzki) Błą losowy Błęy pokrycia Błęy treści Tylko poziom błęu losowego jesteśmy w staie określić liczbowo i porówywać! Struktury Wyboru Braku reakcji Zagubieia Orzuceie Zbiorowość Zbiorowość zefiiowaa baaa Pomiaru Aalizy Iterpretacji Prawa Wyik baaia 7

Błęy statystycze w baaiac ilościowyc Błęy statystycze (ie uwzglęiają błęów wyikającyc z czyika luzkiego, któryc ie a się oszacować liczbowo ozwiercielają tylko błą możliwy o opisaia za pomocą formuł statystyczyc) Losowe (efektywość) ielosowe (aalizy) tzw. systematycze (prawopoobieństwo wystąpieia błęu jest fukcją malejącą liczebości próby ) (pomiary wykoae w tyc samyc warukac wykazują błą o stałej wartości) Wariacja estymatora (samplig errors błą próby) - Tecika losowaia (estymator i jego wariacja) - Liczebość próby Obciążeie estymatora (bias obciążeie estymatora) - Dobór estymatora precyzja trafość 8

iska precyzja jest wyikiem błęu losowego iska trafość jest wyikiem błęu systematyczego Wysoka precyzja i wysoka trafość iska precyzja, wysoka trafość Wysoka precyzja iska trafość 60 9

Całkowity błą ocey Błą śreiokwaratowy określa błą statystyczy pomiaru wyikający: ze zróżicowaia cecy w populacji z obciążeia estymatora MSE ( T ) = E( T Q) = D ( T ) + B Efektywość estymatora Obciążeie estymatora Jeśli posługujemy się estymatorem ieobciążoym całkowity błą z próby sprowaza się o wariacji estymatora. J.Steczkowski str. 89 0

Estymacja puktowa polega a uzaiu za wartość parametru ocey jego estymatora z próby losowej T o jakości estymatora mówi ocea zróżicowaia wartości jakie może przyjmować, czyli ocyleie staarowe estymatora tzw. śrei błą szacuku D( T ) którego przybliżeie jesteśmy w staie obliczyć i ozaczamy SE( T ) miarą jakości wioskowaia za pomocą wybraego estymatora jest tzw. błą wzglęy v = V ˆ ( T ) = SE( T T ) Te typ estymacji pozwala a ustaleie wartości estymatora i jego błęu

Staarowy błą szacuku Błęy losowe małe i uże Lepiej! Wyiki są miej zróżicowae Gorzej! Wyiki są barziej zróżicowae. Zakres rozrzutu jest miarą efektywości wioskowaia a postawie próby. Jest to tzw. staarowy błą szacuku (SE) reguły jego obliczaia są zae. 65

Staarowy błą szacuku SE( T ) Jest fukcją zróżicowaia w populacji (z populacji barziej jeoroej otrzymujemy próby ające miejsze błęy) Jest fukcją rozmiarów próby (uża próba aje błą miejszy iż mała próba) Jest fukcją teciki losowaia (oatkowa iformacja pozwala zastosować barziej efektywe teciki losowaia) 3

Estymacja puktowa Założeie: próba prosta (losową bez zwracaia) Jeśli estymator wartości przeciętej jest w postaci śreiej to jego błą szacuku wyraża się wzorem: SE ( X ) = S S jest ocyleiem staarowym baaego zjawiska w próbie Estymator wskaźika struktury w postaci frakcji: SE( p) = p( p ) p wskaźik struktury baaego zjawiska w próbie 4

Estymacja przeziałowa jest to kostrukcja przeziału liczbowego, który z określoym z góry prawopoobieństwem ( ) zawiera iezaą wartość szacowaego parametru Q P{ T Q } = Rozkłay okłae lub graicze iektóryc estymatorów T są am zae wyzaczae są z rozkłaów cecy lub a mocy twierzeń graiczyc. Te typ estymacji pozwala a ustaleie miimalej liczebości próby 5

Wiarygoość i okłaość szacuku CEL: ustalić wartość parametru Q a postawie T z opuszczalym prawopoobieństwem popełieia błęu - z określoą okłaością - DOKŁADOŚĆ (opuszczaly błą ocey) to ługość przeziału ufości P{ T Q } = P{ T Q T + } = WIARYGODOŚĆ (współczyik ufości) prawopoobieństwo pokrycia parametru przez przeział Zwiększaie wiarygoości powouje pogorszeie okłaości. Pogorszeie wiarygoości zwiększa okłaość oszacowaia. 6

Estymacja przeziałowa - próba prosta () Szacowaie wartości przeciętej m za pomocąśreiej: X Śreia: w próbie jest zgoym i ieobciążoym estymatorem wartości przeciętej w populacji. E ( X ) = m X = i= X i X ( E( X), D( X) ) Dla użej próby rozkła śreiej jest w przybliżeiu ormaly X i - wartość cecy la jeostki i P P P { X u D( X ) < m < X + u D( X )} = D( X ) = { X u SE( X ) < m < X + u SE( X )} = X σ E ( S ) = σ S S u < m < X + u = u - wartość oczytaa z tablic rozkłau (0,) S - wariacja cecy w próbie ieobciążoy estymator wariacji cecy w populacji 7

Estymacja przeziałowa - próba prosta () Szacowaie wskaźika struktury w za pomocą frakcji: Frakcja: w próbie jest zgoym i ieobciążoym estymatorem wskaźika struktury w w populacji. E ( p) = w Dla użej próby rozkła frakcji p jest w przybliżeiu ormaly ( E( p), D( p) ) D( p) = P p { p u D( p) < w < p + u D( p) } = P w( w) p = i= pi E( S ) = E pi = [ p( p) ] = w( w) -jeżeli jeostka posiaa wyróżioa cecę -jeżeli jeostka ie posiaa wyróżioej cecę { p u SE( p) < w < p + u SE( p) } = = 0 p( p) p( p) P p u < w < p + u = p i u - wartość oczytaa z tablic rozkłau (0,) p(-p) - wariacja cecy w próbie ieobciążoy estymator wariacji cecy w populacji 8

Estymacja puktowa i przeziałowa Estymacja puktowa Pozwala a określeie wartości estymatora oraz jego śreiego błęu Estymacja przeziałowa Pozwala a określeie przeziału w jakim zajuje się wartość parametru oraz precyzji tego oszacowaia 9

Dokłaość szacuku PRZYKŁAD PRZYKŁAD przeział ufości la wartości oczekiwaej Próba: 98 samocoów marki REAULT Cel baaia: przecięte zużycie paliwa a wyzaczoej trasie o ługości 00 km. Wyik baaia: x = 6,9 litra. Dotycczasowe oświaczeie: zużycie paliwa ma rozkła ormaly o ocyleiu staarowym =,8 litra Szacowaie wartości przeciętej za pomocą śreiej: P X σ σ u < m < X + u = = 0,05 = 0,95 P 6,9,96 P { 6,5 < m < 7,9} = 0,39,8 < m < 6,9 +,96 98 = 0,95,8 = 0,95 98 = 0, = 0,90 P 6,9,64 P { 6,57 < m < 7,3} = 0,33,8 < m < 6,9 +,64 98 = 0,90,8 = 0,90 98 0

Miimala liczebość próby

Szacowaie miimalej liczebości próby PROBLEM: Wyzaczyć miimalą liczebość próby tak, aby przy założoym współczyiku ufości ( ), poziom okłaości ie został przekroczoy. P{ T Q T + } = P X σ σ u < m < X + u = Ccemy, aby: = 0,95 = 0,39 σ = u = u σ Próba powia liczyć:,8 =,96 0,39 98

Baaie pilotażowe Służy mięzy iymi: oprecyzowaiu liczebości próby w baaiu reprezetacyjym (ocey poziomów i zakresu zmieości la ajważiejszyc zjawisk bęącyc przemiotem pomiaru) ustaleiu łatwości otarcia o poszczególyc grup respoetów Zasay ustalaia liczebości próby baaia pilotażowego: o baaia reprezetacyjego obór losowy ok. 5% przyszłej baaej próby przeważie jest to o 30 o 30 jeostek 3

Gy wariacja cecy jest zaa: = u σ Miimala wielkość próby próba prosta losowaie ze zwracaiem Szacowaie wartości przeciętej za pomocąśreiej: u - wartość oczytaa z tablic rozkłau ormalego (0,) la założoego Gy wariacja cecy ie jest zaa: 0 wielkość próby pilotażowej W przypaku gy baaie pilotażowe ie mogło być przeprowazoe: S = 0 0 i= ( x i x) S oszacowaie wariacji baaej cecy a postawie próby pilotażowej t - wartość oczytaa z tablic rozkłau t-stueta o 0 - stopiac swoboy Wariacja cecy w populacji może być przybliżoa wielkością: ( X max X S = 6 mi Wartości max i mi są określae ekspercko. ) = t S = u S 0 <50 0 >50 4

Miimala wielkość próby próba prosta losowaie ze zwracaiem Szacowaie wskaźika struktury za pomocą frakcji: Gy rzą wielkości szacowaej frakcji jest zay u = w( w) u - wartość oczytaa z tablic rozkłau ormalego (0,) la założoego Gy rzą wielkości szacowaej frakcji ie jest zay u = p( t p oszacowaie frakcji baaej cecy a postawie próby pilotażowej p) - wartość oczytaa z tablic rozkłau t-stueta o 0 - stopiac swoboy t = p( p) W przypaku gy baaie pilotażowe ie mogło być przeprowazoe: Wyzaczae jest p, w którym fukcja p(-p) przyjmuje maximum: p = 0,5 p( p) = 0,5 5

Miimala wielkość próby losowaie bez zwracaia Estymatory w losowaiu zależym (bez zwracaia) mają wariacje określoe iymi wzorami iż w losowaiu ze zwracaiem i wariacje te są miejsze. Korekta ze wzglęu a ie prawopoobieństwo wylosowaia jeostki o próby Szacowaie wartości przeciętej za pomocąśreiej: = u S = ( ) + u S Szacowaie wskaźika struktury za pomocą frakcji: = u p( p) = + u ( ) p( p) Liczebość próby wyliczaa z uwzglęieiem losowaia zależego jest zazwyczaj miejsza iż wyzaczaa z wzoru la próby prostej. Moyfikacja ta ie ma zasaiczego zaczeia przy użyc populacjac. 6

Miimala wielkość próby losowaie bez zwracaia - w warstwac Poprawia precyzję oszacowaia Wiąże się z tzw. alokacją jeostek mięzy warstwy: alokacja rówomiera alokacja proporcjoala alokacja eymaa (uwzglęia wariacje w warstwac) Alokacja proporcjoala Dla estymatora w postaci śreiej: Dla estymatora w postaci frakcji: = = l + u = = = l + u = l l S p ( p ) S p ( p ) oczekiwaa precyzja szacuku S przewiywae a postawie baaia pilotażowego ocyleie staarowe cecy w warstwie p przewiywae a postawie baaia pilotażowego wskaźik struktury w warstwie = - liczebość próby w warstwie 7

Miimala wielkość próby losowaie w warstwac, proporcjoale Populacja - = 5 000 sklepów ogólospożywczyc w mieście X Maksymaly błą szacuku = 3% Współczyik ufości Szacoway jest w - osetek sklepów reklamującyc swoje towary w prasie Warstwy: 5 wg poziomu sprzeaży za ubiegły rok Próba pilotażowa 0 = 5 sklepów 4 000 7 000 3 6 000 4 5 000 5 3 000 5 000 p = 0,95 p (- p ) = l = + l p ( p ) p ( p = 484 ) 0,05 90 77 u = 0, 630 36 0, 540 6 u =,96 = 0,3 050 97 0, 480 58 u p( p) 0,4 890 484 p = 0,4 = = 536 losowaie ze zwracaiem bez próby pilotażowej: u p( p = 0,5 = p) = 067 8

Miimala wielkość próby losowaie w warstwac, alokacja eymaa (uwzglęia zróżicowaie w warstwac) Populacja - = 5 000 sklepów ogólospożywczyc w mieście X Maksymaly błą szacuku = 3% Współczyik ufości Szacoway jest w - osetek sklepów reklamującyc swoje towary w prasie Warstwy: l=5 wg poziomu sprzeaży za ubiegły rok Próba pilotażowa 0 = 5 sklepów 3 4 5 4 000 7 000 6 000 5 000 3 000 5 000 = 0,95 p 0,05 0, 0, 0,3 0, 48 6 00 7 66 457 = u = l = u = =,96 + p l p ( p = p ( ) p ( p ) p ( ) p ) = 457 9

Miimala wielkość próby www.cem.pl / PORADIK / wielkość próby W kotekście jakiego oboru moża używać tego typu arzęzi? W kotekście jakiego typu cec moża używać tego typu arzęzi? 30

Dobór próby PROJEKT ZALICZEIOWY R Aaliza wyików a postawie baaia pilotażowego Ustaleie scematu losowaia Wyzaczeie miimalej liczebość próby Wykorzystaie SPSS Complex Samples jako arzęzia o losowaia próby 3