Statystyka i opracowanie danych W3: Wprowadzenie do statystycznej analizy danych Podstawy wnioskowania statystycznego. Estymacja i estymatory
|
|
- Stanisław Urban
- 8 lat temu
- Przeglądów:
Transkrypt
1 Statystyka i opracowaie daych W3: Wprowadzeie do statystyczej aalizy daych Podstawy wioskowaia statystyczego. Estymacja i estymatory Dr Aa ADRIAN Paw B5, pok407 ada@agh.edu.pl
2 Wprowadzeie Podstawowe cele aalizy zbiorów daych Opis ich struktury Odkrywaie i badaie zależości występujących pomiędzy daymi Narzędzia: metody statystyki matematyczej pakiety statystycze Statgraph, Statistica moduły statystycze w arkuszach kalkulacyjych, bazach daych
3 Temat: Wstępa aaliza daych
4 Na czym polega Wstępa aaliza daych: Ile daych: ile zmieych (cech: Płeć, wykształceie, staż, zarobki) ile przypadków (55) Jakie typy dae jakościowe (płeć, wykształceie) dae ilościowe (staż pracy, płaca) Ile braków, jakie, jak je zastąpić
5 Ocea struktury wykształceie pracowików
6 Jaka jest struktura wykształceia kobiet i mężczyz
7 Rozkład empiryczy zmieej ilościowej
8 Wykresy skategoryzowae; ramkowe
9 Wykresy skategoryzowae; ramkowe
10 Wykresy skategoryzowae; iterakcji
11 Statystyki opisowe
12 Badaia statystycze - rodzaje Badaia pełe obejmują wszystkie elemety populacji, p. a przeglądzie uzębieia daego pacjeta moża określić dokładą liczbę zębów i ich sta Badaia częściowe badaia elemetów próbki statystyczej, mają szerokie zastosowaia i są: koiecze w przypadku populacji ieskończoej, stosowae w populacjach skończoych bardzo liczych stosowae w przypadkach badań iszczących
13 Populacja i próba statystycza Populacja jest to zbiór wszystkich elemetów reprezetujących aalizoway problem (zjawisko) Może być zbiorem skończoym, przeliczalym lub ieprzeliczalym. Próba statystycza to podzbiór właściwy elemetów z badaej populacji
14 Badaia statystycze próby losowe Losowy dobór próby polega a tym, że o fakcie zalezieia się poszczególych elemetów populacji w próbie decyduje przypadek. Jest to taki sposób wyboru przy którym spełioe są astępujące dwa waruki; każda jedostka populacji ma dodatie, zae prawdopodobieństwo zalezieia się w próbie istieje możliwość ustaleia prawdopodobieństwa zalezieia się w próbie dla każdego zespołu elemetów populacji
15 Wybór próby reprezetatywej Od próby wymaga się reprezetatywości, czyli aby z przyjętą dokładością opisywała strukturę badaej populacji. O reprezetatywości decydują dwa czyiki: Liczebość () Sposób doboru grupy Wybór celowy, o przyależości do grupy decyduje badacz, stopień reprezetatywości zależy wyłączie od jakości selekcji Wybór losowy- każdy elemet populacji ma jedakową szasę zalezieia się w próbie z takim samym prawdopodobieństwem, stopień reprezetatywości rośie wraz ze wzrostem liczebości grupy. Stosowae są dwie techiki losowaia: Losowaie iezależe (zwrote) Losowaie zależe (bezzwrote
16 O błędach w badaiach statystyczych Badaia, zarówo pełe jak i częściowe, zawsze obciążoe są błędami, związaymi z: orgaizacją eksperymetu, iedokładością pomiarową, przetwarzaiem wyików, w badaiach częściowych z iedokładością odwzorowaia struktury populacji w strukturę próbki
17 Cechy statystycze i ich rodzaje Cechy, którymi wyróżiają się jedostki wchodzące w skład zbiorowości, azywa się cechami statystyczymi. Każda zbiorowość statystycza ma dużo cech, wyboru cech dokouje się a podstawie zakładaego celu badań. Należy wybierać takie cechy, które staowią istotą własość badaego zjawiska Typy cech cechy jakościowe iemierzale (p. kolor, sprawyiesprawy, ale jakościowymi mogą być też liczby p. r piętra, ) cechy ilościowe mierzale to takie, które dadzą się wyrazić za pomocą jedostek miary w pewej skali ( p. wzrost [cm], waga [kg], udział[%]). Cecha mierzala jest: ciągła, może przyjmować każdą wartość z określoego, skończoego przedziału liczbowego (p.odległość, ciężar, temperatura) dyskreta, skokowa przyjmuje wartości ze zbioru skończoego lub przeliczalego (ilość wyrobów wadliwych, liczba zatrudioych w zawodzie).
18 Co to jest pomiar Pomiar jest procedurą przyporządkowywaia liczb różym wartościom zmieej według ustaloej zasady. W aukach empiryczych aalizowaie różych cech staje się użytecze wtedy gdy moża mierzyć ich asileie w różych obiektach. Typowym pomiarem jest pomiar długości ( odległości dwóch puktów), polega o a policzeiu ile odcików o zaej długości ( cm, m, cal) mieści się wzdłuż mierzoego przedmiotu (odcika) Jak mierzyć zmiee ieobserwowale p. talet, agresję (liczba wulgaryzmów wypowiedziaych w jedostce czasu?), kostruujemy wskaźiki
19 Skale pomiaru Najprostszym przykładem pomiaru jest klasyfikacja, czyli azywaie, dotyczy tylko zmieych jakościowych, gdy brae pod uwagę kategorie są rozłącze, poadto, gdy bierze się pod uwagę wszystkie możliwe kategorie daej zmieej, to podział jest wyczerpujący Pomiar w skali porządkowej (ragowej) ozacza uporządkowaie ze względu a asileie cechy. Tę skalę cechuje spójość ( jeśli x jest róży od y yo x<y lub x>y) i przechodiość (x<y i y<z to x<z) Przypisaie jakiemuś pomiarowi ragę ozacza określeie jego miejsca w ustaloym porządku. Ragi ozaczają porządek a ie różice pomiędzy kolejymi pomiarami
20 Skale pomiaru według Staley Smith Steves Skala omiala dotyczy cech jakościowych, operacją pomiarową jest idetyfikacja kategorii do której ależy zaliczyć wyik, prowadzi do podziału zbioru a zbiory rozłącze ( p. samochody wg kolorów). Skala porządkowa stosowaa jest do badaia cech których atężeie jest określae przez przymiotiki, pociąga za sobą porządkowaie lub uszeregowaie badaej zmieej ( p. poiżej ormy, w ormie, powyżej ormy, albo za mały, mały, średi, duży, za duży) Skala rówomiera (przedziałowa)-stosowaia do pomiaru cech ilościowych, zakłada że zbiór wartości cechy składa się z liczb rzeczywistych określoa przez wskazaie stałej jedostki miary i relacji przyporządkowującej liczbę każdemu wyikowi obserwacji (czas kaledarzowy, temperatura o C) Skala ilorazowa- posiada wszystkie właściwości skali przedziałowej ale pomiary wg tej skali charakteryzują się stałymi stosukami i bezwzględym zerem, ma zastosowaie w fizyce, techice p.. czas jaki upłyął od chwili t do t
21 Opracowaie materiału statystyczego Szeregi statystycze Celem tych działań jest przejście od daych idywidualych do daych zbiorowych. Materiał źródłowy ależy odpowiedio posegregować i policzyć, w wyiku otrzymuje się tzw. tablice robocze. Klasyfikacja daych musi być przeprowadzoa: w sposób rozłączy, jedostki o określoych cechach muszą być jedozaczie przydzieloe do poszczególych klas W sposób zupeły, tz. klasy muszą objąć wszystkie występujące cechy daej zbiorowość Techika zestawiaia zależy od rodzaju skali pomiarowej
22 Szeregi statystycze szczegółowe rozdzielcze czasowe Z cechą ilościową Z cechą jakościową puktowe przedziałowe proste skumulowae proste skumulowae
23 Szereg rozdzielczy Przy budowie szeregu rozdzielczego wyróżia się trzy etapy: Ustaleie liczby klas oraz wielkości przedziałów klasowych Przyporządkowaie daych przyjętym przedziałom klasowym Zliczaie liczby jedostek w każdej klasie Liczba klas k zależy przede wszystkim od liczby obserwacji Stosowae bywają astępujące wzory pomoce do szacowaia liczby przedziałów budowaego szeregu rozdzielczego: k=+3,3 log lub k =
24 Numer klasy Szereg rozdzielczy prosty aaliza struktury wiekowej pacjetów Graice przedziałów klasowych dola góra Środek przedziału Liczość klasy Częstość LP a b x i i i/ , , , , , , , , ,0 Suma 05
25 Wykresy histogram licz ebość wiek
26 Statystyka Opisowa Parametrami statystyczymi ( statystykami) azywamy liczby umożliwiające sumaryczy opis zbiorowości. Parametry te tak dokładie charakteryzują zbiorowość, że mogą być wykorzystae do porówywaia różych zbiorowości. Wyróżia się astępujące grupy parametrów statystyczych: Miary położeia (klasycze i pozycyje) Miary zmieości Miary asymetrii i kocetracji
27 Miary położeia Średie arytmetycza, ważoa harmoicza geometrycza Moda- domiata Kwatyle kwartyl pierwszy mediaa (kwartyl drugi) kwartyl trzeci decyl percetyl
28 Estymatory puktowe podstawowych statystyk Estymatory wartości średich x = i = Średia arytmetycza x i x... = x x x g Średia geometrycza x i = = i = x i w w Średia ważoa, gdzie wagi w i >0 x h = i = i i Średia harmoicza x i
29 Moda (domiata) W rozkładach empiryczych określa się domiatę (modę), tj. ajczęściej występującą wartość cechy M o = x o + m m ( m m ) + ( m m + ) h m gdzie x 0 - dola graicą przedziału w którym występuje moda, h m - rozpiętość przedziału klasowego, m, m-, m+ - liczebości odpowiedio przedziału z modą, poprzediego i astępego
30 Graficze wyzaczaie mody histogram liczebość Mo wiek
31 Mediaa wzór iterpolacyjy dla zmieej ciągłej Mediaą rozkładu empiryczego Me azywamy taką wartość cechy, że co ajmiej połowa jedostek zbiorowości ma wartość cechy ie większą iż Me i jedocześie połowa jedostek ma wartość cechy ie miejszą iż Me. Czyli dystrybuata empirycza F (Me) / Dla zmieej losowej ciągłej mediaę oblicza się wg wzoru: Me m h m = x + m m i = gdzie x m - dola graica przedziału zawierającego mediaę h m, m - odpowiedio rozpiętość i liczebość przedziału mediay i
32 Mediaa Wzór Pearsoa a relacje pomiędzy Mo, Me, oraz dla rozkładów symetryczych i umiarkowaie asymetryczych x Mo = 3 ( x Me ) 5% wartości 5% wartości 5% wartości 5% wartości Q Mediaa Q3 mi Rozstęp kwartylowy Rozstęp max
33 Kwatyle Kwatylem rzędu p, gdzie 0<p<, w rozkładzie empiryczym azywamy taką wartość zmieej x p, dla której, jako pierwszej, dystrybuata empirycza spełia relację F(x p ) p, tz., że prawdopodobieństwo przyjęcia przez zmieą wartości ie większych od x p wyosi co ajmiej p, a wartości ie miejszych x p wyosi co ajmiej -p Mediaa - Kwatyl rzędu / Kwartyl - Kwatyl rzędu k/4, gdzie k=,..,3 Decyl Kwatyl rzędu k/0, gdzie k=,...,9 Percetyl Kwatyl rzędu k/00, gdzie k=,...,99;. Percetyl jest wielkością określającą jaki procet obserwacji (wyików) zajduje się poiżej zadaej wartości x p
34 Miary zmieości Miary zmieości dzielą się a miary klasycze i pozycyje. miary pozycyje : rozstęp, odchyleie ćwiartkowe, współczyik zmieości miary klasycze: wariacja, odchyleie stadardowe, odchyleie przecięte, współczyik zmieości
35 Odchyleie ćwiartkowe Kwartyle są wykorzystywae do określeia pozycyjej miary zróżicowaia, azywaej odchyleiem ćwiartkowym, którym jest wielkość Q, określoa wzorem Q = Q Q 3
36 Miary zmieości Rozstęp- ajprostsza miara zmieości Odchyleie ćwiartkowe Odchyleie przecięte Q R=x max x mi Q 3 Q = Współczyik zmieości d x x + L+ i= = = x x x i x V d = d x
37 Klasycze miary zmieości Wariacja s = ( x i= Odchyleie stadardowe s = i = i x) ( x i x Współczyik zmieości - klasyczy ) V s = s x
38 Miary skośości / asymetrii Miarą stopia i kieruku asymetrii jest klasyczy współczyik asymetrii g, obliczay według wzoru: g = A s 3 3 gdzie s jest odchyleiem stadardowym A 3 jest trzecim mometem cetralym rozkładu empiryczego A r 3 3 = ( x i x ) i = i
39 Miary skośości / asymetrii Niemiaoway współczyik asymetrii (skośości) A stosoway do porówań asymetrii wielu rozkładów A = x s Mo gdy: A=0 rozkład symetryczy asymetria lewostroa- wydłużoe lewe ramie rozkładu asymetria prawostroa wydłużoe prawe ramie rozkładu Stwierdzoo, że jedyie w przypadku bardzo silej asymetrii współczyik A przekracza wartość
40 Miary skośości / asymetrii Pozycyjy współczyik asymetrii w w = ( Q 3 Me ) ( Me Q ) Q gdzie Q jest odchyleiem ćwiartkowym, Me jest mediaą Q i Q 3 odpowiedio pierwszym i trzecim kwartylem, Stwierdzoo astępujące związki dla asymetrii lewostroej x sr <Me<Mo asymetrii prawostroej Mo<Me<x sr
41 Podstawy wioskowaia statystyczego Jeśli S jest przestrzeią zdarzeń elemetarych (w statystyce azywaa populacją), to Prostąpróbąlosową (próbką statystyczą) o liczości azywamy ciąg iezależych zmieych losowych X, X,.., X, określoych a przestrzei S i takich, że każda z ich ma te sam rozkład. Ciąg wartości x, x,.., x próby losowej X, X,.., X azywamy realizacją próby losowej. Wybór elemetów populacji powiie być dokoay w taki sposób, żeby każdy podzbiór populacji, składający się z elemetów miał taką samą szasę wybraia
42 Zadaie: oceić średi wzrost dorosłych Polaków. Jeśli wybieramy próbę spośród studetów ie jest to jedak próba wszystkich dorosłych Polaków Utożsamiamy populację z badaą cechą Szacujemy szukaą wartość ( średi wzrost) obliczając pewą wartość z próby Niech T(X, X,.., X ), w aszym rozumieiu, dobrze przybliża wartość iezaego wskaźika. Taką fukcję T azywamy statystyką. Każda tak rozumiaa statystyka jest zmieą losową, a zatem posiada określoy rozkład i te rozkład odgrywa bardzo ważą rolę w aalizie statystyczej.
43 Rozkład średiej w prostej próbie losowej Średią, w prostej próbie losowej X, X,.., X o liczości, azywamy statystykę X = X + X X Podaa defiicja jest szczególym przypadkiem statystyki T(X, X,.., X ) Średia X jest zmieą losową, a x jest kokretą wartością z jedej kokretej próby. Możemy wylosować kilka prób 00 elemetowych i z każdej otrzymać ią wartość p. x=`76,5; x =77,8...
44 Prawo Wielkich Liczb (PWL) Prawo Wielkich Liczb: Niech X będzie zmieą losową o wartości oczekiwaej µ X i skończoej wariacji σ X < i iech X, X,.., X będzie prostą próbą losową z rozkładu zmieej X. Wówczas dla dowolie małej dodatiej liczby ε i ( X [ µ ε, µ + ε ]) P X X
45 Charakterystyki rozkładu wartości średiej Zakładając, że prosta próba losowa X, X,.., X pochodzi z rozkładu o wartości średiej µ i wariacji σ, Otrzymamy ( ) X X X X X X X X.... )... ( )... ( σ σ σ σ σ µ µ µ µ µ µ µ µ = = = = = X X σ σ µ µ = = zatem
46 Cetrale twierdzeie graicze Jeśli X, X,.., X jest prostą próbą losową z rozkładu o wartości średiej µ i skończoej wariacji σ. Wówczas dla prób losowych o dużej liczebości rozkład stadaryzowaej średiej jest bliski stadardowemu rozkładowi ormalemu N(0,), tz rozkład średiej X jest w przybliżeiu rówy rozkładowi N( µ, σ / ) Zatem dla dowolych a i b (a b) i zmieej losowej Z o stadardowym rozkładzie ormalym P a X µ σ / b P ( a Z b) = Φ ( b) Φ ( a )
47 Zastosowaie - przykład P Rozkład aszego codzieego dojazdu do pracy jest w przybliżeiu jedostajy a odciku ( 0,5h,h) a jedocześie czasy dojazdów w róże di są iezależe. Jakie ( w przybliżeiu) jest prawdopodobieństwo zdarzeia, że średi dziey dojazd w ciągu 30 di przekroczy 0,8h (48 mi) Rozwiązaie: iech X i ozacza czas dojazdu w i-tym diu, i=,,30 X i ma rozkład jedostajy a odciku [0,5, ], zatem stąd 0,5 + 3 µ X = oraz σ i 4 X 48 * = X i > 0, 8 48 * P ( Z = > ( 0,5 ), 89 ) = Φ = 48 (, 89 ) = 0, 03
48 Rozkład częstości Zakładamy, że zmiea X z rozkładu, z którego pochodzi próba, może przyjmować tylko dwie wartości: ozaczmy, gdy baday obiekt posiada określoą cechę 0, gdy obiekt tej cechy ie posiada p=p(x=) q=-p=p(x=0) Liczba p, zwaa proporcją jest rówa prawdopodobieństwu posiadaia wybraej cechy (własości) przez losowo wybraą jedostkę. Zauważmy, że µ X =*p+0*(-p)=p, stąd też wyika że rozpatryway wcześiej problem szacowaia wartości średiej jest w tym kokretym przypadku jedozaczy z szacowaiem proporcji. Przykłady zastosowań: szacowaie proporcji produktów wadliwych wyprodukowaych w ciągu miesiąca, albo leworęczych ucziów przychodzących do I klasy
49 Rozkład częstości Częstością występowaia w prostej próbie losowej azywamy statystykę pˆ = i = gdzie X, X,.., X jest prostą próbą losową z rozkładu dwupuktowego o wartościach 0 i. Statystykę p obliczoą dla kokretych wartości w próbie azywamy wartością częstości X i
50 Twierdzeia o częstości występowaia. Częstość występowaia pomożoa przez liczość próby ma rozkład dwumiaowy (Berouliego) B (, p). Poadto. Dla dowolych rzeczywistych a i b, gdy p p p p p ) ( ˆ ˆ = = σ µ ) ( ) ( ) ( ˆ a b b p p p p a P Φ Φ
51 Przykład zastosowań W populacji dorosłych Polaków 39% ma kłopoty ze sem. Jakie jest prawdopodobieństwo, że w próbie 00 elemetowej, częstość osób mających kłopoty ze sem ie przekroczy 0,33. Iteresuje as P( pˆ 0,33) P Dae: a=-, b=33, = ( pˆ ) Φ = Φ(.3) = *0.39*0.6
52 Estymacja i estymatory.
53 Techiki wioskowaia statystyczego W statystyce matematyczej stosowae są dwie techiki wioskowaia: Estymacja polegająca a oszacowaiu z pewą dokładością określoych wartości charakteryzujących rozkład badaej cechy p. częstości, wartości oczekiwaej, wariacji. Weryfikacja hipotez statystyczych polegająca a sprawdzeiu słuszości przypuszczeń dotyczących postaci rozkładu cechy (testy zgodości) bądź wartości jego parametrów (parametrycze testy istotości) Obie wymieioe techiki uzupełiają się wzajemie.
54 Co to jest estymator Zakładamy, że rozkład badaej cechy w populacji geeralej jest opisay za pomocą dystrybuaty F (x;θ), gdzie Θ ozacza parametr od którego zależy ta dystrybuata (taki jak p. λ w rozkładzie Poissoa). Niezaa wartość parametru Θ będzie szacowaa (obliczoa) a podstawie próby -elemetowej (X,.,X )
55 Defiicja estymatora Estymatorem T parametru Θ rozkładu populacji geeralej azywa się statystykę (dowolą) z próby T = t (X,...,X ), która służy do oszacowaia wartości liczbowej tego parametru. Skoro szacuku parametru dokouje się w oparciu o dae z próby, zatem istieje możliwość popełieia błędu ( iech go ozacza litera d), który azyway jest błędem szacuku (estymacji) parametru Θ d = T -Θ
56 Błąd estymacji Błąd d jest też zmieą losową ( zależą od próby losowej), a za miarę tego błędu przyjmuje się = E (T Θ) Zauważmy, że jeśli E (T ) = Θ wtedy wyrażeie określające, jest wariacją D (T ) estymatora T,, a odchyleie stadardowe D(T ) jest średim (stadardowym) błędem szacuku parametru Θ, błędem względym oszacowaia jest iloraz D(T ) / Θ
57 Estymacja i estymatory Rozpatrywae dotychczas statystyki: średia i częstość ależą do ajczęściej stosowaych w praktyce. W przypadku gdy statystyki używae są do szacowaia (przybliżaia) iezaych parametrów rozkładu zmiee losowej oszą specjalą azwę: Statystykę T(X, X,.., X ), służącą do oszacowaia iezaego parametru populacji azywamy estymatorem. Dla kokretych wartości próby X =x, X =x,.., X = x liczbę T(X, X,.., X ) azywamy wartością estymatora
58 Estymacja i estymatory W zależości od tego co chcemy oszacować rozróżia się estymację parametryczą, gdy szacowae są parametry rozkładu zmieej X (p. E(X), D (X)) Estymację ieparametryczą, gdy próbujemy wioskować o postaci rozkładu cechy X w populacji. Podstawy teorii estymacji sformułował Karl Pearso a przełomie XIX i XX wieku.. Pierwszym krokiem w estymacji jest wylosowaie z populacji - elemetowej próby, po czym. a podstawie badań próby - obliczeń wykoaych a daych zawartych w próbce 3. wyciągamy wioski dotyczące badaej cechy w całej populacji.
59 Rodzaje estymacji wg kryterium wyiku Estymacja puktowa ma zastosowaie gdy, a podstawie daych z próby, chcemy ustalić liczbową wartość określoego parametru rozkładu cechy w całej populacji Estymacja przedziałowa polega a wyzaczeiu graic przedziału liczbowego, w którym, z określoym prawdopodobieństwem, zawiera się wartość szacowaego parametru Podstawowym arzędziem szacowaia iezaego parametru jest estymator obliczoy a podstawie próby. p. dla wartości oczekiwaej jest to średia arytmetycza, albo średia ważoa. Liczba możliwych estymatorów kokretego parametru rozkładu może być duża ale, bierze się pod uwagę tylko te, które posiadają określoe właściwości (cechy).
60 Cechy dobrego estymatora Zgody Nieobciążoy Najefektywiejszy Estymator jest zgody jeśli jest stochastyczie zbieży z szacowaym parametrem. W praktyce ozacza to, że im większa próba (liczość próbki) tym większe prawdopodobieństwo, że estymator przyjmie wartości bliższe szacowaemu parametrowi. Przykład im więcej ćwiczymy tym bardziej prawdopodoby sukces.
61 Zbieżość stochastycza Ciąg zmieych losowych (X, X,.., X )={X } jest stochastyczie zbieży do stałej c, jeśli dla dowolego ε>0, jest spełioa zależość lim P( X c < ε ) = Ozacza to, że prawdopodobieństwo zdarzeia ( c < ε ) X wzrasta do, co ie ozacza zbieżości w sesie aalizy matematyczej
62 Estymator zgody Estymator T jest zgody jeśli dla dowolego ε>0. lim P { T Θ < ε } = Jeśli wybray estymator ie jest zgody to zwiększeie liczebości próby może go oddalić od wartości szacowaej. Przykład estymatorem średich wyików grupy jest średia ocea ajlepszego studeta, tak skrajie zdefiioway estymator ie jest zgody, bo zwiększeie liczości grupy zwiększa prawdopodobieństwo oddalaia go od średiej ocey w całej grupie. Jeśli estymator jest zgody to jest asymptotyczie ieobciążoy
63 Podstawowe własości estymatorów Tw.: Jeśli estymator jest ieobciążoy lub asymptotyczie ieobciążoy oraz jego wariacja spełia relację D ( T ) 0 lim = to jest o estymatorem zgodym Estymator T parametru Θ jest ieobciążoy jeśli spełioa jest relacja E (T ) = Θ Jeśli ta relacja ie zachodzi, to estymator azywamy obciążoym, a wielkość b (T ) = E (T ) - Θ azywamy obciążeiem estymatora
64 Cechy dobrego estymatora - Nieobciążoość Nieobciążoość estymatora ozacza, że wartość oczekiwaa estymatora ieobciążoego jest dokładie rówa wartości szacowaego parametru. Obciążoość ozacza, że wartości dostarczae przez taki estymator obciążoe są błędem systematyczym
65 Obciążoość i ieobciążoość estymatora Odchyleie stadardowe dae wzorem s = ( x i x) i= jest estymatorem obciążoym odchyleia stadardowego w całej populacji, a ieobciążoym jest odchyleie obliczoe z wzoru s = ( x i x) i=
66 Cechy dobrego estymatora - Efektywość Efektywość estymator jest tym efektywiejszy im miejsza jest jego wariacja. Spośród wszystkich estymatorów, które są zgode i ieobciążoe wybieramy te, który ma ajmiejszą wariację, jest ajefektywiejszy.
67 Przykłady estymatorów puktowych Estymatorem zgodym, ieobciążoym i ajefektywiejszym dla wartości oczekiwaej w populacji jest średia arytmetycza X = i= X i Mediaa wyzaczoa z próby jest ieobciążoym ale miej efektywym od średiej arytmetyczej estymatorem wartości oczekiwaej
68 Przykłady estymatorów puktowych Niech m ozacza liczbę wyróżioych elemetów w próbie elemetowej ( p. liczbę wyrobów wadliwych), wtedy statystyka będąca częstością w próbie P = m jest estymatorem zgodym, ieobciążoym i ajefektywiejszym frakcji P w populacji
69 Przykłady estymatorów puktowych S = ( X i= i X ) S jest estymatorem zgodym ale obciążoym wariacji w całej populacji. Wskazówka: tego wzoru używamy obliczając wariację z całej populacji, atomiast do estymacji a podstawie próbki ależy wyik z próby pomożyć przez współczyik /(-)
70 Własości estymatora - podsumowaie Jeśli day jest zbiór estymatorów T,... T r ieobciążoych, to te estymator, który ma w tym zbiorze ajmiejsza wariację, jest estymatorem ajefektywiejszym. Tw. Estymator parametru statystyczego powiie być: ieobciążoy zgody ajefektywiejszy Metody wyzaczaia estymatorów: metoda mometów, metoda ajwiększej wiarygodości
71 Estymacja parametrycza Ze względu a formę wyiku estymacji wyróżimy: Estymacja puktowa gdy szacujemy liczbową wartość określoego parametru rozkładu cechy w całej populacji Estymacja przedziałowa gdy wyzaczamy graice przedziału liczbowego, w których, z określoym prawdopodobieństwem, mieści się prawdziwa wartość szacowaego parametru.
72 Przedziały ufości dla klasyczych parametrów statystyczych Estymacja przedziałowa polega a wyzaczeiu graic przedziału liczbowego, w którym, z określoym prawdopodobieństwem, rówym (-α), zawiera się wartość szacowaego parametru
73 Estymacja przedziałowa P (Θ d (X,...,X )< Θ < Θ g (X,...,X )) = -α Losowy przedział (Θd,Θg ) azywa się przedziałem ufości parametru Θ Graice przedziału ufości są fukcjami zmieych losowych X,...,X -α azywamy poziomem ufości (lub współczyikiem ufości) Zwykle przyjmuje się -α = 0,99 lub 0,95 lub 0,90 w zależości od rozpatrywaego zagadieia
74 Przedział ufości dla wartości oczekiwaej, gdy zae jest odchyleie stadardowe gdzie: X Cecha X ma w populacji rozkład ormaly N( µ, σ), odchyleie stadardowe σ jest zae. Estymatorem wartości oczekiwaej µ, uzyskaym MNW jest średia arytmetycza, która jest zmieą losową o rozkładzie N(µ, σ/ ) Po stadaryzacji otrzymuję zmieą U o rozkładzie N(0,) U jest liczbą elemetów z próby losowej ozacza średią arytmetyczą obliczoą z próby losowej σ odchyleie stadardowe populacji = X σ µ
75 Przedział ufości dla wartości oczekiwaej gdy zae jest odchyleie stadardowe σ P( X u Φ(u -α/ ) = - α/ σ µ < σ α α < X + u ) = α Poziom ufości - α α/ α/ u α/ = - u -α/ 0 u -α/ u
76 Praktycza realizacja przedziałów ufości dla µ, dla prostych prób losowych o liczościach =5, z rozkładu N (0,) dla poziomu ufości -α = 0.9
77 Problem miimalej liczości próby α σ µ σ α α = < + < ) ( u X u P Długość przedziału ufości wyosi u σ α Żądamy by maksymaly błąd oszacowaia ie przekraczał zadaej z góry wartości d d u σ α Z tej relacji wyika, że d u σ α
78 Zadaie Wykoujemy pomiary grubości płytki metalowej. Jak dużą liczbę pomiarów () ależy przeprowadzić, aby prawdopodobieństwem (ufością) wyoszącym 0,95 maksymaly błąd ocey ie przekraczał 0,0 mm. Zakładamy, że odchyleie stadardowe błędów pomiarów σ=0.
79 Przedział ufości dla wartości oczekiwaej, gdy odchyleie stadardowe jest iezae Estymatorem µ, uzyskaym MNW jest średia arytmetycza, ie zamy σ, musimy zatem wybrać statystykę, która od σ ie zależy t X m = S Statystyka t ma rozkład Studeta z - stopiami swobody, ie zależy od parametru σ ale od parametru S, S jest odchyleiem stadardowym obliczoym z próby.
80 Przedział ufości dla wartości oczekiwaej, gdy odchyleie stadardowe jest iezae P Przedział ufości dla wartości oczekiwaej ma wtedy postać S ( X tα, < m < X + tα, ) = S α gdzie wartość tα,-, jest kwatylem rzędu α, z - stopiami swobody Długość przedziału wyosi tα,-s/ -
81 Kwatyle t -α (), rzędu -α,rozkładu Studeta o stopiach swobody -α
82 Przedział ufości dla wartości oczekiwaej, gdy iezay jest rozkład w populacji W praktyce często ie zay jest rozkład cechy w populacji i brak jest podstaw do przyjęcia, że jest o ormaly. Wiadomo, że średia arytmetycza wyzaczoa z próby o dowolym rozkładzie jest zmieą losową o rozkładzie N(m, σ/ ), dlatego Niezae σ moża przybliżyć obliczoym z dużej próby odchyleiem stadardowym S α σ µ σ α α = + < < ) ( u X u X P α µ α α = + < < ) ( s u X s u X P
83 Zadaie Dokoao 0 pomiarów ciśieia wody a ostatim piętrze bloku 5 piętrowego i okazało się, że średie ciśieie wyosiło, podczas gdy wariacja wyiosła 4,4. Zaleźć liczbowe wartości krańców przedziałów ufości dla wartości oczekiwaej przyjmując poziom ufości -α = 0,95 -α = 0,90 -α = 0,98
84 Przedział ufości dla wariacji w populacji ormalej Przedział jest zbudoway w oparciu o statystykę χ =s / σ, która ma rozkład χ o - stopiach swobody. W rozkładzie χ określa się dwie wartości, spełiające odpowiedio rówości P( χ χ α ) = α, P( χ χ α ) = α,
85
86 Przedział ufości dla wariacji w populacji ormalej Z podaych wzorów wyika, że ; Po przekształceiu których otrzymujemy przedział ufości dla wariacji α χ χ χ α α = < < ) (,, P α χ σ χ α α = < < ) (,, S P α χ σ χ α α = < < ) (,, S S P
87 Zadaie Odchyleie stadardowe σ błędu przyrządu pomiarowego jest iezae. Zakładamy, że rozkład błędów pomiarów jest rozkładem ormalym. Przeprowadzoo = 0 pomiarów i otrzymao astępujące wyiki {7; 7,5; 8,5; 8; 6; 7,5; 6,5; 5;5 7,5; 6 } Wyzaczyć liczbowe wartości krańców przedziałów ufości dla Wartości oczekiwaej Dla odchyleia stadardowego Na poziomie ufości -α = 0,95
88 Przedziały ufości dla proporcji p Opierając się a częstości skostruujemy przedziały ufości dla proporcji p. Jeśli próba losowa iezależych zmieych o rozkładzie puktowym P(X=)=-P(X=0) = p jest dostateczie licza, by móc skorzystać z przybliżeia rozkładem N(0,), statystyki (*) Wówczas pˆ α α α ) ˆ ( ˆ ˆ u p p p p u P p p p p ) ˆ ( ˆ ˆ
89 Zastosowaie Agecja badająca w 000 roku opiie Polaków a podstawie 000 elemetowej próby stwierdziła, że 57% popiera wejście Polski do Uii. Uzając, ze mamy do czyieia z rozkładem dwupuktowym skostruujemy przedział ufości a poziomie 0,95 dla proporcji Polaków popierających wejście Polski do UE Próba o =000 jest dostateczie licza by skorzystać ze rozkładu statystyki (*) Przedział 95% ufości to [0,54,0,60], atomiast wielkość 0,57(-0,57)/000 = 0,0056 moża uzać za błąd stadardowy otrzymaej częstości, w ujęciu procetowym wyosi o około,6%
90 Przedział ufości dla proporcji p α α α + ˆ) ˆ( ˆ ˆ) ˆ( ˆ p p u p p p p u p P Waże jest aby pamiętać jakie są miimale wymagaia a liczość próby i proporcję p, by móc rozkład podaej w (*) statystyki przybliżać rozkładem N(0,)
91 Zadaie Odchyleie stadardowe σ błędu przyrządu pomiarowego jest iezae. Zakładamy, że rozkład błędów pomiarów jest rozkładem ormalym. Przeprowadzoo = 0 pomiarów i otrzymao astępujące wyiki {7; 7,5; 8,5; 8; 6; 7,5; 6,5; 5;5 7,5; 6 } Wyzaczyć liczbowe wartości krańców przedziałów ufości dla Wartości oczekiwaej Dla odchyleia stadardowego Na poziomie ufości -α = 0,95
Statystyka i Opracowanie Danych. W7. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407
Statystyka i Opracowaie Daych W7. Estymacja i estymatory Dr Aa ADRIAN Paw B5, pok407 ada@agh.edu.pl Estymacja parametrycza Podstawowym arzędziem szacowaia iezaego parametru jest estymator obliczoy a podstawie
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowaie daych Podstawy wioskowaia statystyczego. Prawo wielkich liczb. Cetrale twierdzeie graicze. Estymacja i estymatory Dr Aa ADRIAN Paw B5, pok407 ada@agh.edu.pl Wprowadzeie Jeśli S
X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.
Zagadieia estymacji Puktem wyjścia badaia statystyczego jest wylosowaie z całej populacji pewej skończoej liczby elemetów i zbadaie ich ze względu a zmieą losową cechę X Uzyskae w te sposób wartości x,
Estymacja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 7
Metody probabilistycze i statystyka Estymacja Dr Joaa Baaś Zakład Badań Systemowych Istytut Sztuczej Iteligecji i Metod Matematyczych Wydział Iformatyki Politechiki Szczecińskiej Metody probabilistycze
3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej
PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elemety kombiatoryki 2. Zmiee losowe i ich rozkłady 3. Populacje i próby daych, estymacja parametrów 4. Testowaie hipotez 5. Testy parametrycze 6. Testy
Rachunek prawdopodobieństwa i statystyka Wnioskowanie statystyczne. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407
Rachek rawdoodobieństwa i statystyka Wioskowaie statystycze. Estymacja i estymatory Dr Aa ADRIAN Paw B5, ok407 ada@agh.ed.l Estymacja arametrycza Podstawowym arzędziem szacowaia iezaego arametr jest estymator
STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2
STATYSTYKA Rafał Kucharski Uiwersytet Ekoomiczy w Katowicach 2015/16 ROND, Fiase i Rachukowość, rok 2 Rachuek prawdopodobieństwa Rzucamy 10 razy moetą, dla której prawdopodobieństwo wyrzuceia orła w pojedyczym
Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste
Statystyka opisowa Miary statystycze: 1. miary położeia a) średia z próby x = 1 x = 1 x = 1 x i - szereg wyliczający x i i - szereg rozdzielczy puktowy x i i - szereg rozdzielczy przedziałowy, gdzie x
Estymacja: Punktowa (ocena, błędy szacunku) Przedziałowa (przedział ufności)
IV. Estymacja parametrów Estymacja: Puktowa (ocea, błędy szacuku Przedziałowa (przedział ufości Załóżmy, że rozkład zmieej losowej X w populacji geeralej jest opisay dystrybuatą F(x;α, gdzie α jest iezaym
ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA
ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA Mamy populację geeralą i iteresujemy się pewą cechą X jedostek statystyczych, a dokładiej pewą charakterystyką liczbową θ tej cechy (p. średią wartością
Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)
Elemety statystyki opisowej Izolda Gorgol wyciąg z prezetacji (wykład I) Populacja statystycza, badaie statystycze Statystyka matematycza zajmuje się opisywaiem i aalizą zjawisk masowych za pomocą metod
Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).
Cetrale miary położeia Średia; Moda (domiata) Mediaa Kwatyle (kwartyle, decyle, cetyle) Moda (Mo, D) wartość cechy występującej ajczęściej (ajlicziej). Mediaa (Me, M) dzieli uporządkoway szereg liczbowy
Lista 6. Estymacja punktowa
Estymacja puktowa Lista 6 Model metoda mometów, rozkład ciągły. Zadaie. Metodą mometów zaleźć estymator iezaego parametru a w populacji jedostajej a odciku [a, a +. Czy jest to estymator ieobciążoy i zgody?
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o
1. Wioskowaie statystycze. W statystyce idetyfikujemy: Cecha-Zmiea losowa Rozkład cechy-rozkład populacji Poadto miaem statystyki określa się także fukcje zmieych losowych o tym samym rozkładzie. Rozkłady
Miary położenia (tendencji centralnej) to tzw. miary przeciętne charakteryzujące średni lub typowy poziom wartości cechy.
MIARY POŁOŻENIA I ROZPROSZENIA WYNIKÓW SERII POMIAROWYCH Miary położeia (tedecji cetralej) to tzw. miary przecięte charakteryzujące średi lub typowy poziom wartości cechy. Średia arytmetycza: X i 1 X i,
Statystyczny opis danych - parametry
Statystyczy opis daych - parametry Ozaczeia żółty owe pojęcie czerwoy, podkreśleie uwaga * materiał adobowiązkowy Aa Rajfura, Matematyka i statystyka matematycza a kieruku Rolictwo SGGW Zagadieia. Idea
Estymacja przedziałowa
Metody probabilistycze i statystyka Estymacja przedziałowa Dr Joaa Baaś Zakład Badań Systemowych Istytut Sztuczej Iteligecji i Metod Matematyczych Wydział Iformatyki Politechiki Szczecińskiej Metody probabilistycze
STATYSTYKA MATEMATYCZNA
TATYTYKA MATEMATYCZNA ROZKŁADY PODTAWOWYCH TATYTYK zmiea losowa odpowiedik badaej cechy, (,,..., ) próba losowa (zmiea losowa wymiarowa, i iezależe zmiee losowe o takim samym rozkładzie jak (taką próbę
16 Przedziały ufności
16 Przedziały ufości zapis wyiku pomiaru: sugeruje, że rozkład błędów jest symetryczy; θ ± u(θ) iterpretacja statystycza przedziału [θ u(θ), θ + u(θ)] zależy od rozkładu błędów: P (Θ [θ u(θ), θ + u(θ)])
Ćwiczenie 2 ESTYMACJA STATYSTYCZNA
Ćwiczeie ETYMACJA TATYTYCZNA Jest to metoda wioskowaia statystyczego. Umożliwia oszacowaie wartości iteresującego as parametru a podstawie badaia próbki. Estymacja puktowa polega a określeiu fukcji zwaej
Plan wykładu. Analiza danych Wykład 1: Statystyka opisowa. Literatura. Podstawowe pojęcia
Pla wykładu Aaliza daych Wykład : Statystyka opisowa. Małgorzata Krętowska Wydział Iformatyki Politechika Białostocka. Statystyka opisowa.. Estymacja puktowa. Własości estymatorów.. Rozkłady statystyk
Statystyka matematyczna. Wykład II. Estymacja punktowa
Statystyka matematycza. Wykład II. e-mail:e.kozlovski@pollub.pl Spis treści 1 dyskretych Rozkłady zmieeych losowych ciągłych 2 3 4 Rozkład zmieej losowej dyskretej dyskretych Rozkłady zmieeych losowych
Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.
Z adaie Niech,,, będą iezależymi zmieymi losowymi o idetyczym rozkładzie ormalym z wartością oczekiwaą 0 i wariacją. Wyzaczyć wariację zmieej losowej. Wskazówka: pokazać, że ma rozkład Γ, ODP: Zadaie Niech,,,
Wybrane litery alfabetu greckiego
Wybrae litery alfabetu greckiego α alfa β beta Γ γ gamma δ delta ɛ, ε epsilo η eta Θ θ theta κ kappa Λ λ lambda µ mi ν i ξ ksi π pi ρ, ϱ ro σ sigma τ tau Φ φ, ϕ fi χ chi Ψ ψ psi Ω ω omega Ozaczeia a i
STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr inż Krzysztof Bryś
1 STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr iż Krzysztof Bryś Pojȩcia wstȩpe populacja - ca ly zbiór badaych przedmiotów lub wartości. próba - skończoy podzbiór populacji podlegaj acy badaiu.
Charakterystyki liczbowe zmiennych losowych: wartość oczekiwana i wariancja
Charakterystyki liczbowe zmieych losowych: wartość oczekiwaa i wariacja dr Mariusz Grządziel Wykłady 3 i 4;,8 marca 24 Wartość oczekiwaa zmieej losowej dyskretej Defiicja. Dla zmieej losowej dyskretej
Histogram: Dystrybuanta:
Zadaie. Szereg rozdzielczy (przyjmujemy przedziały klasowe o długości 0): x0 xi i środek i*środek i_sk częstości częstości skumulowae 5 5 8 0 60 8 0,6 0,6 5 5 9 0 70 7 0,8 0, 5 5 5 0 600 0, 0,6 5 55 8
PRZEDZIAŁY UFNOŚCI. Niech θ - nieznany parametr rozkładu cechy X. Niech α będzie liczbą z przedziału (0, 1).
TATYTYKA MATEMATYCZNA WYKŁAD 3 RZEDZIAŁY UFNOŚCI Niech θ - iezay parametr rozkład cechy. Niech będzie liczbą z przedział 0,. Jeśli istieją statystyki, U i U ; U U ; których rozkład zależy od θ oraz U θ
STATYSTYKA OPISOWA WYKŁAD 1 i 2
STATYSTYKA OPISOWA WYKŁAD i 2 Literatura: Marek Cieciura, Jausz Zacharski, Metody probabilistycze w ujęciu praktyczym, L. Kowalski, Statystyka, 2005 2 Statystyka to dyscyplia aukowa, której zadaiem jest
Liczebnośd (w tys.) n
STATYSTYKA Statystyka bada prawidłowości w zjawiskach masowych (tz. takich, które mogą występowad ieograiczoą ilośd razy). Przedmiotem badao statyki są zbiory (populacje), których elemetami są wszelkiego
θx θ 1, dla 0 < x < 1, 0, poza tym,
Zadaie 1. Niech X 1,..., X 8 będzie próbą z rozkładu ormalego z wartością oczekiwaą θ i wariacją 1. Niezay parametr θ jest z kolei zmieą losową o rozkładzie ormalym z wartością oczekiwaą 0 i wariacją 1.
Estymacja przedziałowa:
Estymacja przedziałowa: Zamiast szukad ajlepszego estymatora, tak jak w estymacji puktowej będziemy poszukiwad przedziału, do którego będzie ależał szukay parametr z odpowiedio dużym prawdopodobieostwem.
Wykład 11 ( ). Przedziały ufności dla średniej
Wykład 11 (14.05.07). Przedziały ufości dla średiej Przykład Cea metra kwadratowego (w tys. zł) z dla 14 losowo wybraych mieszkań w mieście A: 3,75; 3,89; 5,09; 3,77; 3,53; 2,82; 3,16; 2,79; 4,34; 3,61;
Estymacja parametrów populacji
Estymacja parametrów populacji Estymacja parametrów populacji Estymacja polega a szacowaiu wartości parametrów rozkładu lub postaci samego rozkładu zmieej losowej, a podstawie próby statystyczej. Estymacje
STATYSTYKA OPISOWA PODSTAWOWE WZORY
MIARY POŁOŻENIA Średia Dla daych idywidualych: STATYSTYKA OPISOWA PODSTAWOWE WZORY Q i = x lmi + i mi 1 4 j h m i mi x = 1 x i x = 1 i ẋ i gdzie ẋ i środek i-tego przedziału i liczość i- tego przedziału
ANALIZA DANYCH DYSKRETNYCH
ZJAZD ESTYMACJA Jest to metoda wioskowaia statystyczego. Umożliwia oa oszacowaie wartości iteresującego as parametru a podstawie badaia próbki. Estymacja puktowa polega a określeiu fukcji zwaej estymatorem,
Estymacja przedziałowa - przedziały ufności
Estymacja przedziałowa - przedziały ufości Próbę -elemetową charakteryzujemy jej parametrami (p. x, s, s ). Służą oe do ocey wartości iezaych parametrów populacji (m, σ, σ). Nazywamy je estymatorami puktowymi
KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1
KURS STATYSTYKA Lekcja 3 Parametrycze testy istotości ZADANIE DOMOWE www.etrapez.pl Stroa Część : TEST Zazacz poprawą odpowiedź (tylko jeda jest prawdziwa). Pytaie Statystykę moża rozumieć jako: a) próbkę
STATYSTYKA OPISOWA PODSTAWOWE WZORY
MIARY POŁOŻENIA Średia Dla daych idywidualych: x = 1 STATYSTYKA OPISOWA PODSTAWOWE WZORY x i x = 1 i ẋ i gdzie ẋ i środek i-tego przedziału i liczość i- tego przedziału Domiata (moda Liczba ajczęściej
0.1 ROZKŁADY WYBRANYCH STATYSTYK
0.1. ROZKŁADY WYBRANYCH STATYSTYK 1 0.1 ROZKŁADY WYBRANYCH STATYSTYK Zadaia 0.1.1. Niech X 1,..., X będą iezależymi zmieymi losowymi o tym samym rozkładzie. Obliczyć ES 2 oraz D 2 ( 1 i=1 X 2 i ). 0.1.2.
Statystyka powtórzenie (I semestr) Rafał M. Frąk
Statystyka powtórzeie (I semestr) Rafał M. Frąk TEORIA Statystyka Statystyka zajmuje się badaiem procesu zbieraia oraz iterpretacji daych liczbowych lub jakościowych. Przedmiotem statystyki są metody badaia
Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12
Wykład Korelacja i regresja Dr Joaa Baaś Zakład Badań Systemowych Istytut Sztuczej Iteligecji i Metod Matematyczych Wydział Iformatyki Politechiki Szczecińskiej Wykład 8. Badaie statystycze ze względu
Miary położenia. Miary rozproszenia. Średnia. Wariancja. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.
Miary położeia Średia Dla daych idywidualych: x = 1 x = 1 x i i ẋ i gdzie ẋ i środek i tego przedziału i - liczość i-tego przedziału Domiata moda Liczba ajczęściej występująca jeśli taka istieje - dla
Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja
Podstawowe ozaczeia i wzory stosowae a wykładzie i laboratorium Część I: estymacja 1 Ozaczeia Zmiee losowe (cechy) ozaczamy a wykładzie dużymi literami z końca alfabetu. Próby proste odpowiadającymi im
Wykład nr 2. Statystyka opisowa część 2. Plan wykładu
Wykład r 2 Statystyka opisowa część 2 Pla wykładu 1. Uwagi wstępe 2. Miary tedecji cetralej 2.1. Wartości średie 2.2. Miary pozycyje 2.3. Domiata 3. Miary rozproszeia 4. Miary asymetrii 5. Miary kocetracji
PODSTAWY BIOSTATYSTYKI ĆWICZENIA
PODSTAWY BIOSTATYSTYKI ĆWICZENIA FILIP RACIBORSKI FILIP.RACIBORSKI@WUM.EDU.PL ZAKŁAD PROFILAKTYKI ZAGROŻEŃ ŚRODOWISKOWYCH I ALERGOLOGII WUM ZADANIE 1 Z populacji wyborców pobrao próbkę 1000 osób i okazało
STATYSTKA I ANALIZA DANYCH LAB II
STATYSTKA I ANALIZA DANYCH LAB II 1. Pla laboratorium II rozkłady prawdopodobieństwa Rozkłady prawdopodobieństwa dwupuktowy, dwumiaowy, jedostajy, ormaly. Związki pomiędzy rozkładami prawdopodobieństw.
Modele probabilistyczne zjawisk losowych
Statystyka-matematycza-II Wykład Modele probabilistycze zjawisk losowych Pojęcia podstawowe: Zdarzeia elemetare: ajprostsze zdarzeie mogące być wyróżioe dla daego doświadczeia losowego. Ω - zbiór zdarzeń
Ćwiczenie nr 14. Porównanie doświadczalnego rozkładu liczby zliczeń w zadanym przedziale czasu z rozkładem Poissona
Ćwiczeie r 4 Porówaie doświadczalego rozkładu liczby zliczeń w zadaym przedziale czasu z rozkładem Poissoa Studeta obowiązuje zajomość: Podstawowych zagadień z rachuku prawdopodobieństwa, Zajomość rozkładów
Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.
Rachuek prawdopodobieństwa i statystyka W12: Statystycza aaliza daych jakościowych Dr Aa ADRIAN Paw B5, pok 407 ada@agh.edu.pl Wprowadzeie Rozróżia się dwa typy daych jakościowych: Nomiale jeśli opisują
WYKŁAD 1. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady
WYKŁAD Zdarzeia losowe i prawdopodobieństwo Zmiea losowa i jej rozkłady Metody statystycze metody opisu metody wioskowaia statystyczego sytetyczy liczbowy opis właściwości zbioru daych ocea charakterystyk
1 Dwuwymiarowa zmienna losowa
1 Dwuwymiarowa zmiea loowa 1.1 Dwuwymiarowa zmiea loowa kokowa X = x i, Y = y k = p ik przy czym i, k N oraz p ik = 1; i k p i = X = x i = p ik dla i N; p k = Y = y k = p ik dla k N; k i F 1 x = p i dla
Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl
Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Wprowadzenie Podstawowe cele analizy zbiorów danych Uogólniony opis poszczególnych
Miary rozproszenia. Miary położenia. Wariancja. Średnia. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.
Miary położeia Średia Dla daych idywidualych: x = 1 x = 1 x i i ẋ i gdzie ẋ i środek i tego przedziału i - liczość i-tego przedziału Domiata moda Liczba ajczęściej występująca jeśli taka istieje - dla
Prawdopodobieństwo i statystyka r.
Zadaie 1 Rzucamy 4 kości do gry (uczciwe). Prawdopodobieństwo zdarzeia iż ajmiejsza uzyskaa a pojedyczej kości liczba oczek wyiesie trzy (trzy oczka mogą wystąpić a więcej iż jedej kości) rówe jest: (A)
SIGMA KWADRAT LUBELSKI KONKURS STATYSTYCZNO- DEMOGRAFICZNY
SIGMA KWADRAT LUBELSKI KONKURS STATYSTYCZNO- DEMOGRAFICZNY Weryfikacja hipotez statystyczych WNIOSKOWANIE STATYSTYCZNE Wioskowaie statystycze, to proces uogóliaia wyików uzyskaych a podstawie próby a całą
Metrologia: miary dokładności. dr inż. Paweł Zalewski Akademia Morska w Szczecinie
Metrologia: miary dokładości dr iż. Paweł Zalewski Akademia Morska w Szczeciie Miary dokładości: Najczęściej rozkład pomiarów w serii wokół wartości średiej X jest rozkładem Gaussa: Prawdopodobieństwem,
COLLEGIUM MAZOVIA INNOWACYJNA SZKOŁA WYŻSZA WYDZIAŁ NAUK STOSOWANYCH. Kierunek: Finanse i rachunkowość. Robert Bąkowski Nr albumu: 9871
COLLEGIUM MAZOVIA INNOWACYJNA SZKOŁA WYŻSZA WYDZIAŁ NAUK STOSOWANYCH Kieruek: Fiase i rachukowość Robert Bąkowski Nr albumu: 9871 Projekt: Badaie statystycze cey baryłki ropy aftowej i wartości dolara
Statystyka matematyczna dla leśników
Statystyka matematycza dla leśików Wydział Leśy Kieruek leśictwo Studia Stacjoare I Stopia Rok akademicki 0/0 Wykład 5 Testy statystycze Ogóle zasady testowaia hipotez statystyczych, rodzaje hipotez, rodzaje
Elementy modelowania matematycznego
Elemety modelowaia matematyczego Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Modelowaie daych (ilościowe): Metody statystycze: estymacja parametrów modelu,
Twierdzenia graniczne:
Twierdzeia graicze: Tw. ierówośd Markowa Jeżeli P(X > 0) = 1 oraz EX 0: P X k 1 k EX. Tw. ierówośd Czebyszewa Jeżeli EX = m i 0 < σ = D X 0: P( X m tσ) 1 t. 1. Z partii towaru o wadliwości
ZBIEŻNOŚĆ CIĄGU ZMIENNYCH LOSOWYCH. TWIERDZENIA GRANICZNE
RACHUNEK PRAWDOPODOBIEŃSTWA WYKŁAD 8. ZBIEŻNOŚĆ CIĄGU ZMIENNYCH LOSOWYCH. TWIERDZENIA GRANICZNE 1 Zbieżość ciągu zmieych losowych z prawdopodobieństwem 1 (prawie apewo) Ciąg zmieych losowych (X ) jest
Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w
Zad Dae są astępujące macierze: A =, B, C, D, E 0. 0 = = = = 0 Wykoaj astępujące działaia: a) AB, BA, C+E, DE b) tr(a), tr(ed), tr(b) c) det(a), det(c), det(e) d) A -, C Jeśli działaia są iewykoale, to
d wymiarowy wektor losowy Niech (Ω, S, P) przestrzeń probabilistyczna Definicja Odwzorowanie X: Ω R nazywamy 1-wymiarowym wektorem
d wymiarowy wektor losowy Niech (Ω, S, P) przestrzeń probabilistycza Defiicja Odwzorowaie X: Ω R d azywamy d-wymiarowym wektorem losowym jeśli dla każdego (x 1, x 2,,x d ) є R d zbiór Uwaga {ω є Ω: X(ω)
n n X n = σ σ = n n n Ponieważ zmienna losowa standaryzowana ma rozkład normalny N(0, 1), więc
5.3. Zagadieia estymacji 87 Rozważmy teraz dokładiej zagadieie szacowaia wartości oczekiwaej m zmieej losowej X o rozkładzie ormalym N(m, F), w którym odchyleie stadardowe F jest zae. Niech X, X,..., X
Parametryczne Testy Istotności
Parametrycze Testy Istotości Wzory Parametrycze testy istotości schemat postępowaia pukt po pukcie Formułujemy hipotezę główą H odośie jakiegoś parametru w populacji geeralej Hipoteza H ma ajczęściej postać
Prawdopodobieństwo i statystyka r.
Zadaie. Wykoujemy rzuty symetryczą kością do gry do chwili uzyskaia drugiej szóstki. Niech Y ozacza zmieą losową rówą liczbie rzutów w których uzyskaliśmy ie wyiki iż szóstka a zmieą losową rówą liczbie
Testowanie hipotez. H 1 : µ 15 lub H 1 : µ < 15 lub H 1 : µ > 15
Testowaie hipotez ZałoŜeia będące przedmiotem weryfikacji azywamy hipotezami statystyczymi. KaŜde przypuszczeie ma swoją alteratywę. Jeśli postawimy hipotezę, Ŝe średica pia jedoroczych drzew owej odmiay
1 Testy statystyczne. 2 Rodzaje testów
1 Testy statystycze Podczas sprawdzaia hipotez statystyczych moga¾ wystapić ¾ dwa rodzaje b ¾edów. Prawdopodobieństwo b ¾edu polegajacego ¾ a odrzuceiu hipotezy zerowej (H 0 ), gdy jest oa prawdziwa, czyli
TESTY LOSOWOŚCI. Badanie losowości próby - test serii.
TESTY LOSOWOŚCI Badaie losowości próby - test serii. W wielu zagadieiach wioskowaia statystyczego istotym założeiem jest losowość próby. Prostym testem do weryfikacji tej własości jest test serii. 1 Dla
Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2
Wykład 5 Przedziały ufości Zwykle ie zamy parametrów populacji, p. Chcemy określić a ile dokładie y estymuje Kostruujemy przedział o środku y, i taki, że mamy 95% pewości, że zawiera o Nazywamy go 95%
Statystyka i rachunek prawdopodobieństwa
Statystyka i rachuek prawdopodobieństwa Filip A. Wudarski 22 maja 2013 1 Wstęp Defiicja 1. Statystyka matematycza opisuje i aalizuje zjawiska masowe przy użyciu metod rachuku prawdopodobieństwa. Defiicja
1 Twierdzenia o granicznym przejściu pod znakiem całki
1 Twierdzeia o graiczym przejściu pod zakiem całki Ozaczeia: R + = [0, ) R + = [0, ] (X, M, µ), gdzie M jest σ-ciałem podzbiorów X oraz µ: M R + - zbiór mierzaly, to zaczy M Twierdzeie 1.1. Jeżeli dae
Wokół testu Studenta 1. Wprowadzenie Rozkłady prawdopodobieństwa występujące w testowaniu hipotez dotyczących rozkładów normalnych
Wokół testu Studeta Wprowadzeie Rozkłady prawdopodobieństwa występujące w testowaiu hipotez dotyczących rozkładów ormalych Rozkład ormaly N(µ, σ, µ R, σ > 0 gęstość: f(x σ (x µ π e σ Niech a R \ {0}, b
STATYSTYKA I ANALIZA DANYCH
TATYTYKA I ANALIZA DANYCH Zad. Z pewej partii włókie weły wylosowao dwie próbki włókie, a w każdej z ich zmierzoo średicę włókie różymi metodami. Otrzymao astępujące wyiki: I próbka: 50; średia średica
Rozkłady statystyk z próby Twierdzenia graniczne
Rozkłady statystyk z róby Twierdzeia graicze PRÓBA LOSOWA Próbą losową rostą azyway ciąg -zieych losowych iezależych i osiadających jedakowe rozkłady takie jak rozkład zieej losowej w oulacji geeralej
Statystyka Wzory I. Analiza struktury
Uiwersytet Ekooiczy w Katowicach Wzory I. Aaliza struktury 1. Miary tedecji cetralej (średie, przecięte Średia arytetycza Dla sz. ważoego Dla sz. ważoego dla z. ciągłej Dla szeregu wyliczającego: dla zieej
ZDARZENIE ELEMENTARNE to możliwy wynik doświadczenia losowego. Wszystkie takie możliwe wyniki tworzą zbiór zdarzeń elementarnych.
STATYSTYKA to auka, której przedmiotem zaiteresowaia są metody pozyskiwaia i prezetacji, a przede wszystkim aalizy daych opisujących zjawiska masowe. Metody statystycze oparte są a rachuku prawdopodobieństwa.
Estymacja punktowa i przedziałowa
Estymacja puktowa i przedziałowa Marta Zalewska Zakład Profilaktyki Zagrożeń Środowiskowych i Alergologii Populacja Próba losowa (próbka) Parametry rozkładu Estymatory (statystyki) Własości estymatorów
Podstawowe pojęcia. Próba losowa. Badanie próby losowej
METODY PROBABILISTYCZNE I STATYSTYKA WYKŁAD 8: STATYSTYKA OPISOWA. ROZKŁADY PRAWDOPODOBIEŃSTWA WYSTĘPUJĄCE W STATYSTYCE. Małgorzata Krętowska Wydział Iforatyki Politechika Białostocka Podstawowe pojęcia
Statystyka w rozumieniu tego wykładu to zbiór metod służących pozyskiwaniu, prezentacji, analizie danych.
Statystyka w rozumieiu tego wykładu to zbiór metod służących pozyskiwaiu, prezetacji, aalizie daych. Celem geeralym stosowaia tych metod, jest otrzymywaie, a podstawie daych, użyteczych uogólioych iformacji
będą niezależnymi zmiennymi losowymi z rozkładu jednostajnego na przedziale ( 0,
Zadaie iech X, X,, X 6 będą iezależymi zmieymi losowymi z rozkładu jedostajego a przedziale ( 0, ), a Y, Y,, Y6 iezależymi zmieymi losowymi z rozkładu jedostajego a przedziale ( 0, ), gdzie, są iezaymi
Pojcie estymacji. Metody probabilistyczne i statystyka Wykład 9: Estymacja punktowa. Własnoci estymatorów. Rozkłady statystyk z próby.
Pojcie estymacji Metody probabilistycze i statystyka Wykład 9: Estymacja puktowa. Własoci estymatorów. Rozkłady statystyk z próby. Szacowaie wartoci parametrów lub rozkładu zmieej losowej w populacji geeralej
Statystyka opisowa. () Statystyka opisowa 24 maja / 8
Część I Statystyka opisowa () Statystyka opisowa 24 maja 2010 1 / 8 Niech x 1, x 2,..., x będą wyikami pomiarów, p. temperatury, ciśieia, poziomu rzeki, wielkości ploów itp. Przykład 1: wyiki pomiarów
ZMIENNA LOSOWA I JEJ PARAMETRY -powtórzenie
WNIOSKOWANIE STATYSTYCZNE ZMIENNA LOSOWA I JEJ PARAMETRY -powtórzeie,, S P przestrzeń probabilistycza (matematyczy model zjawiska losowego), zbiór wszystkich zdarzeń elemetarych, S zbiór zdarzeń, (podzbiory
Estymatory nieobciążone o minimalnej wariancji
Estymatory ieobciążoe o miimalej wariacji Model statystyczy (X, {P θ, θ Θ}); g : Θ R 1 Zadaie: oszacować iezaą wartość g(θ) Wybrać takie δ(x 1, X 2,, X ) by ( θ Θ) ieobciążoość E θ δ(x 1, X 2,, X ) = g(θ)
1 Przedziały ufności. ). Obliczamy. gdzie S pochodzi z rozkładu B(n, 1 2. P(2 S n 2) = 1 P(S 2) P(S n 2) = 1 2( 2 n +n2 n +2 n ) = 1 (n 2 +n+2)2 n.
Przedziały ufości W tym rozdziale będziemy zajmować się przede wszystkim zadaiami związaymi z przedziałami ufości Będą as rówież iteresować statystki pozycyje oraz estymatory ajwiększej wiarygodości (Eg
L.Kowalski zadania ze statystyki matematycznej-zestaw 3 ZADANIA - ZESTAW 3
L.Kowalski zadaia ze statystyki matematyczej-zestaw 3 ZADANIA - ZESTAW 3 Zadaie 3. Cecha X populacji ma rozkład N m,. Z populacji tej pobrao próbę 7 elemetową i otrzymao wyiki x7 = 9, 3, s7 =, 5 a Na poziomie
Modele tendencji rozwojowej STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 18 listopada 2017
STATYSTYKA OPISOWA Dr Alia Gleska Istytut Matematyki WE PP 18 listopada 2017 1 Metoda aalitycza Metoda aalitycza przyjmujemy założeie, że zmiay zjawiska w czasie moża przedstawić jako fukcję zmieej czasowej
Niezależność zmiennych, funkcje i charakterystyki wektora losowego, centralne twierdzenia graniczne
Wykład 4 Niezależość zmieych, fukcje i charakterystyki wektora losowego, cetrale twierdzeia graicze Dr Joaa Baaś Zakład Badań Systemowych Istytut Sztuczej Iteligecji i Metod Matematyczych Wydział Iformatyki
PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH
PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH POMIAR FIZYCZNY Pomiar bezpośredi to doświadczeie, w którym przy pomocy odpowiedich przyrządów mierzymy (tj. porówujemy
2.1. Studium przypadku 1
Uogóliaie wyików Filip Chybalski.. Studium przypadku Opis problemu Przedsiębiorstwo ŚRUBEX zajmuje się produkcją wyrobów metalowych i w jego szerokim asortymecie domiują różego rodzaju śrubki i wkręty.
Statystyka opisowa - dodatek
Statystyka opisowa - dodatek. *Jak obliczyć statystyki opisowe w dużych daych? Liczeie statystyk opisowych w dużych daych może sprawiać problemy. Dla przykładu zauważmy, że aiwa implemetacja średiej arytmetyczej
Kurs Prawdopodobieństwo Wzory
Kurs Prawdoodobieństwo Wzory Elemety kombiatoryki Klasycza deiicja rawdoodobieństwa gdzie: A - liczba zdarzeń srzyjających A - liczba wszystkich zdarzeń P A Tel. 603 088 74 Prawdoodobieństwo deiicja Kołmogorowa
Komputerowa analiza danych doświadczalnych
Komputerowa aaliza daych doświadczalych Wykład 7 8.04.06 dr iż. Łukasz Graczykowski lgraczyk@if.pw.edu.pl Semestr leti 05/06 Cetrale twierdzeie graicze - przypomieie Sploty Pobieraie próby, estymatory
1 Zmienne losowe. Własności dystrybuanty F (x) = P (X < x): F1. 0 F (x) 1 dla każdego x R, F2. lim F (x) = 0 oraz lim F (x) = 1,
1 Zmiee loowe Właości dytrybuaty F x = X < x: F1. 0 F x 1 dla każdego x R, F2. lim F x = 0 oraz lim F x = 1, x x + F3. F jet fukcją iemalejącą, F4. lim x x 0 F x = F x 0 dla każdego x R, F5. a X < b =
Ćwiczenia nr 5. TEMATYKA: Regresja liniowa dla prostej i płaszczyzny
TEMATYKA: Regresja liiowa dla prostej i płaszczyzy Ćwiczeia r 5 DEFINICJE: Regresja: metoda statystycza pozwalająca a badaie związku pomiędzy wielkościami daych i przewidywaie a tej podstawie iezaych wartości
Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl
Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl Wprowadzenie Podstawowe cele analizy zbiorów danych Uogólniony opis poszczególnych