STATYSTYKA: MATERIAŁY POMOCNICZE DO ZAJĘĆ

Wielkość: px
Rozpocząć pokaz od strony:

Download "STATYSTYKA: MATERIAŁY POMOCNICZE DO ZAJĘĆ"

Transkrypt

1 Dr hab. Adam Szulc, prof. SGH Instytut Statystyk Demograf STATYSTYKA: MATERIAŁY POMOCNICZE DO ZAJĘĆ Motto I: Prawe każdy jest statystykem ale newelu o tym we (nspratorzy: Moler Joseph Schumpeter) Motto II: Statystyka jest bodajże ostatnm relktem mstyk dna codzennego (Stansław Lem) Motto III: In God we trust. All others must brng data (z nternetu) Motto IV: Żadnej sprawedlwośc ne ma być ne może - dobrze, że jest statystyka - z tego trzeba sę ceszyć (z Szewców Wtkacego)

2 Sps treśc I. STATYSTYKA: PRZEDMIOT I METODY Przykłady zastosowań statystyk Zakres statystyk... 3 II. ROZKŁAD ZMIENNEJ LOSOWEJ I JEGO PARAMETRY Rozkład zmennej losowej Wyznaczane funkcj prawdopodobeństwa Wykorzystane parametrów rozkładu zmennej losowej... 5 III. WYBRANE ROZKŁADY I ICH ZASTOSOWANIE Rozkład dwumanowy Rozkład normalny IV. ROZKŁADY GRANICZNE... 7 V. ESTYMACJA PARAMETRÓW Estymacja przedzałowa Przykłady przedzałów ufnośc VI. TESTOWANIE HIPOTEZ STATYSTYCZNYCH VII. BADANIE ZALEŻNOŚCI (WSPÓŁWYSTĘPOWANIA) ZJAWISK Wprowadzene Przykład Badane sły zależność Testowane hpotez o nezależnośc VIII. MODEL REGRESJI LINIOWEJ Z JEDNĄ ZMIENNĄ Podstawowy pomysł Interpretacja parametrów Ocena ("jakośc") oszacowana modelu ex post IX. ANALIZA TRENDU I WAHAŃ OKRESOWYCH Problem Najprostsze metody dekompozycj IX. INDEKSY Aneks: Najkrótsze wprowadzene do rachunku prawdopodobeństwa ZADANIA ZMIENNA LOSOWA I JEJ ROZKŁAD STATYSTYKA OPISOWA ROZKŁAD DWUMIANOWY. TWIERDZENIA GRANICZNE ROZKŁAD NORMALNY. ROZKŁADY STATYSTYK Z PRÓBY ESTYMACJA PARAMETRÓW. TESTY STATYSTYCZNE ANALIZA WARIANCJI. BADANIE ZALEŻNOŚCI ZMIENNYCH MODELE REGRESJI LINIOWEJ I SZEREGI CZASOWE INDEKSY ZADANIA DLA DOCIEKLIWYCH PRZYKŁADOWE ZADANIA EGZAMINACYJNE Z POPRZEDNICH LAT

3 I. STATYSTYKA: PRZEDMIOT I METODY 1. Przykłady zastosowań statystyk 1. W codzennym życu: podejmowane decyzj (np. o zakupe) po zebranu opn nnych osób, dzałalność bur matrymonalnych, ludowe przepowedne pogody, wybór wykładowcy na uczeln. 2. W ekonom zarządzanu: weryfkacja teor ekonomcznych, ustalane stawk ubezpeczenowej, przewdywane zachowań konsumentów, badane czynnków wzrostu ekonomcznego. 3. W tzw. życu publcznym: sondaże opn, komunkaty o stane gospodark (zmany PKB, produkcj, pozom nflacj tp.) warunkach życa ludnośc. 4. Inne: fltry antyspamowe, testy urządzeń, eksperymenty medyczne rolncze. 2. Zakres statystyk W szerszym znaczenu obejmuje zberane danych, ch przetwarzane oraz (ewentualne) publkowane. Statystyk może być tylko producentem danych, tylko ch użytkownkem lub jednym drugm. Wykład na studum lcencjackm jest adresowany przede wszystkm do użytkownków koncentruje sę na przetwarzanu wykorzystanu surowych danych. Praktycznym celem statystyk jest przede wszystkm dokonywane optymalnych wyborów w warunkach nepewnośc. Jest to możlwe dzęk powtarzalnośc zjawsk, choć w pojedynczych przypadkach może okazać sę zawodne. Ne ma lepszego narzędza formalnego opsu takego postępowana nż rachunek prawdopodobeństwa 1. Przedmot statystyk można przedstawć symbolczne w sposób następujący: POPULACJA GENERALNA próba losowa ops, wnoskowane populacja nelosowa ops Populacja generalna jest obektem badana. Z różnych względów (przede wszystkm z uwag na koszty) ne badamy jej w całośc lecz jedyne za pomocą losowo wybranej częśc czyl próby. Jeżel próba jest wylosowana poprawne dostateczne duża, to pownna dość dokładne odzwercedlać zjawska zachodzące w populacj generalnej. Przykładowo, losowa próba osób zapytanych na jaką partę będą głosować ma odzwercedlać preferencje poltyczne wszystkch uprawnonych do głosowana czyl populacj generalnej wyborców. 1 Podstawowe pojęca rachunku prawdopodobeństwa wykorzystywane podczas nnejszego wykładu przedstawone są na str

4 Podane rozkładu głosów w próbe charakterystyk głosujących (średn wek, lczba osób z wyższym wykształcenem tp.) wchodz w skład statystyk opsowej. Ustalene czy próba jest dostateczne lczna lub rozmarów błędów jest przykładem wnoskowana statystycznego. W przypadku gdy próba ne jest losowa, wnoskowane statystyczne ne jest możlwe. Pojęca odnoszące sę (umowne) do populacj generalnej to: prawdopodobeństwo, wartość oczekwana, teoretyczny rozkład zjawska. Odpowadające m pojęca w próbe to: częstość, średna, rozkład empryczny zjawska. Kluczowym narzędzem w statystyce jest zmenna losowa formalne zdefnowana jako funkcja określona na zborze zdarzeń elementarnych (por. str. 23). Innym słowy, oznacza ona przyporządkowane możlwym do zastnena zjawskom wartośc. Przykładowo, zmenną losową może być welkość dochodów na głowę w rodzne wśród Polaków czy lczba wyrzuconych kostką oczek podzelona przez 3. W przypadku zjawsk nemerzalnych (lczbowo), jak np. płeć, zdefnowane zmennej losowej równeż jest możlwe, (np. jako wartość 0 dla mężczyzn oraz 1 dla kobet) czasam pomocne, ale nekoneczne. Zmenną losową, a tym samym badane zjawsko, opsuje sę za pomocą funkcj prawdopodobeństwa (przyporządkowane wartoścom zmennej prawdopodobeństw ch wystąpena) /lub parametrów (pojedynczych lczb charakteryzujących rozkład prawdopodobeństwa). Problemy do przemyślena: 1. Anketer mał zebrać nformacje o stosowanu przez meszkańców Warszawy preparatów zołowych. W celu zwększena efektywnośc badana pytana zadawał wyłączne osobom wychodzącym ze sklepu sprzedającego take preparaty. Czy była to słuszna stratega? Czy może być ona skuteczna w pewnych sytuacjach? 2. Spośród osób, u których stwerdzono występowane choroby szalonych krów 98% jadło w przeszłośc wołownę. Czy fakt ten stanow (statystyczny) dowód zwązku mędzy jedzenem wołowny występowanem tej choroby? 3. Wynkom rzutu kostką (C - lczba oczek) przyporządkowano różne wartośc. a/ F(C) = C 2 1 gdy C parzyste b/ G ( C) C gdy C neparzyste c/ H(C) = 1 gdy C 2 d/ I(C) = 0 gdy C 1. Które z przyporządkowań tworzy zmenną losową? 4. 73% odpowadających na anketę Samorządu Studentów SGH uznało ją za potrzebną (Magel, styczeń 2005, str. 15). Czy stwerdzene, ż około 73% studentów SGH podzela to zdane jest uzasadnone? 5. Kto jest autorem stwerdzena Sprawedlwośc ne ma ne będze, węc ceszmy sę, że mamy przynajmnej statystykę? 4

5 II. ROZKŁAD ZMIENNEJ LOSOWEJ I JEGO PARAMETRY 1. Rozkład zmennej losowej Aby uzyskać pełny ops zmennej losowej (będącej modelem badanego zjawska) wystarczy podać jej wartośc odpowadające m prawdopodobeństwa 2. Ten zbór nformacj jest nazywany rozkładem zmennej losowej. Rozkład ten można przedstawć równoważne za pomocą funkcj, zwanej dystrybuantą, zdefnowanej następująco: F( x ) P( X x ) Wyznacza ona prawdopodobeństwo, że zmenna losowa ne przekroczy danej wartośc (x). 2. Wyznaczane funkcj prawdopodobeństwa W praktyce najczęścej ne dysponujemy rozkładem zmennej losowej. Funkcję prawdopodobeństwa czasam można wyznaczyć, dokładne lub w przyblżenu, posługując sę dedukcją (np. przy rzuce kostką), jednak najczęścej nezbędne jest wylosowane próby. Neznaną funkcję można wyznaczyć szacując (oblczając w przyblżenu) prawdopodobeństwo odpowadające każdej wartośc zmennej osobno, często jednak można to zrobć znając jedyne klasę funkcj oblczając wartość jednej lub wększej lczby pewnych stałych zwanych parametram rozkładu. Charakterystyk te wnny być oblczone na podstawe wszystkch elementów populacj generalnej, co w praktyce najczęścej ne jest możlwe. Szacowane ch wartośc na podstawe próby nos nazwę estymacj parametru (ów) rozkładu. Zagadnene to będze omawane szerzej w ramach wnoskowana statystycznego. 3. Wykorzystane parametrów rozkładu zmennej losowej W praktyce zazwyczaj ne dysponujemy rozkładem zmennej, a jedyne wartoścam lub (znaczne częścej) oszacowanam parametrów. Nawet jeżel ch znajomość ne pozwala odtworzyć pełnego rozkładu (jest to możlwe tylko dla nektórych ch typów), to umejętność ch nterpretacj pozwala ujrzeć najbardzej stotne cechy tego rozkładu. W welu przypadkach użytkownk jest zanteresowany jedyne wartoścam parametrów, z których najważnejsze to średna mernk zróżncowana zmennej. Parametry rozkładu można podzelć na: 1. Charakteryzujące tzw. tendencje centralną czyl, mówąc neformalne, najbardzej typowe wartośc: średna, medana, domnanta. 2. Charakteryzujące zróżncowane (dyspersję) zmennej: warancja, odchylene standardowe, współczynnk zmennośc. 3. Mary pozycyjne: kwantyle. 4. Charakterystyk kształtu rozkładu: współczynnk asymetr. 2 W przypadku zmennej cągłej z uwag na neskończene dużą lczbę tych wartośc podaje sę jedyne zakres zmennośc postać funkcj gęstośc prawdopodobeństwa. 5

6 4. Podstawowe parametry. 1. Średna (wartość oczekwana). Wyznacza przecętną wartość zmennej. 2. Warancja. Ocena rozrzut wartośc zmennej wokół średnej. 3. Odchylene standardowe jest oblczane jako perwastek kwadratowy z warancj. Jest równeż marą rozrzutu wartośc zmennej wokół średnej, w odróżnenu od warancj wyrażaną w takch samych jednostkach jak zmenna losowa. UWAGA: Popularna nterpretacja mówąca, że odchylene standardowe jest średnm odchylenem od średnej ne jest poprawne (gdyż odchylene to zawsze jest równe zero). 4. Współczynnk zmennośc jest oblczany jako stosunek odchylena standardowego do średnej. Pownen być stosowany zwłaszcza gdy chcemy porównywać zróżncowane dwóch zmennych o różnych wartoścach oczekwanych. 5. Medana jest welkoścą dzelącą populację na dwe częśc: co najmnej 50% elementów przyjmuje wartośc ne mnejsze od medany co najmnej 50% wartośc ne wększe. 6. Domnanta jest wartoścą zmennej występującą najczęścej. 7. Kwantyle rzędu 1/p oznaczają take welkośc, które dzelą populację na część, w której znajduje sę co najmnej 1/p elementów przyjmujących wartośc ne wększe nż ten kwantyl część, w której znajduje sę co najmnej 1-1/p elementów przyjmujących wartośc ne mnejsze nż ten kwantyl. Medana jest kwantylem rzędu ½. 8. Klasyczny współczynnk asymetr jest uzupełnającym mernkem pozwalającym ocenć kształt rozkładu. Np. jego dodatna wartość sugeruje, że dłuższa część rozkładu ( ogon ) znajduje sę po prawej strone. W przypadku rozkładów symetrycznych jest on równy zeru. 5. Użyteczne twerdzena o nektórych parametrach 1. Wartość oczekwana loczynu stałej zmennej losowej jest równa loczynow stałej wartośc oczekwanej zmennej. 2. Wartość oczekwana sumy zmennych jest równa sume wartośc oczekwanych. 3. Wartość oczekwana loczynu dwóch zmennych nezależnych jest równa loczynow wartośc oczekwanych. 4. Warancja stałej jest równa zeru. 5. Warancja loczynu stałej zmennej losowej jest równa loczynow kwadratu stałej warancj zmennej. 6. Warancja jest różncą mędzy średnm kwadratem kwadratem średnej. 7. Warancja sumy dwóch zmennych nezależnych jest równa sume ch warancj. Analogczne parametry twerdzena są zdefnowane dla próby. Problemy do przemyślena: 1. Czy prawdopodobeństwo, z jaką zmenna skokowa przyjmuje pewną wartość (x) w populacj generalnej jest parametrem? 2. Należy udowodnć, że dla każdej zmennej losowej o dowolnym rozkładze średne odchylene od wartośc oczekwanej wynos zero. 3. Należy podać praktyczny przykład sytuacj, w której znajomość średnej bez znajomośc warancj może wprowadzć w błąd. 6

7 III. WYBRANE ROZKŁADY I ICH ZASTOSOWANIE 1. Rozkład dwumanowy. Nech prawdopodobeństwo pewnego zdarzena (np. trafena do celu, wycągnęca losu, wypadku) wynos p. Zdarzene to będzemy nazywać sukcesem 3. Jeżel podejmujemy n prób odnesena sukcesu (n strzałów, losowań czy podejść do egzamnu), to prawdopodobeństwo odnesena k sukcesów (oczywśce k mus być neujemną lczbą całkowtą) wyznacza sę za pomocą następującego wzoru: P(X n! (n k)!k! k nk n k) p (1 p) Wartość oczekwana zmennej o tym rozkładze (czyl lczby sukcesów w n próbach) oraz jej warancja wynoszą, odpowedno: E(X) n p D 2 (X) n p (1 p) Aby wyznaczyć rozkład zmennej wystarczy zatem oszacować prawdopodobeństwo sukcesu, jako że lczbę prób ustalamy samodzelne. 2. Rozkład normalny. Znaczene tego rozkładu wynka co najmnej z trzech faktów: może być wykorzystany do opsywana rozkładu welu zjawsk naturalnych (cężar cała wzrost, loraz ntelgencj tp.), jest wykorzystywany w twerdzenach grancznych (patrz nżej), może być wykorzystany do opsywana rozkładu błędów losowych. Funkcje gęstośc tego rozkładu ten można jednoznaczne wyznaczyć za pomocą dwóch parametrów, których wartośc są równe wartośc oczekwanej zmennej o rozkładze normalnym (oznaczanej zwykle przez m) oraz jej odchylenu standardowemu (σ): f ( X ) 1 ( X m) exp Poneważ wyznaczene dokładnej dystrybuanty dla zmennej o rozkładze normalnym ne jest możlwe, w celu wyznaczena prawdopodobeństw stosuje sę funkcje przyblżające jej postać (są one wbudowane w wększość paketów statystycznych, a także stablcowane). 2 IV. ROZKŁADY GRANICZNE Zastosowane. W praktyce bardzo rzadko znany jest rozkład zmennej w populacj generalnej. Jeżel próba jest duża, to pewne statystyk z próby mają rozkład zblżony do pewnego znanego rozkładu 3 Choć nekoneczne mus być ono sukcesem w potocznym tego słowa znaczenu. 7

8 (w naszym przypadku najczęścej normalnego) nezależne od rozkładu zmennej w populacj. Rozkład takej statystyk nazywamy rozkładem grancznym. Perwszym hstoryczne twerdzenem o zbeżnośc rozkładu jest tzw. Prawo Welkch Lczb (Bernoullego): lm P n k n p 1, 0 Mów ono, że wraz ze zwększanem lczby prób w schemace Bernoullego częstość sukcesów zblża sę do prawdopodobeństwa sukcesu. Dzałane tego twerdzena można zaobserwować w praktyce: rzucając monetą klka razy, nerzadko uzyskujemy częstość orłów znaczne różnącą sę od 0,5 (nawet 0 lub 1), podczas gdy rzucając np. 200 razy prawe na pewno uzyskamy częstość zblżoną do 0,5. Twerdzene DeMovre a Laplace a: lm P n Xn n p n p(1 p) u ( u) gdze Xn jest zmenną o rozkładze dwumanowym o parametrach n p zaś Φ(u) oznacza dystrybuantę rozkładu normalnego standardowego. Twerdzene to mów, że standaryzowana (standaryzacja oznacza odjece wartośc oczekwanej podzelene przez odchylene standardowe) zmenna o rozkładze dwumanowym ma granczny rozkład normalny standardowy. Twerdzene Lndeberga Levy ego (tzw. centralne twerdzene granczne) jest uogólnenem powyższego (ma zastosowane do każdego rozkładu). Twerdzene to posługuje sę cągem zmennych nezależnych {X1, X2,..., Xn}, z których każda ma jednakową wartość oczekwaną (E) odchylene standardowe (D). Twerdzene to można węc zastosować w przypadku gdy z populacj losuje sę w sposób nezależny (ze zwracanem) n-elementową próbę. Każdy (-ty) wynk losowana traktuje sę jako wartość zmennej (X). n Xk n E k 1 lm P u ( u) n D n Twerdzene mów węc, że rozkładem grancznym dla statystyk po lewej strone nerównośc (standaryzowanej sumy zmennych) jest rozkład normalny standardowy. Wnosek z twerdzene Lndeberga Levy ego: Średna wartość elementów próby ma granczny rozkład N ( E, D / n). 8

9 D. Porer ( Intermedate Statstcs and Econometrcs str. 202) przedstawł następującą lustrację grafczną tego wnosku (T oznacza lczebność próby, a Δ średną w populacj). Każda kolumna oznacza nny rozkład (skokowy): w perwszym przypadku zmenna przyjmuje wartośc 2, 4 6, w drugm wartośc całkowte od 1 do 6, w trzecm wartośc 2, 4 6 z różnym prawdopodobeństwam. Wszystke rozkłady średnej z próby są zblżone do normalnego już przy 20 elementach. Problem do przemyślena: Proszę zapsać funkcję prawdopodobeństwa średnej z dwuelementowej próby dla każdego z rozkładów. V. ESTYMACJA PARAMETRÓW Estymacja (jeden z dwóch elementów wnoskowana statystycznego) oznacza oblczane przyblżonej wartośc parametrów w populacj generalnej na podstawe próby losowej. Przyblżene wartośc parametru (oszacowane) uzyskujemy za pomocą statystyk zwanej estymatorem. Wartość oszacowana praktyczne zawsze różn sę od wartośc parametru. Różncę tę nazywamy błędem losowym. 9

10 Przykłady: a/ średna wartość zmennej w próbe jest estymatorem średnej w populacj generalnej (np. na podstawe średnej wartośc dochodu w GUS-owskej próbe gospodarstw domowych wnoskujemy o średnej dla kraju czy danej grupy społecznej). b/ odsetek wyróżnonych elementów w próbe jest estymatorem odsetka wyróżnonych elementów w populacj generalnej (np. na podstawe odsetka osób deklarujących w sondażu udzał w wyborach wnoskujemy o odsetku w kraju). Wybór estymatora: Wybór właścwego estymatora pownen być on dokonywany przy użycu technk analzy błędów losowych, tak aby estymator spełnał jak najwęcej z ponższych kryterów. 1. Neobcążoność: wartość oczekwana estymatora jest równa wartośc parametru (np. warancja próby jest obcążonym estymatorem warancj w populacj generalnej). Innym słowy, wartość oczekwana błędu wnna być równa zeru. 2. Zgodność: błąd estymacj można dowolne zmnejszać, zwększając lczebność próby. 3. Efektywność: warancja estymatora jest jak najmnejsza (warancja neobcążonego estymatora pozwala ocenć wartość błędu losowego popełnanego przy estymacj: m wyższa warancja, tym wyższy błąd). 1. Estymacja przedzałowa Oblczając wartość oszacowana (czyl dokonując estymacj punktowej) mamy praktyczne zerową szansę na znalezene dokładnej wartośc parametru. Z tego względu zamast stwerdzać na podstawe próby, że np. 45% gospodarstw domowych w Polsce posada samochód, należałoby użyć określena około 45%. Jest ono jednak neprecyzyjne. Estymacja przedzałowa ma na celu wyznaczene przedzału (zwanego przedzałem ufnośc), w którym prawdopodobne znajdze sę parametr. Przedzał ten jest wyznaczany tak, aby z założonym prawdopodobeństwem 1-α (zwanym ufnoścą) objął on neznany parametr: P f ( Tn) g( Tn) 1 gdze Tn Θ oznaczają, odpowedno, wartość oszacowana parametr, zaś f g są funkcjam. 1-α pownna być lczbą blską jednośc (zwykle wynos 0,95 lub 0,90) lecz przyjęce zbyt wysokego pozomu ufnośc spraw, że przedzał będze bardzo dług, a przez to bezużyteczny. Uwaga: Często popełnanym po wyznaczenu przedzału błędem jest stwerdzene, ż z prawdopodobeństwem 1-α obejmuje on wartość parametru. Ne ma ono sensu, gdyż zarówno końce przedzału po wylosowanu próby jak parametr są stałym. O prawdopodobeństwe można mówć jedyne w odnesenu do wartośc zmennej losowej czyl w tym przypadku estymatora Tn wyznaczającego końce przedzału. Poprawna (choć ne jedyna) nterpretacj mów, ż 1-α oznacza prawdopodobeństwo (częstość), z jakm wyznaczane w ten sposób przedzały obejmują parametr. 2. Przykłady przedzałów ufnośc 1. Dla wartośc oczekwanej (m) przy normalnym rozkładze zmennej: P X S( X ) S( X ) t m X t 1 n 1 n 1 10

11 gdze n jest lczebnoścą próby, zaś tα jest wyznaczone tak, aby zmenna o rozkładze t- Studenta znalazła sę w przedzale (-tα, tα) z prawdopodobeństwem 1-α. 2. Dla prawdopodobeństwa (p) w populacj generalnej (duża próba): (1 ) (1 ) P w u w p w u w 1 n w n w gdze w jest odsetkem oblczonym na podstawe próby o lczebnośc n, zaś zmenna o rozkładze normalnym, standardowym znajduje sę w przedzale (-uα, uα) z prawdopodobeństwem 1-α. Problemy do przemyślena: Co może oznaczać tzw. błąd statystyczny 3% podawany przy omówenach sondaży opn publcznej? Czy jego wartość zależy od (przykładowo) rzeczywstego poparca dla danej part? Jeżel tak, to czy rośne on czy maleje wraz ze wzrostem poparca? VI. TESTOWANIE HIPOTEZ STATYSTYCZNYCH Złota myśl (oparta na przekonanu ne tylko o matematycznych, ale zdroworozsądkowych korzenach statystyk): testy 4 pokazują, że nawet wyrafnowane metody statystyczne są oparte na powszechne przyjętych zasadach. Przykładowo, jeżel reklama mów, że w 20% czekoladek XX można znaleźć nespodzankę, to sprawdzanem (testem) takej opn (hpotezy) jest zakup pewnej lczby czekoladek. Gdy procent nespodzanek znaczne odbega od 20, uznaje sę reklamę za neprawdzwą, choć należy też dopuścć możlwość, że próba była wyjątkowo nereprezentatywna. Ta ostatna sytuacja taka jest tym bardzej prawdopodobna, m mnejsza jest próba. Testy statystyczne służą do weryfkacj hpotez o wartośc parametrów w populacj (testy parametryczne) lub o type rozkładu zmennej w populacj (testy zgodnośc). Przykład testu (parametrycznego) wartośc oczekwanej: Interesuje nas czy średna w populacj generalnej wynos m1 (np. czy średne zużyce palwa przez samochód YY wynos 8 ltrów/100 km). Hpotezę tę (tzw. hpotezę zerową) zapsuje sę: H0 : E(X) = m1 Jeżel H0 jest neprawdzwa, to spełnona mus być hpoteza alternatywna 5 H1 : E(X) m1 4 Drug, po estymacj parametrów, element wnoskowana statystycznego 5 Od postac hpotezy alternatywnej zależy dalsze postępowane; występuje ona równeż w forme: H 1 : E(X) > m 1 lub H 1 : E(X) < m 1. Przyjęce takej wersj hpotezy alternatywnej wymaga dodatkowej wedzy o rozkładze lub założeń. 11

12 W celu weryfkacj hpotezy losujemy próbę n-elementową z populacj generalnej (np. 50 samochodów YY). Jeżel hpoteza zerowa jest prawdzwa, to średna z próby (czyl średne zużyce palwa przez te 50 samochodów) pownna meścć sę z określonym z góry prawdopodobeństwem (np. 0,95) w pewnym obszarze wokół hpotetycznej średnej m 1 (patrz: lewa strona równana 1). Zamast wyznaczać ten obszar wygodnej jest wyznaczyć nny obszar, w którym z takm samym prawdopodobeństwem pownna znaleźć sę średna wystandaryzowana): X m 1 X [ m a; m a) P [ u ; ] 1 P 1 1 u (1) / n Jeżel hpoteza zerowa jest prawdzwa a rozkład zmennej jest normalny z odchylenem standardowym σ, to wystandaryzowana zmenna: u n X m1 (2) / n (zwana statystyką testową) znajdze sę z prawdopodobeństwem α (jest to tzw. pozom stotnośc testu) poza obszarem [-uα; uα] (w tzw. obszarze krytycznym). Jeżel take zdarzene nastąp, to uznaje sę hpotezę zerową za neprawdzwą. Istneje też jednak możlwość, że nastąpło mało prawdopodobne zdarzene - przy prawdzwośc hpotezy zerowej statystyka testowa znalazła sę w obszarze krytycznym (zdarzene to nazywamy błędem perwszego rodzaju). Poneważ ne wadomo, które z powyższych dwóch zdarzeń naprawdę zaszło, to prawdopodobeństwo takego błędu (α) należy ustalać na nskm (zwykle 0,05 lub 0,1 czyl tak aby prawdopodobeństwo po prawej strone równana 1 wynosło 0,95 lub 0,9). Analza warancj (ANOVA) jest szczególnym testem hpotezy o równośc średnch, gdyż pozwala badać jednocześne równość węcej nż dwóch średnch. Tym samym można go potraktować równeż jako test zależnośc (choć nedoskonały patrz problem do przemyślena ponżej) medzy dwema zmennym: tą, dla której oblczamy średne zmenną sprawającą, że badana jednostka należy do jednej z porównywanych populacj. Przykładowo, porównując średne zarobk w trzech grupach według pozomu wykształcena badamy jednocześne zależność mędzy zarobkam wykształcenem. Aby móc posługwać sę analzą warancj, należy sprawdzć czy dane spełnają następujące założena: badana zmenna ma rozkład normalny warancja tej zmennej we wszystkch badanych populacjach jest jednakowa Ponadto wymaga sę aby z każdej populacj próby były losowane nezależne od sebe. 12

13 Ogólna dea analzy warancj polega na porównanu zróżncowana średnch pomędzy grupam (SSB; stosuje sę też oznaczena SSTR, a w polskej lteraturze SKM) wewnątrz grup (SSE; w polskej lteraturze także SKW). Jeżel zróżncowane mędzygrupowe jest duże w porównanu ze zróżncowanem wewnątrzgrupowym, to uznajemy że zmenna klasyfkująca ma wpływ na zmenną badaną. Przez duże zróżncowane należy rozumeć taką jego wartość, która sprawa, ze statystyka testowa znajdze sę w obszarze odrzuceń. Przykład 1 (lustrujący ogólną flozofę analzy warancj) Jeżel w Sejme odbywa sę głosowane nad jakmś projektem zróżncowane głosów pomędzy partam jest duże, a wewnątrzpartyjne małe, oznacza to, że przynależność partyjna ma wpływ na to jak posłowe głosują. Przykładu ne można traktować jako dosłowną lustrację analzy warancj, poneważ badana zmenna jest jakoścowa. Przykład 2 (możlwość zastosowana analzy warancj) Jeżel na średną ocenę 6 studentów III roku SGH ne wpływa mejsce zameszkana (np.: akademk, wynajęte meszkane, wynajęty pokój, przy rodzne), to zróżncowane średnch ocen w ramach jednego rodzaju zameszkana pownno być duże w porównanu ze zróżncowanem pomędzy tym rodzajam. Śwadczy ono bowem o tym, że na średną ocenę stotnejszy wpływ mają nne neuwzględnone czynnk, objawające sę zróżncowanem wewnątrzgrupowym. W modelu ANOVA wartość zmennej yj (-ta wartość w j-tej grupe; =1,...nj; j=1,...,r) można przedstawć następująco: y m a e j j j gdze m oznacza średną w całej populacj, aj odchylene od m spowodowane dzałanem zmennej klasyfkującej (X) zaś ej odchylene losowe o zerowej wartośc oczekwanej. Hpotezy można zapsać na dwa sposoby. lub H H H H :, j m :, j m :, j a :, j a m m 0 0 j j Oba zapsy oznaczają, że wszystke średne w r grupach są jednakowe że zróżncowane jest spowodowane jedyne czynnkam losowym, zwązanym z faktem, ze badana jest tylko próba, a ne cała populacja. ANOVA wykorzystuje równość warancyjną, zgodne z którą łączne zróżncowane zmennej badanej Y (SST) jest sumą zróżncowana mędzygrupowego (SSB) spowodowanego zmenną klasyfkującą oraz wewnątrzgrupowego (SSE) spowodowanego czynnkam losowym. Statystyka testowa ma postać następującego lorazu warancj: SSB / r 1 F SSE / n r gdze n oznacza łączną lczebność próby zaś r lczbę klas dla zmennej X. 6 Którą w przyblżenu można potraktować jako zmenną cągłą; normalność rozkładu pownna być testowana. 13

14 Powyższa statystyka ma rozkład F z (r-1/n-r) stopnam swobody przyjmuje tym wększą wartość m wększe jest SSB w porównanu z SSE. Zatem jeżel przekroczy ona wartość krytyczną właścwą dla rozkładu Fr 1 / nr, to należy odrzucć hpotezę zerową na korzyść hpotezy alternatywnej. Można wtedy stwerdzć (z odpowednm ryzykem błędu I rodzaju), że przynajmnej dwe średne w grupach różną sę od sebe, co z kole oznacza wpływ zmennej klasyfkującej X na zmenną badaną Y. Do przemyślena: Proszę podać przykład rozkładu w którym zmenne są zależne ale średne warunkowe są równe (lczebność lczba kategor dowolna). Co wykaże ANOVA? VII. BADANIE ZALEŻNOŚCI (WSPÓŁWYSTĘPOWANIA) ZJAWISK 1. Wprowadzene Cel: Prognozowane jednych zjawsk na podstawe drugch (np. prawdopodobeństwa spowodowana wypadku przez kerowcę na podstawe jego weku, płc stażu ). Znalezene czynnków wpływających na zjawska (choroby, wzrost gospodarczy tp.) Podobne jak w poprzednm semestrze zasadnczym narzędzem badana jest zmenna losowa, tym razem dwuwymarowa. Zależność medzy zjawskam (najczęścej modelowanym za pomocą zmennych, w szczególnośc zmennych losowych) można czasam ocenać na podstawe wykresów lub tablc lecz najczęścej należy oblczyć wartośc odpowednch mernków, a także wykonać testy (tym razem hpotez o nezależnośc zmennych). W perwszym przypadku celem jest ustalene sły zjawska, w drugm stwerdzene czy na podstawe wynku uzyskanego za pomocą próby losowej można wnoskować o stnenu jakejkolwek zależnośc w populacj generalnej. 2. Przykład Cecha X to zachowane nflacj: ponżej oczekwań lub powyżej oczekwań. Cecha Y to zmana ndeksu gełdowego po ogłoszenu komunkatu o nflacj: wzrost, spadek, bez zman. Dla wygody można tym sytuacjom przypsać (arbtralne) wartośc, np. (0, 1) dla X (1, 0, -1) dla Y. Jeżel np. dla X=0 obserwujemy skupene wartośc Y wokół -1, zaś dla X=1 wokół wartośc 1, oznacza to slną zależność mędzy zjawskam. Podobne twerdzmy w przypadku rozkładu odwrotnego, tzn. dla X=0 Y skupają sę wokół 1 td. ( odwrotność w przypadku cech nemerzalnych można opsać jedyne słowam, np.: nflacj powyżej oczekwań częścej towarzyszą spadk ndeksu ). Jeżel natomast wartośc Y mają dentyczny (podobny) rozkład dla każdej wartośc X, to śwadczy to o braku (o słabej) zależnośc. 14

15 4. NARZĘDZIA OPISU Tablca korelacyjna czyl dwuwymarowy szereg rozdzelczy (ne jest koneczna, ale bardzo pomocna). Rozkłady brzegowe opsywane przez (dobrze już znane) jednowymarowe szereg rozdzelcze. Rozkłady warunkowe czyl rozkłady jednej ze zmennych przy warunku (np. X=x lub Y=y j ) narzuconym na druga zmenną. Wyznacza sę je na podstawe wzoru: P(Y=yj X=x) = P[(Y=yj) (X=x)]/P(X=x) = pj/p. Przy nezależnośc zmennych wszystke rozkłady warunkowe są jednakowe. Jest to zgodne ne tylko z defncją nezależnośc zmennych 7 lecz równeż z ntucją. Jeżel np. rozkład osób według wykształcena jest jednakowy wśród zwolennków, przecwnków ne mających zdana na temat udzału Polsk w wojne w Iraku, to wększość (myślących) osób uzna, że wykształcene ne ma wpływu na pogląd w tej sprawe. 3. Badane sły zależnośc Możlwe jest ne tylko w przypadku gdy cechy są merzalne, choć nektóre z ponższych mernków wymagają tego warunku. W polskej lteraturze rozróżna sę zależność korelację zmennych 8, przy czym korelacja jest szczególnym przypadkem zależnośc, jednak korelacja lnowa ne jest (wbrew nazwe) szczególnym przypadkem korelacj. Współczynnk korelacj lnowej (Pearsona) pozwala m. n. stwerdzć czy mędzy zmennym występuje lnowa zależność funkcyjna czyl czy wartość jednej zmennej jednoznaczne determnuje wartość drugej czy zależność ta ma postać lnową. Jeżel tak, to współczynnk ten przyjmuje wartość 1 lub -1. Im jego wartość jest blższa zeru, tym (ewentualna) zależność jest bardzej odległa od lnowej. Oblczene WKL wymaga, aby obe cechy były merzalne. Stosunek korelacyjny (Pearsona) lub wskaźnk korelacyjny pozwala stwerdzć brak korelacj (wartość 0) lub jej obecność (wartośc dodatne). Brak korelacj oznacza, że wszystke rozkłady warunkowe mają jednakowe wartośc oczekwane (czyl z braku zależnośc, który mplkuje dentyczność rozkładów warunkowych, wynka brak korelacj lecz ne odwrotne). SK wymaga, aby co najmnej jedna cecha była merzalna. Współczynnk zbeżnośc (Cramera) jest najbardzej unwersalny: może być stosowany dla obu cech nemerzalnych. Przyjmuje wartość 1 w przypadku zależnośc determnstycznej (np. funkcyjnej, gdy obe cechy są merzalne) 0 w przypadku braku zależnośc. Współczynnk korelacj rang (Spearmana) pozwala oblczyć słę zależnośc jedyne na podstawe uporządkowana badanych cech (które ne muszą być merzalne) - jest ona tym slnejsza, m bardzej uporządkowane jednej wpływa na uporządkowane drugej. Współczynnk ten przyjmuje wartośc z takego samego zakresu jak WKL. 4. Testowane hpotez o nezależnośc Dla każdego z wymenonych powyżej mernków można skonstruować test, w którym hpoteza zerowa mów o braku zależnośc lub korelacj czyl o zerowej wartośc stosownego 7 Zadane: proszę sprawdzć to za pomocą wzoru. 8 W lteraturze anglojęzycznej w zasadze ne stosuje sę tego rozróżnena. 15

16 mernka. Warto też dodać, że w analze warancj statystyka testowa jest tożsama ze statystyką stosunku korelacyjnego. Hpotezę zerową w jej przypadku (o równośc średnch) można nterpretować jako hpotezę o braku korelacj mędzy dwema zmennym. Problemy do przemyślena: 1. Pewna blondynka unkała latana samolotem z uwag na możlwość podłożena bomby przez terrorystę, wedząc że prawdopodobeństwo takego zdarzena wynos 0, Po pewnym czase jednak znalazła sposób jak nemal bez obawy korzystać z samolotów. Prawdopodobeństwo, ż na pokładze znajdą sę dwe bomby wynos (0,000001) 2, jest zatem na tyle małe, że może być zaakceptowane nawet przez najbardzej ostrożną osobę. Nasza blondynka zaberała węc zawsze własną bombę do samolotu. W swom mnemanu redukowała tym samym prawdopodobeństwo podłożena bomby przez terrorystę, bo byłaby to druga bomba, zaś prawdopodobeństwo znalezena sę dwóch bomb na pokładze wynos (0,000001) 2. Czy powyższe rozumowane jest poprawne? Na pytane należy odpowedzeć posługując sę pojęcam z zakresu rachunku prawdopodobeństwa. 2. Dane statystyczne ne pozostawają wątplwośc (...) w USA w stanach, w których wykonuje sę karę śmerc wskaźnk zabójstw są od 48 do 101 procent wyższe nż w tych, które je znosły (Ameryka nad Wsłą, podtytuł: Surowe kary ne gwarantują wększego bezpeczeństwa, Rzeczpospolta) Czy powyższe fakty stotne wskazują, że stosowane kary śmerc ne powoduje przecętne zmnejszena lczby zabójstw (a nawet ją zwększa)? VIII. MODEL REGRESJI LINIOWEJ Z JEDNĄ ZMIENNĄ 1. Podstawowy pomysł Jeżel Y jest zależna od X, to Y można w przyblżenu przedstawć jako funkcję f(x) w celu: - prognozowana wartośc Y, - opsana kształtu zależnośc medzy X Y (np. w modelach ekonomcznych). Funkcję f(x) nazywa sę funkcją regresj (Y względem X). Zakładając jej lnowość (co najczęścej będzemy robć w ramach kursu) można oszacować jej parametry (dwa) według ponższych zasad. Parametry funkcj αx+β są oszacowane tak, aby mnmalzowały sumę kwadratów odchyleń 9 wartośc emprycznych zmennej Y (y) od wartośc funkcj ax + b, zwanych (nezbyt precyzyjne) wartoścam teoretycznym. Wtedy: cov( X, Y) a oraz b Y ax (1) 2 S ( X ) 9 Stąd nazwa metody wyznaczana oszacowań α β: metoda najmnejszych kwadratów 16

17 Y y E(Y X=x) ε e α1x+ α0 a1x+ a0 x X Rys. 1 Model regresj lnowej (punkt empryczny, funkcja regresj w populacj jej oszacowane) 2. Formalny zaps modelu y x ε ( 1,2,...,n) (2) gdze ε jest tzw. resztą (zwaną też, nezbyt fortunne, składnkem losowym ). Alternatywny zaps modelu regresj to: E ( Y X x ) x (3) Funkcja regresj wyznacza w tym przypadku warunkową wartość oczekwaną zmennej Y (tzw. objaśnanej), pod warunkem, że zmenna X (tzw. objaśnająca) przyjęła wartośc X. Modele zapsane za pomocą równań (2) (3) są równoważne jeżel jest spełnony warunek: E ( ε X) 0 (4) Jeżel dodatkowo zachodz: 2 E ( εε' X) I (5) (gdze I jest macerzą dagonalną z wartoścam 1 na przekątnej ), to estymatory parametrów funkcj uzyskane za pomocą równana (1) są neobcążone, zgodne najefektywnejsze. Take same warunk spełna wtedy też estymator warunkowej wartośc oczekwanej Y przedstawony przez równane (3). 3. Interpretacja parametrów. Jeżel zmenna X zmena sę o jednostkę, to zmenna Y zmena sę średno o α jednostek. Parametr β mów le wynos średna wartość Y, jeżel X=0. 17

18 f(y X) lub f(y,x) Y N(α1xn+α0,σ 2 ) α1x+α0 (x2,y2) (xn,yn) (x 1,y 1 ) x1 x2... xn X Rys. 2 Założena modelu regresj lnowej z jedną zmenną objaśnającą 4. Ocena ("jakośc") oszacowana modelu ex post. 1. Sprawdzene czy reszty modelu spełnają założena (m. n. test autokorelacj, np. Durbna -Watsona test jednorodnośc warancj, np. Goldfelda Quandta). 2. Test stotnośc: sprawdzene czy błąd standardowy oszacowana parametrów ne jest zbyt duży w stosunku do wartośc oszacowana (statystyka t-studenta). 3. Mernk dopasowana modelu: sprawdzene jak bardzo empryczne wartośc Y odchylają sę od teoretycznych. Do oceny służy współczynnk determnacj R 2. Przykłady: 1. Na podstawe badana obejmującego 1000 osób oszacowano model zależnośc dochodu mesęcznego (Y) od wykształcena wyrażanego lczbą ukończonych klas/lat studów (X): y x 2. Obserwując samochód przez 25 mesęcy oszacowano model zależnośc zużytej benzyny w cągu mesąca(y) od lczby przejechanych klometrów (X): y 0,08 0, 20 x Problemy do przemyślena: 1. Interpretacja parametrów model oraz wartośc prognoz oblczonych dla X=12 (perwszy model) X=800 (drug model). 2. W którym modelu należy oczekwać wyższego współczynnka determnacj (R 2 ). 18

19 IX. ANALIZA 10 TRENDU I WAHAŃ OKRESOWYCH Szereg czasowy to dane o zjawsku zberane w kolejnych momentach lub okresach. Analza szeregów czasowych polega na modelowanu zmennośc tego zjawska w czase. 1. Problem Na zmenność zjawsk w czase wpływają równocześne: trend (wzrostowy, spadkowy, zmenny), wahana regularne zwane równeż okresowym (kwartalne, dzenne tp.) oraz wahana przypadkowe (np. powódź, bankructwo spółk gełdowej, moda). Prezentacja trendów oraz prognozowane wartośc zmennej wymaga przynajmnej oddzelena czystego trendu od wahań regularnych (dekompozycj szeregu czasowego) Najprostsze metody dekompozycj Można wyróżnć metody dwustopnowe (prostsze) równoczesne. W perwszym przypadku najperw wyznacza sę funkcję trendu (dokonuje wygładzena szeregu) pozbawoną wahań regularnych, następne porównuje wartośc szeregu czasowego z funkcją trendu. Średne odchylene uznaje sę za wskaźnk wahań regularnych. W drugm przypadku można np. oszacować model regresj, w którym zmenną objaśnaną są wartośc szeregu, zmennym objaśnającym: czas, zmenne zero-jedynkowe wskazujące przynależność do danego podokresu (np. perwszego kwartału, wrześna tp.) oraz, ewentualne, funkcje tychże Metoda wygładzana za pomocą średnch ruchomych (metoda mechanczna ): dwustopnowa. Trend wyznacza sę za pomocą przesuwających sę średnch obejmujących kolejno wszystke wyrazy cyklu (roku, tygodna tp.). Zaleta: prostota. Wady: brak możlwośc wnoskowana statystycznego; utrata częśc nformacj (jednego cyklu) Wykorzystane modelu regresj (metoda analtyczna ) Zestaw zmennych objaśnających oprócz czasu zmennych zero-jedynkowych wskazujących przynależność do danego podokresu zawera loczyny tych zmennych czasu. Tak model ne zakłada z góry, że wahana okresowe mają stałą (w ujęcu bezwzględnym) ampltudę. Zalety: wnoskowane statystyczne jest możlwe dla trendu wahań, ne jest koneczne zakładane z góry addytywnośc lub multplkatywnośc sezonowośc. Ogranczena: w przypadku stosowana model lnowych metoda jest skuteczna jedyne gdy kerunek trendu jest stały; często zwykła MNK ne pozwala uzyskać neobcążonych oszacowań nektórych parametrów modelu (np. R 2, warancj oszacowań). 10 Baaardzo uproszczona. 11 Wpływ wahań przypadkowych będze pomjany. 19

20 Produkcja energ elektrycznej w Alfaland Szereg (Y t ) Czas (t) Szereg czasowy Model regresj Średna ruchoma Produkcja energ (yt), model regresj lnowej ( ŷ t ) średne ruchome ( y t ) I II III IV I II III IV I II III IV t yt ŷ t 96,24 96,82 97,40 97,98 98,55 99,13 99,71 100,29 100,86 101,44 102,02 102,59 y t ,38 97,63 98,88 99,75 100,63 101,25 101,25 101, yt - szereg surowy (dane) yˆ t 0,5769t 95,67 - model regresj lnowej oszacowany za pomocą MNK (Yt - zmenna objaśnana, t - zmenna objaśnająca) y ( ) t yt 1 yt 1 0, 5 yt2 yt2 y t - średna ruchoma (scentrowana, poneważ długość 4 cyklu jest lczbą parzystą (4)). 20

21 X. INDEKSY Nektóre z ndeksów czyl relatywnych wskaźnków zman cen lub fzycznych rozmarów produkcj/konsumpcj 12 występują na perwszych stronach gazet, np. ndeks cen konsumpcyjnych (mernk nflacj), ndeks Produktu Krajowego Brutto lub produkcj przemysłowej. Ich wartośc są oblczane regularne przez urzędy statystyczne w wększośc rozwnętych krajów, a nformacja na ch temat ma stotny wpływ na poltykę ekonomczną, penężną czy społeczną Indeksy są formułam statystycznym pozwalającym rozłożyć zmanę nomnalnej wartośc dochodów lub produkcj na zmanę welkośc fzycznych czyl realnych (ndeks lośc) zmanę cen. Przykładowo, jeżel nomnalny dochód rodzny Poszepszyńskch wzrósł w serpnu b. r. o 10% w porównanu z kwetnem ub. r., to najczęścej ne oznacza to 10- procentowego wzrostu zamożnośc (realnych dochodów). Rzeczywsty wzrost zależy bowem równeż od pozomu nflacj (merzonej za pomocą ndeksu cen).gdyby przekroczyła ona 10%, nastąpłby spadek realnej zamożnośc. Dokładna wycena tej ostatnej zmany, a także welkośc zman cen jest jednym z celów nauk o ndeksach. Podstawowy problem teoretyczny zwązany z ch konstrukcją wynka z konecznośc ujęca w jednym mernku (zagregowana) zman cen lub fzycznych rozmarów nejednorodnych dóbr 13. Ponżej przedstawony jest przykład wyceny zman cen lośc jednego produktu. W tabel podane są ceny (w zł za sztukę) welkośc sprzedaży (w mln. bochenków), a także wartośc sprzedaży (w mln. zł) pewnego gatunku chleba oraz wartośc różnych ndeksów ndywdualnych. Znając welkość dwóch z trzech ndeksów: cen, lośc wartośc można oblczyć trzec z nch dzęk własnośc: v = p q spełnanej dla dowolnych okresów, przez ndeksy ze stałą podstawą łańcuchowe. Ne jest ona jednak spełnana wprost przez ndeksy ndeksy agregatowe opsane ponżej 14. Rok Nr ok- Cena Indeks cen Indeks cen Ilość Indeks Indeks Wartość * * t resu p t p, t/t p,t/t-1 q t lośc q, t/t lośc q,t/t-1 v t =p t q t Należy ,20 1,2 1,2 25 1,25 1, ,5 1,5 1, ,1 0, ,7 1,7 1, ,1 1 37,4 Indeksy wartośc v wpsać samodzelne dwe kolumny * * p, t/t, q, t/t - ndeksy ze stałą podstawą (tu: rok 1995) p,t/t-1, q,t/t-1 - ndeksy ze zmenną podstawą (łańcuchowe) 12 Zwane w skróce ndeksam lośc. 13 Przykładowo, w przypadku ndeksów konsumpcj będą to np. różne produkty żywnoścowe, usług, wydatk meszkanowe tp. 14 Przedstawone zostały tylko ndeksy cen. Aby uzyskać ndeksy lośc wystarczy zamenć p q we wzorach. 21

22 22 Indeksy agregatowe mają za zadane ocenć średną welkość zmany cen lub produkcj/konsumpcj zboru (agregatu) obejmującego węcej nż jeden produkt. Sposób ch konstrukcj pownen uwzględnać m. n. fakt ż znaczene np. zmany cen męsa jest znaczne wększe nż zmana ceny gwoźdz. Indeksy wnny też spełnać klka oczywstych postulatów formalnych, np. ne pownny przyjmować wartośc mnejszej nż 1 gdy wszystke ceny (lośc) wzrosły, pownen też przyjąć wartość 1,1 gdy wszystke ceny wzrosły o 10%. Postulaty te są spełnane m. n. przez dwa ponższe ndeksy. Indeks cen wg formuły Laspeyresa LIP ma postać lorazu wartośc wszystkch dóbr oblczanych przy cenach pochodzących z obu porównywanych okresów stałych loścach pochodzących z okresu bazowego. Może też meć formę średnej arytmetycznej wartośc ndeksów ndywdualnych. n n n P L w p p q p q p I gdze pt jest -tą (=1,2,...,n) ceną w okrese t-tym (t=0,1), qt analogczną loścą, zaś w0 udzałem -tego dobra (=1,2,...,n) w łącznej wartośc konsumpcj lub produkcj w okrese bazowym (0). Indeks cen według formuły Paaschego jest oblczany następująco: 1 n n n P P w p p q p q p I czyl jako loraz wartośc penężnych oblczonych przy loścach z okresu beżącego (1) lub (alternatywne) jako średna harmonczna ndeksów ndywdualnych. Indeks wartośc można oblczyć jako loraz ndeksów cen lośc o różnych formułach: P P Q L Q P P L v I I I I I Równość ta jest spełnona też przez tzw. dealny ndeks Fshera czyl średną geometryczną ndeksów Laspeyresa Paaschego: Q F P F Q P Q L P P P L V I I I I I I I

23 Aneks: Najkrótsze wprowadzene do rachunku prawdopodobeństwa Prawdopodobeństwo zdarzena (oznaczane symbolem p lub P(X)) jest pojmowane tu jako częstość (w znaczenu relatywnym) występowana tego zdarzena w jakejś zborowośc: w populacj generalnej, w próbe, w długm okrese jeżel mamy do czynena ze zjawskam powtarzalnym 15. Wszystke możlwe zdarzena tworzą przestrzeń zdarzeń elementarnych (oznaczaną symbolem Ω). Prawdopodobeństwo nteresującego nas zdarzena w przypadku gdy Ω jest zborem skończonym oblczamy jako stosunek lczby wystąpeń tego zdarzena w zborze Ω do lczebnośc tego zboru. Gdy Ω jest zborem neskończonym, prawdopodobeństwo zdarzena można oblczyć np. posługując sę funkcją gęstośc prawdopodobeństwa. Przykłady przestrzen zdarzeń elementarnych prawdopodobeństw zdarzeń. 1. Rzuty monetą: Ω = {orzeł, reszka} 2. Rzuty kostką: Ω = {1, 2, 3, 4, 5, 6} Ω = {parzysta lczba oczek, neparzysta lczba oczek} 3. Dochody osobste Polaków: Ω = {dochód najbednejszego, dochód drugego od końca, dochód trzecego od końca,..., dochód najbogatszego} (przy założenu, że dochód każdej osoby jest nny) Mogą nas nteresować następujące zdarzena 1. Wyrzucene orła (p = 1/2) 2. Wyrzucene jedynk lub szóstk (p=2/6) 3. Wylosowane osoby z dochodem mesęcznym z przedzału [1000 zł; 1500 zł] (oblczene prawdopodobeństwa wymagałoby rzeczywstych danych). Kolejnym stotnym pojęcem jest zmenna losowa. Oznacza ono funkcję określoną na zborze zdarzeń elementarnych. Innym słowy, zmenna losowa przyporządkowuje zdarzenom elementarnym wartośc. Przykładowo, na zborze dochodów z powyższego przykładu można określć następujące zmenne losowe: 1. Wartość dochodu wylosowanej osoby (to najbardzej naturalna zmenna losowa dla tej przestrzen zdarzeń elementarnych), 2. Kwadrat dochodu wylosowanej osoby, 3. Funkcje przyjmująca wartość 1 gdy dochód jest powyżej średnej 0 w przecwnym przypadku. Problem do przemyślena: Student Rodon R. wypowedzał następujące zdana: 1. Prawdopodobeństwo wygrana na loter wynos 0, Prawdopodobeństwo, ze zdam egzamn ze statystyk w perwszym podejścu wynos 0,8. Czy w obydwu przypadkach słowo prawdopodobeństwo oznaczało to samo pojęce? 15 W tym przypadku zborowość ta ne mus stneć realne. 23

24 LITERATURA I INNE POMOCE Lteratura podstawowa: 1. J. Jóżwak J. Podgórsk. Statystyka od podstaw, PWE (różne wydana) lub 2. J. Podgórsk. Statystyka dla studów lcencjackch, PWE. Lteratura uzupełnająca: 1. A. D. Aczel, Statystyka w zarządzanu, PWN. 2. M. Weczorek. Statystyka. Lubę to (zbór zadań), SGH. 3. J.T. McClave, P. G. Benson, T.T. Sncch, Statstcs for Busness and Economcs, Pearson Educaton Lmted. Lteratura dla doceklwych: 1. D. J. Porer. Intermedate Statstcs and Econometrcs; A Comparatve Approach, The MIT Press. 2. A. Naman, R. Rosenfeld G. Zrkel. Understandng Statstcs, The McGraw-Hll Companes. 3. J. M. Utts, Seeng through Statstcs, Duxbury Press. ( 4. J. M. Utts R.F. Heckard, Mnd on Statstcs, Duxbury Press. Poneważ wydawca już ne oferuje wybranych fragmentów za darmo, to polecam nną ksążkę tych autorów dostęną we fragmentach tutaj: UWAGA! (ponżej lnk tylko dla osób o slnych nerwach) (ne należy nterpretować tego znalezska w duchu za pomocą statystyk można wszystko udowodnć, a raczej zastanowć sę co należy w takej sytuacj zrobć). ZADANIA ZMIENNA LOSOWA I JEJ ROZKŁAD 1. Zwykły obywatel Józef K. postanowł zagrać na wyścgach, mając do dyspozycj kwotę 200 zł. Cena jednego zakładu wynos 50 zł. W przypadku wygranej, której prawdopodobeństwo za każdym razem wynos 0,1, chce zrezygnować z dalszej gry. a/ należy stworzyć funkcję prawdopodobeństwa dla lczby wykuponych zakładów. b/ le wynos wartość mernka zróżncowana wartośc zakładów; jaka jest jego nterpretacja? 2. Józef K. na podobnych zasadach grywa też w totalzatora płkarskego. Cena zakładu wynos 20 zł zaś łączna kwota jaką postanowł przeznaczyć na grę to 60 zł. Prawdopodobeństwo wygranej wynos 0,2. 24

25 a/ Ile wynos warancja sumy wartośc obydwu zakładów? b/ Ile wynos warancja różncy wartośc obydwu zakładów? 3. Jaką wartość mus meć parametr a, aby funkcja zdefnowana następująco: ax f ( X ) 0 2 dla X -1 X 2 dla pozostał ych X mogła być funkcją gęstośc prawdopodobeństwa dla zmennej X. Należy też znaleźć wartość oczekwaną X. 4 * Dla jakej wartośc parametru a funkcja zdefnowana następująco: 2 a exp( x / 2) dla x 0 f ( x) 0 dla x 0 może być funkcją gęstośc prawdopodobeństwa? 5. Należy odtworzyć rozkład zmennej, wedząc że: a/ średne odchylene od medany w tym rozkładze wynos -0,3, b/ zmenna przyjmuje wartośc: -2, 0 1, c/ wartość -2 przyjmowana jest z 3 razy wększą częstoścą nż Dystrybuanta zmennej losowej X ma postać: X (-, -3) [-3, 1) [1, 5) [5, 10) [10, 15) [15, + ) F(X) 0 0,1 0,25 0,45 0,9 1 Należy: a/ wyznaczyć funkcję prawdopodobeństwa tej zmennej, b/ oblczyć zaznaczyć na wykrese dystrybuanty P(0< X <5). c/ oblczyć wartość oczekwana odchylene standardowe zmennej X. 7 *. W godz odstęp pomędzy kursam metra jest stały. Średn czas czekana na pocąg (przez losowo przybywającą na stacje osobę) wynos 4 mn. Ile wynos warancja czasu oczekwana? 8 * Czy za pomocą nerównośc Czebyszewa, spełnonej dla dowolnego k>0 dowolnego rozkładu zmennej X: P 2 X E( X ) k D( X ) 1/ k można uzyskać zadowalające oszacowana prawdopodobeństw znalezena sę zmennej o rozkładze normalnym w tzw. przedzale jedno-, dwu- trzysgmowym. STATYSTYKA OPISOWA 1. Zbadano 15 pensjonaruszy zakładu karnego o zaostrzonym rygorze pod względem lczby udzelonych m w badanym mesącu przepustek. Wynk dla 14 osób są następujące: 2, 2, 1, 3, 4, 5, 0, 1, 3, 2, 4, 4, 3, 1. Domnanta dla pełnego (15 - elementowego) rozkładu wynos 2. 25

26 a/ Należy uzupełnć dane, zbudować szereg rozdzelczy dla lczby przepustek oraz narysować dystrybuantę empryczną znterpretować jej wartość w punkce 3. b/ Czy na tej podstawe można wnoskować o przecętnej mesęcznej lczbe przepustek udzelanych węźnom w Polsce? 2. W grupe 20 studentów zdających egzamn poprawkowy ze statystyk zbadano oceny z egzamnu z ekonometr. Uzyskano następujące dane ndywdualne: ,5 3,5 3,5 3, Należy zbudować szereg rozdzelczy oraz oblczyć znterpretować odchylene standardowe, domnantę medanę. 3. W Alfaland 25% najbednejszych ne płac podatku dochodowego. W losowej próbe zbadano roczne dochody 400 osób, które przedstawono w następującej tabel: X [0;2] (2;4] (4;6] (6;10] (10;20] (20;30] (30;60] n 0,05 0,20 0,25 0,25 0,10 0,10 0,05 X oznacza roczny dochód (w dukatach) -tej grupy dochodowej, n' zaś odsetek osób o dochodach należących do tej grupy. a/ Ile wynos dochód najbogatszej osoby ne płacącej podatku? Jak brzm statystyczna nazwa tej welkośc? b/ Czy na powyższe pytana można odpowedzeć dysponując jedyne ponższą tabelą? X [0;4] (4;10] (10;15] (15;60] n 0,25 0,50 0,05 0,20 4. " (...) wzęto nawet próbk krw (...), aby ustalć 'średną wyczynową' pozomu hemoglobny. Obecne ta średna jest ustalona dla kobet na 16,5 a dla mężczyzn na 18,5, a wszystko, co powyżej, uznawane jest za dopng." (Rzeczpospolta, dzał sportowy). W ponższym zestawe należy wybrać prawdzwe stwerdzene: a/ druge zdane jest zawsze prawdzwe, b/ druge zdane jest zawsze fałszywe, c/ druge zdane jest prawdzwe tylko w pewnej, mało prawdopodobnej, sytuacj; jeżel tak, to w jakej, d/ druge zdane jest fałszywe tylko w pewnej, mało prawdopodobnej, sytuacj; jeżel tak, to w jakej. (Należy założyć, że twórcy przepsów antydopngowych mają pewną wedzę o statystyce, co ne mus dotyczyć autora notatk). 5. Trener prowadzący nabór do sekcj koszykówk zbadał wzrost w dwóch dużych grupach chłopców urodzonych w latach Średn wzrost w obydwu grupach wynosł 168 cm., współczynnk asymetr zaś Który rozkład jest korzystnejszy z punktu wdzena trenera? (Wskazówka: narysować przyblżoną funkcję gęstośc rozkładu). 6. Lczba UFO zarejestrowanych przez Państwową Agencję d/s UFO w perwszych 6 mesącach 2001 roku była następująca: W drugm półroczu ne zaobserwowano żadnych obektów. Należy: a/ Oblczyć średną warancję mesęcznej lczby UFO dla całego roku. 26

27 b/ Oblczyć częstość występowana mesęcy, w cągu których lczba zaobserwowanych UFO wykraczała poza obszar wyznaczony przez jedno odchylene standardowe wokół średnej studentów psało egzamn ocenany w skal od 0 do 100, uzyskując wynk: Zakres ocen [0; 20] (20; 40] (40; 60] (60; 80] (80; 100] Lczba studentów Posługując sę powyższym danym należy: a/ narysować hstogram oraz dystrybuantę empryczną, b/ wyznaczyć znterpretować klasyczny oraz pozycyjny wskaźnk asymetr. 8 *. Mesęczne wydatk 100 gospodarstw domowych wynosły łączne 165 tys. zł były pogrupowane w klasy o jednakowej rozpętośc. Wydatk perwszej grupy obejmującej 15% gospodarstw wynosły 11,25 tys. zł. Wydatk kolejnej grupy obejmującej 30% gospodarstw wynosły 37,5 tys. zł. Wydatk następnych grup obejmujących kolejno 25%, 20% 10% gospodarstw wynosły odpowedno 43,75 tys. zł, 45 tys zł. 27,5 tys zł. a/ Należy ocenć grafczne lczbowo asymetre rozkładu. b/ Ile wynos wartość dystrybuanty emprycznej dla 1750 zl? c/ Jake prawdopodobeństwo (w jakej populacj jakego zdarzena) wyznacza częstość odpowadająca perwszemu przedzałow klasowemu? 9 * Należy podać przykład rozkładu zmennej o asymetr prawostronnej, dla którego tzw. współczynnk skośnośc (patrz: Statystyka od Podstaw, rozdz. 2.6) przyjmuje wartość ujemną. Zmenna pownna przyjmować co najmnej 5 różnych wartośc. Można też podać wzór określający funkcję prawdopodobeństwa lub gęstośc prawdopodobeństwa. 10. Należy ocenć prawdzwość ponższych stwerdzeń, uzasadnając wybór: a/ W rozkładze zarobków pracownków frmy X medana jest znaczne mnejsza od średnej. Oznacza to, że stneje nelczna grupa pracownków o zarobkach welokrotne wyższych od średnej, zaś zarobk wększośc pracownków są ponżej średnej. b/ Jeżel zmenna losowa ma rozkład skokowy, to element populacj dla którego wartość zmennej jest równa wartośc oczekwanej występuje z najwększą częstoścą. c/ Aby uzyskać opnę na temat stosunku Polaków do relg lepej przeprowadzć anketę wśród wychodzących z koścoła nż na dworcu kolejowym. ROZKŁAD DWUMIANOWY. TWIERDZENIA GRANICZNE. 1. Ośmu śwadkom przedstawono nezależne po 10 osób, wśród których znajdował sę podejrzany o dokonane przestępstwa. Ile wynos prawdopodobeństwo, że wyberając losowo przynajmnej dwóch śwadków wskaże podejrzanego jako osobę wdzaną w mejscu przestępstwa? 2. Stała pensja netto gajowego Maruchy wynos 1800 zł mesęczne, do czego dochodz prema 40 zł za każdego zatrzymanego kłusownka. Lczba kłusownków przebywających w jego rewrze wynos 50, a prawdopodobeństwo zatrzymana w cągu mesąca dla każdego z 27

STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH

STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH 1 Test zgodnośc χ 2 Hpoteza zerowa H 0 ( Cecha X populacj ma rozkład o dystrybuance F). Hpoteza alternatywna H1( Cecha X populacj

Bardziej szczegółowo

KURS STATYSTYKA. Lekcja 1 Statystyka opisowa ZADANIE DOMOWE. www.etrapez.pl Strona 1

KURS STATYSTYKA. Lekcja 1 Statystyka opisowa ZADANIE DOMOWE. www.etrapez.pl Strona 1 KURS STATYSTYKA Lekcja 1 Statystyka opsowa ZADANIE DOMOWE www.etrapez.pl Strona 1 Część 1: TEST Zaznacz poprawną odpowedź (tylko jedna jest prawdzwa). Pytane 1 W statystyce opsowej mamy pełne nformacje

Bardziej szczegółowo

Natalia Nehrebecka. Zajęcia 4

Natalia Nehrebecka. Zajęcia 4 St ł Cchock Stansław C h k Natala Nehrebecka Zajęca 4 1. Interpretacja parametrów przy zmennych zerojedynkowych Zmenne 0 1 Interpretacja przy zmennej 0 1 w modelu lnowym względem zmennych objaśnających

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4 Stansław Cchock Natala Nehrebecka Zajęca 4 1. Interpretacja parametrów przy zmennych zerojedynkowych Zmenne 0-1 Interpretacja przy zmennej 0 1 w modelu lnowym względem zmennych objaśnających Interpretacja

Bardziej szczegółowo

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np. Wykład 7 Uwaga: W praktyce często zdarza sę, że wynk obu prób możemy traktować jako wynk pomarów na tym samym elemence populacj np. wynk x przed wynk y po operacj dla tego samego osobnka. Należy wówczas

Bardziej szczegółowo

STATYSTYKA: MATERIAŁY POMOCNICZE DO ZAJĘĆ

STATYSTYKA: MATERIAŁY POMOCNICZE DO ZAJĘĆ Dr hab. Adam Szulc, prof. SGH Instytut Statystyk Demograf STATYSTYKA: MATERIAŁY POMOCNICZE DO ZAJĘĆ Motto I: Prawe każdy jest statystykem ale newelu o tym we (nspratorzy: Moler Joseph Schumpeter) Motto

Bardziej szczegółowo

Weryfikacja hipotez dla wielu populacji

Weryfikacja hipotez dla wielu populacji Weryfkacja hpotez dla welu populacj Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Intelgencj Metod Matematycznych Wydzał Informatyk Poltechnk Szczecńskej 5. Parametryczne testy stotnośc w

Bardziej szczegółowo

Natalia Nehrebecka. Wykład 2

Natalia Nehrebecka. Wykład 2 Natala Nehrebecka Wykład . Model lnowy Postad modelu lnowego Zaps macerzowy modelu lnowego. Estymacja modelu Wartośd teoretyczna (dopasowana) Reszty 3. MNK przypadek jednej zmennej . Model lnowy Postad

Bardziej szczegółowo

) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4

) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4 Zadane. Nech ( X, Y ),( X, Y ), K,( X, Y n n ) będą nezależnym zmennym losowym o tym samym rozkładze normalnym z następującym parametram: neznaną wartoścą oczekwaną EX = EY = m, warancją VarX = VarY =

Bardziej szczegółowo

Egzamin ze statystyki/ Studia Licencjackie Stacjonarne/ Termin I /czerwiec 2010

Egzamin ze statystyki/ Studia Licencjackie Stacjonarne/ Termin I /czerwiec 2010 Egzamn ze statystyk/ Studa Lcencjacke Stacjonarne/ Termn /czerwec 2010 Uwaga: Przy rozwązywanu zadań, jeśl to koneczne, naleŝy przyjąć pozom stotnośc 0,01 współczynnk ufnośc 0,99 Zadane 1 PonŜsze zestawene

Bardziej szczegółowo

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej Badane współzależnośc dwóch cech loścowych X Y. Analza korelacj prostej Kody znaków: żółte wyróżnene nowe pojęce czerwony uwaga kursywa komentarz 1 Zagadnena 1. Zwązek determnstyczny (funkcyjny) a korelacyjny.

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6 Stansław Cchock Natala Nehrebecka Wykład 6 1 1. Interpretacja parametrów przy zmennych objaśnających cągłych Semelastyczność 2. Zastosowane modelu potęgowego Model potęgowy 3. Zmenne cągłe za zmenne dyskretne

Bardziej szczegółowo

0 0,2 0, p 0,1 0,2 0,5 0, p 0,3 0,1 0,2 0,4

0 0,2 0, p 0,1 0,2 0,5 0, p 0,3 0,1 0,2 0,4 Zad. 1. Dana jest unkcja prawdopodobeństwa zmennej losowej X -5-1 3 8 p 1 1 c 1 Wyznaczyć: a. stałą c b. wykres unkcj prawdopodobeństwa jej hstogram c. dystrybuantę jej wykres d. prawdopodobeństwa: P (

Bardziej szczegółowo

Funkcje i charakterystyki zmiennych losowych

Funkcje i charakterystyki zmiennych losowych Funkcje charakterystyk zmennych losowych Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Intelgencj Metod Matematycznych Wydzał Informatyk Poltechnk Szczecńskej 5. Funkcje zmennych losowych

Bardziej szczegółowo

Natalia Nehrebecka. Zajęcia 3

Natalia Nehrebecka. Zajęcia 3 St ł Cchock Stansław C h k Natala Nehrebecka Zajęca 3 1. Dobroć dopasowana równana regresj. Współczynnk determnacj R Dk Dekompozycja warancj zmennej zależnej ż Współczynnk determnacj R. Zmenne cągłe a

Bardziej szczegółowo

Statystyka Inżynierska

Statystyka Inżynierska Statystyka Inżynerska dr hab. nż. Jacek Tarasuk AGH, WFIS 013 Wykład DYSKRETNE I CIĄGŁE ROZKŁADY JEDNOWYMIAROWE Zmenna losowa, Funkcja rozkładu, Funkcja gęstośc, Dystrybuanta, Charakterystyk zmennej, Funkcje

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6 Stansław Cchock Natala Nehrebecka Wykład 6 1 1. Zastosowane modelu potęgowego Przekształcene Boxa-Coxa 2. Zmenne cągłe za zmenne dyskretne 3. Interpretacja parametrów przy zmennych dyskretnych 1. Zastosowane

Bardziej szczegółowo

65120/ / / /200

65120/ / / /200 . W celu zbadana zależnośc pomędzy płcą klentów ch preferencjam, wylosowano kobet mężczyzn zadano m pytane: uważasz za lepszy produkt frmy A czy B? Wynk były następujące: Odpowedź Kobety Mężczyźn Wolę

Bardziej szczegółowo

Zadane 1: Wyznacz średne ruchome 3-okresowe z następujących danych obrazujących zużyce energ elektrycznej [kwh] w pewnym zakładze w mesącach styczeń - lpec 1998 r.: 400; 410; 430; 40; 400; 380; 370. Zadane

Bardziej szczegółowo

1.1. Uprość opis zdarzeń: 1.2. Uprościć opis zdarzeń: a) A B A Uprościć opis zdarzeń: 1.4. Uprościć opis zdarzeń:

1.1. Uprość opis zdarzeń: 1.2. Uprościć opis zdarzeń: a) A B A Uprościć opis zdarzeń: 1.4. Uprościć opis zdarzeń: .. Uprość ops zdarzeń: a) A B, A \ B b) ( A B) ( A' B).. Uproścć ops zdarzeń: a) A B A b) A B, ( A B) ( B C).. Uproścć ops zdarzeń: a) A B A B b) A B C ( A B) ( B C).4. Uproścć ops zdarzeń: a) A B, A B

Bardziej szczegółowo

Statystyka. Zmienne losowe

Statystyka. Zmienne losowe Statystyka Zmenne losowe Zmenna losowa Zmenna losowa jest funkcją, w której każdej wartośc R odpowada pewen podzbór zboru będący zdarzenem losowym. Zmenna losowa powstaje poprzez przyporządkowane każdemu

Bardziej szczegółowo

Rozkład dwupunktowy. Rozkład dwupunktowy. Rozkład dwupunktowy x i p i 0 1-p 1 p suma 1

Rozkład dwupunktowy. Rozkład dwupunktowy. Rozkład dwupunktowy x i p i 0 1-p 1 p suma 1 Rozkład dwupunktowy Zmenna losowa przyjmuje tylko dwe wartośc: wartość 1 z prawdopodobeństwem p wartość 0 z prawdopodobeństwem 1- p x p 0 1-p 1 p suma 1 Rozkład dwupunktowy Funkcja rozkładu prawdopodobeństwa

Bardziej szczegółowo

Statystyka Opisowa 2014 część 2. Katarzyna Lubnauer

Statystyka Opisowa 2014 część 2. Katarzyna Lubnauer Statystyka Opsowa 2014 część 2 Katarzyna Lubnauer Lteratura: 1. Statystyka w Zarządzanu Admr D. Aczel 2. Statystyka Opsowa od Podstaw Ewa Waslewska 3. Statystyka, Lucjan Kowalsk. 4. Statystyka opsowa,

Bardziej szczegółowo

KURS STATYSTYKA. Lekcja 6 Regresja i linie regresji ZADANIE DOMOWE. www.etrapez.pl Strona 1

KURS STATYSTYKA. Lekcja 6 Regresja i linie regresji ZADANIE DOMOWE. www.etrapez.pl Strona 1 KURS STATYSTYKA Lekcja 6 Regresja lne regresj ZADANIE DOMOWE www.etrapez.pl Strona 1 Część 1: TEST Zaznacz poprawną odpowedź (tylko jedna jest prawdzwa). Pytane 1 Funkcja regresj I rodzaju cechy Y zależnej

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7 Stansław Cchock Natala Nehrebecka Wykład 7 1 1. Zmenne cągłe a zmenne dyskretne 2. Interpretacja parametrów przy zmennych dyskretnych 1. Zmenne cągłe a zmenne dyskretne 2. Interpretacja parametrów przy

Bardziej szczegółowo

( ) ( ) 2. Zadanie 1. są niezależnymi zmiennymi losowymi o. oraz. rozkładach normalnych, przy czym EX. i σ są nieznane. 1 Niech X

( ) ( ) 2. Zadanie 1. są niezależnymi zmiennymi losowymi o. oraz. rozkładach normalnych, przy czym EX. i σ są nieznane. 1 Niech X Prawdopodobeństwo statystyka.. r. Zadane. Zakładamy, że,,,,, 5 są nezależnym zmennym losowym o rozkładach normalnych, przy czym E = μ Var = σ dla =,,, oraz E = μ Var = 3σ dla =,, 5. Parametry μ, μ σ są

Bardziej szczegółowo

Rozwiązania (lub wskazówki do rozwiązań) większości zadań ze skryptu STATYSTYKA: MATERIAŁY POMOCNICZE DO ZAJĘĆ oraz EGZAMINÓW Z LAT

Rozwiązania (lub wskazówki do rozwiązań) większości zadań ze skryptu STATYSTYKA: MATERIAŁY POMOCNICZE DO ZAJĘĆ oraz EGZAMINÓW Z LAT Rozwązana (lub wskazówk do rozwązań) wększośc zadań ze skryptu STATYSTYKA: MATERIAŁY POMOCNICZE DO ZAJĘĆ oraz EGZAMINÓW Z LAT 01-014 ZMIENNA LOSOWA I JEJ ROZKŁAD Zadane 1/ str. 4 a/ zmenna może przyjmować

Bardziej szczegółowo

Natalia Nehrebecka. Dariusz Szymański

Natalia Nehrebecka. Dariusz Szymański Natala Nehrebecka Darusz Szymańsk . Sprawy organzacyjne Zasady zalczena Ćwczena Lteratura. Czym zajmuje sę ekonometra? Model ekonometryczny 3. Model lnowy Postać modelu lnowego Zaps macerzowy modelu dl

Bardziej szczegółowo

Analiza danych. Analiza danych wielowymiarowych. Regresja liniowa. Dyskryminacja liniowa. PARA ZMIENNYCH LOSOWYCH

Analiza danych. Analiza danych wielowymiarowych. Regresja liniowa. Dyskryminacja liniowa.   PARA ZMIENNYCH LOSOWYCH Analza danych Analza danych welowymarowych. Regresja lnowa. Dyskrymnacja lnowa. Jakub Wróblewsk jakubw@pjwstk.edu.pl http://zajeca.jakubw.pl/ PARA ZMIENNYCH LOSOWYCH Parę zmennych losowych X, Y możemy

Bardziej szczegółowo

Projekt 6 6. ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH CAŁKOWANIE NUMERYCZNE

Projekt 6 6. ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH CAŁKOWANIE NUMERYCZNE Inormatyka Podstawy Programowana 06/07 Projekt 6 6. ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH CAŁKOWANIE NUMERYCZNE 6. Równana algebraczne. Poszukujemy rozwązana, czyl chcemy określć perwastk rzeczywste równana:

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada. Zajęcia 3

Stanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada. Zajęcia 3 Stansław Cchock Natala Nehrebecka Katarzyna Rosak-Lada Zajęca 3 1. Dobrod dopasowana równana regresj. Współczynnk determnacj R 2 Dekompozycja warancj zmennej zależnej Współczynnk determnacj R 2 2. Zmenne

Bardziej szczegółowo

Badanie współzaleŝności dwóch cech ilościowych X i Y. Analiza korelacji prostej. Badanie zaleŝności dwóch cech ilościowych. Analiza regresji prostej

Badanie współzaleŝności dwóch cech ilościowych X i Y. Analiza korelacji prostej. Badanie zaleŝności dwóch cech ilościowych. Analiza regresji prostej Badane współzaleŝnośc dwóch cech loścowych X Y. Analza korelacj prostej Badane zaleŝnośc dwóch cech loścowych. Analza regresj prostej Kody znaków: Ŝółte wyróŝnene nowe pojęce czerwony uwaga kursywa komentarz

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6 Stansław Cchock Natala Nehrebecka Wykład 6 1 1. Zastosowane modelu potęgowego Model potęgowy Przekształcene Boxa-Coxa 2. Zmenne cągłe za zmenne dyskretne 3. Interpretacja parametrów przy zmennych dyskretnych

Bardziej szczegółowo

Plan wykładu: Typowe dane. Jednoczynnikowa Analiza wariancji. Zasada: porównać zmienność pomiędzy i wewnątrz grup

Plan wykładu: Typowe dane. Jednoczynnikowa Analiza wariancji. Zasada: porównać zmienność pomiędzy i wewnątrz grup Jednoczynnkowa Analza Waranc (ANOVA) Wykład 11 Przypomnene: wykłady zadana kursu były zaczerpnęte z podręcznków: Statystyka dla studentów kerunków techncznych przyrodnczych, J. Koronack, J. Melnczuk, WNT

Bardziej szczegółowo

Modele wieloczynnikowe. Modele wieloczynnikowe. Modele wieloczynnikowe ogólne. α β β β ε. Analiza i Zarządzanie Portfelem cz. 4.

Modele wieloczynnikowe. Modele wieloczynnikowe. Modele wieloczynnikowe ogólne. α β β β ε. Analiza i Zarządzanie Portfelem cz. 4. Modele weloczynnkowe Analza Zarządzane Portfelem cz. 4 Ogólne model weloczynnkowy można zapsać jako: (,...,,..., ) P f F F F = n Dr Katarzyna Kuzak lub (,...,,..., ) f F F F = n Modele weloczynnkowe Można

Bardziej szczegółowo

Analiza struktury zbiorowości statystycznej

Analiza struktury zbiorowości statystycznej Analza struktury zborowośc statystycznej.analza tendencj centralnej. Średne klasyczne Średna arytmetyczna jest parametrem abstrakcyjnym. Wyraża przecętny pozom badanej zmennej (cechy) w populacj generalnej:

Bardziej szczegółowo

Parametry zmiennej losowej

Parametry zmiennej losowej Eonometra Ćwczena Powtórzene wadomośc ze statysty SS EK Defncja Zmenną losową X nazywamy funcję odwzorowującą przestrzeń zdarzeń elementarnych w zbór lczb rzeczywstych, taą że przecwobraz dowolnego zboru

Bardziej szczegółowo

Nieparametryczne Testy Istotności

Nieparametryczne Testy Istotności Neparametryczne Testy Istotnośc Wzory Neparametryczne testy stotnośc schemat postępowana punkt po punkce Formułujemy hpotezę główną odnoszącą sę do: zgodnośc populacj generalnej z jakmś rozkładem, lub:

Bardziej szczegółowo

Statystyka Opisowa 2014 część 1. Katarzyna Lubnauer

Statystyka Opisowa 2014 część 1. Katarzyna Lubnauer Statystyka Opsowa 2014 część 1 Katarzyna Lubnauer Lteratura: 1. Statystyka w Zarządzanu Admr D. Aczel 2. Statystyka Opsowa od Podstaw Ewa Waslewska 3. Statystyka, Lucjan Kowalsk. 4. Statystyka opsowa,

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Procedura normalizacji

Procedura normalizacji Metody Badań w Geograf Społeczno Ekonomcznej Procedura normalzacj Budowane macerzy danych geografcznych mgr Marcn Semczuk Zakład Przedsęborczośc Gospodark Przestrzennej Instytut Geograf Unwersytet Pedagogczny

Bardziej szczegółowo

Analiza danych OGÓLNY SCHEMAT. http://zajecia.jakubw.pl/ Dane treningowe (znana decyzja) Klasyfikator. Dane testowe (znana decyzja)

Analiza danych OGÓLNY SCHEMAT. http://zajecia.jakubw.pl/ Dane treningowe (znana decyzja) Klasyfikator. Dane testowe (znana decyzja) Analza danych Dane trenngowe testowe. Algorytm k najblższych sąsadów. Jakub Wróblewsk jakubw@pjwstk.edu.pl http://zajeca.jakubw.pl/ OGÓLNY SCHEMAT Mamy dany zbór danych podzelony na klasy decyzyjne, oraz

Bardziej szczegółowo

Rachunek prawdopodobieństwa i statystyka W 11: Analizy zależnościpomiędzy zmiennymi losowymi Model regresji wielokrotnej

Rachunek prawdopodobieństwa i statystyka W 11: Analizy zależnościpomiędzy zmiennymi losowymi Model regresji wielokrotnej Rachunek prawdopodobeństwa statstka W 11: Analz zależnoścpomędz zmennm losowm Model regresj welokrotnej Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl Model regresj lnowej Model regresj lnowej prostej

Bardziej szczegółowo

5. Pochodna funkcji. lim. x c x c. (x c) = lim. g(c + h) g(c) = lim

5. Pochodna funkcji. lim. x c x c. (x c) = lim. g(c + h) g(c) = lim 5. Pocodna funkcj Defncja 5.1 Nec f: (a, b) R nec c (a, b). Jeśl stneje granca lm x c x c to nazywamy ją pocodną funkcj f w punkce c oznaczamy symbolem f (c) Twerdzene 5.1 Jeśl funkcja f: (a, b) R ma pocodną

Bardziej szczegółowo

Zaawansowane metody numeryczne Komputerowa analiza zagadnień różniczkowych 1. Układy równań liniowych

Zaawansowane metody numeryczne Komputerowa analiza zagadnień różniczkowych 1. Układy równań liniowych Zaawansowane metody numeryczne Komputerowa analza zagadneń różnczkowych 1. Układy równań lnowych P. F. Góra http://th-www.f.uj.edu.pl/zfs/gora/ semestr letn 2006/07 Podstawowe fakty Równane Ax = b, x,

Bardziej szczegółowo

Badania sondażowe. Braki danych Konstrukcja wag. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa

Badania sondażowe. Braki danych Konstrukcja wag. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa Badana sondażowe Brak danych Konstrukcja wag Agneszka Zęba Zakład Badań Marketngowych Instytut Statystyk Demograf Szkoła Główna Handlowa 1 Błędy braku odpowedz Całkowty brak odpowedz (UNIT nonresponse)

Bardziej szczegółowo

Dobór zmiennych objaśniających

Dobór zmiennych objaśniających Dobór zmennych objaśnających Metoda grafowa: Należy tak rozpąć graf na werzchołkach opsujących poszczególne zmenne, aby występowały w nm wyłączne łuk symbolzujące stotne korelacje pomędzy zmennym opsującym.

Bardziej szczegółowo

Zestaw zadań 4: Przestrzenie wektorowe i podprzestrzenie. Liniowa niezależność. Sumy i sumy proste podprzestrzeni.

Zestaw zadań 4: Przestrzenie wektorowe i podprzestrzenie. Liniowa niezależność. Sumy i sumy proste podprzestrzeni. Zestaw zadań : Przestrzene wektorowe podprzestrzene. Lnowa nezależność. Sumy sumy proste podprzestrzen. () Wykazać, że V = C ze zwykłym dodawanem jako dodawanem wektorów operacją mnożena przez skalar :

Bardziej szczegółowo

Zaawansowane metody numeryczne

Zaawansowane metody numeryczne Wykład 9. jej modyfkacje. Oznaczena Będzemy rozpatrywać zagadnene rozwązana następującego układu n równań lnowych z n newadomym x 1... x n : a 11 x 1 + a 12 x 2 +... + a 1n x n = b 1 a 21 x 1 + a 22 x

Bardziej szczegółowo

SZACOWANIE NIEPEWNOŚCI POMIARU METODĄ PROPAGACJI ROZKŁADÓW

SZACOWANIE NIEPEWNOŚCI POMIARU METODĄ PROPAGACJI ROZKŁADÓW SZACOWANIE NIEPEWNOŚCI POMIARU METODĄ PROPAGACJI ROZKŁADÓW Stefan WÓJTOWICZ, Katarzyna BIERNAT ZAKŁAD METROLOGII I BADAŃ NIENISZCZĄCYCH INSTYTUT ELEKTROTECHNIKI ul. Pożaryskego 8, 04-703 Warszawa tel.

Bardziej szczegółowo

PROGNOZOWANIE SPRZEDAŻY Z ZASTOSOWANIEM ROZKŁADU GAMMA Z KOREKCJĄ ZE WZGLĘDU NA WAHANIA SEZONOWE

PROGNOZOWANIE SPRZEDAŻY Z ZASTOSOWANIEM ROZKŁADU GAMMA Z KOREKCJĄ ZE WZGLĘDU NA WAHANIA SEZONOWE STUDIA I PRACE WYDZIAŁU NAUK EKONOMICZNYCH I ZARZĄDZANIA NR 36 Krzysztof Dmytrów * Marusz Doszyń ** Unwersytet Szczecńsk PROGNOZOWANIE SPRZEDAŻY Z ZASTOSOWANIEM ROZKŁADU GAMMA Z KOREKCJĄ ZE WZGLĘDU NA

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

ANALIZA KORELACJI WYDATKÓW NA KULTURĘ Z BUDŻETU GMIN ORAZ WYKSZTAŁCENIA RADNYCH

ANALIZA KORELACJI WYDATKÓW NA KULTURĘ Z BUDŻETU GMIN ORAZ WYKSZTAŁCENIA RADNYCH Potr Mchalsk Węzeł Centralny OŻK-SB 25.12.2013 rok ANALIZA KORELACJI WYDATKÓW NA KULTURĘ Z BUDŻETU GMIN ORAZ WYKSZTAŁCENIA RADNYCH Celem ponższej analzy jest odpowedź na pytane: czy wykształcene radnych

Bardziej szczegółowo

dy dx stąd w przybliżeniu: y

dy dx stąd w przybliżeniu: y Przykłady do funkcj nelnowych funkcj Törnqusta Proszę sprawdzć uzasadnć, które z podanych zdań są prawdzwe, a które fałszywe: Przykład 1. Mesęczne wydatk na warzywa (y, w jednostkach penężnych, jp) w zależnośc

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 11

Stanisław Cichocki. Natalia Nehrebecka. Wykład 11 Stansław Cchock Natala Nehrebecka Wykład 11 1 1. Testowane hpotez łącznych 2. Testy dagnostyczne Testowane prawdłowośc formy funkcyjnej: test RESET Testowane normalnośc składnków losowych: test Jarque-Berra

Bardziej szczegółowo

Zjawiska masowe takie, które mogą wystąpid nieograniczoną ilośd razy. Wyrazów Obcych)

Zjawiska masowe takie, które mogą wystąpid nieograniczoną ilośd razy. Wyrazów Obcych) Statystyka - nauka zajmująca sę metodam badana przedmotów zjawsk w ch masowych przejawach ch loścową lub jakoścową analzą z punktu wdzena nauk, do której zakresu należą.

Bardziej szczegółowo

STATYSTYCZNA ANALIZA WYNIKÓW POMIARÓW

STATYSTYCZNA ANALIZA WYNIKÓW POMIARÓW Zakład Metrolog Systemów Pomarowych P o l t e c h n k a P o z n ańska ul. Jana Pawła II 4 60-965 POZAŃ (budynek Centrum Mechatronk, Bomechank anonżyner) www.zmsp.mt.put.poznan.pl tel. +48 61 665 5 70 fax

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7 Stansław Cchock Natala Nehrebecka Wykład 7 . Zmenne dyskretne Kontrasty: efekty progowe, kontrasty w odchylenach Interakcje. Przyblżane model nelnowych Stosowane do zmennych dyskretnych o uporządkowanych

Bardziej szczegółowo

SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY Opsowa analza struktury zjawsk masowych Demografa statystyka PROJEKT DOFINANSOWANY ZE ŚRODKÓW NARODOWEGO BANKU POLSKIEGO URZĄD STATYSTYCZNY

Bardziej szczegółowo

METODA UNITARYZACJI ZEROWANEJ Porównanie obiektów przy ocenie wielokryterialnej. Ranking obiektów.

METODA UNITARYZACJI ZEROWANEJ Porównanie obiektów przy ocenie wielokryterialnej. Ranking obiektów. Opracowane: Dorota Mszczyńska METODA UNITARYZACJI ZEROWANEJ Porównane obektów przy ocene welokryteralnej. Rankng obektów. Porównane wybranych obektów (warantów decyzyjnych) ze względu na różne cechy (krytera)

Bardziej szczegółowo

Problemy jednoczesnego testowania wielu hipotez statystycznych i ich zastosowania w analizie mikromacierzy DNA

Problemy jednoczesnego testowania wielu hipotez statystycznych i ich zastosowania w analizie mikromacierzy DNA Problemy jednoczesnego testowana welu hpotez statystycznych ch zastosowana w analze mkromacerzy DNA Konrad Furmańczyk Katedra Zastosowań Matematyk SGGW Plan referatu Testowane w analze mkromacerzy DNA

Bardziej szczegółowo

Prawdopodobieństwo geometryczne

Prawdopodobieństwo geometryczne Prawdopodobeństwo geometryczne Przykład: Przestrzeń zdarzeń elementarnych określona jest przez zestaw punktów (x, y) na płaszczyźne wypełna wnętrze kwadratu [0 x ; 0 y ]. Znajdź p-stwo, że dowolny punkt

Bardziej szczegółowo

Współczynnik korelacji liniowej oraz funkcja regresji liniowej dwóch zmiennych

Współczynnik korelacji liniowej oraz funkcja regresji liniowej dwóch zmiennych Współcznnk korelacj lnowej oraz funkcja regresj lnowej dwóch zmennch S S r, cov współcznnk determnacj R r Współcznnk ndetermnacj ϕ r Zarówno współcznnk determnacj jak ndetermnacj po przemnożenu przez 00

Bardziej szczegółowo

SYSTEMY UCZĄCE SIĘ WYKŁAD 7. KLASYFIKATORY BAYESA. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

SYSTEMY UCZĄCE SIĘ WYKŁAD 7. KLASYFIKATORY BAYESA. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska. SYSTEMY UCZĄCE SIĘ WYKŁAD 7. KLASYFIKATORY BAYESA Częstochowa 4 Dr hab. nż. Grzegorz Dudek Wydzał Elektryczny Poltechnka Częstochowska TWIERDZENIE BAYESA Wedza pozyskwana przez metody probablstyczne ma

Bardziej szczegółowo

Minister Edukacji Narodowej Pani Katarzyna HALL Ministerstwo Edukacji Narodowej al. J. Ch. Szucha 25 00-918 Warszawa Dnia 03 czerwca 2009 r.

Minister Edukacji Narodowej Pani Katarzyna HALL Ministerstwo Edukacji Narodowej al. J. Ch. Szucha 25 00-918 Warszawa Dnia 03 czerwca 2009 r. Mnster Edukacj arodowej Pan Katarzyna HALL Mnsterstwo Edukacj arodowej al. J. Ch. Szucha 25 00-918 arszawa Dna 03 czerwca 2009 r. TEMAT: Propozycja zmany art. 30a ustawy Karta auczycela w forme lstu otwartego

Bardziej szczegółowo

Analiza rodzajów skutków i krytyczności uszkodzeń FMECA/FMEA według MIL STD - 1629A

Analiza rodzajów skutków i krytyczności uszkodzeń FMECA/FMEA według MIL STD - 1629A Analza rodzajów skutków krytycznośc uszkodzeń FMECA/FMEA według MIL STD - 629A Celem analzy krytycznośc jest szeregowane potencjalnych rodzajów uszkodzeń zdentyfkowanych zgodne z zasadam FMEA na podstawe

Bardziej szczegółowo

Hipotezy o istotności oszacowao parametrów zmiennych objaśniających ˆ ) ˆ

Hipotezy o istotności oszacowao parametrów zmiennych objaśniających ˆ ) ˆ WERYFIKACJA HIPOTEZY O ISTOTNOŚCI OCEN PARAMETRÓW STRUKTURALNYCH MODELU Hpoezy o sonośc oszacowao paramerów zmennych objaśnających Tesowane sonośc paramerów zmennych objaśnających sprowadza sę do nasępującego

Bardziej szczegółowo

Regresja liniowa i nieliniowa

Regresja liniowa i nieliniowa Metody prognozowana: Regresja lnowa nelnowa Dr nż. Sebastan Skoczypec Zmenna losowa Zmenna losowa X zmenna, która w wynku pewnego dośwadczena przyjmuje z pewnym prawdopodobeństwem wartość z określonego

Bardziej szczegółowo

PROSTO O DOPASOWANIU PROSTYCH, CZYLI ANALIZA REGRESJI LINIOWEJ W PRAKTYCE

PROSTO O DOPASOWANIU PROSTYCH, CZYLI ANALIZA REGRESJI LINIOWEJ W PRAKTYCE PROSTO O DOPASOWANIU PROSTYCH, CZYLI ANALIZA REGRESJI LINIOWEJ W PRAKTYCE Janusz Wątroba, StatSoft Polska Sp. z o.o. W nemal wszystkch dzedznach badań emprycznych mamy do czynena ze złożonoścą zjawsk procesów.

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7 Stansław Cchock Natala Nehrebecka Wykład 7 1 1. Interakcje 2. Przyblżane model nelnowych 3. Założena KMRL 1. Interakcje 2. Przyblżane model nelnowych 3. Założena KMRL W standardowym modelu lnowym zakładamy,

Bardziej szczegółowo

Analiza korelacji i regresji

Analiza korelacji i regresji Analza korelacj regresj Zad. Pewen zakład produkcyjny zatrudna pracownków fzycznych. Ich wydajność pracy (Y w szt./h) oraz mesęczne wynagrodzene (X w tys. zł) przedstawa ponższa tabela: Pracownk y x A

Bardziej szczegółowo

NAFTA-GAZ marzec 2011 ROK LXVII. Wprowadzenie. Tadeusz Kwilosz

NAFTA-GAZ marzec 2011 ROK LXVII. Wprowadzenie. Tadeusz Kwilosz NAFTA-GAZ marzec 2011 ROK LXVII Tadeusz Kwlosz Instytut Nafty Gazu, Oddzał Krosno Zastosowane metody statystycznej do oszacowana zapasu strategcznego PMG, z uwzględnenem nepewnośc wyznaczena parametrów

Bardziej szczegółowo

6. ROŻNICE MIĘDZY OBSERWACJAMI STATYSTYCZNYMI RUCHU KOLEJOWEGO A SAMOCHODOWEGO

6. ROŻNICE MIĘDZY OBSERWACJAMI STATYSTYCZNYMI RUCHU KOLEJOWEGO A SAMOCHODOWEGO Różnce mędzy obserwacjam statystycznym ruchu kolejowego a samochodowego 7. ROŻNICE MIĘDZY OBSERWACJAMI STATYSTYCZNYMI RUCHU KOLEJOWEGO A SAMOCHODOWEGO.. Obserwacje odstępów mędzy kolejnym wjazdam na stację

Bardziej szczegółowo

Portfele zawierające walor pozbawiony ryzyka. Elementy teorii rynku kapitałowego

Portfele zawierające walor pozbawiony ryzyka. Elementy teorii rynku kapitałowego Portel nwestycyjny ćwczena Na podst. Wtold Jurek: Konstrukcja analza rozdzał 5 dr chał Konopczyńsk Portele zawerające walor pozbawony ryzyka. lementy teor rynku kaptałowego 1. Pożyczane penędzy amy dwa

Bardziej szczegółowo

Prawdopodobieństwo i statystyka r.

Prawdopodobieństwo i statystyka r. Prawdopodobeństwo statystya.05.00 r. Zadane Zmenna losowa X ma rozład wyładnczy o wartośc oczewanej, a zmenna losowa Y rozład wyładnczy o wartośc oczewanej. Obe zmenne są nezależne. Oblcz E( Y X + Y =

Bardziej szczegółowo

EKONOMETRIA I Spotkanie 1, dn. 05.10.2010

EKONOMETRIA I Spotkanie 1, dn. 05.10.2010 EKONOMETRIA I Spotkane, dn. 5..2 Dr Katarzyna Beń Program ramowy: http://www.sgh.waw.pl/nstytuty/e/oferta_dydaktyczna/ekonometra_stacjonarne_nest acjonarne/ Zadana, dane do zadań, ważne nformacje: http://www.e-sgh.pl/ben/ekonometra

Bardziej szczegółowo

Pokazać, że wyżej zdefiniowana struktura algebraiczna jest przestrzenią wektorową nad ciałem

Pokazać, że wyżej zdefiniowana struktura algebraiczna jest przestrzenią wektorową nad ciałem Zestaw zadań : Przestrzene wektorowe. () Wykazać, że V = C ze zwykłym dodawanem jako dodawanem wektorów operacją mnożena przez skalar : C C C, (z, v) z v := z v jest przestrzeną lnową nad całem lczb zespolonych

Bardziej szczegółowo

BADANIA OPERACYJNE. Podejmowanie decyzji w warunkach niepewności. dr Adam Sojda

BADANIA OPERACYJNE. Podejmowanie decyzji w warunkach niepewności. dr Adam Sojda BADANIA OPERACYJNE Podejmowane decyzj w warunkach nepewnośc dr Adam Sojda Teora podejmowana decyzj gry z naturą Wynk dzałana zależy ne tylko od tego, jaką podejmujemy decyzję, ale równeż od tego, jak wystąp

Bardziej szczegółowo

XXX OLIMPIADA FIZYCZNA ETAP III Zadanie doświadczalne

XXX OLIMPIADA FIZYCZNA ETAP III Zadanie doświadczalne XXX OLIMPIADA FIZYCZNA ETAP III Zadane dośwadczalne ZADANIE D Nazwa zadana: Maszyna analogowa. Dane są:. doda półprzewodnkowa (krzemowa) 2. opornk dekadowy (- 5 Ω ), 3. woltomerz cyfrowy, 4. źródło napęca

Bardziej szczegółowo

2012-10-11. Definicje ogólne

2012-10-11. Definicje ogólne 0-0- Defncje ogólne Logstyka nauka o przepływe surowców produktów gotowych rodowód wojskowy Utrzyywane zapasów koszty zwązane.n. z zarożene kaptału Brak w dostawach koszty zwązane.n. z przestoje w produkcj

Bardziej szczegółowo

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński Mkroekonometra 13 Mkołaj Czajkowsk Wktor Budzńsk Symulacje Analogczne jak w przypadku cągłej zmennej zależnej można wykorzystać metody Monte Carlo do analzy różnego rodzaju problemów w modelach gdze zmenna

Bardziej szczegółowo

Metody predykcji analiza regresji

Metody predykcji analiza regresji Metody predykcj analza regresj TPD 008/009 JERZY STEFANOWSKI Instytut Informatyk Poltechnka Poznańska Przebeg wykładu. Predykcja z wykorzystanem analzy regresj.. Przypomnene wadomośc z poprzednch przedmotów..

Bardziej szczegółowo

Proces narodzin i śmierci

Proces narodzin i śmierci Proces narodzn śmerc Jeżel w ewnej oulacj nowe osobnk ojawają sę w sosób losowy, rzy czym gęstość zdarzeń na jednostkę czasu jest stała w czase wynos λ, oraz lczba osobnków n, które ojawły sę od chwl do

Bardziej szczegółowo

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Natalia Nehrebecka Stanisław Cichocki. Wykład 10 Natala Nehrebecka Stansław Cchock Wykład 10 1 1. Testy dagnostyczne 2. Testowane prawdłowośc formy funkcyjnej modelu 3. Testowane normalnośc składnków losowych 4. Testowane stablnośc parametrów 5. Testowane

Bardziej szczegółowo

ZAJĘCIA 3. Pozycyjne miary dyspersji, miary asymetrii, spłaszczenia i koncentracji

ZAJĘCIA 3. Pozycyjne miary dyspersji, miary asymetrii, spłaszczenia i koncentracji ZAJĘCIA Pozycyjne ary dyspersj, ary asyetr, spłaszczena koncentracj MIARY DYSPERSJI: POZYCYJNE, BEZWZGLĘDNE Rozstęp dwartkowy (ędzykwartylowy) Rozstęp dwartkowy określa rozpętośd tej częśc obszaru zennośc

Bardziej szczegółowo

Teoria niepewności pomiaru (Rachunek niepewności pomiaru) Rodzaje błędów pomiaru

Teoria niepewności pomiaru (Rachunek niepewności pomiaru) Rodzaje błędów pomiaru Pomary fzyczne - dokonywane tylko ze skończoną dokładnoścą. Powodem - nedoskonałość przyrządów pomarowych neprecyzyjność naszych zmysłów borących udzał w obserwacjach. Podawane samego tylko wynku pomaru

Bardziej szczegółowo

Analiza zależności zmiennych ilościowych korelacja i regresja

Analiza zależności zmiennych ilościowych korelacja i regresja Analza zależnośc zmennych loścowych korelacja regresja JERZY STEFANOWSKI Instytut Informatyk Poltechnka Poznańska Plan wykładu 1. Lnowa zależność mędzy dwoma zmennym: Prosta regresja Metoda najmnejszych

Bardziej szczegółowo

Ntli Natalia Nehrebecka. Dariusz Szymański. Zajęcia 4

Ntli Natalia Nehrebecka. Dariusz Szymański. Zajęcia 4 Ntl Natala Nehrebecka Darusz Szymańsk Zajęca 4 1 1. Zmenne dyskretne 3. Modele z nterakcjam 2. Przyblżane model dlnelnowych 2 Zmenne dyskretne Zmenne nomnalne Zmenne uporządkowane 3 Neco bardzej skomplkowana

Bardziej szczegółowo

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić). Egzamin ze Statystyki Matematycznej, WNE UW, wrzesień 016, zestaw B Odpowiedzi i szkice rozwiązań 1. Zbadano koszt 7 noclegów dla 4-osobowej rodziny (kwatery) nad morzem w sezonie letnim 014 i 015. Wylosowano

Bardziej szczegółowo

MATEMATYKA POZIOM ROZSZERZONY Kryteria oceniania odpowiedzi. Arkusz A II. Strona 1 z 5

MATEMATYKA POZIOM ROZSZERZONY Kryteria oceniania odpowiedzi. Arkusz A II. Strona 1 z 5 MATEMATYKA POZIOM ROZSZERZONY Krytera ocenana odpowedz Arkusz A II Strona 1 z 5 Odpowedz Pytane 1 2 3 4 5 6 7 8 9 Odpowedź D C C A B 153 135 232 333 Zad. 10. (0-3) Dana jest funkcja postac. Korzystając

Bardziej szczegółowo

Rozkłady statystyk z próby

Rozkłady statystyk z próby Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny

Bardziej szczegółowo

Propozycja modyfikacji klasycznego podejścia do analizy gospodarności

Propozycja modyfikacji klasycznego podejścia do analizy gospodarności Jacek Batóg Unwersytet Szczecńsk Propozycja modyfkacj klasycznego podejśca do analzy gospodarnośc Przedsęborstwa dysponujące dentycznym zasobam czynnków produkcj oraz dzałające w dentycznych warunkach

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA Powtórka Powtórki Kowiariancja cov xy lub c xy - kierunek zależności Współczynnik korelacji liniowej Pearsona r siła liniowej zależności Istotność

Bardziej szczegółowo

Teoria niepewności pomiaru (Rachunek niepewności pomiaru) Rodzaje błędów pomiaru

Teoria niepewności pomiaru (Rachunek niepewności pomiaru) Rodzaje błędów pomiaru Pomary fzyczne - dokonywane tylko ze skończoną dokładnoścą. Powodem - nedoskonałość przyrządów pomarowych neprecyzyjność naszych zmysłów borących udzał w obserwacjach. Podawane samego tylko wynku pomaru

Bardziej szczegółowo

Twierdzenie Bezouta i liczby zespolone Javier de Lucas. Rozwi azanie 2. Z twierdzenia dzielenia wielomianów, mamy, że

Twierdzenie Bezouta i liczby zespolone Javier de Lucas. Rozwi azanie 2. Z twierdzenia dzielenia wielomianów, mamy, że Twerdzene Bezouta lczby zespolone Javer de Lucas Ćwczene 1 Ustal dla których a, b R można podzelć f 1 X) = X 4 3X 2 + ax b przez f 2 X) = X 2 3X+2 Oblcz a b Z 5 jeżel zak ladamy, że f 1 f 2 s a welomanam

Bardziej szczegółowo

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński Mkroekonometra 5 Mkołaj Czajkowsk Wktor Budzńsk Uogólnone modele lnowe Uogólnone modele lnowe (ang. Generalzed Lnear Models GLM) Różną sę od standardowego MNK na dwa sposoby: Rozkład zmennej objaśnanej

Bardziej szczegółowo

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej

Bardziej szczegółowo

STATYSTYKA. Zmienna losowa skokowa i jej rozkład

STATYSTYKA. Zmienna losowa skokowa i jej rozkład STATYSTYKA Wnosowane statystyczne to proces myślowy polegający na formułowanu sądów o całośc przy dysponowanu o nej ogranczoną lczbą nformacj Zmenna losowa soowa jej rozład Zmenną losową jest welość, tóra

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA. Wkład wstępn. Teora prawdopodobeństwa element kombnatork. Zmenne losowe ch rozkład 3. Populacje prób danch, estmacja parametrów 4. Testowane hpotez statstcznch 5. Test parametrczne

Bardziej szczegółowo