Zastosowanie techniki Propensity Score Matching w badaniach ewaluacyjnych
|
|
- Magda Przybylska
- 6 lat temu
- Przeglądów:
Transkrypt
1 Zastosowanie techniki Propensity Score Matching w badaniach ewaluacyjnych III Międzyregionalna Konferencja Ewaluacyjna Dariusz Majerek Katedra Matematyki Stosowanej Wydział Podstaw Techniki Politechniki Lubelskiej Toruń czerwca 2016
2 Model Neymana-Rubin a a Y i - wartość zmiennej wynikowej b dla i-tej jednostki; T i będzie zmienną określającą czy dla i-tej jednostki został zastosowany bodziec c ; T i = 1 - grupa interwencji T i = 0 - grupa bez interwencji X i - wektor kowariantów d, których wartości nie zależą od tego, do której grupy zostanie zakwalifikowana jednostka. Y i (1) - wartość zmiennej wynikowej dla i-tej jednostki, gdy zastosowano wobec niej interwencję; Y i (0) - wartość zmiennej wynikowej dla i-tej jednostki, gdy nie zastosowano wobec niej interwencji. a znany też jako Rubin Casual Model b ang. outcome c ang. treatment d ang. covariates 2 / 27
3 Wielkość efektu Wielkość efektu dla pojedynczej jednostki τ i = Y i (1) Y i (0), i = 1,..., N. (1) Przeciętny efekt oddziaływania bodźca (ATE a ) τ ATE = EY (1) EY (0). (2) Przeciętny efekt oddziaływania bodźca dla jednostek dla których zastosowano interwencję (ATT b ) τ ATT = E[Y (1) T = 1] E[Y (0) T = 1]. (3) W przypadku szacowania τ ATE i τ ATT mamy do czynienia albo z brakiem danych c albo ze stanem kontrfaktycznym d. a ang. Average Treatment Effect b ang. Average Treatment Effect on the Treated c żadna jednostka nie może się znaleźć w obu grupach jednocześnie d E(Y (0) T = 1) 3 / 27
4 Metoda eksperymentalna W przypadku szacowania efektu interwencji najczęściej zaleca się przeprowadzenie badania eksperymentalnego (zwanego dalej eksperymentem). Polega ono na losowym doborze obiektów do badania (I zasada randomizacji) oraz losowego doboru obiektów, w stosunku do których zostanie zastosowany bodziec (II zasada randomizacji). Dla każdego obiektu zostanie przypisany kod zastosowanego bodźca a oraz wartość odpowiedzi na interwencję. Takie podejście pozwala na proste wyznaczenie nieobciążonego i zgodnego estymatora wielkości efektu występującego w populacji, w postaci różnicy średnich próbkowych (obiektów objętych interwencją i nieobjętych). W przypadku danych pochodzących z eksperymentu, rozkład cech (zarówno obserwowanych jak i nieobserwowanych), które charakteryzują obiekty jest jednakowy. a zmienna ze skali nominalnej lub porządkowej, najczęściej dychotomiczna 4 / 27
5 Dane obserwowane Badania metodą eksperymentalną mogą nie być wykonalne z kilu powodów: logistycznych, finansowych, czasowych i etycznych. Niestety w kontekście większości badań ex-post II zasada randomizacji nie jest spełniona. W tym przypadku wcześniej wspomniany estymator może charakteryzować się dużym obciążeniem a oraz brakiem zgodności (Guo et al., 2006). Różnice w dystrybucji cech mogą znacząco wpłynąć na wartość zmiennej Y w obu grupach, zatem oszacowanie efektu oddziaływania bodźca za pomocą różnicy średnich obu prób będzie obciążone sporym błędem. Wspomniane różnice skutkują tzw. obciążeniem selekcyjnym równym E[Y (0) T = 1] E[Y (0) T = 0]. (4) a ang. bias 5 / 27
6 Pierwsze próby rozwiązania tego problemu opierały się o modele regresji zmiennej Y względem T oraz X (Cox, 1956; Robinson, 1973) Ŷ i = E[Y i T i, X i ] = β 0 + β τ T i + β 1 X i + ε. Wówczas β τ jest oszacowaniem wielkości efektu. Istotnie taka metoda zmniejsza obciążenie selekcyjne ale metody dopasowania prób a wprowadzone później charakteryzują się jeszcze mniejszym obciążeniem selekcyjnym (Rosenbaum, 2002). Jedna z pierwszych form matchingu opierała się na dopasowaniu prób ze względu na wszystkie obserwowane cechy X. Jednostki dobierane są wówczas w ten sposób, aby na poziomie każdej cechy wektora X próba eksperymentalna i kontrolna były identyczne. Istotnie obniża to błąd selekcyjny, natomiast trudno w praktyce zastosować tą metodę gdy dysponujemy niezbyt liczną próbą, a kowariantów w wektorze X jest wiele lub są mierzone na skali ilorazowej. a ang. matching 6 / 27
7 Próby dopasowane ze względu na cechy mogą posłużyć jako materiał do wyznaczenia wielkości efektu tylko wtedy, gdy spełnione są następujące założenia a : Y (0), Y (1) T X, (5) 0 < P(T = 1 X) < 1. (6) Istotą tych założeń jest zapewnienie, że rozkłady zmiennej zależnej zarówno w grupie eksperymentalnej, jak i kontrolnej są niezależne od bodźca jeśli znane są wartości kowariantów oraz niemożliwe jest aby na podstawie X jednoznacznie określić, do której grupy należy obiekt. Propensity Score Ze względu na praktyczne ograniczenia metody dopasowania prób wg cech, Rubin i Rosenbaum (1983) wprowadzili funkcję propensity score e(x) = P[T = 1 X = x]. (7) a w angielskojęzycznych publikacjach założenia te są nazywane Conditional Independence Assumption lub Strongly Ignorable Treatment Assigment 7 / 27
8 Funkcja propensity score ma następujące własności: jest funkcją balansującą a, czyli T X e(x), (8) jeśli spełnione jest założenie warunkowej niezależności (5 i 6) względem X, to również względem e(x), czyli Y (0), Y (1) T e(x) (9) 0 < P(T =1 e(x)) < 1. (10) Najczęstszą praktyką w wyznaczaniu wartości funkcji e(x) jest zastosowanie regresji logistycznej lub probitowej. W przypadku gdy interwencja może przyjmować więcej niż dwa stany, do estymacji propensity score wykorzystamy wielomianową regresję logistyczną lub probitową (Caliendo and Kopeinig, 2008). a ang. balancing score 8 / 27
9 Dobór zmiennych do modelu W poszukiwaniu właściwych kowariantów, które potencjalnie mogłyby wpłynąć na spełnienie założenia o niezależności warunkowej, należy zrobić dokładny desk research. Przegląd literatury przedmiotowej, wiedza teoretyczna oraz wyniki wcześniejszych badań mogą rzucić światło na kierunki poszukiwań. Z pewnością muszą to być zmienne, na które nie miał wpływu fakt przynależności do grupy eksperymentalnej czy kontrolnej. Unikamy również zmiennych jednoznacznie wpływających na otrzymanie lub nie otrzymanie interwencji. Heckman (1997), Dehejia i Wahba (1999) sugerują, żeby wziąć wszystkie te zmienne z wektora X, które mają wpływ na zmienną Y i T. Bryson (2002), Augutrzky i Schmidt (2001) twierdzą, że włączanie do modelu propensity score wszystkich dostępnych zmiennych zwiększa wariancję estymatora efektu. Z drugiej strony Rubin i Thomas (1996) zaznaczają, iż tylko te zmienne, które nie mają związku ze zmienną wynikową lub nie są właściwym kowariantem można odrzucić. 9 / 27
10 Łączenie metodą najbliższego sąsiada a Polega na dobraniu do jednostki z grupy eksperymentalnej takiego elementu z puli kontrolnej, aby ich wartości propensity score były najbliższe. W zależności od wybranego algorytmu łączenia, metoda najbliższego sąsiada będzie prowadzić do różnego stopnia zbalansowania grup eksperymentalnej i kontrolnej. W przypadku metod chciwych b, czyli 1 : n i bez powtórzeń, otrzymamy estymator o większej precyzji (mniejsza wariancja) ale większym obciążeniu (Smith and Todd, 2005). Dodatkowo w metodzie bez powtórzeń zaleca się losowe ustawienie elementów w grupie eksperymentalnej przed wykonaniem łączenia, ponieważ jego jakość zależy od porządku elementów objętych interwencją (Smith, 1997). a ang. Nearest Neighbor b w literaturze obcojęzycznej funkcjonuje pod nazwą greedy 10 / 27
11 Algorytmy łączenia Technika Propensity Score Matching obejmuje wiele algorytmów łączenia prób eksperymentalnej i kontrolnej w oparciu o wartość propensity score. Sposoby łączenia: Bez powtórzeń - każdy element z puli kontrolnej może być tylko raz użyty w grupie kontrolnej. Ten typ łączenia zwiększa obciążenie estymatora efektu ale zmniejsza jego wariancję. Z powtórzeniami - każdy element z puli kontrolnej może być wykorzystany kilka razy jako element w grupie kontrolnej. Ten typ łączenia zmniejsza obciążenie estymatora efektu ale zwiększa jego wariancję. 1 : 1 - czyli jednemu elementowi grupy eksperymentalnej jest przyporządkowany jeden ( najlepszy ) element puli kontrolnej. Do dopasowanie sprawia, że jest mniejsze obciążenie estymatora efektu ale większa wariancja. 1 : n - czyli jednemu elementowi grupy eksperymentalnej jest przyporządkowane n ( najlepszych ) elementów puli kontrolnej. Do dopasowanie sprawia, że jest większe obciążenie estymatora efektu ale mniejsza wariancja. 11 / 27
12 Łączenie z limitem lub promieniem a Zasada działania jest zbliżona do poprzedniej, z tym wyjątkiem, że ustalony jest pewien limit różnicy pomiędzy wartościami propensity score obu elementów, którego nie można przekroczyć. Różnica pomiędzy metodą z limitem a metodą z promieniem jest taka, że w tej pierwszej należy ustalić wcześniej liczbę sąsiadów z grupy kontrolnej, których będziemy dopasowywać do jednostki z grupy eksperymentalnej. Natomiast w drugiej wszystkie jednostki, które spełniają warunek e 1 (x i ) e 0 (x j ) < r są włączane do puli kontrolnej, przy czym e 1 (x i ) jest wartością propensity score dla ustalonej i-tej jednostki z grupy eksperymentalnej, a e 0 (x j ) jest wartością propensity score dla dowolnej j-tej jednostki z puli kontrolnej. W przypadku kiedy różnica nie da się znaleźć w puli kontrolnej elementów spełniających powyższe warunki, to taką jednostkę eliminujemy z próby eksperymentalnej (Dehejia and Wahba, 2002). Niedogodności w metodzie z limitem jest konieczność arbitralnego ustalenia limitu. a ang. Caliper Matching i Radius Matching 12 / 27
13 Warstwowanie ze względu na propensity score a Metoda ta polega na podziale wartości propensity score na rozłączne przedziały (warstwy). Najczęściej polecany jest podział kwantylowy. Rosenbaum i Rubin pokazali, że wówczas redukuje się w ten sposób 90% całkowitego obciążenia selekcyjnego (Rosenbaum and Rubin, 1984). Imbens (2004) twierdzi, że jeśli się weźmie warstwy o jednakowej liczebności, to do oszacowania efektu τ ATE użyjemy średniej różnic średnich w poszczególnych warstwach. Natomiast do oszacowania τ ATT zaleca się użycia średniej ważonej różnic średnich w poszczególnych warstwach, z wagami proporcjonalnymi do liczby elementów wystawionych na działanie bodźca w danej warstwie. a ang. Stratification on the Propensity Score 13 / 27
14 Ważona metoda PSM a Podejście wprowadzone przez Rosenbaum a (1987) jest nieco inne od wcześniejszych, ponieważ nie dokonujemy w niej właściwego matchingu, natomiast wszystkie elementy w próbie włączamy do badania z odpowiednią wagą. Jest nią odwrotność prawdopodobieństwa otrzymania bodźca przez jednostkę ω i = T i e i + 1 T i 1 e i, (11) gdzie e i są wartościami propensity score dla i-tej jednostki. Oznacza to, że w ważonej próbie rozkład kowariantów będzie niezależny od bodźca. a znana jako ang. Inverse Probability of Treatment Weighting 14 / 27
15 Regresja z uwzględnieniem PS a Rozwiązanie to zakłada włączenie do modelu regresji wartości propensity score Ŷ i = E[Y i T i, X i ] = β 0 + β τ T i + β 1 e i (X i ) + ε. (12) Metoda ta różni się znacząco od wcześniej wymienionych, podejściem do balansowania prób: podział na planowanie doświadczenia i estymację efektu; w modelach regresyjnych występuje tendencja do modyfikowania wyników w kierunku zakładanego efektu (Rubin, 2001); podejście regresyjne jest dosyć wrażliwe na to czy wartość propensity score została właściwie oszacowana. a ang. Covariate Adjustment with Propensity Score 15 / 27
16 Testowanie dopasowania Najczęstszym sposobem testowania jakości dopasowania próby kontrolnej do eksperymentalnej jest ocena zbalansowania kowariantów za pomocą standaryzowanych różnic. Różnice standaryzowane SB = X (1) X (0) 0.5 (S 2 X (1) + S 2 X (0) ) 100% (13) Ocena zbalansowania dokonywana jest przez porównanie różnic standaryzowanych przed i po matchingu. Zdarza się, że wspomniana różnica jest też testowana testem istotności różnic. O ile przed dopasowaniem próby różnica może być istotna, to po dopasowaniu już nie powinna. 16 / 27
17 Przykład Dane częściowo pochodzą z badania przeprowadzonego w USA w latach i dotyczą programu National Support Work Demonstration, którego zadaniem było sprawdzenie jaki jest poziom zarobków, po odbyciu stażu w zakładzie pracy chronionej. Badaniem były objęte osoby z problemami: przestępcy, narkomani, kobiety, które dłuższy czas przebywały na zasiłku socjalnym oraz osoby, które porzuciły naukę w wieku lat. Badanie zostało przeprowadzone metodą eksperymentalną w wynik oszacowanego efektu dla mężczyzn wyniósł 1794$. W latach późniejszych dane te zostały uzupełnione przez LaLonde a (1986) o wyniki dwóch spisów powszechnych Panel Study of Income Dynamics i Current Population Survey. Dane przygotowane przez LaLonde a zostały wykorzystane do weryfikacji jakości techniki PSM przeprowadzonej w (Dehejia and Wahba, 1999) i (Dehejia and Wahba, 2002). 17 / 27
18 Model Dehejia i Wahba Grupa eksperymentalna składała z 185 mężczyzn objętych interwencją, a pula kontrolna zawierała dane ze spisu powszechnego PSID na temat 2490 mężczyzn w wieku poniżej 55 lat, pracujących. Dla obu grup obserwowane były zmienne: wiek (AGE), lata edukacji (EDUC), czy mężczyzna przerwał edukację przed 12 rokiem życia (NODEGREE), czy jest czarnoskóry (BLACK), czy jest latynosem (HISP), czy jest żonaty (MARR), czy był bezrobotny w roku 1974 (U74), czy był bezrobotny w roku 1975 (U75), poziom zarobków w 1974 (RE74), poziom zarobków w 1975 (RE75), poziom zarobków w 1978 (RE78). Ostatnia zmienna była traktowana jako wynikowa. 18 / 27
19 Rozpatrywane modele regresja wieloraka RE78 i = β 0 + β τ T i + β 1 X i, (14) gdzie X = AGE, AGE 2, EDUC, NODEGREE, BLACK, HISP, RE74, RE75 propensity score eβ1x i e(x i ) = 1 + e β1x, (15) i gdzie X = AGE, AGE 2, EDUC, EDUC 2, NODEGREE, BLACK, HISP, MARR, RE74, RE75, RE74 2, RE75 2, U74 BLACK 19 / 27
20 Wyniki Oszacowanie efektu interwencji przeprowadzono w oparciu o kilka technik: różnica średnich bez dopasowania; regresję wieloraką; dopasowaniem po cechach; PSM metodą najbliższego sąsiada (1:1) z powtórzeniami; PSM metodą z promieniem (r = 0.001, , ); PSM metodą warstwową (6 warstw); regresja wieloraka z PS. Zbalansowania grup znacząco się różniły w zależności od zastosowanej metody. Najlepsze zbalansowanie uzyskano przy metodzie łączenia wg cech. Natomiast nieco gorsze zbalansowanie wykazywały techniki PSM. 20 / 27
21 Wyniki Model N 1 N 0 ATT SE a Surowe średnie Regresja wieloraka Łączenie po cechach PSM NN PSM r = PSM r = PSM r = PSM warstwowe 1086 b Regresja z PS a niektóre błędy standardowe były liczone za pomocą techniki bootstrap b Korekta ze wzledu na common support 21 / 27
22 Wady PSM W ostatnich latach coraz częściej pojawia się krytyka techniki PSM (King et al., 2011), (King and Nielsen, Working Paper). Wskazuje się przykłady zastosowań PSM, w których po jej użyciu balans pomiędzy grupami się nawet pogarsza. Zbalansowanie odbywa się tylko po obserwowanych zmiennych, zmienne nieobserwowane nie są balansowane. Alternatywą mogą być: Mahalanobis Distance Matching; Coarsened Exact Matching. 22 / 27
23 Bibliografia (1) Donald B. Rubin. Bayesian inference for causal effects: The role of randomization. The Annals of Statistics, 6(1):34 58, Shenyang Guo, Richard P. Barth, and Claire Gibbons. Propensity score matching strategies for evaluating substance abuse services for child welfare clients. Children and Youth Services Review, 28(4): , David R. Cox. A note on weighted randomization. The Annals of Mathematical Statistics, 27(4): , John Robinson. The analysis of covariance under a randomization model. Journal of the Royal Statistical Society. Series B (Methodological), 35(2): , Paul R. Rosenbaum. Covariance adjustment in randomized experiments and observational studies. Statistical Science, 17(3): , / 27
24 Bibliografia (2) Paul R. Rosenbaum and Donald B. Rubin. The central role of the propensity score in observational studies for causal effects. Biometrika, 70(1):41 55, Marco Caliendo and Sabine Kopeinig. Some practical guidance for the implementation of propensity score matching. Journal of Economic Surveys, 22(1):31 72, Petra E. Todd James J. Heckman, Hidehiko Ichimura. Matching as an econometric evaluation estimator: Evidence from evaluating a job training programme. The Review of Economic Studies, 64(4): , Rajeev H. Dehejia and Sadek Wahba. Causal effects in nonexperimental studies: Reevaluating the evaluation of training programs. Journal of the American Statistical Association, 94(448): , Alex Bryson. The union membership wage premium: an analysis using propensity score matching. Discussion Paper, / 27
25 Bibliografia (3) Boris Augutrzky and Christoph M. Schmidt. The propensity score: a means to an end. IZA Discussion Paper, Neal Thomas Donald B. Rubin. Matching using estimated propensity scores: Relating theory to practice. Biometrics, 52(1): , Jeffrey A. Smith and Petra E. Todd. Does matching overcome lalonde s critique of nonexperimental estimators? Journal of Econometrics, 125 (1 2): , Experimental and non-experimental evaluation of economic policy and models. Herbert L. Smith. Matching with multiple controls to estimate treatment effects in observational studies. Sociological Methodology, 27(1): , Rajeev H. Dehejia and Sadek Wahba. Propensity score matching methods for non-experimental causal studies. Review of Economics and Statistics, 84: , / 27
26 Bibliografia (4) Paul R. Rosenbaum and Donald B. Rubin. Reducing bias in observational studies using subclassification on the propensity score. Journal of the American Statistical Association, 79(387): , Guido Imbens. Nonparametric estimation of average treatment effects under exogeneity: A review. Review of Economics and Statistics, Paul R. Rosenbaum. Model-based direct adjustment. Journal of the American Statistical Association, 82(398): , Donald B. Rubin. Using propensity scores to help design observational studies: Application to the tobacco litigation. Health Services and Outcomes Research Methodology, 2(3): , Robert J. LaLonde. Evaluating the econometric evaluations of training programs with experimental data. The American Economic Review, 76(4): , / 27
27 Bibliografia (5) Gary King, Richard Nielsen, Carter Coberley, James E. Pope, and Aaron Wells. Comparative effectiveness of matching methods for causal inference Gary King and Richard Nielsen. Why propensity scores should not be used for matching. Working Paper. 27 / 27
Propensity score matching (PSM)
Propensity score matching (PSM) Jerzy Mycielski Uniwersytet Warszawski Maj 2010 Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 1 / 18 Badania ewaluacyjne Ocena wpływu
Propensity Score Matching
Zajęcia 5 Plan na dziś 1 Dehejia i Wahba (1999) Dehejia i Wahba (1999) Causal Effects in Nonexperimental Studies: Reevaluating the Evaluation of Training Programs Rajeev H. Dehejia, Sadek Wahba, Journal
Propensity Score Matching
Zajęcia 7 Plan na dziś Deheija (2005) 1 Deheija (2005) Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników 2 PSM dla danych NSW Testy bilansowania Powtórzenie wyników
Propensity Score Matching
Zajęcia 4 Plan na dziś 1 Potencjalne i obserwowane wyniki Regresja dla danych eksperymentalnych 2 Angrist i Pischke, 2009 Potencjalne i obserwowane wyniki Regresja dla danych eksperymentalnych Mostly Harmless
Propensity Score Matching
Zajęcia 6 Plan na dziś 1 Does matching overcome LaLonde s critique of nonexperimental estimators Jeffrey A. Smith, Petra E. Todd (2005) Journal of Econometrics, vol. 125, str. 305-353. Brak zgody w literaturze
Zastosowanie schematu analizy difference-in-differences w badaniach politycznych. Adam Gendźwiłł Tomasz Żółtak Uniwersytet Warszawski
Zastosowanie schematu analizy difference-in-differences w badaniach politycznych Adam Gendźwiłł Tomasz Żółtak Uniwersytet Warszawski Potential outcomes framework Indywidualny efekt przyczynowy różnica
Monte Carlo, bootstrap, jacknife
Monte Carlo, bootstrap, jacknife Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej: http://www.ssc.wisc.edu/~bhansen/econometrics/ Monte Carlo: rozdział 8.8, 8.9 Bootstrap: rozdział
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów regresji z wykorzystaniem metody bootstrap. Wrocław, 22.03.2017r Wybór najlepszej procedury - podsumowanie Co nas interesuje przed przeprowadzeniem
Modele quasi-eksperymentalne: Różnica w różnicy oraz inne metody
Warsztaty szkoleniowe z zakresu oceny oddziaływania instrumentów aktywnej polityki rynku pracy Modele quasi-eksperymentalne: Różnica w różnicy oraz inne metody Celine Ferre, Gdańsk, 22 lutego 2017 r. Metody
STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów
STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1
Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie
Wnioskowanie statystyczne. Statystyka w 5
Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Magdalena Frąszczak Wrocław, 21.02.2018r Tematyka Wykładów: Próba i populacja. Estymacja parametrów z wykorzystaniem metody
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Wprowadzenie W ostatnich latach metody mikroekonometryczne zdobywają coraz większą popularność i uznanie badaczy. Jest to związane przede wszystkim z rozwojem technik gromadzenia i przetwarzania danych.
Propensity Score Matching
Zajęcia 2 Plan dzisiejszych zajęć 1 Doświadczenia Idealne doświadczenie Nie-idealne doświadczenia 2 Idealne doświadczenie Nie-idealne doświadczenia Plan idealnego doświadczenia (eksperymentu) Plan doświadczenia
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Pobieranie prób i rozkład z próby
Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.
Efekty dofinansowanych studiów podyplomowych
2013 Efekty dofinansowanych studiów podyplomowych Przedmiot badania Przedmiot badania W latach 2008-2010, w ramach Poddziałania 2.1.1 PO KL, uruchomiono 117 projektów, obejmujących dofinansowanie studiów
Analiza niepewności pomiarów
Teoria pomiarów Analiza niepewności pomiarów Zagadnienia statystyki matematycznej Dr hab. inż. Paweł Majda www.pmajda.zut.edu.pl Podstawy statystyki matematycznej Histogram oraz wielobok liczebności zmiennej
Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej
7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach
Testowanie hipotez statystycznych. Wnioskowanie statystyczne
Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy
Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe
Wprowadzenie do teorii ekonometrii Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Zajęcia Wykład Laboratorium komputerowe 2 Zaliczenie EGZAMIN (50%) Na egzaminie obowiązują wszystkie informacje
Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:
Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności
Modele quasi-eksperymentalne: Różnica w różnicy oraz inne metody
Warsztaty szkoleniowe z zakresu oceny oddziaływania instrumentów aktywnej polityki rynku pracy Modele quasi-eksperymentalne: Różnica w różnicy oraz inne metody Celine Ferre, Gdańsk, 22 lutego 2017 r. Metody
STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2
STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;
Zróżnicowanie poziomu ubóstwa w Polsce z uwzględnieniem płci
Zróżnicowanie poziomu ubóstwa w Polsce z uwzględnieniem płci Łukasz Wawrowski Katedra Statystyki Uniwersytet Ekonomiczny w Poznaniu Zróżnicowanie poziomu ubóstwa w Polsce z uwzględnieniem płci 2 / 23 Plan
Rozkłady statystyk z próby
Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny
STATYSTYKA OD PODSTAW Z SYSTEMEM SAS. wersja 9.2 i 9.3. Szkoła Główna Handlowa w Warszawie
STATYSTYKA OD PODSTAW Z SYSTEMEM SAS wersja 9.2 i 9.3 Szkoła Główna Handlowa w Warszawie Spis treści Wprowadzenie... 6 1. Podstawowe informacje o systemie SAS... 9 1.1. Informacje ogólne... 9 1.2. Analityka...
Modele quasi-eksperymentalne: Model regresji nieciągłej
Warsztaty szkoleniowe z zakresu ewaluacji wpływu instrumentów Aktywnych Polityk Rynku Pracy Modele quasi-eksperymentalne: Model regresji nieciągłej Maciej Wilamowski, Kraków, 6 czerwca 2017 r. Metody ewaluacji
Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści
Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, 2018 Spis treści Przedmowa 13 O Autorach 15 Przedmowa od Tłumacza 17 1. Wprowadzenie i statystyka opisowa 19 1.1.
Zmienna bazowa. 100(1 α)% przedział ufności dla µ: 100(α)% test hipotezy dla µ = µ 0; odrzucić, jeżeli Ȳ nie jest w przedziale
Wprowadzenie Wprowadzenie Wnioskowanie podsumowanie Zdefiniuj populację, która będzie przedmiotem badań Zbierz parametry, które będą przedmiotem wnioskowania Wybierz losową próbę z populacji Przeprowadź
IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15
IV WYKŁAD STATYSTYKA 26/03/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 4 Populacja generalna, próba, losowanie próby, estymatory Statystyka (populacja generalna, populacja próbna, próbka mała, próbka duża, reprezentatywność,
Ewaluacja efektów netto
Ewaluacja efektów netto interwencji publicznych Stanisław Bienias Podyplomowe studium SGH Ewaluacja projektów i programów unijnych Marzec 2012 Zasady Jeżeli coś jest niezrozumiałe pytamy Jeżeli coś jest
TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.
TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe
Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25
Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane
Modele quasi-eksperymentalne: Model regresji nieciągłej
Warsztaty szkoleniowe z zakresu oceny oddziaływania instrumentów aktywnej polityki rynku pracy Modele quasi-eksperymentalne: Model regresji nieciągłej Maciej Wilamowski, Gdańsk, 22 lutego 2017 r. Metody
ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA
ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA Jan Mielniczuk Wisła, grudzień 2009 PLAN Błędy predykcji i ich podstawowe estymatory Estymacja błędu predykcji w modelu liniowym. Funkcje kryterialne Własności
Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną
Wydział: Zarządzanie i Finanse Nazwa kierunku kształcenia: Finanse i Rachunkowość Rodzaj przedmiotu: podstawowy Opiekun: prof. nadzw. dr hab. Tomasz Kuszewski Poziom studiów (I lub II stopnia): II stopnia
WERYFIKACJA HIPOTEZ STATYSTYCZNYCH
WERYFIKACJA HIPOTEZ STATYSTYCZNYCH I. TESTY PARAMETRYCZNE II. III. WERYFIKACJA HIPOTEZ O WARTOŚCIACH ŚREDNICH DWÓCH POPULACJI TESTY ZGODNOŚCI Rozwiązania zadań wykonywanych w Statistice przedstaw w pliku
Rozkłady statystyk z próby. Statystyka
Rozkłady statystyk z próby tatystyka Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających ten
Wagi poststratyfikacyjne w Europejskim Sondażu Społecznym:
Metodologiczne Inspiracje 2014 Badania ilościowe w naukach społecznych Wyzwania i problemy Wagi poststratyfikacyjne w Europejskim Sondażu Społecznym: możliwości i ograniczenia prawidłowego wykorzystania
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 4 Wrocław, 17 października 2011 Temat. Weryfikacja hipotez statystycznych dotyczących wartości oczekiwanej w dwóch populacjach o rozkładach normalnych. Model 3. Porównanie średnich
Estymacja parametrów w modelu normalnym
Estymacja parametrów w modelu normalnym dr Mariusz Grządziel 6 kwietnia 2009 Model normalny Przez model normalny będziemy rozumieć rodzine rozkładów normalnych N(µ, σ), µ R, σ > 0. Z Centralnego Twierdzenia
Testowanie hipotez statystycznych
9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :
Szkice rozwiązań z R:
Szkice rozwiązań z R: Zadanie 1. Założono doświadczenie farmakologiczne. Obserwowano przyrost wagi ciała (przyrost [gram]) przy zadanych dawkach trzech preparatów (dawka.a, dawka.b, dawka.c). Obiektami
Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ
Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,
weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)
PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
Testowanie hipotez statystycznych. Wprowadzenie
Wrocław University of Technology Testowanie hipotez statystycznych. Wprowadzenie Jakub Tomczak Politechnika Wrocławska jakub.tomczak@pwr.edu.pl 10.04.2014 Pojęcia wstępne Populacja (statystyczna) zbiór,
Przyczynowość, selekcja i endogeniczne oddziaływanie
Przyczynowość, selekcja i endogeniczne oddziaływanie Paweł Strawiński Uniwersytet Warszawski Wydział Nauk Ekonomicznych pstrawinski@wne.uw.edu.pl Kwiecień 2007 Streszczenie W modelach konstruowanych dla
Wykorzystanie metod kontrfaktycznych w badaniach ewaluacyjnych
2013 Rafał Trzciński Wykorzystanie metod kontrfaktycznych w badaniach ewaluacyjnych Międzyregionalna konferencja ewaluacyjna: Ewaluacja programów operacyjnych wyzwania, inspiracje, przyszłość Toruń, 25.06.2013
Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8
Stanisław Cichocki Natalia Nehrebecka Zajęcia 8 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów
Testowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
Natalia Neherbecka. 11 czerwca 2010
Natalia Neherbecka 11 czerwca 2010 1 1. Konsekwencje heteroskedastyczności i autokorelacji 2. Uogólniona MNK 3. Stosowalna Uogólniona MNK 4. Odporne macierze wariancji i kowariancji b 2 1. Konsekwencje
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Własności estymatorów regresji porządkowej z karą LASSO
Własności estymatorów regresji porządkowej z karą LASSO Uniwersytet Mikołaja Kopernika w Toruniu Uniwersytet Warszawski Badania sfinansowane ze środków Narodowego Centrum Nauki przyznanych w ramach finansowania
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski
Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych
Spis treści 3 SPIS TREŚCI
Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe
Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.
Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. dr hab. Jerzy Nakielski Katedra Biofizyki i Morfogenezy Roślin Plan wykładu: 1. Etapy wnioskowania statystycznego 2. Hipotezy statystyczne,
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez statystycznych
Wykład 8 Dane kategoryczne
Wykład 8 Dane kategoryczne Wrocław, 19.04.2017r Zmienne kategoryczne 1 Przykłady zmiennych kategorycznych 2 Zmienne nominalne, zmienne ordynalne (porządkowe) 3 Zmienne dychotomiczne kodowanie zmiennych
LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.
LABORATORIUM 4 1. Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz. I) WNIOSKOWANIE STATYSTYCZNE (STATISTICAL INFERENCE) Populacja
NOWY PROGRAM STUDIÓW 2016/2017 SYLABUS PRZEDMIOTU AUTORSKIEGO: Wprowadzenie do teorii ekonometrii. Część A
NOWY PROGRAM STUDIÓW 2016/2017 SYLABUS PRZEDMIOTU AUTORSKIEGO: Autor: 1. Dobromił Serwa 2. Tytuł przedmiotu Sygnatura (będzie nadana, po akceptacji przez Senacką Komisję Programową) Wprowadzenie do teorii
Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów
Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,
Biostatystyka, # 3 /Weterynaria I/
Biostatystyka, # 3 /Weterynaria I/ dr n. mat. Zdzisław Otachel Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, p. 221 bud. CIW, e-mail: zdzislaw.otachel@up.lublin.pl
STATYSTYKA wykład 5-6
TATYTYKA wykład 5-6 Twierdzenia graniczne Rozkłady statystyk z próby Wanda Olech Twierdzenia graniczne Jeżeli rozpatrujemy ciąg zmiennych losowych {X ; X ;...; X n }, to zdarza się, że ich rozkłady przy
WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno
WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:
Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa
Spis treści Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Romuald Kotowski Katedra Informatyki Stosowanej PJWSTK 2009 Spis treści Spis treści 1 Wstęp Bardzo często interesujący
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
Dystrybuanta i funkcja gęstości
Dystrybuanta i funkcja gęstości Dziedziną dystrybuanty zmiennej losowej jest zawsze: Zbiór liczb nieujemnych Zbiór liczb dodatnich Przedział (0,1) Zbiór liczb rzeczywistych Zbiorem wartości dystrybuanty
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Redakcja i korekta Bogdan Baran Projekt graficzny okładki Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2011 ISBN
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA
Opis zakładanych efektów kształcenia na studiach podyplomowych Nazwa studiów: BIOSTATYSTYKA PRAKTYCZNE ASPEKTY STATYSTYKI W BADANIACH MEDYCZNYCH Typ studiów: doskonalące Symbol Efekty kształcenia dla studiów
Próbkowanie. Wykład 4 Próbkowanie i rozkłady próbkowe. Populacja a próba. Błędy w póbkowaniu, cd, Przykład 1 (Ochotnicy)
Wykład 4 Próbkowanie i rozkłady próbkowe µ = średnia w populacji, µ=ey, wartość oczekiwana zmiennej Y σ= odchylenie standardowe w populacji, σ =(Var Y) 1/2, pierwiastek kwadratowy wariancji zmiennej Y,
Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Wykład 4 Prognozowanie, stabilność 1 / 17 Agenda
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza
OPTYMALIZACJA LICZBY WARSTW DLA ALOKACJI NEYMANA
Tomasz Bąk Uniwersytet Ekonomiczny w Katowicach OPTYMALIZACJA LICZBY WARSTW DLA ALOKACJI NEYMANA Wprowadzenie Losowanie warstwowe jest często wykorzystywaną w praktyce metodą doboru próby w przypadku estymacji
WYKŁAD 5 TEORIA ESTYMACJI II
WYKŁAD 5 TEORIA ESTYMACJI II Teoria estymacji (wyznaczanie przedziałów ufności, błąd badania statystycznego, poziom ufności, minimalna liczba pomiarów). PRÓBA Próba powinna być reprezentacyjna tj. jak
Wnioskowanie bayesowskie
Wnioskowanie bayesowskie W podejściu klasycznym wnioskowanie statystyczne oparte jest wyłącznie na podstawie pobranej próby losowej. Możemy np. estymować punktowo lub przedziałowo nieznane parametry rozkładów,
Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 3. Zmienne losowe 4. Populacje i próby danych 5. Testowanie hipotez i estymacja parametrów 6. Test t 7. Test
STATYSTYKA MAŁYCH OBSZARÓW I. WPROWADZENIE
1 STATYSTYKA MAŁYCH OBSZARÓW I. WPROWADZENIE 1.1 Podejścia w statystyce małych obszarów Randomizacyjne Wektor wartości badanej cechy traktowany jest jako nielosowy. Szacowana charakterystyka jest nielosowa
5. WNIOSKOWANIE PSYCHOMETRYCZNE
5. WNIOSKOWANIE PSYCHOMETRYCZNE Model klasyczny Gulliksena Wynik otrzymany i prawdziwy Błąd pomiaru Rzetelność pomiaru testem Standardowy błąd pomiaru Błąd estymacji wyniku prawdziwego Teoria Odpowiadania
VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15
VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady
STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.
STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z
STUDIA METODOLOGICZNE
NR 9 (652) WRZESIEŃ 25 CZASOPISMO GŁÓWNEGO URZĘDU STATSTCZNEGO I POLSKIEGO TOWARZSTWA STATSTCZNEGO STUDIA METODOLOGICZNE Od Redakcji Zgodnie z zapowiedzią z poprzedniego numeru Wiadomości Statystycznych,
Metody Statystyczne. Metody Statystyczne.
gkrol@wz.uw.edu.pl #4 1 Sprawdzian! 5 listopada (ok. 45-60 minut): - Skale pomiarowe - Zmienne ciągłe i dyskretne - Rozkład teoretyczny i empiryczny - Miary tendencji centralnej i rozproszenia - Standaryzacja
TESTOWANIE HIPOTEZ STATYSTYCZNYCH
TETOWANIE HIPOTEZ TATYTYCZNYCH HIPOTEZA TATYTYCZNA przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia jest oceniana na