Propensity score matching (PSM)

Podobne dokumenty
Modele quasi-eksperymentalne: Różnica w różnicy oraz inne metody

Modele quasi-eksperymentalne: Różnica w różnicy oraz inne metody

Zastosowanie schematu analizy difference-in-differences w badaniach politycznych. Adam Gendźwiłł Tomasz Żółtak Uniwersytet Warszawski

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Stanisław Cichocki Natalia Nehrebecka. Wykład 7


Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Zawansowane modele wyborów dyskretnych

Stosowana Analiza Regresji

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

STATYSTYKA MATEMATYCZNA

Propensity Score Matching

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Propensity Score Matching

Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński

Elementy modelowania matematycznego

STATYSTYKA MATEMATYCZNA

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Stopę zbieżności ciagu zmiennych losowych a n, takiego, że E (a n ) < oznaczamy jako a n = o p (1) prawdopodobieństwa szybciej niż n α.

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Zadania ze statystyki cz.8. Zadanie 1.

Pomiar wpływu I: Jak mierzyć wpływ? Wstęp do projektowania ewaluacji

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Metoda Monte Carlo. Jerzy Mycielski. grudzien Jerzy Mycielski () Metoda Monte Carlo grudzien / 10

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11

Porównanie dwóch rozkładów normalnych

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński

Wykład 3 Hipotezy statystyczne

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

ESTYMACJA. Przedział ufności dla średniej

Hierarchiczna analiza skupień

Projektowanie eksperymentu Część 1

Testy nieparametryczne

Agnieszka Nowak Brzezińska Wykład III

Natalia Neherbecka. 11 czerwca 2010

Stanisław Cichocki. Natalia Nehrebecka

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Testowanie hipotez statystycznych. Wprowadzenie

Propensity Score Matching

STATYSTYKA

MODELE LINIOWE. Dr Wioleta Drobik

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Uogolnione modele liniowe

5. WNIOSKOWANIE PSYCHOMETRYCZNE

Agnieszka Nowak Brzezińska Wykład III

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Rozkłady statystyk z próby

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

Efektywność polityki rynku pracy w metropoliach i na peryferiach Zenon Wiśniewski

Pomiar wpływu I: Jak mierzyć wpływ? Wstęp do projektowania ewaluacji

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Wnioskowanie bayesowskie

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Podręcznik akademicki dofinansowany przez Ministra Nauki i Szkolnictwa Wyższego

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Value at Risk (VaR) Jerzy Mycielski WNE. Jerzy Mycielski (Institute) Value at Risk (VaR) / 16

ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Wojciech Skwirz

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Modele quasi-eksperymentalne: Model regresji nieciągłej

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Zastosowanie techniki Propensity Score Matching w badaniach ewaluacyjnych

Statystyka Matematyczna Anna Janicka

PDF created with FinePrint pdffactory Pro trial version

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Test U Manna-Whitneya : Test H Kruskala-Wallisa Test Wilcoxona

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

Agnieszka Nowak Brzezińska

METODY STATYSTYCZNE W BIOLOGII

Prawdopodobieństwo i statystyka

Wykład 9 Testy rangowe w problemie dwóch prób

Wykorzystanie techniki propensity score matching w badaniach ewaluacyjnych

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Własności statystyczne regresji liniowej. Wykład 4

Fuzja sygnałów i filtry bayesowskie

Metody badawcze. Metodologia Podstawowe rodzaje metod badawczych

Spis treści 3 SPIS TREŚCI

Wykład 2: Tworzenie danych

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

R-PEARSONA Zależność liniowa

Szacowanie przyczynowego wpływu interwencji: funkcje, walory, ograniczenia oraz relacje z innymi podejściami w ewaluacji

Regresja nieparametryczna series estimator

Schemat eksperymentalny Część 1: Ścieżka techniczna

Stanisław Cichocki. Natalia Nehrebecka

Modele quasi-eksperymentalne: Model regresji nieciągłej

Analiza wariancji. dr Janusz Górczyński

Regresja i Korelacja

Polska-Warszawa: Usługi badania rynku 2016/S (Suplement do Dziennika Urzędowego Unii Europejskiej, , 2016/S )

METODY STATYSTYCZNE W BIOLOGII

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Teoria Estymacji. Do Powyżej

Transkrypt:

Propensity score matching (PSM) Jerzy Mycielski Uniwersytet Warszawski Maj 2010 Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 1 / 18

Badania ewaluacyjne Ocena wpływu bodźca Przykłady: ocena skuteczności programów aktywizacji zawodowej ocena skuteczności dotacji mających na celu zachęcanie do innowacyjności Idealny eksperyment społeczny 1 jednostki należące do grupy eksperymentalnej i kontrolnej mają ten sam rozkład cech nieobserwowalnych 2 jednostki należące do grupy eksperymentalnej i kontrolnej mają ten sam rozkład cech obserwowalnych 3 ten sam kwestionariusz zostałzastosowany w przypadku grupy eksperymentalnej i kontrolnej - cechy i wyniki są mierzone w ten sam sposób 4 obie grupy znajdują się w tym samy otoczeniu ekonomicznym Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 2 / 18

Badania ewaluacyjne c.d. Idealną metodą ewaluacyjną jest eksperyment zrandomizowany w przypadku takiego eksperymentu założenia (1)-(4) są automatycznie spełnione Tradycyjna analiza ekonomiczna dotycząca problemów związanych z ewaluacją w przypadku danych nieeksperymentalnych koncentrowały się na problemie z założeniem (1) - np. model Heckmana w praktyce jednak ważniejsze wydają się problemy z założeniami (2), (3), (4). Metoda PSM umożliwia znaczną redukcję obciążenia estymacji efektu bodźca jeśli nie jest spełnione założenie (2). Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 3 / 18

Notacja i I 1 grupa eksperymentalna j I 0 grupa kontrolna D {0, 1} D = 0 jednostka nie została poddana działaniu bodźca (niebodźcowana - untreated) D = 1 jednostka została poddana działaniu bodźca (bodźcowana - treated) X - wektor charakterystyk jednostki Pr (X) prawdopodobieństwo znalezienia się w grupie eksperymentalnej (propensity score) Efekt przyczynowy mierzony jest za pomocą zmiennej wynikowej Y Y 0 wynik w przypadku jednostki niebodźcowanej Y 1 wynik w przypadku jednostki bodźcowanej Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 4 / 18

Efekt przyczynowy Efekt przyczynowy (Treatment Effect ) dla jednostki o charakterystykach X E (Y 1 Y 0 D = 1, X) Średni efekt przyczynowy (Average Treatment Effect - ATE) ATE = E (Y 1 Y 0 ) Średni efekt przyczynowy dla grupy eksperymentalnej (Average Treatment Effect on the treated - ATE 1 ) ATE 1 = E (Y 1 Y 0 D = 1) Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 5 / 18

Efekt przyczynowy c.d. Obserwujemy Y = DY 1 + (1 D) Y 0 Każdej jednostce przypisany jest efekt zaobserwowany i konfaktyczny I 0 I 1 D = 0 Y 0 Y 1 D = 1 Y 0 Y 1 Nie jest możliwe bezpośrednie zaobserwowanie efektu przyczynowego dla grupy kontrolnej E (Y 0 D = 1, X) (efektu kontrfaktycznego) Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 6 / 18

Idea PSM Sprawdzamy jaka jest różnica między średnią wielkością zmiennej wynikowej dla jednostek bodźcowanych i podobnych niebodźcowanych. Im bardziej podobna jest jednostka niebodźcowana do jednostki bodźcowanej tym większą ma wagę w dokonywanym porównaniu Oszacowanie efekt przyczynowy dla jednostki i (Treatment Effect) Y 1i j I 0 W N0,N 1 (i, j) Y 0j Oszacowanie średniego efektu przyczynowego (ATE) [ i I 1 w N0,N 1 (i) Y 1i j I 0 W N0,N 1 (i, j) Y 0j Różne metody PSM są oparte na różnym doborze funkcji wag w N0,N 1 (i) i W N0,N 1 (i, j). Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 7 / 18 ]

Statystyczna niezależność Definicja Pr (D = 1 Y 0, Y 1, X) = Pr (D = 1 X) (1) Selekcja do próby następuje w oparciu jedynie o czynniki obserwowalne Zakładamy, że niewystępuje samoselekcja. Wykluczona selekcja w oparciu o czynniki nieobserwowalne wpływające na wynik bodźcowania - tak jak w modelu Heckmana Inna notacja (Y 0, Y 1 ) D X Stable Unit Treatment Assumption SUTVA - wynik dla poszczególnych jednostek nie zależy od wyników pozostałych jednostek Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 8 / 18

Silna statystyczna niezależność Jeśli dodatkowo prawdą założenie o wspólnej dziedzinie (common support): 0 < Pr (X) < 1 (2) Jeśli warunki (1) (1), to mówimy o silnej statystycznej niezależności. Warunek (2) jest warunkiem stosowania PSM. Jeśli Pr (X) = 0 lub Pr (X) = 1, to jednostka jest nigdy bądź zawsze bodźcowana i dobranie dla niej odpowiedników w próbie kontrolnej jest niemożliwe. W przypadku, gdy niespełniony jest warunek (2) musimy ograniczyć się do podpopulacji, w której jest on spełniony Zdefiniujmy Wspólna dziedzina S 0 = Supp (X D = 0) S 1 = Supp (X D = 1) S = S 0 S 1 Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 9 / 18

Dekompozycja obciążenia oszacowania w badaniach ewaluacyjnych Różnica średnich wyników w grupie eksperymentalnej i kontrolnej E (Y 0 D = 1, X S 1 ) E (Y 0 D = 0, X S 0 ) = B 1 + B 2 + B 3 Obciążenie wynikające z niepokrywających się dziedzin B 1 = E [E (Y 0 D = 1, X S 1 \ (S 0 S 1 )) D = 1] E [E (Y 0 D = 0, X S 0 \ (S 0 S 1 )) D = 0] Obciążenie wynikające z odmienności rozkładów w grupie eksperymentalnej i kontrolnej B 2 = E [E (Y 0 D = 0, X S 0 S 1 ) D = 1] E [E (Y 0 D = 0, X S 0 S 1 ) D = 0] Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 10 / 18

Dekompozycja obciążenia oszacowania w badaniach ewaluacyjnych c.d. Obciążenie wynikające z wynikające z różnic rozkładów charakterystyk nieobserwowalnych w grupie eksperymentalnej i kontrolnej B 3 = E [E (Y 0 D = 1) E (Y 0 D = 0) D = 1, X S 0 S 1 ] Zastosowanie PSM umożliwia skorygowanie obciążenia B 2 oraz określenie wspólnej dziedziny, dla której nie występuje obciążenie B 1 Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 11 / 18

Implikacje silnej statystycznej niezależności c.d. Z silnej niezależności wynika, że średni efekt kontrfaktyczny można policzyć w następujący sposób E (Y 0 D = 1) = E [E (Y 0 D = 1, X) D = 1] = E [E (Y 0 D = 0, X) D = 1] Załóżmy, że udało nam się uzyskać parametryczne bądź nieparametryczne oszacowania r 0 (X i ) = E (Y 0 D = 0, X i ) i r 1 (X i ) = E (Y 1 D = 1, X i ) Oszacowanie ATE 1 możemy uzyskać jako średnią 1 N 1 i I 1 ( r 1 (X i ) r 0 (X i )) Do przeprowadzenia tego przekształcenia wystarczy nam założenie, że Y 0 D X Do oszacowania ATE 1 wystarczy jeszcze słabsze założenie niezależności średnich Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 12 / 18

Implikacje silnej statystycznej niezależności Silna statystyczna niezależność implikuje, że (Resenbaum, Rubin 1983) (Y 0, Y 1 ) D Pr (X) Dowód E [D Y 0, Y 1, Pr (X)] = E {E [D Y 0, Y 1, X] Pr (X)} = E [E [D Y 0, Y 1, X] Pr (X)] = E [Pr (D = 1 Y 0, Y 1, X) Pr (X)] = E {Pr (D = 1 X) Pr (X)} = E {Pr (X) Pr (X)} = Pr (X) = E [D Pr (X)] Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 13 / 18

Implikacje silnej statystycznej niezależności c.d. Wniosek Resenbauma i Rubina oznacza, że niezależność wyniku od przynależności do grupy kontrolnej zachodzi nie tylko warunkowo względem cech ale także warunkowo względem Pr (X) Zauważmy, że jeśli mamy obserwacje z grupy eksperymentalnej i kontrolnej o identycznym Pr (X), to ATE 1 można oszacować jako: E [Y 1 D = 1, Pr (X)] E [Y 0 D = 0, Pr (X)] = E [Y 1 Y 0 Pr (X)] Dobierając podobne jednostki nie musimy uwzględniać podobieństwa wszystkich cech a jedynie zbliżoną wartość Pr (X) Procedura PSM korzysta z tej fundamentalnej własności: W PSM grupa kontrolna dobierana jest z puli kontrolnej (zbioru obserwacji nie objętych działaniem bodźca) na podstawie podobieństwa oszacowanych wartości propensity score Pr (X) Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 14 / 18

PSM - szacowanie propensity score Metody parametryczne (probit, logit) Metody nieparametryczne Kluczowym problemem przy szacowaniu Pr (X) jest zwrócenie uwagi na to, czy spełnione jest założenie o wspólnej dziedzinie zakres wartości dopasowanych prawdopodobieństw powinien być zbliżony nie powinny występować predyktory doskonale przewidujące wynik Z tego powodu w literaturze pojawia się pogląd, że model dla Pr (X) nie powinien być "zbyt dobry" Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 15 / 18

PSM - dobieranie obserwacji do grupy kontrolnej Dobieranie bez zwracania lub ze zwracaniem Liczba jednostek z grupy kontrolnej przypadająca na jednostkę bodźcowaną: 1 do 1, 1 do n Algorytm dobierania: najbliższy sąsiad (nearest neighbor) najbliższy sąsiad z limitem (nearest neighbor with caliper) metoda z promieniem (radius matching) metoda jądrowa ( ) Pr(Xi ) Pr(X K j) h w ij = przy czym h jest szerokością okna j I0 ( Pr(Xi ) Pr(X j) h Dobór algorytmu dobierania odpowiedników zależy głównie od wielkości próby Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 16 / 18 )

PSM - ocena jakości łączenia W idealnym przypadku grupa kontrolna uzyskana na podstawie PSM powinna być duża i mieć identyczny rozkład charakterystyk obserwowalnych jak grupa eksperymentalna Przy doborze algorytmu doboru obserwacji powinnísmy brać pod uwagę dwa elementy: obciążenie oszacowania efektu przyczynowego: tym mniejsze im podobniejsze obserwacje w grupie kontrolnej wariancję oszacowania efektu przyczynowego: tym mniejsza im większa grupa kontrolna Do zbadania jakości łączenia można porównać średnie wartości charakterystyk w grupie eksperymentalnej i grupie kontrolnej Można procedurę tę sformalizować przeprowadzając testy równości średnich Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 17 / 18

PSM - zalety i ograniczenia Zalety W przypadku stosowania PSM nie musimy przyjmować parametrycznych postaci zależności między efektem przyczynowym a charakterystykami jednostek - zależność E ( Y 1 D = 1, X) i E ( Y 0 D = 1, X) może mieć całkiem ogólną formę eliminuje najważniejsze źródła obciążenia Ograniczenia muszą być spełnione założenia silnej statystycznej niezależność brak samoselekcji brak selekcji w oparci o cechy nieobserwowalne duże wymagania w odniesieniu do wielkości zbioru danych - aby dobrać podobne obserwacje do grupy kontrolnej musimy mieć dużą pulę kontrolną Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 18 / 18