Modele quasi-eksperymentalne: Różnica w różnicy oraz inne metody

Podobne dokumenty
Modele quasi-eksperymentalne: Różnica w różnicy oraz inne metody

Pomiar wpływu II: Podstawowe koncepcje wyników quasi-eksperymentalnych

Modele quasi-eksperymentalne: Model regresji nieciągłej

Warsztaty szkoleniowe z zakresu oceny oddziaływania instrumentów aktywnej polityki rynku pracy. Łańcuch wyników

Modele quasi-eksperymentalne: Model regresji nieciągłej

Schemat eksperymentalny Część 1: Ścieżka techniczna

Studium przypadku: eksperymenty kontrolowane

Modele quasi-eksperymentalne: Model regresji nieciągłej

Dostępność danych o uczestnikach programów rynku pracy w Polsce

Studium przypadku: W poszukiwaniu grupy porównawczej dla ewaluacji interwencji realizowanych w Polsce Tomasz Gajderowicz, Gdańsk, 20 lutego 2017 r.

Pomiar wpływu I: Jak mierzyć wpływ? Wstęp do projektowania ewaluacji

Ocena Programu Robót Publicznych na Łotwie

Projektowanie eksperymentu Część 1

Pomiar wpływu I: Jak mierzyć wpływ? Wstęp do projektowania ewaluacji

Zalecenia praktyczne w przeprowadzaniu ewaluacji

Wybór metody ewaluacji

Propensity score matching (PSM)

Studium przypadku: eksperymenty kontrolowane

Wstęp do ewaluacji wpływu

Projektowanie eksperymentu część 2

Dobór metody ewaluacji wpływu

PROGRAM. Warsztaty budowania umiejętności w zakresie ewaluacji wpływu programów zatrudnienia lutego 2017 r.

PROGRAM. Warsztaty budowania umiejętności w zakresie ewaluacji wpływu programów zatrudnienia lutego 2017 r.

Ocena Programu Robót Publicznych na Łotwie

PROGRAM. Warsztaty szkoleniowe z zakresu ewaluacji wpływu instrumentów Aktywnych Polityk Rynku Pracy 5-8 czerwca 2017 r.

Dostępność danych o uczestnikach programów rynku pracy w Polsce

Przegląd ewaluacji wpływu

Efektywność polityki rynku pracy w metropoliach i na peryferiach Zenon Wiśniewski

Zastosowanie schematu analizy difference-in-differences w badaniach politycznych. Adam Gendźwiłł Tomasz Żółtak Uniwersytet Warszawski

Studium przypadku: W poszukiwaniu grupy porównawczej dla ewaluacji interwencji realizowanych w Polsce Tomasz Gajderowicz, Gdańsk, 20 lutego 2017 r.

Studium przypadku: W poszukiwaniu grupy porównawczej dla ewaluacji interwencji realizowanych w Polsce Tomasz Gajderowicz, Kraków, 5 czerwca 2017 r.

Ewaluacja w polityce społecznej

DOBÓR PRÓBY. Czyli kogo badać?

Zalecenia praktyczne w przeprowadzaniu ewaluacji

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Lekcje płynące z niepowodzeń

Problem badawczy Przeprowadzenia badania ewaluacyjnego projektu realizowanego w ramach Poddziałania 6.1.3

Statystyka i Analiza Danych

METODY STATYSTYCZNE W BIOLOGII

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

METODY STATYSTYCZNE W BIOLOGII

Zalecenia praktyczne w przeprowadzaniu ewaluacji

METODY STATYSTYCZNE W BIOLOGII

Skuteczność instrumentów wsparcia wśród małopolskich przedsiębiorców - wyniki badań

Wykorzystanie danych administracyjnych w eksperymentach kontrolowanych

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

ANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH

RECENZJA KSIĄŻKI POD REDAKCJĄ ZENONA WIŚNIEWSKIEGO, KAMILA ZAWADZKIEGO EFEKTYWNOŚĆ POLITYKI RYNKU PRACY W POLSCE RECENZJE WIESŁAW GOLNAU

Regresja i Korelacja

Podręcznik akademicki dofinansowany przez Ministra Nauki i Szkolnictwa Wyższego

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Jak poprawić efektywność usług rynku pracy?

Szkolenie Regresja liniowa

POWIATOWY URZĄD PRACY w Lubinie

Pobieranie prób i rozkład z próby

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Efekty dofinansowanych studiów podyplomowych

LIDER BIZNESOWYCH SZKOLEŃ JĘZYKOWYCH. Oferta. Super praktyczny. Warsztat

STATYSTYKA MATEMATYCZNA

1. Wielkość i stopa bezrobocia. Stopa bezrobocia stan z r.

Rezultaty projektu Pierwsza szychta realizowanego w ramach Inicjatywy Wspólnotowej EQUAL inspiracją dla projektodawców w 2010 roku.

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński

Eksperyment jako metoda badawcza

Żródło:

Efekty wsparcia młodych osób niepracujących i niekształcących się w ramach Programu Operacyjnego Wiedza Edukacja Rozwój

Sprawozdanie z działalności Miejskiego Urzędu Pracy w Lublinie - I półrocze 2015 r. -

Warsztat: Randomizacja w programie Excel

Rezultaty projektu Pierwsza szychta realizowanego w ramach Inicjatywy. projektodawców w 2010 roku.

Kontekstowe wskaźniki efektywności nauczania - warsztaty

Statystyka matematyczna dla leśników

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

I n f o r m a c j a. Powiatowy Urząd Pracy w Lubinie. o stanie i strukturze bezrobocia w powiecie lubińskim wg stanu na dzień r.

Projekt Konserwator aktywizacja zawodowa osób bezrobotnych w instytucjach sektora kultury. Kraków, Hotel Andels, 22 lutego 2013 r.

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA

INFORMACJA. o stanie i strukturze bezrobocia. rejestrowanego

Wsparcie osób młodych do 30 roku życia w ramach Osi I Osoby młode na rynku pracy Programu Operacyjnego Wiedza Edukacja Rozwój

Badanie efektów wsparcia zrealizowanego na rzecz osób młodych w ramach Programu Operacyjnego Wiedza Edukacja Rozwój I BADANIE WSKAŹNIKOWE

Stosowana Analiza Regresji

Metoda najmniejszych kwadratów

INFORMACJA O SYTUACJI NA LOKALNYM RYNKU PRACY w 2014 roku z załącznikami

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

W A R S Z A W A

PDF created with FinePrint pdffactory Pro trial version

Informacja o strukturze wydatków oraz gospodarce środkami Funduszu Pracy na realizację zadań z zakresu aktywnej polityki rynku pracy w województwie

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Nawroty w uzależnieniach - zmiany w kontaktach z alkoholem po zakończeniu terapii

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Sprawozdanie z działalności Miejskiego Urzędu Pracy w Lublinie - I półrocze 2011 r. -

Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0

5. WNIOSKOWANIE PSYCHOMETRYCZNE

Statystyka i Analiza Danych

Mieczysław Kowerski. Program Polska-Białoruś-Ukraina narzędziem konwergencji gospodarczej województwa lubelskiego

POWIATOWY URZĄD PRACY W LEGNICY Z FILIĄ W CHOJNOWIE ANALIZA EFEKTYWNOŚCI I SKUTECZNOŚCI SZKOLEŃ ZA 2014 ROK

BEZROBOCIE W POLSCE W 2013 ROKU

OSOBY W WIEKU LAT

Ustalanie mocy testu i optymalnej wielkości próby

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Wynagrodzenia absolwentów MBA w 2017 roku

Transkrypt:

Warsztaty szkoleniowe z zakresu oceny oddziaływania instrumentów aktywnej polityki rynku pracy Modele quasi-eksperymentalne: Różnica w różnicy oraz inne metody Celine Ferre, Gdańsk, 22 lutego 2017 r.

Metody ewaluacji Instrumentarium Przydział losowy Model regresji nieciągłej Metoda podwójnej różnicy PSM (Dopasowanie) Metody quasieksperymentalne (wymagają większej liczby założeń)

Metody ewaluacji Instrumentarium Przydział losowy Model regresji nieciągłej Metoda podwójnej różnicy PSM (Dopasowanie)

METODA PODWÓJNEJ RÓŻNICY (DIFFERENCE-IN-DIFFERENCE, DiD)

Metoda podwójnej różnicy (DiD) Y= Prawdopodobieństwo zatrudnienia P= Program szkolenia dla młodzieży Zapisani (T) Po (1) 0.74 0.81 - - Przed (0) 0.60 0.78 Nie zapisani (C) - = Różnica +0.14 +0.03 0.11 Diff-in-Diff: Wpływ=(Y T1 -Y T0 )-(Y C1 -Y C0 )

Prawdopodobieństwo zatrudnienia Wpływ=(A-B)-(C-D)=(A-C)-(B-D) Nie-uczestnicy Uczestnicy D=0.78 C=0.81 A=0.74 Wpływ=0.11 B=0.60 Podobne trendy przed realizacją programu t=0 t=1 Czas

Przykład programu Progresa Okr. badany (t=1) Wydatki gosp. (Y) Okr. bazowy (t=0) Wydatki gosp. (Y) Zapisani Nie zapisani Różnica 268.75 290-21.25 233.47 281.74-48.27 Różnica 35.28 8.26 27.02 Szacowany wpływ na konsumpcję (Y) Regresja liniowa 27.06** Regresja liniowa wielu zmiennych 25.53** Uwaga: Jeśli efekt jest znaczący statystycznie przy 1% poziomu znaczenia, szacowany wpływ oznaczony jest dwiema gwiazdkami (**).

Rekomendacje dla polityki Progresa? Wpływ programu Progresa na konsumpcję (Y) Przypadek 1: Przed i Po 34.28** Przypadek 2: Uczestnicy & Nie-uczestnicy -4.15 Przypadek 3: Przydział losowy 29.75** Przypadek 4: Nieciągły model regresji 30.58** Przypadek 5: Metoda podwójnej różnicy 25.53** Uwaga: Jeśli efekt jest znaczący statystycznie przy 1% poziomu znaczenia, szacowany wpływ oznaczony jest dwiema gwiazdkami (**).

Przykład: Nowa Umowa dla Młodych [New Deal for Young People: Wielka Brytania] Program CO? Program dla osób w wieku od 18 do 24 lat, które pobierały zasiłek dla bezrobotnych przez okres 6 miesięcy lub dłuższy. Oferuje możliwości pracy, zdobycia nowych umiejętności lub doświadczenia w sektorach gospodarczych związanych z wolontariatem i ochroną środowiska. GDZIE? Wprowadzony w Wielkiej Brytanii w 1998 roku DLACZEGO? Pomoc młodym w znalezieniu zatrudnienia i zwiększenie ich zatrudnialności Metoda/kryteria kwalifikacji o o Dane Osoby pomiędzy 18 a 24 rokiem życia, zarejestrowane jako bezrobotne przez ponad 6 miesięcy stanowią grupę poddaną działaniu Osoby pomiędzy 30 a 39 rokiem życia, zarejestrowane jako bezrobotne przez ponad 6 miesięcy stanowią grupę kontrolną Joint Unemployment and Vacancies Operating System (JUVOS), dotyczą okresu do lutego 2001 roku - 32 miesiące po rozpoczęciu programu ogólnokrajowego

Problem I: Z założenia wymagane są takie same trendy Różnica w różnicy jest interpretowalna tylko wówczas, gdy obydwie grupy podlegały podobnym trendom przed programem. Zmiany w zaobserwowanych wynikach wśród osób nieprzyjętych byłyby takie same wśród osób przyjętych. Co, jeśli w każdym wypadku uczestnictwo wśród osób przyjętych wzrosłoby bardziej, niż u osób nieprzyjętych? NARUSZENIE ZASADY TAKICH SAMYCH TRENDÓW!

Prawdopodobieństwo zdobycia zatrudnienia Równe trendy C=0,81 D=0,78 A=0,74 B=0,60 Podobne trendy przed programem T=0 T=1 Czas

Prawdopodobieństwo zdobycia zatrudnienia Różne trendy C=0,81 D=0,78 A=0,74 Różne trendy przed interwencją B=0,60 Zmierzenie wpływu programu nie będzie możliwe za pomocą metody różnicy w różnicy T=0 T=1 Czas

Co w wypadku, gdy dane zdarzenie ma wpływ tylko na jedną grupę? Przypadek 1: Program szkoleniowy W programie udział wzięły tylko osoby szczególnie zmotywowane Urzędnicy przyjmują tylko takie osoby, co do których istnieją oczekiwania, że szkolenie zakończy się u nich sukcesem DDprzecenia efekt programu Przypadek 2: Granty na rozwój działalności firm działających w sektorze publicznym Grupa poddana działaniu = małe firmy pracujące dla sektora publicznego Grupa kontrolna = małe firmy w sektorze prywatnym Uwaga! Np. BREXIT będzie miał różny wpływ na te grupy! DD nie docenia efektu interwencji

Prawdopodobieństwo zdobycia zatrudnienia Test trendu W celu przeprowadzenia testu niezbędne są co najmniej 3 obserwacje: o 2 obserwacje przed o 1 obserwacja po Przed Przed działaniem t=-1 działaniem t=0 Po działaniu t=1 Czas

. Problem 2: Zmiany w składach grup w miarę upływu czasu Metoda DD wymaga obserwacji takich samych rodzajów grup na przestrzeni czasu Na przykład, wszystkie osoby posiadające konkretne umiejętności opuszczają program, bo nie potrzebują już szkolenia, co sprawia, że po zakończeniu programu wyniki szkolenia u osób pozostających w programie są niższe. DD nie docenia efektu programu Na przykład, wszystkie osoby nieposiadające konkretnych umiejętności opuszczają program, bo nie mogą dotrzeć na miejsce szkolenia. DD przecenia efekt programu

Pamiętajmy! Metoda różnicy w różnicach Łączy metodę uczestnicy i nie-uczestnicy, z metodą przed i po Współczynnik kierunkowy: utworzenie stanu kontrfaktycznego dla zmiany w wyniku PODSTAWOWE ZAŁOŻENIE Trendy - współczynniki kierunkowe - są takie same w grupie eksperymentalnej i porównawczej W celu przeprowadzenie testu niezbędne są co najmniej 3 obserwacje na przestrzeni czasu: o 2 obserwacje przed o 1 obserwacja po

Ćwiczenie: Zastosuj metodę DiD do oceny skutków programu szkoleń dla młodzieży niewykwalifikowanej Jaki jest wpływ programu na młodzież niewykwalifikowaną? Młodzież niewykwalifikowana (15-24) Młodzież wykwalifikowana (15-24) Dorośli niewykwalifikowani (25-44) 2007 65 83 72 2010 58 75 62 2013 60 77 63

Polska: Kiedy korzystać z metody podwójnej różnicy? Przykłady/dyskusja Do jakich programów w Polsce można zastosować metodę podwójnej różnicy (DiD)? Czy przychodzą Ci na myśl realizowane w Polsce programy, do których można zastosować metodę podwójnej różnicy (DiD)? Jak zdefiniował(a)byś osoby uczestniczące i nie uczestniczące w programie? Czy mogą się pojawić problemy związane z zastosowaniem metody podwójnej różnicy (DiD)?

Metody ewaluacji Instrumentarium Przydział losowy Model regresji nieciągłej Metoda podwójnej różnicy PSM (Dopasowanie)

Łączenie Przeciętnie, grupa uczestników inerwencji różni się od grupy osób nieprzyjętych (z jakiejś przyczyny to właśnie te osoby są w programie) Niektóre osoby są jednak do siebie podobne Można zatem łączyć ze sobą podobne jednostki

Ćwiczenie grupowe Prosimy wszystkich o powstanie

Próba porównania wyników u podobnych osób OSOBY NIEPRZYJĘTE OSOBY PRZYJĘTE BRAK EDUKACJI WYKSZTAŁCENIE PODSTAWOWE WYKSZTAŁCENIE ŚREDNIE WYKSZTAŁCENIE WYŻSZE

W praktyce jest to bardziej złożone Łączenie na poziomie wszystkich widocznych cech (np. przychód, płeć, edukacja...) Grupa porównawcza: osoby nieuczestniczące o podobnych cechach Sformułowanie łącznej oceny podobieństwa (Propensity Score): obliczenie prawdopodobieństwa udziału dla wszystkich osób na podstawie obserwowalnych cech tych osób Połączenie jednostek o takim samym prawdopodobieństwie udziału, jak w grupie eksperymentalnej

Próba porównania wyników u podobnych osób OSOBY NIEPRZYJĘTE OSOBY PRZYJĘTE BRAK EDUKACJI WYKSZTAŁCENIE PODSTAWOWE WYKSZTAŁCENIE ŚREDNIE WYKSZTAŁCE NIE WYŻSZE

Problem nr 2: Łączenie jest możliwe tylko na podstawie obserwowalnych danych ŁĄCZENIE NIE ROZWIĄZUJE PROBLEMU SELEKCJI! Co, jeśli niemożliwe jest zebranie danych o cechach jednostek, które to cechy są istotne dla udziału w programie i dla wyników?

Pamiętajmy! PSM Wymaga dużych prób i danych cechujących się wysoką jakością U podstaw, łączenie może być bardzo przydatne: o należy poznać zasadę przydziału i dokonywać doboru na jej podstawie o połączenie z innymi metodami (np. różnica w różnicy) Łączenie po fakcie jest ryzykowne: o uwaga, jeśli brak jest teoretycznych założeń, gdyż o łączenie na podstawie zmiennych endogenicznych daje złe wyniki.

Przykład: Programy Aktywnego Rynku Pracy [Polska] Programy CO? Trzy programy APRP w celu zwalczania bezrobocia w Polsce: (i) szkolenie: dla bezrobotnych o umiejętnościach nieposzukiwanych, bądź bez umiejętności umiejętności szeroko poszukiwane (ii) prace interwencyjne : wynagrodzenie w wysokości zasiłku dla bezrobotnych (iii) roboty publiczne: miejsca pracy stworzone przez samorządy terytorialne/gminy i miasta GDZIE? Polska, ewaluacja w 1998 r. za lata 1992-1996 Metoda/kryteria kwalifikacji o o Osoby oświadczające, że wzięły udział w jednym z programów, tworzą grupę eksperymentalną Osoby, które nie brały udziału, ale posiadały podobne cechy przed wdrożeniem programu, tworzą grupę kontrolną Dane Dodatek szczególny do polskiego BAEL (LFS) z 1996 roku zawierający dane retrospektywne Wyniki (i) Szkolenie = dobre wyniki, (ii) prace interwencyjne = brak dla kobiet, negatywne w przypadku mężczyzn, (iii) roboty publiczne = negatywne w przypadku mężczyzn

Polska: Kiedy można zastosować PSM? Przykłady/dyskusja Jakie są w Polsce programy, w których możliwe było zastosowanie jakiegoś rodzaju PSM? W jakich programach w Polsce można by zastosować metodę Propensity Score Matching (PSM)? Jak zdefiniować osoby biorące udział i osoby niebiorące udziału? Czy metoda Propensity Score Matching (PSM) mogłaby powodować problemy?

Test

Pyt.1: Które z następujących stwierdzeń jest głównym założeniem estymacji typu różnica w różnicach (DiD)? A. Przy braku programu, wskaźniki wyników będą kształtować się tak samo dla grupy badawczej i kontrolnej wraz z upływem czasu B. Przy braku programu, wskaźniki wyników będą kształtować się inaczej dla grupy badawczej i kontrolnej wraz z upływem czasu C. Grupy badawcze i kontrolne poddane są różnym wstrząsom, które wpłyną na wskaźniki wyników (opady deszczu, susza, itp.) 0% 0% 0% A. B. C.

Pyt. 2: Oceniasz program reformy zarządzania w szkołach przeznczony dla ubogich szkół. Postanawiasz zastosować metodę podwójnej różnicy, porównując szkoły objęte programem, ze szkołami, które w nim nie uczestniczyły. W tym samym okresie rząd zatrudnił większa liczbę nauczycieli w ubogich obszarach. Czy prowadzi to do zawyżenia czy zaniżenia wyników programu? A. Zawyżenie B. Zaniżenie C. Ani jedno, ani drugie 0% 0% 0% A. B. C.

Pyt.3: Jaka jest największa wada metody propensity score matching? A. Nie można prowadzić dopasowania w oparciu o charakterystyki obserwowalne B. Nie można prowadzić dopasowania w oparciu o charakterystyki nieobserwowalne C. Grupa eksperymentalna i porównawcza podlegają 0% 0% 0% różnym trendom. A. B. C.

Ocena Prosimy o ocenę sesji

Prosimy o ocenę tempa prezentacji A. Akurat B. Zbyt wolne C. Zbyt szybkie D. Nie mam zdania

Prosimy o ocenę przydatności wybranego materiału technicznego A. Bardzo przydatny B. Ledwo przydatny C. Nieprzydatny D. Nie mam zdania

Prosimy o ocenę jasności i efektywności przekazu A. Doskonała! B. Dobra C. Dostateczna D. Słaba E. Nie mam zdania

Dziękujemy!