Pomiar wpływu I: Jak mierzyć wpływ? Wstęp do projektowania ewaluacji

Podobne dokumenty
Pomiar wpływu I: Jak mierzyć wpływ? Wstęp do projektowania ewaluacji

Projektowanie eksperymentu Część 1

Schemat eksperymentalny Część 1: Ścieżka techniczna

Projektowanie eksperymentu część 2

Modele quasi-eksperymentalne: Różnica w różnicy oraz inne metody

Zalecenia praktyczne w przeprowadzaniu ewaluacji

Zalecenia praktyczne w przeprowadzaniu ewaluacji

Modele quasi-eksperymentalne: Różnica w różnicy oraz inne metody

Modele quasi-eksperymentalne: Model regresji nieciągłej

Modele quasi-eksperymentalne: Model regresji nieciągłej

Pomiar wpływu II: Podstawowe koncepcje wyników quasi-eksperymentalnych

Zalecenia praktyczne w przeprowadzaniu ewaluacji

Modele quasi-eksperymentalne: Model regresji nieciągłej

Dostępność danych o uczestnikach programów rynku pracy w Polsce

Warsztat: Randomizacja w programie Excel

Dostępność danych o uczestnikach programów rynku pracy w Polsce

Studium przypadku: W poszukiwaniu grupy porównawczej dla ewaluacji interwencji realizowanych w Polsce Tomasz Gajderowicz, Gdańsk, 20 lutego 2017 r.

Dobór metody ewaluacji wpływu

PROGRAM. Warsztaty budowania umiejętności w zakresie ewaluacji wpływu programów zatrudnienia lutego 2017 r.

Studium przypadku: W poszukiwaniu grupy porównawczej dla ewaluacji interwencji realizowanych w Polsce Tomasz Gajderowicz, Gdańsk, 20 lutego 2017 r.

Studium przypadku: eksperymenty kontrolowane

PROGRAM. Warsztaty budowania umiejętności w zakresie ewaluacji wpływu programów zatrudnienia lutego 2017 r.

Studium przypadku: eksperymenty kontrolowane

PROGRAM. Warsztaty szkoleniowe z zakresu ewaluacji wpływu instrumentów Aktywnych Polityk Rynku Pracy 5-8 czerwca 2017 r.

Wybór metody ewaluacji

Ewaluacja w polityce społecznej

Studium przypadku: W poszukiwaniu grupy porównawczej dla ewaluacji interwencji realizowanych w Polsce Tomasz Gajderowicz, Kraków, 5 czerwca 2017 r.

Warsztaty szkoleniowe z zakresu oceny oddziaływania instrumentów aktywnej polityki rynku pracy. Łańcuch wyników

Powiatowy Urząd Pracy w Grajewie Grajewo, ul Strażacka 6A. Analiza skuteczności i efektywności szkoleń zawodowych za 2015 rok

Propensity score matching (PSM)

Jak poprawić efektywność usług rynku pracy?

Dobre praktyki w zakresie monitoringu i ewaluacji w Polsce: BAROMETR INNOWACYJNOŚCI

ROCZNY PLAN DZIAŁANIA PROJEKTÓW POZAKONKURSOWYCH (POWIATOWYCH URZĘDÓW PRACY) W RAMACH RPOWP

Ustalanie mocy testu i optymalnej wielkości próby

ROCZNY PLAN DZIAŁANIA PROJEKTÓW POZAKONKURSOWYCH (POWIATOWYCH URZĘDÓW PRACY) W RAMACH RPOWP

Wykorzystanie metod kontrfaktycznych w badaniach ewaluacyjnych

Jak wybrać 45 najlepszych prezentacji na FORUM?

Wskaźniki realizacji celu

Ewaluacja w nowym nadzorze pedagogicznym

Seminarium upowszechniające

M&E na różnych poziomach interwencji

OCENA ODDZIAŁYWANIA AKTYWNYCH PROGRAMÓW ZATRUDNIENIA. Matteo Morgandi Warszawa, maj 2016 r.

Propensity Score Matching

Projekt współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego. II seminarium konsultacyjne.

Eksperyment jako metoda badawcza

KRYTERIA WYBORU PROJEKTÓW DLA DZIAŁANIA 7.1 RPO WO

Regulamin rekrutacji i uczestnictwa w projekcie EUROPOLIS II

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA

ROCZNY PLAN DZIAŁANIA PROJEKTÓW POZAKONKURSOWYCH (POWIATOWYCH URZĘDÓW PRACY) W RAMACH RPOWP

INFORMACJA O NABORZE PROJEKTÓW POZAKONKURSOWYCH POWIATOWYCH URZĘDÓW PRACY NA ROK 2017

METODY STATYSTYCZNE W BIOLOGII

Wniosek o dofinansowanie

Badanie efektów wsparcia zrealizowanego na rzecz osób młodych w ramach Programu Operacyjnego Wiedza Edukacja Rozwój I BADANIE WSKAŹNIKOWE

Czy rynek pracy potrzebuje absolwentów szkół wyższych? Analiza porównawcza pomiędzy regionami.

METODY STATYSTYCZNE W BIOLOGII

POVERTY AND SOCIAL IMPACT TACKLING DIFFICULT ISSUES IN POLICY REFORM

Załącznik do Uchwały Nr 94/2016 KM RPO WO z dnia 14 października 2016 r.

Informacja Powiatowego Urzędu Pracy w Nowym Mieście Lubawskim na temat projektu Twoja Kariera - - Twój Wybór

STANDARDY I KRYTERIA OCENY JAKOŚCI PROGRAMÓW PROMOCJI ZDROWIA I PROFILAKTYKI W RAMACH SYSTEMU REKOMENDACJI

METODY STATYSTYCZNE W BIOLOGII

Plan działania na lata

Proces badawczy schemat i zasady realizacji

Sprawozdanie z działalności Miejskiego Urzędu Pracy w Lublinie - I półrocze 2011 r. -

Uchwała Nr 49/2016 Komitetu Monitorującego Regionalny Program Operacyjny Województwa Podlaskiego na lata z dnia 16 grudnia 2016 r.

e n e r g e t y c z n e g o w P o l s c e? J a n R u t k o w s k i A l e k s a n d e r S z p o r

Sprawozdanie z działalności Miejskiego Urzędu Pracy w Lublinie - I półrocze 2015 r. -

Powiatowy Urząd Pracy w Lubinie w ramach Europejskiego Funduszu Społecznego (EFS) realizuje:

REGULAMIN REKRUTACJI UCZESTNIKÓW PROJEKTU

REGULAMIN REKRUTACJI UCZESTNIKÓW PROJEKTU

BADANIA EWALUACYJNE -WPROWADZENIE

Kontekstowe wskaźniki efektywności nauczania - warsztaty

SPIS TREŚCI CZĘŚĆ I : PRZEZNACZENIE, PROCES I PODSTAWY METODOLOGICZNE BADAŃ MARKETINGOWYCH...17

Standardy pracy socjalnej z osobami pozostającymi bez pracy

PROGRAM WSPÓŁPRACY TRANSGRANICZNEJ POLSKA BIAŁORUŚ UKRAINA

PROGRAM MŁODZI NA RYNKU PRACY. Projekt pilotażowy Twoja Kariera Twój Wybór realizowany przez Powiatowy Urząd Pracy w Częstochowie

Problem badawczy Przeprowadzenia badania ewaluacyjnego projektu realizowanego w ramach Poddziałania 6.1.3

Psychospołeczne uwarunkowania aktywności zawodowej osób niepełnosprawnych. nosprawnych. w Warszawie. Konferencja nt.

INFORMACJA. o stanie i strukturze bezrobocia. rejestrowanego

Wojewódzki Urząd Pracy w Poznaniu

Działania Wojewódzkiego Urzędu Pracy w Warszawie nakierowane na aktywizację osób bezrobotnych 50+

Zastosowanie schematu analizy difference-in-differences w badaniach politycznych. Adam Gendźwiłł Tomasz Żółtak Uniwersytet Warszawski

8 Przygotowanie wdrożenia

1. Liczbę i odsetek osób, które ukończyły szkolenia z wynikiem pozytywnym, w stosunku do rozpoczynających szkolenia;

I. WSKAŹNIKI PODSTAWOWE

Wojewódzki Urząd Pracy w Kielcach

Ocena Programu Robót Publicznych na Łotwie

Załącznik 7 Wzór karty oceny merytorycznej wniosku o dofinansowanie projektu konkursowego w ramach PO WER

PODSTAWOWE INFORMACJE O PROJEKTACH. Działanie 8.1 Podniesienie aktywności zawodowej osób bezrobotnych poprzez działania powiatowych urzędów pracy

Zmiany w regulacjach prawnych w Polsce dotyczące wsparcia zatrudnienia młodych

Załącznik Karta oceny merytorycznej wniosku o dofinansowanie projektu konkursowego w ramach WRPO 2014+

Plan działania na lata

Warsztaty praktyk unijnych

REGULAMIN REKRUTACJI UCZESTNIKÓW PROJEKTU

PODSTAWOWE INFORMACJE O PROJEKTACH

INFORMACJA O SYTUACJI NA POWIATOWYM RYNKU PRACY w miesiącu marcu 2007 roku.

ĆWICZENIE Lody na drodze Ent-teach Rozdział 6 Zarządzanie Projektami

Powiatowy Urząd Pracy w Ustrzykach Dolnych

REGULAMIN REKRUTACJI DO PROJEKTU Aktywni na rynku pracy! NR RPLD IP /16

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA

Transkrypt:

Warsztaty szkoleniowe z zakresu oceny oddziaływania instrumentów aktywnej polityki rynku pracy Pomiar wpływu I: Jak mierzyć wpływ? Wstęp do projektowania ewaluacji Maciej Jakubowski, Gdańsk, 21 lutego 2017 r.

Spis Cel Idealne stany kontrfaktyczne Niepoprawne analizy kontrfaktyczne Przed i po Osoby przyjęte a osoby nieprzyjęte Badanie metodą eksperymentu z grupa kontrolną (RCT)

Ewaluacja wpływu Jaki jest nasz cel?

Nasz cel Oszacuj efekt (wpływ) na wynik (Y) programu (P). Wpływ= Y T - Y C P = program bądź działanie Y = wskaźnik, miara sukcesu Y T = wynik przy wdrożeniu programu Y C = wynik bez wdrażania programu (kontrola)

Pytanie badawcze Jaki wpływ ma......interwencja: szkolenia młodych... (P)...na prawdopodobieństwo zdobycia zatrudnienia? (Y)

Wyzwanie - brak stanu kontrfaktycznego Wpływ= Y T - Y C Nie sprawdzamy, co spotkałoby osoby poszukujące pracy, jeśli nie wzięłyby udziału w żadnym szkoleniu (stan kontrafaktyczny)?

Idealny stan kontrfaktyczny RZECZYWISTOŚĆ KLONÓW/RÓWNOLEGŁA

Idealny eksperyment W pierwszej kolejności należy określić docelową grupę uczestników...

Idealny eksperyment...a następnie powielić docelowych uczestników

Idealny eksperyment...później poddać docelowych uczestników szkoleniu

Idealny eksperyment - klony...i za jakiś czas porównać prawdopodobieństwo znalezienia zatrudnienia między grupami. Jako że osoby, które przeszły szkolenie, są dokładnie tymi samymi osobami, które nie brały udziału w szkoleniu, można rzeczywiście stwierdzić, że to program spowodował różnicę.

Niepoprawne analizy kontrfaktyczne Przypadek 1: Przed i po

Przypadek 1: Przed i po (1) Obserwacja tylko osób uczestniczących Y 78 A (2) Dwie obserwacje na przestrzeni czasu: Status zatrudnienia na 12 miesięcy przed programem Status zatrudnienia 12 miesięcy po programie 65 t=-12 miesięcy B t=+12 miesięcy 13 Czas OCENA WPŁYWU =A-B= +13 punktów procentowych

Przypadek 1: Przed i po Problem: nie wiemy, co by się stało, gdyby programu nie było Boom gospodarczy: o Rzeczywisty wpływ=a-c o A-B przecenia wpływ Recesja: o Rzeczywisty wpływ=a-d o A-B nie docenia wpływu Y 78 65 B T=0 T=1 A C? D? Wpływ? α = $35 Wpływ? Czas

Sytuacja 1: Przed i po Przykład Aktynej Polityki Rynku Pracy (APRP): Program szkolenia młodych Prawdopodobieństwo znalezienia zatrudnienia po 6 miesiącach szkolenia (1) Obserwowanie wyłącznie uczestników programu Y 80 B (2) Dwie obserwacje w czasie: 1997/8 1998/9 70 A 10% t = 1997 t = 1998 Czas OSZACOWANIE EFEKTU ODDZIAŁYWANIA: A B = -10%

Niepoprawne analizy kontrfaktyczne Przypadek 2: Porównanie osób przyjętych z osobami nieprzyjętymi do programu

Przypadek 2: Niektóre osoby zostają przyjęte, inne nie Osoby niekwalifikujące się (Nieaktywne) Osoby kwalifikujące się (Młodzi bezrobotni = docelowa populacja) Osoby nieprzyjęte Osoby przyjęte

Przypadek 2: Niektóre osoby zostają przyjęte, inne nie GRUPA EKSPERYMENTALNA GRUPA KONTROLNA

Przypadek 2: Niektóre osoby zostają przyjęte, inne nie Problem selekcji do próby Co, jeśli osoby, które decydują się nie brać udziału w programie, są inne?

Przypadek 2: Niektóre osoby zostają przyjęte, inne nie Problem obciążenia selekcyjnego Co, jeśli te różnice mają wpływ na wyniki? Czy czynniki wpływające na przyjęcie do programu są skorelowane z prawdopodobieństwem znalezienia zatrudnienia?

Przypadek 2: Niektóre osoby zostają przyjęte, inne nie Przykład Programu Robót Publicznych (PRP) na zasadzie kto pierwszy, ten lepszy Czy przyjęte do programu osoby poszukujące pracy były podobne do osób, które chciały się zarejestrować, lecz się spóźniły? Osoby poszukujące pracy, które zgłosiły się wcześnie i zostały przyjęte do programu Jakie problemy mogą pojawić się w trakcie porównywania tych grup? Osoby poszukujące pracy, które zgłosiły się później - kiedy nie było już miejsc w programie robót publicznych

Pamiętajmy... Problem porównania stanów przed i po: w miarę upływu czasu zmianie podlegają także inne istotne czynniki. Porównanie osób przyjętych z osobami nieprzyjętymi Problem: obciążenie selekcyjne - osoby przyjęte mogą być inne, a my nie widzimy tych różnic. Obydwie grupy porównawcze mogą prowadzić do obciążonych szacunków odnośnie oddziaływania programu.

Dobre stany kontrfaktyczne Badanie randomizowane (RCT)

Przykład: Efekt programu Gwarancje Pracy dla Młodzieży [Dania] Program CO? Program aktywizacji zawodowej młodych (<30), granty edukacyjne, granty na zatrudnienie. GDZIE? Lata 2009 do 2010, Dania DLACZEGO? W celu zwiększenia zatrudnienia wśród młodych, długotrwale bezrobotnych osób Metoda/kryteria kwalifikacji Naukowcy przeprowadzili badanie (RCT) w celu zbadania wpływu programu APRP na zatrudnienie wśród młodych i na ich rezultaty w nauce. Trwający 32 tygodnie program był skierowany do osób poniżej 32 roku życia poszukujących pracy, które w okresie pomiędzy listopadem 2009 roku a lutym 2010 roku stały się albo były już bezrobotne. Spośród 3 380 uczestników, naukowcy losowo dobrali 1 683 osoby do grupy eksperymentalnej i 1 697 osób do grupy porównawczej. Wyniki Program zmniejszył bezrobocie wśród młodych bez wykształcenia i nie miał wpływu na osoby z wykształceniem. Ponadto, przydzielone do grupy eksperymentalnej osoby poszukujące pracy przez dłuższy okres otrzymywały świadczenia chorobowe. Program nie został wdrożony zgodnie z planem. W praktyce, jedyna różnica pomiędzy grupą eksperymentalną a grupą porównawczą polegała na tym, że osoby poszukujące pracy w grupie eksperymentalnej częściej spotykały się z osobą wdrażającą program.

Podstawowa konstrukcja badania randomizowanego Działania wielokrotne/łączone Osoby Metody randomizacji indywidualne/klastry Populacja docelowa Dobór losowy Wyłączone z badania Próba poddana ewaluacji Badanie początkowe Przydział losowy Grupa eksperymentalna Grupa kontrolna Badanie końcowe Wiarygodność zewnętrzna Wiarygodność wewnętrzna Kontrola Pomiar wpływu

Losowy dobór próby i losowy przydział Losowy dobór próby spośród obszaru zainteresowania

Losowy dobór próby i losowy przydział Losowy dobór próby spośród obszaru zainteresowania Losowy przydział do grupy eksperymentalnej i grupy kontrolnej Losowy dobór próby z grupy eksperymentalnej i grupy kontrolnej

Możliwości randomizacji przy ograniczonych zasobach

Jaki poziom randomizacji? Istotne czynniki 1. Jednostka wdrażająca Jednostka powinna być co najmniej na poziomie jednostki pośredniczącej w programie 2. Oddziaływanie na osoby zewnętrzbe (efekt spillover) Osoby w grupie kontrolnej także korzystają z programu (np. jeśli uczestnicy/uczestniczki szkolenia rozmawiają z osobami nieuczestniczącymi) 3. Jednostka doboru próby i moc statystyczna Randomizacja na możliwie najniższym poziomie 4. Kwestie etyczne

Dlaczego tak ważna jest wielkość próby? Pytanie ogólne: Jak duża musi być próba, aby w wiarygodny sposób oddawała wymiar danego efektu? Co w tym przypadku oznacza wiarygodny? Oznacza to, że będziemy mieli uzasadnienie co do pewności, że różnica pomiędzy grupą korzystającą a grupą niekorzystającą z programu jest spowodowana programem Randomizacja wyklucza obciążenie, ale nie usuwa szumów: działa dzięki prawu wielkich liczb...jak wielkie musi być wielkie?

Kilka najczęstszych kwestii natury politycznej Nie jesteśmy zainteresowani pokazywaniem (potencjalnie) złych wiadomości Długotrwałe ewaluacje nie współgrają z tempem zmian oczekiwanym przez decydentów ale... Gorsze jest zrobienie czegoś niepoprawnie i ukrycie tego faktu Ewaluację wpływu można przedstawić jako narzędzie do identyfikacji obszarów godnych poprawy Ewaluację można skonstruować tak, aby zbadać różne opcje Dobrze skonstruowany plan może się obronić niezależnie od cyklów politycznych Wyciągnięte wnioski: Należy rozumieć obawy z zakresu polityki, aby odpowiednio skonstruować plan Praca etapowa Ewaluacja części programu (pod kątem geograficznym) Prezentacja wyników w niezbyt odległym czasie (nawet jeśli analiza nie będzie pełna), co podtrzyma zainteresowanie polityków i ich zaangażowanie w ewaluację wpływu 31

Kilka najczęstszych kwestii technicznych Już wiemy, co w praktyce działa... nie ma potrzeby ewaluacji Interwencja jest wystarczająco skomplikowana i nie chcemy jej komplikować jeszcze bardziej Istnieje już zgoda co do koncepcji programu Ewaluacje są zbyt kosztowne; nie stać nas na nie ale... Być może jest to skomplikowane, ale brak ewaluacji oznacza brak dowodów Korelacja a związek przyczynowy to nie to samo W większości przypadków gotowe uzgodnienia są po prostu podstawowymi założeniami koncepcji programu Wyciągnięte wnioski: Programy będące w fazie przygotowawczej nadają się lepiej od programów będących w fazie wdrożenia Bądźmy pragmatyczni 32

Przypadek duński W Danii wprowadzono program mający na celu uzyskanie dowodów empirycznych co do efektywności programów APRP Badania randomizowane - średnio 2 rocznie Baza wiedzy - baza danych z przeprowadzonych na całym świecie badań empirycznych odnośnie efektywności programów APRP Aktywna współpraca ze społecznością naukową, dostarczanie danych, udział w konferencjach, interaktywne bazy danych itp. Stan na dziś (2011 r.) Ukończono 8 badań randomizowanych 2 badania trwają 1-2 są w fazie przygotowawczej Zaplanowano 30 projektów pilotażowych na małą skalę 33

O czym należy pamiętać, rozważając interwencję Na jakim poziomie odbędzie się zarządzanie interwencją? (indywidualnym, wsi, grupy, okręgu itp.) Jeśli utworzono klastry, to do ilu klastrów można dotrzeć za pomocą istniejącego budżetu? Jeśli utworzono klastry, to ile klastrów istnieje poza klastrami programowymi? Jaki poziom podporządkowania się do programu zaobserwowano w pilotażach? Czy należy spodziewać się zjawiska oddziaływania na innych (spillover) na dużą skalę?

O czym należy pamiętać, rozważając interwencję Czy należy się spodziewać, że program będzie miał różne efekty na osoby/grupy o różnych cechach? Czy program można podzielić na etapy? Czy istnieje wiele programów (działań) podlegających ewaluacji? Czy istnieją uzupełniające programy (działania) podlegające ewaluacji?

Dziękujemy!