Szacowanie przyczynowego wpływu interwencji: funkcje, walory, ograniczenia oraz relacje z innymi podejściami w ewaluacji

Podobne dokumenty
Rola ewaluacji w doskonaleniu polityk publicznych i rozwoju instytucji

Wykorzystanie metod kontrfaktycznych w badaniach ewaluacyjnych

Propensity score matching (PSM)

Dobre praktyki w zakresie monitoringu i ewaluacji w Polsce: BAROMETR INNOWACYJNOŚCI

Pomiar wpływu I: Jak mierzyć wpływ? Wstęp do projektowania ewaluacji

Zastosowanie schematu analizy difference-in-differences w badaniach politycznych. Adam Gendźwiłł Tomasz Żółtak Uniwersytet Warszawski

Pomiar wpływu I: Jak mierzyć wpływ? Wstęp do projektowania ewaluacji

POVERTY AND SOCIAL IMPACT TACKLING DIFFICULT ISSUES IN POLICY REFORM

Projektowanie eksperymentu Część 1

Podręcznik akademicki dofinansowany przez Ministra Nauki i Szkolnictwa Wyższego

PROGRAM. Warsztaty szkoleniowe z zakresu ewaluacji wpływu instrumentów Aktywnych Polityk Rynku Pracy 5-8 czerwca 2017 r.

PROGRAM. Warsztaty budowania umiejętności w zakresie ewaluacji wpływu programów zatrudnienia lutego 2017 r.

PROGRAM. Warsztaty budowania umiejętności w zakresie ewaluacji wpływu programów zatrudnienia lutego 2017 r.

Metody badawcze. Metodologia Podstawowe rodzaje metod badawczych

8 Przygotowanie wdrożenia

BADANIA EWALUACYJNE -WPROWADZENIE

Opis znaczenia kryterium. Lp. Nazwa kryterium Opis kryterium. 1. Wnioskodawca przeprowadził inwentaryzację zasobów nauki objętych projektem.

Opis znaczenia kryterium. Lp. Nazwa kryterium Opis kryterium

WYKŁAD 2: PSYCHOLOGIA POZNAWCZA JAKO NAUKA EKSPERYMENTALNA

Ewaluacja w polityce społecznej

Ewaluacja w polityce społecznej

SCENARIUSZ WYWIADU GRUPOWEGO (I)

Ewaluacja w polityce społecznej

Schemat eksperymentalny Część 1: Ścieżka techniczna

Ewaluacja w polityce społecznej

PROGRAM WSPÓŁPRACY TRANSGRANICZNEJ POLSKA BIAŁORUŚ UKRAINA

Budżet zadaniowy autentyczne narzędzie zarządzania publicznego?

Projektowanie eksperymentu część 2

Ewaluacja w polityce społecznej

WSTĘPNE WYTYCZNE DO OCENY STRATEGII ZIT

EWALUACJA WEWNĘTRZNA PRZEDMIOT BADANIA PROCESY WSPOMAGANIA ROZWOJU I EDUKACJI DZIECI SĄ ZORGANIZOWANE W SPOSÓB SPRZYJAJĄCY UCZENIU SIĘ

Psychospołeczne uwarunkowania aktywności zawodowej osób niepełnosprawnych. nosprawnych. w Warszawie. Konferencja nt.

Propensity Score Matching

Metodologia badań psychologicznych

badania empiryczne podejścia & proces badawczy [warto mieć z tyłu głowy]

Zastosowanie rozmytych map kognitywnych do badania scenariuszy rozwoju jednostek naukowo-dydaktycznych

Rozdział XII. MONITORING I EWALUACJA

System rekomendacji programów profilaktycznych

Zarządzanie projektami

Pomiar wyników, czyli monitoring i ewaluacja w pracy socjalnej i polityce miejskiej

Akademia Młodego Ekonomisty

Etapy modelowania ekonometrycznego

Planowanie, realizacja i ewaluacja pracy dydaktycznej, opiekuńczej i wychowawczej w kontekście nowej podstawy programowej

Cyfrowe udostępnianie informacji sektora publicznego (ISP) ze źródeł administracyjnych

Studium przypadku: W poszukiwaniu grupy porównawczej dla ewaluacji interwencji realizowanych w Polsce Tomasz Gajderowicz, Gdańsk, 20 lutego 2017 r.

Modele quasi-eksperymentalne: Różnica w różnicy oraz inne metody

JAK BADAĆ JAKOŚĆ W PROJEKTACH PARTNERSTW STRATEGICZNYCH?

Ryzyko w świetle nowych norm ISO 9001:2015 i 14001:2015

KARTA OCENY MERYTORYCZNEJ. Kryterium Czy warunek został spełniony? Okres realizacji projektu jest zgodny z okresem wskazanym w regulaminie

Eksperyment jako metoda badawcza

metodologia Założenia metodologiczne projektu Rola i znaczenie ewaluacji tagi: metodologia

Dobór metody ewaluacji wpływu

STANDARDY I KRYTERIA OCENY JAKOŚCI PROGRAMÓW PROMOCJI ZDROWIA I PROFILAKTYKI W RAMACH SYSTEMU REKOMENDACJI

mgr Małgorzata Pawlik

EFEKTY WSPARCIA PRZEDSIĘBIORSTW RPO ORAZ POIG. ANALIZA KONTRFAKTYCZNA

PROGRAM WSPÓŁPRACY TRANSGRANICZNEJ POLSKA BIAŁORUŚ UKRAINA

METODY I TECHNIKI BADAŃ SPOŁECZNYCH

Zarządzanie ryzykiem teoria i praktyka. Ewa Szczepańska Centrum Projektów Informatycznych Warszawa, dnia 31 stycznia 2012 r.

Informacje, o których mowa w art. 110w ust. 4 u.o.i.f., tj.:

Metody badań w naukach ekonomicznych

Polska-Warszawa: Usługi badania rynku 2016/S (Suplement do Dziennika Urzędowego Unii Europejskiej, , 2016/S )

Krytyka współczesnych koncepcji polityki społecznej

Elementy podlegające monitoringowi i ewaluacji w ramach wdrażania LSR dla obszaru PLGR

NAUKA DLA PRAKTYKI. Priorytety kształcenia studentów- aspekt teoretyczny i praktyczny ELŻBIETA MĘCINA-BEDNAREK

Ewaluacja polityki spójności Trendy i kierunki rozwoju

Studium przypadku: W poszukiwaniu grupy porównawczej dla ewaluacji interwencji realizowanych w Polsce Tomasz Gajderowicz, Gdańsk, 20 lutego 2017 r.

Organizacja i Zarządzanie Wykład 12 dr Adam Salomon Katedra Transportu i Logistyki, Wydział Nawigacyjny Akademii Morskiej w Gdyni

Lista sprawdzająca edukacyjne dobre praktyki upodmiotawiania i partycypacji w nauczaniu ewaluacja ilościowa

OKRESOWY PLAN EWALUACJI

Psychologia społeczna Michał Bilewicz Podstawowe czasopisma w psychologii społecznej Journal of Personality and Social Psychology Personality and

Program wychowawczo- -profilaktyczny szkoły

Teoria zmiany w praktyce. Marilyn Taylor Institute for Voluntary Action

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

W poprzedniej prezentacji: Przewodnik po biznesplanie

LICZBA PRZYZNA NYCH PUNKTÓW UZASADNIENI E PRZYZNANEJ PUNKTACJI ŹRÓDŁO WERYFIKA CJI LP. KRYTRIUM OPIS KRYTERIUM PUNKTACJA

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną

Fundusze UE, jako środki publiczne, wymagają starannego wydatkowania.

Załącznik Nr 5 do Zarz. Nr 33/11/12 KARTA PRZEDMIOTU. 2. Kod przedmiotu ZP-Z1-19

Wykład 10 Zrandomizowany plan blokowy

ANALIZA LOGICZNA Drzewa problemów

MONITOROWANIE ZIELONEJ GOSPODARKI doświadczenia międzynarodowe

Staże i praktyki zagraniczne dla osób kształcących się i szkolących zawodowo

Międzynarodowe kwalifikacje CGAP

Ekonomiczny Uniwersytet Dziecięcy

Ewaluacja w strategiach rozwiązywania problemów

KIERUNKOWE EFEKTY KSZTAŁCENIA KIERUNEK STUDIÓW INFORMATYCZNE TECHNIKI ZARZĄDZANIA

Streszczenie pracy doktorskiej Autor: mgr Wojciech Wojaczek Tytuł: Czynniki poznawcze a kryteria oceny przedsiębiorczych szans Wstęp W ciągu

EKODIALOG Maciej Mikulski. ul. Za Siedmioma Górami Zalesie Górne tel.:

PROGRAMY KSZTAŁCENIA PRZEDMIOTÓW ARTYSTYCZNYCH OPRAC. DR BEATA LEWIŃSKA

Zasady funkcjonowania systemu kontroli zarządczej w Urzędzie Miasta Lublin i jednostkach organizacyjnych miasta Lublin akceptowalny poziom ryzyka

Project funded by European Commission LLP Programme Leonardo Da Vinci TOI IT1-LEO CUP G12F

Kryteria i zasady w badaniach społecznych

KARTA OCENY MERYTORYCZNEJ. Czy warunek został spełniony?

Strategia partycypacyjna sprzeczność czy konieczność

Mocne i słabe strony procesu ewaluacji Pożądane kierunki zmian na lata

Opis zakładanych efektów kształcenia. Absolwent studiów pierwszego stopnia: WIEDZA

Ewaluacja w polityce społecznej

Systemy wspomagania decyzji

Badania marketingowe. - Konspekt wykładowy

Najczęściej popełniane błędy w procesie walidacji metod badawczych

Transkrypt:

Szacowanie przyczynowego wpływu interwencji: funkcje, walory, ograniczenia oraz relacje z innymi podejściami w ewaluacji prof. dr hab. Jarosław Górniak Uniwersytet Jagielloński III Międzyregionalna Konferencja Ewaluacyjna Nowe wyzwania dla ewaluacji programów operacyjnych w perspektywie 2014-2020 Toruń, 21-22 czerwca 2016

Dwa kluczowe podejścia do ewaluacji Ewaluacja oparta o teorię programu (w tym ewaluacja realistyczna) Program może być traktowany jako hipoteza, że określonych warunkach wdrożenie określonego zestawu przedsięwzięć w oparciu o założone zasoby przyniesie zaplanowane efekty Celem ewaluacji jest obserwacja i wyjaśnienie zmiany w kategoriach założeń (często nieujawnianych w programie) dotyczących wykorzystania właściwych zasobów w właściwie dobranych działań zmierzających do założonych efektów Odtworzenie teorii programu jego modelu logicznego, a w ewaluacji realistycznej: mechanizmu generującego efekty w danych warunkach jest podstawą trafności ewaluacji i użyteczności także dla innych programów Ewaluacja efektów Jak najlepszy pomiar efektów: trafny, rzetelny obiektywny Pomiar to zestaw obserwacji, które zmniejszają niepewność i które można wyrazić jako liczbę Ustalenie efektu netto, czyli wielkości zmiany wywołanej przyczynowo przez program: różnica między uzyskanym wynikiem, a oszacowanym dla sytuacji, gdyby nie podjęto działania przykład: edukacyjna wartość dodana Obecnie główny nurt teorii ewaluacji opowiada się za syntezą tych podejść ale jak taka synteza powinna wyglądać?

Ewaluacja oparta o teorię programu Istotą podejścia opartego o teorię programu było odtworzenie założonego przez decydentów modelu zależności zaplanowanych efektów od dobranych instrumentów działania. Rekonstrukcja teorii programu i teorii wdrożenia pozwala na zrozumienie przebiegu interwencji poprzez odczytanie motywów decyzji. Ewaluacja podąża za procesem wdrożenia interwencji dostarczając lepszego zrozumienia uwarunkowań powodzenia i niepowodzenia w realizacji programu oraz określenia użyteczności uzyskanych wyników. TBE daje dobry wgląd w złożoność warunków realizacji i sukcesu bądź porażki programu oraz w powiązania pomiędzy czynnikami składającymi się na te warunki. Problemem TBE jest słabe oddzielenie efektów programu od efektów oddziaływania innych czynników w otoczeniu i stąd zakłócenie obrazu wielkości efektu, który można przypisać interwencji oraz najczęściej jakościowy charakter wyników.

Trzy problemy, przed którymi staje ewaluacja James Heckmann Ewaluacji wpływu (przyczynowego) przeszłych interwencji na obserwowane efekty, w tym w ich wpływ na dobrobyt osób, na które interwencja jest ukierunkowana. Przewidywanie wpływu interwencji już wdrożonych w jednym środowisku w innych środowiskach, z uwzględnieniem dobrobytu. Przewidywanie efektów interwencji nigdy nie wprowadzanych w nowych warunkach środowiskowych, z uwzględnieniem skutków dla dobrobytu (Heckmann 2005, s. 8)

Poza eksperyment Złotym standardem badania przyczynowego jest eksperyment randomizowany W ewaluacji ograniczone są możliwości opierania się na eksperymentach Szacowanie efektu netto w oparciu o metody dające zbliżony efekt do: Planu randomizowanego propensity score matching Randomizowanego planu blokowego corsend exact matching Wyniki eksperymentu i ekwiwalentnych planów kontrfaktycznych mają ograniczone walory poznawcze: Otrzymujemy oszacowanie efektu Nie mamy wglądu w mechanizm społeczny w ramach którego program działa

Problemy z randomizowanym planem eksperymentalnym

Ograniczenia planu randomizowanego Może wystąpić tzw. obciążenie randomizacyjne oszacowań (Heckman i Smith, 1995): mierzony jest raczej efekt zamiaru uczestnictwa niż efekt uczestnictwa w programie (uczestnicy mogą odpaść, a nie-uczestnicy mogą znaleźć substytuty) Także badania eksperymentalne mogą prowadzić do błędnych wniosków Badania skoncentrowane jedynie na ustaleniu wielkości efektu netto mają ograniczone walory dla procesu uczenia się decydentów publicznych Konieczne jest zrozumienie wpływu przyczynowego programu w szerszym kontekście jego działania.

prosty eksperyment X bodziec (randomizacja) Y wynik pomiaru efektu η 1, η 2 zmienne latentne (np. potrzeba domknięcia i skłonność do uprzedzeń) Problemy: - Jak silnie bodziec działa na η 1? - Jak dobry jest pomiar efektu? - Jeśli słabo wynik może być nieistotny nawet gdy wpływ jest silny Kenneth A. Bollen i Judea Perl, 2012

Inny mechanizm przyczynowy? - X działa na inną zmienną, która wpływa na latentną zmienną zależną - X i Y pozostają w istotnej statystycznie zależności

Inny mechanizm 2 - Zależność między X a Y jest istotna - η 1 nie wpływa na η 2 - Bodziec wpływa na inną zmienną - η 4, która wpływa na η 2

W kierunku syntezy

Wielkość efektu a rozliczalność wydatków publicznych Misją ewaluacji jest wsparcie rozliczalności/odpowiedzialności (accountability) instytucji publicznych wobec obywateli. Presja polityczna na dowody racjonalności w zakresie wydatków publicznych i oczekiwanie koncentracji programów i ewaluacji na efektach (Barca i in. 2011) Rola dowodów z ewaluacji w procesie uzasadnienia decyzji w politykach publicznych: czy dowody te mają znaczenie? Wyniki ewaluacji jako wkład do decyzyjnego kosza na śmieci (Cohen, March, Olsen): poza teorię programu

White a theory based impact evaluation (2009) 1. 2. 3. Nakreśl (map out) łańcuch przyczynowy (teorię programu) Zrozum kontekst Antycypuj heterogeniczność 4. Rygorystyczna ewaluacja wpływu z użyciem wiarygodnego podejścia kontrfaktycznego 5. 6. Rygorystyczna analiza stanu faktycznego Używaj metod mieszanych

Jak powiązać podejście oparte o teorię programu z badaniem wpływu przyczynowego interwencji Wynikiem fazy TBE powinien być model mechanizmu przyczynowego w ramach którego interwencja prowadzi do oczekiwanej zmiany. Należy wykorzystać język Acyklicznych Grafów Ukierunkowanych (ADG) do opisu modelu tego mechanizmu z koncentracją na interwencji jako bodźcu (exposure) i założonej zmianie jako efekcie. Należy ustalić minimalny zestaw cech, których kontrola jest niezbędna dla wyeliminowania zakłócenia obrazu zależności między interwencją a efektem przez tzw. tylne drzwi Na tej podstawie należy zaplanować proces pomiaru ilościowego zoperacjonalizowanych zmiennych chodzących w skład minimalnego zestawu Wreszcie, należy dokonać oszacowania efektu przyczynowego w warunkach kontroli potencjalnych zmiennych zakłócających.

Skierowany graf acykliczny (Pearl 2000) Co muszę zmierzyć, by wiedzieć, jak X wpływa na Y? Z 1 Z 2 Z 3 Z 4 Z 5 Z 6 Z 7 Z 8 Z 9 Z 10 X Z 11 Y 33

Jak zbudować DAG 1. Ustalić co jest interwencją, a co wynikiem 2. Przeprowadzić główną ścieżkę/i przyczynowego oddziaływania interwencji na efekt uwzględniając wszystkie potencjalne mediatory. 3. Należy dodać do modelu wszystkie zmienne, które mogą przyczynowo wpływać na wynik interwencji. 4. Wskazać oddziaływania przyczynowe pomiędzy wszystkimi zmiennymi wpływającymi na wynik interwencji a interwencją. 5. Ustalić, czy występują jeszcze jakiekolwiek zależności przyczynowe pomiędzy którymikolwiek zmiennymi uwzględnionymi w modelu i uwzględnić reprezentujące je strzałki w modelu. 6. Ustalić dla każdej pary zmiennych, czy istnieją jakiekolwiek zmienne, które wpływają przyczynowo na parę. Ta lista kroków została sporządzona na podstawie znakomitego wykładu Scotta Vennersa umieszczonego w youtube.com: https://www.youtube.com/watch?v=pjhu4fimhbq

Proponowane kroki w ewaluacji 1. Najpierw działamy w ramach podejścia ewaluacji opartej na teorii programu, najlepiej w bardziej zaawansowanym wydaniu, zbliżonym do ewaluacji realistycznej. 2. W oparciu o ustalenia etapu 1. konstruujemy ukierunkowany graf acykliczny (DAG) lub panel SWIG reprezentujący ścieżkę działania interwencji na efekt i ustalamy minimalny zestaw zmiennych podlegających kontroli, by można było bez zakłócenia przez tzw. tylne drzwi oszacować zależność przyczynową. 3. Projektujemy plan gromadzenia danych zgodnie z wynikami analizy DAG z uwzględnieniem wymogów pomiaru, m.in. ilustrowanych wyżej. 4. Realizujemy starannie badanie. 5. Szacujemy parametry modelu przyczynowego. 6. Podsumowujemy wyniki ewaluacji opisując mechanizm działający u podstaw programu oraz przedstawiając wielkość efektu wywołanego przez interwencję.