Warsztaty szkoleniowe z zakresu ewaluacji wpływu instrumentów Aktywnych Polityk Rynku Pracy Warsztat: Randomizacja w programie Excel Piotr Ćwiakowski Tomasz Gajderowicz, Kraków, 5 czerwca 2017 r.
Przydział losowy jest kluczowym warunkiem dobrego przeprowadzenia eksperymentu? Jak można w praktyce przeprowadzić randomizację?
Sytuacja Ewaluatora Ustalono, że w odniesieniu do interwencji, która ma być poddana ewaluacji, jest możliwość zastosowania eksperymentu z grupą kontrolną (RCT) Ewaluator ma już bazę danych osób, które kwalifikują się do interwencji Teraz trzeba wybrać: podgrupę do eksperymentu oraz kto będzie w grupie eksperymentalnej, a kto będzie w grupie kontrolnej Jak już wiemy, trzeba dokonać PRZYDZIAŁU LOSOWEGO
Pytania, które należy zadać: Ile osób ma być w eksperymencie? W najlepszej wersji? A realnie ile wystarczy? Ile osób ma być w grupie kontrolnej i eksperymentalnej? Jak w praktyce dokonać przydziału losowego? Czy rzut monetą jest dobrą metodą?
Zróbmy to sami, wykorzystując MS Excel 1. Proszę otworzyć arkusz Przydział losowy 1. Plik powinien znajdować się na pulpicie komputera lub 2. można go ściągnąć z dropbox 2. Proszę otworzyć zadanie 1
Zróbmy to sami, wykorzystując MS Excel Proszę otworzyć zadanie 1 Zadanie 1. W pewnym powiecie znajduje się populacja 100 osób bezrobotnych. Wylosuj do badania ewaluacyjnego: 1) 20 kandydatów, 2) 50 kandydatów, 3) 80 kandydatów. Dla każdej próby losowej skonstruuj grupę eksperymentalną i kontrolną w stosunku 1:1.
Jak wylosować, 20, 50, 80 osób? Rzut monetą wydaje się nieadekwatny Dane:
Funkcja LOS
Co teraz? Sortowanie! Najpierw trzeba wkleić wylosowane liczby na sztywno. Zaznaczenie kolumny kopiowanie wklejanie jako wartości
Co teraz? Sortowanie! Potem trzeba posortować po wylosowanych sztywnych wartościach
Czy widzimy to samo?
Czy widzimy to samo? NIE! I dobrze, na tym polega losowanie!
Dalej, wystarczy wziąć 20, 50, 80 pierwszych osób
Jak wylosować grupę eksperymentalną i kontrolną? Właściwie wystarczy podzielić na pół osoby już są na losowych pozycjach Można też wylosować ponownie! W ten sposób jak ostatnio
Albo inaczej: Można też zadać Excelowi losowanie typu orzeł-reszka Zaleta: od razu mamy jasną kategoryzację Wada: może się zdarzyć że w jednej grupie będzie np. o osobę więcej przy dużych grupach nie jest to problem
Ważne pytanie: Która liczebność (20, 50, 80), pozwoli na najbardziej wiarygodną ewaluację wpływu? Aby grupy były dobrze dobrane, powinny być takie same Sprawdźmy czy faktycznie są Pokażmy na naszym przykładzie: działanie Prawa Wielkich Liczb!
Zadanie 2
Zadanie 2 Metodą przez tabelę przestawną
Zadanie 2 Metodą przez tabelę przestawną
Zadanie 2 Metodą przez tabelę przestawną
Zadanie 3 Zróbmy to na większą skalę!
Zadanie 3 Zróbmy to na większą skalę! i metodą losowania warstwowego :)
Zadanie 3 Na czym polega ćwiczenie? Używając danych z arkusza Dane_1000, wylosuj grupę 100 osób do eksperymentu kontrolowanego. Postaraj się, aby proporcje osób w danych przedziałach wiekowych były takie same w próbie jak w populacji bezrobotnych wg GUS (dane za I kwartał 2015 r.).
Najpierw przyjrzyjmy się tabeli poniżej ramki z poleceniem Zadanie 3 Rozwiązanie Struktura wiekowa bezrobotnych Twoje obliczenia Kategorie wiekowe Rozkład w populacji Ile obserwacji do próby? Rozkład w próbie 18-24 15% 25-34 28% 35-44 22% 45-54 20% 55-59 11% 60 lat i więcej 4% Źródło: GUS (dane za I kwartał 2015 r.)
Zadanie 3 Rozwiązanie Struktura wiekowa bezrobotnych Twoje obliczenia Kategorie wiekowe Rozkład w populacji Ile obserwacji do próby? Rozkład w próbie 18-24 15% 25-34 28% 35-44 22% 45-54 20% 55-59 11% 60 lat i więcej 4% Źródło: GUS (dane za I kwartał 2015 r.) Na pomarańczowym tle znajdują się rozkłady wieku w populacji.
Zadanie 3 Rozwiązanie Struktura wiekowa bezrobotnych Twoje obliczenia Kategorie wiekowe Rozkład w populacji Ile obserwacji do próby? Rozkład w próbie 18-24 15% 25-34 28% 35-44 22% 45-54 20% 55-59 11% 60 lat i więcej 4% Źródło: GUS (dane za I kwartał 2015 r.) Tutaj wpisujemy formułę, która pozwoli na obliczenie ile osób z próby (o liczebności 100) potrzeba wylosować z każdej kategorii wiekowej
Zadanie 3 Rozwiązanie Struktura wiekowa bezrobotnych Twoje obliczenia Kategorie wiekowe Rozkład w populacji Ile obserwacji do próby? Rozkład w próbie 18-24 15% 25-34 28% 35-44 22% 45-54 20% 55-59 11% 60 lat i więcej 4% Źródło: GUS (dane za I kwartał 2015 r.) Jak powinna wyglądać formuła dla pierwszego wiersza?
Zadanie 3 Rozwiązanie Struktura wiekowa bezrobotnych Twoje obliczenia Kategorie wiekowe Rozkład w populacji Ile obserwacji do próby? Rozkład w próbie 18-24 15% 25-34 28% 35-44 22% 45-54 20% 55-59 11% 60 lat i więcej 4% Źródło: GUS (dane za I kwartał 2015 r.) Są dwie możliwości: 1) = 15%*100 2) = C10*100
Zadanie 3 Rozwiązanie Struktura wiekowa bezrobotnych Twoje obliczenia Kategorie wiekowe Rozkład w populacji Ile obserwacji do próby? Rozkład w próbie 18-24 15% 15 25-34 28% 28 35-44 22% 22 45-54 20% 20 55-59 11% 11 60 lat i więcej 4% 4 Źródło: GUS (dane za I kwartał 2015 r.) Poprawne wyniki w tabeli.
Zadanie 3 Rozwiązanie Struktura wiekowa bezrobotnych Twoje obliczenia Kategorie wiekowe Rozkład w populacji Ile obserwacji do próby? Rozkład w próbie 18-24 15% 15 25-34 28% 28 35-44 22% 22 45-54 20% 20 55-59 11% 11 60 lat i więcej 4% 4 Źródło: GUS (dane za I kwartał 2015 r.) W tej kolumnie dzielimy wszystkie liczby z kolumny po lewej przez 100, żeby sprawdzić procentowy rozkład w próbie
Zadanie 3 Rozwiązanie Struktura wiekowa bezrobotnych Twoje obliczenia Kategorie wiekowe Rozkład w populacji Ile obserwacji do próby? Rozkład w próbie 18-24 15% 15 15% 25-34 28% 28 28% 35-44 22% 22 22% 45-54 20% 20 20% 55-59 11% 11 11% 60 lat i więcej 4% 4 4% Źródło: GUS (dane za I kwartał 2015 r.) Poprawne wyniki
Zadanie 3 Finał Losowanie warstwowe z populacji 1. Wpisz funkcje LOS() do pierwszej komórki. 2. Skopiuj formułę do pozostałych komórek w kolumnie (tak jak to robiliśmy wcześniej). 3. Zamień formuły na wartości (tak jak to robiliśmy wcześniej). 4. Załóż filtry na bazę danych. Posortuj po kolumnie Rand i następnie po kategoriach wiekowych. 5. Wybierz z każdej grupy tyle obserwacji ile potrzebujesz wklej do arkusza z tabelą wynikową. GOTOWE!
Dziękujemy za uwagę!