Propensity Score Matching

Wielkość: px
Rozpocząć pokaz od strony:

Download "Propensity Score Matching"

Transkrypt

1 Zajęcia 5

2 Plan na dziś 1 Dehejia i Wahba (1999)

3 Dehejia i Wahba (1999) Causal Effects in Nonexperimental Studies: Reevaluating the Evaluation of Training Programs Rajeev H. Dehejia, Sadek Wahba, Journal of the American Statistical Association, vol. 94, nr. 448, str

4 wyników LaLonde (1986) W artykule pokazany jest sposób szacowania efektów oddziaływania na podstawie danych nieeksperymentalnych W artykule wykorzystano dane z artykułu LaLonde (1986) Celem badania LaLonde (1986) było pokazanie który sposób szacowania efektów oddziaływania na podstawie danych przekrojowych (nieeksperymentalnych) pozwala uzyskać nieobciążone oszacowanie zgodne z wynikiem eksperymentu Wnioskiem z badania LaLonde było, że metody nieeksperymentalne dają mniej dokładne wyniki w stosunku do metod eksperymentalnych lub te wyniki są zależne od wybranej specyfikacji modelu

5 Cel artykułu Dehejia i Wahba (1999) W artykule autorzy wykorzystują metody propensity score do danych z badania LaLonde (1986) W celu budowania grupy kontrolnej wykorzystują technikę propensity score matching Zauważają, że uwzględnienie różnic wszystkich charakterystyk sprzed interwencji jest trudne w przypadku, gdy jest duża liczba takich charakterystyk lub gdy grupa eksperymentalna różni się znacznie od potencjalnych jednostek kontrolnych Oszacowana wartość propensity score jest jedną liczbą podsumowującą wartości wszystkich charakterystyk dla danej obserwacji

6 Cel artykułu Dehejia i Wahba (1999) Oszacowane wartości propensity score mogą być wykorzystane do kontroli różnic pomiędzy grupą poddaną oddziaływaniu eksperymentalnemu i oddziaływaniu kontrolnemu Metoda PSM opiera się na założeniu, że przydzielenie oddziaływania jest powiązane wyłącznie z obserwowanymi charakterystykami przed interwencją (ignorable treatment, selection on observables) Badanie pokazało, że wykorzystanie techniki propensity score matching do danych LaLonde pozwala na uzyskane oszacowań bliższych oszacowaniom eksperymentalnym niż wyniki LaLonde (1986)

7 Informacje ogólne Dehejia i Wahba (1999) National Supported Work Demonstration był programem czasowego zatrudnienia dla osób pozbawionych podstawowych kwalifikacji Program był zarządzany przez Manpower Demonstration Research Corporation Uczestnicy programu byli przydzielani do różnego typu działań w sposób losowy Pomoc otrzymała jedynie część aplikujących. W rezultacie schemat programu zapewnił istnienie grupy odniesienia

8 Program szkoleń NSW Program prowadzono w dziesięciu miejscach w Stanach Zjednoczonych Ameryki Północnej (Atlanta, Chicago, Hartford, Jersey City, Newark, Nowy Jork, Oakland, Filadelfia, San Francisco, Wisconsin) Program trwał od 6 do 18 miesięcy Od wszystkich potencjalnych uczestników zebrano dane, a następnie ankietowano po zakończeniu programu W artykule ograniczono się do analizy danych dla mężczyzn Uzasadnieniem wyboru był brak odporności wyników uzyskanych przez LaLonde na zmiany specyfikacji formy funkcyjnej modelu, szczególnie dla tej grupy

9 Program szkoleń NSW Kandydaci byli włączani do programu w okresie od marca 1975 do lipca 1977 Jedną z konsekwencji jest fakt, iż osoby przyjęte w początkowym okresie do programu różniły się pod względem charakterystyk ekonomicznych i demograficznych od osób przyjętych w późniejszym okresie Dodatkowo różnią się one pod względem czasu ekspozycji na oddziaływanie eksperymentalne By temu przeciwdziałać LaLonde zdyskontował uzyskiwane zarobki

10 Ograniczenie próby Dehejia i Wahba (1999) LaLonde ograniczył próbę do osób przyjętych do programu po grudniu 1975, którzy zakończyli uczestnictwo w programie przed styczniem 1978 Dzięki temu mógł potraktować zarobki z roku 1975 jako wartość niezależną od oddziaływania (ang. preintervention variable) a zarobki z roku 1978 jako jego wynik Literatura pokazuje, że w przypadku oceny programu aktywizacji na rynku pracy uwzględnienie zarobków tylko z jednego roku może być niewystarczające W związku z tym, autorzy ograniczają próbę LaLonde do osób dla których dostępna jest informacja o wysokości zarobków w 1974 roku

11 Losowość próby Dehejia i Wahba (1999) Podpróba jest wybierana na podstawie miesiąca przystąpienia do programu i historii zatrudnienia, preintervention variables Przy spełnionym założeniu, że pierwotna randomizacja była niezależna od charakterystyk osób sprzed interwencji ograniczona próba zachowuje cechy danych eksperymentalnych W grupie eksperymentalnej i kontrolnej rozkłady charakterystyk sprzed interwencji są identyczne LaLonde (1986) wykorzystał próbę eksperymentalną liczącą 297 obserwacji i grupę kontrolną liczącą 425 obserwacji Dehejia i Wahba ograniczyli liczebność próby eksperymentalnej do 185 obserwacji, a grupy kontrolnej do 260 obserwacji

12 Charakterystyki próby Dehejia i Wahba (1999) Podpróba danych eksperymentalnych Dehejia i Wahba (1999) różni się od danych LaLonde (1986) Najważniejszą różnicą jest wysokość zarobków w 1975 roku Jest to suma efektu kohorty i faktu, że w próbie Dehejia i Wahba jest większa liczba osób, które przed programem były bezrobotne Różnice w rozkładzie charakterystyk sprzed programu nie są statystycznie istotne poza zmienną no degree

13 Tabela 1.Charakterystyka danych

14 Grupy odniesienia Dehejia i Wahba (1999) PSID-1: Wszystkie gospodarstwa które uczestniczyły w badaniu w latach , głową był mężczyzna w wieku i nie był na emeryturze w 1975 PSID-2: PSID-1 ograniczone do mężczyzn nie pracujących w 1976 PSID-3: PSID-1 ograniczone do mężczyzn nie pracujących w 1975 i 1976 CPS-1: Wszyscy mężczyźni z CPS w wieku do 55 lat CPS-2: Wszyscy mężczyźni z CPS w wieku do 55 lat, nie pracujący wiosną 1975 CPS-3: CPS-1 ograniczone do bezrobotnych mężczyzn w 1976, których dochód w 1975 był poniżej linii ubóstwa

15 Grupy odniesienia Dehejia i Wahba (1999) Próby PSID-1 - PSID-3 oraz CPS-1 są identyczne jak w badaniu LaLonde, prób CPS-2 i CPS-3 autorom nie udało się dokładnie odtworzyć, użyto prób podobnych Dehejia i Wahba zauważają, że rozkłady cech w podpróbach różnią się od rozkładów tych cech w grupie eksperymentalnej

16 Tabela 1. Charakterystyka grup odniesienia

17 Charakterystyka grup odniesienia Rozkłady charakterystyk w grupach PSID-1 oraz CPS-1 różnią się w sposób istotny statystycznie od rozkładu w grupie eksperymentalnej W przypadku dodatkowych grup skonstruowanych przez LaLonde różnice w wartościach charakterystyk są mniejsze, ale pozostają statystycznie istotne na poziomie istotności 1 %

18 Oszacowania efektu uczestnictwa w programie W kolejnym kroku autorzy odtworzyli oryginalne wyniki artykułu LaLonde (1986) (tabela A) W modelu regresji jako zmiennych kontrolnych użyto: age, age squared, years of schooling, high school dropout status, black, hispanic oraz w przypadku tabeli C zarobków w 1974 roku (tabela C) Następnie zastosowali te same techniki analizy do wybranego podzbioru danych w dwóch wariantach bez dodatkowej zmiennej wysokość zarobków w 1974 roku (tabela B) z dodatkową zmienną wysokość zarobków w 1974 roku (tabela C)

19 Oszacowania efektu uczestnictwa w programie Dehejia i Wahba uzyskali wyższą wartość oszacowania dla efektu uczestnictwa w programie Wyższy jest efekt uczestnictwa w programie dla osób, które wcześniej przystąpiły do programu oraz osób bezrobotnych przed programem Oszacowania w kolumnie 5, gdzie użyto pełnego zestawu zmiennych kontrolnych, są najbliższe wynikom eksperymentalnym

20 Tabela 2. Dane LaLonde (1986)

21 Tabela 2. Podpróba Dehejia i Wahba (1999)

22 Oszacowania efektu szkolenia Uwzględnienie dodatkowej zmiennej poprawia oszacowania względem zaprezentowanych w części B tabeli 2. Część oszacowań nadal ma wartość ujemną ale bliższą wartości zero Wartości w kolumnie (4) i (5) są bliższe wynikom eksperymentalnym niż odpowiadające im rezultaty z tabeli 2B najbliższe eksperymentalnym uzyskano dla próby CPS-3.

23 Tab 2. Podpróba Dehejia i Wahba (1999) z zarobkami 1974

24 Metoda szacowania Dehejia i Wahba (1999) W pierwszym kroku szacowane jest propensity score dla każdej próby Autorzy wybrali model logistyczny Początkowo wprowadzono zmienne w pierwszej potędze Autorzy grupowali obserwacje ze względu na oszacowaną wartość propensity score i weryfikowali zbilansowanie rozkładów charakterystyk w każdej warstwie W artykule nie jest to wprost napisane, ale zapewne podzielili przedział [0, 1] na dwadzieścia warstw o szerokości 0,05 W każdej warstwie przeprowadzili test równości rozkładu oparty o dwa pierwsze momenty (średnia i wariancja)

25 Metoda szacowania Dehejia i Wahba (1999) W przypadku braku istotnych różnic autorzy akceptowali specyfikację formy funkcyjnej modelu W przypadku istotnych statystycznie różnic, autorzy dodawali czynniki wyższego rzędu (zmienne w kolejnych potęgach) oraz interakcje między zmiennymi. Czynność była powtarzana do uzyskania zbilansowania rozkładów W drugim kroku szacowano rozmiar efektu wykorzystując nieparametryczny model regresji z jedną zmienną objaśniającą. Nieparametryczną metodą była stratyfikacja albo matching

26 Stratyfikacja Dehejia i Wahba (1999) Obserwacje są sortowane względem oszacowanej wartości propensity score od najmniejszej do największej Obserwacje z wartością propensity score mniejszą niż minimum i większą niż maksimum dla grupy eksperymentalnej są usuwane Warstwy, definiowane na postawie wartości propensity score są ustalane tak, by rozkłady zmiennych były w każdej warstwie zbilansowane Ważona różnica między średnim wynikiem w grupie eksperymentalnej i kontrolnej jest oszacowaniem przeciętnego efektu oddziaływania wobec jednostek poddanych oddziaływaniu (ATT), wagami są liczby obserwacji w grupie eksperymentalnej

27 Matching Dehejia i Wahba (1999) Każda jednostka z grupy eksperymentalnej jest łączona ze zwracaniem z najbliższą jednostką z grupy kontrolnej pod względem wartości propensity score. Ta technika nosi nazwę łączenia najbliższych sąsiadów (ang. nearest neighbour matching) Jednostki nie poddane oddziaływaniu, które nie zostaną połączone nie są brane pod uwagę przy obliczaniu oszacowania efektu oddziaływania

28 Uzasadnienie podejścia dwuetapowego z wykorzystaniem regresji nieparametrycznej będzie narażone na problem wielowymiarowości Ten problem powoduje, że do szacowania propensity score jest wykorzystywany model parametryczny Dzięki temu oszacowania są mniej czułe na zmiany specyfikacji modelu dla propensity score Przyjęta metoda weryfikacji poprawności szacowania propensity score powoduje, że charakterystyki sprzed interwencji są zbilansowane Jest to warunkiem dostatecznym dla uzyskania nieobciążonych oszacowań dla ATT

29 Liczebność grup kontrolnych Większość obserwacji z PSID (1333 z 2490) oraz CPS (12611 z 15992) nie jest uwzględnianych podczas szacowania wartości efektu oddziaływania, ponieważ wartość propensity score jest niższa niż minimum w grupie eksperymentalej Pomimo tego pierwsza warstwa zawiera większość jednostek z grupy kontrolnej i tylko kilka z grupy eksperymentalnej W przypadku dużej liczby warstw liczebność grupy eksperymentalnej przewyższa liczebność grupy kontrolnej Wspólna część przedziału określoności dla wartości propensity score (overlap) jest niewielka

30 Histogram propensity score dla PSID

31 Histogram propensity score dla CPS

32 Szacowanie wartości oddziaływania Autorzy wykorzystali warstwowanie w celu pogrupownia jednostek z grupy eksperymentalnej Wartość efektu oddziaływania obliczono osobno dla każdej warstwy jako różnicę w średnich zarobkach w 1978 roku dla grupy eksperymentalnej i kontrolnej Następnie utworzono ważoną średnią, w której wagami były liczebności warstw w grupie eksperymentalnej (kolumna 4) Alternatywnym sposobem szacowania efektu oddziaływania była regresja wewnątrz warstw (kolumna 5) Wykorzystano również propensity score matching (kolumna 7, przed łączeniem i 8 po łączeniu)

33 Formy funkcyjne modelu a: regresja RE78 na wskaźnik oddziaływania oraz age, age squared, education, no degree, black, hispanic, RE74, RE75 b: regresja RE78 na wskaźnik oddziaływania oraz propensity score i propensity score2 d: ważona MNK, specyfikacja jak w (a). e: PSID1: logit dla Pr(T=1)=f(age, age2, education, education2, married, nodegree, black, hispanic, RE74, RE75, RE74 2, RE75 2, u74 black) f: PSID2 oraz PSID3: logit dla Pr(T=1)=f(age, age2, education, education2, married, nodegree, black, hispanic, RE74, RE75, RE74 2, RE75 2, u74, u75) g: CPS: logit dla Pr(T=1)=f(age, age2, education, educaion2, married, nodegree, black, hispanic, RE74, RE75, u74, u75, education RE74, age3)

34 Oszacowania wartości efektu Dla próby PSID Oszacowanie metodą warstwowania wynosi 1608$ Oszacowanie metodą propensity score wynosi 1691$ Obie wartości są bliskie wynikowi eksperymentalnemu Uwzględnienie dodatkowych zmiennych wpływa w niewielkim stopniu na wartość oszacowania efektu Dla próby CPS Oszacowanie metodą warstwowania wynosi 1713$ Oszacowanie metodą propensity score wynosi 1582$ Obie wartości są bliskie wynikowi eksperymentalnemu Uwzględnienie dodatkowych zmiennych wpływa w niewielkim stopniu na wartość oszacowania efektu są znacznie bliższe wynikom eksperymentalnym niż w artykule LaLonde (1986)

35 Tabela 3. Oszacowania wartości efektów programu

36 Oszacowania wartości efektu Dla mniej liczebnych podprób oszacowania są bliższe wartościom z eksperymentu Aczkolwiek nadal rozrzut (wariancja) uzyskanych oszacowań jest znaczna Wyjaśnienia dlaczego tak się dzieje dostarcza tabela 4 prezentująca statystyki opisowe dla mniej liczebnych grup odniesienia Próby PSID-1 oraz CPS-1 są zbliżone pod względem rozkładu charakterystyk do grupy eksperymentalnej, mniej liczebne podpróby mają inne rozkłady dla poszczególnych charakterystyk Szczególnie duże rozbieżności w rozkładach są widoczne dla danych PSID

37 Tabela 4. Statystyki opisowe grup odniesienia

38 Charakterystyki grup odniesienia Połączona część (ang. matched subset) prób CPS-1 oraz PSID-1 jest po względem rozkładu cech bardzo podobna do cech jednostek z grupy eksperymentalnej W przypadku mniej liczebnych podzbiorów już tak nie jest. Jest to szczególnie widoczne w podgrupach z badania PSID

39 Ważna cecha PSM Dehejia i Wahba (1999) Ważną cechą metod wykorzystujących propensity score jest fakt, że podpróby zbudowane metodą ad-hoc nie są ani potrzebne ani pożądane. Podpróby zbudowane na podstawie rozkładu jednej charakterystyki mogą być wystarczające do zbilansowania rozkładu pozostałych charakterystyk Wektor propensity score uwzględnia równocześnie wszystkie charakterystyki, większą wagę przykładając do najbardziej odpowiednich jednostek porównawczych pod względem wszystkich cech, nie tylko wybranej jednej

40 Komentarz do wyników Pomimo tego, że oszacowania wykorzystujące propensity score matching są bliższe wynikom eksperymentalnym niż oszacowania wykorzystujące modele regresji, odchylenia standardowe oszacowań są znacznie większe. Dla prób CPS i PSID wynoszą odpowiednio 1152 oraz 1581 podczas, gdy na podstawie modeli regresji 550 i 886 Różnica wynika z faktu, że oszacowania wykorzystujące propensity score matching wykorzystują mniejszą liczbę obserwacji Gdy przy łączeniu wykorzystywane są dodatkowe zmienne, błędy standardowe są zbliżone (Tabela 3, kolumna 8)

41 Wrażliwość wyników na specyfikację propensity score Okazuje się, że wyniki nie są wrażliwe na niewielkie modyfikacje specyfikacji wektora propensity score Usunięcie wyższych potęg oraz interakcji zmiennych objaśniających w niewielkim stopniu wpływ a na wartości uzyskanych oszacowań efektów programu Zmiany w wartości oszacowania efektu są niższe od jednego odchylenia standardowego Jednak warto zauważyć, że wartości oszacowań są dalsze od wyników eksperymentalnych w porównaniu z wynikami z Tabeli 3

42 Tabela 5. Wrażliwość oszacowań ATT na zmiany specyfikacji propensity score

43 Wrażliwość wyników na dobór zmiennych Ważnym założeniem metody PSM jest to, że w modelu powinny być uwzględnione wszystkie zmienne wpływające na przydział oddziaływania i wszystkie zmienne skorelowane ze zmienną wynikową Z tego powodu Dehejia i Wahba ograniczyli próbę LaLonde W celu sprawdzenia poprawności założenia oszacowali modele bez uwzględniania zmiennej zarobki w 1974 roku zależą od uwzględnienia tej zmiennej, ale w każdej próbie w inny sposób

44 Tabela 5. Wrażliwość oszacowań ATT na zmiany specyfikacji propensity score

45 (1) Dehejia i Wahba (1999) Dehejia i Wahba pokazali w jaki sposób można wykorzystać technikę propensity score matching do oszacowania efektów oddziaływania na podstawie danych nie pochodzących z eksperymentu Wartości oszacowań uzyskane na podstawie połączonych zbiorów danych nieeksperymentalnych i eksperymentalnych (zbiory LaLonde) są bliskie wynikom eksperymentalnym i są odporne na wybór grupy odniesienia oraz specyfikację formy funkcyjnej wektora propensity score

46 (2) Dehejia i Wahba (1999) Podstawą skuteczności metody jest ograniczenie analizy do podzbioru danych, który jest podobny pod względem charakterystyk do grupy eksperymentalnej Dodatkowo, analiza pokazała, że w dużym zbiorze jednostek nie poddanych działaniu eksperymentalnemu tylko kilka może być podobnych pod względem istotnych charakterystyk do jednostek z grupy eksperymentalnej Nawet nieliczna grupa odniesienia (grupa kontrolna) jest wystarczająca do oszacowania efektu programu Jednak, metoda wykorzystująca wektory propensity score nie jest uniwersalnym remedium na wszystkie problemy. Jeżeli ważna charakterystyka skorelowana z przydziałem do oddziaływania lub zmienną wynikową jest nieobserwowana to metoda nie daje dobrych rezultatów

Propensity Score Matching

Propensity Score Matching Zajęcia 4 Plan na dziś 1 Potencjalne i obserwowane wyniki Regresja dla danych eksperymentalnych 2 Angrist i Pischke, 2009 Potencjalne i obserwowane wyniki Regresja dla danych eksperymentalnych Mostly Harmless

Bardziej szczegółowo

Propensity Score Matching

Propensity Score Matching Zajęcia 7 Plan na dziś Deheija (2005) 1 Deheija (2005) Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników 2 PSM dla danych NSW Testy bilansowania Powtórzenie wyników

Bardziej szczegółowo

Propensity Score Matching

Propensity Score Matching Zajęcia 6 Plan na dziś 1 Does matching overcome LaLonde s critique of nonexperimental estimators Jeffrey A. Smith, Petra E. Todd (2005) Journal of Econometrics, vol. 125, str. 305-353. Brak zgody w literaturze

Bardziej szczegółowo

Propensity score matching (PSM)

Propensity score matching (PSM) Propensity score matching (PSM) Jerzy Mycielski Uniwersytet Warszawski Maj 2010 Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 1 / 18 Badania ewaluacyjne Ocena wpływu

Bardziej szczegółowo

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności: Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności

Bardziej szczegółowo

Zastosowanie schematu analizy difference-in-differences w badaniach politycznych. Adam Gendźwiłł Tomasz Żółtak Uniwersytet Warszawski

Zastosowanie schematu analizy difference-in-differences w badaniach politycznych. Adam Gendźwiłł Tomasz Żółtak Uniwersytet Warszawski Zastosowanie schematu analizy difference-in-differences w badaniach politycznych Adam Gendźwiłł Tomasz Żółtak Uniwersytet Warszawski Potential outcomes framework Indywidualny efekt przyczynowy różnica

Bardziej szczegółowo

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Monte Carlo, bootstrap, jacknife

Monte Carlo, bootstrap, jacknife Monte Carlo, bootstrap, jacknife Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej: http://www.ssc.wisc.edu/~bhansen/econometrics/ Monte Carlo: rozdział 8.8, 8.9 Bootstrap: rozdział

Bardziej szczegółowo

Wykład 4: Statystyki opisowe (część 1)

Wykład 4: Statystyki opisowe (część 1) Wykład 4: Statystyki opisowe (część 1) Wprowadzenie W przypadku danych mających charakter liczbowy do ich charakterystyki można wykorzystać tak zwane STATYSTYKI OPISOWE. Za pomocą statystyk opisowych można

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.

Bardziej szczegółowo

WNIOSKOWANIE STATYSTYCZNE

WNIOSKOWANIE STATYSTYCZNE STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących

Bardziej szczegółowo

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012

Bardziej szczegółowo

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1. Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w

Bardziej szczegółowo

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z

Bardziej szczegółowo

Szkice rozwiązań z R:

Szkice rozwiązań z R: Szkice rozwiązań z R: Zadanie 1. Założono doświadczenie farmakologiczne. Obserwowano przyrost wagi ciała (przyrost [gram]) przy zadanych dawkach trzech preparatów (dawka.a, dawka.b, dawka.c). Obiektami

Bardziej szczegółowo

Wykład 2: Tworzenie danych

Wykład 2: Tworzenie danych Wykład 2: Tworzenie danych Plan: Statystyka opisowa a wnioskowanie statystyczne Badania obserwacyjne a eksperyment Planowanie eksperymentu, randomizacja Próbkowanie z populacji Rozkłady próbkowe Wstępna/opisowa

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom

Bardziej szczegółowo

Zastosowanie techniki Propensity Score Matching w badaniach ewaluacyjnych

Zastosowanie techniki Propensity Score Matching w badaniach ewaluacyjnych Zastosowanie techniki Propensity Score Matching w badaniach ewaluacyjnych III Międzyregionalna Konferencja Ewaluacyjna Dariusz Majerek Katedra Matematyki Stosowanej Wydział Podstaw Techniki Politechniki

Bardziej szczegółowo

Modele quasi-eksperymentalne: Model regresji nieciągłej

Modele quasi-eksperymentalne: Model regresji nieciągłej Warsztaty szkoleniowe z zakresu oceny oddziaływania instrumentów aktywnej polityki rynku pracy Modele quasi-eksperymentalne: Model regresji nieciągłej Maciej Wilamowski, Gdańsk, 22 lutego 2017 r. Metody

Bardziej szczegółowo

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. imię, nazwisko, nr indeksu: Ekonometria egzamin 0/0/0. Egzamin trwa 90 minut.. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu. Złamanie

Bardziej szczegółowo

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( ) Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału

Bardziej szczegółowo

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów 5. Testowanie

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

Modele quasi-eksperymentalne: Model regresji nieciągłej

Modele quasi-eksperymentalne: Model regresji nieciągłej Warsztaty szkoleniowe z zakresu ewaluacji wpływu instrumentów Aktywnych Polityk Rynku Pracy Modele quasi-eksperymentalne: Model regresji nieciągłej Maciej Wilamowski, Kraków, 6 czerwca 2017 r. Metody ewaluacji

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8 Stanisław Cichocki Natalia Nehrebecka Zajęcia 8 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów

Bardziej szczegółowo

Kolokwium ze statystyki matematycznej

Kolokwium ze statystyki matematycznej Kolokwium ze statystyki matematycznej 28.05.2011 Zadanie 1 Niech X będzie zmienną losową z rozkładu o gęstości dla, gdzie 0 jest nieznanym parametrem. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Jednoczynnikowa analiza wariancji

Jednoczynnikowa analiza wariancji Jednoczynnikowa analiza wariancji Zmienna zależna ilościowa, numeryczna Zmienna niezależna grupująca (dzieli próbę na więcej niż dwie grupy), nominalna zmienną wyrażoną tekstem należy w SPSS przerekodować

Bardziej szczegółowo

Analiza korespondencji

Analiza korespondencji Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy

Bardziej szczegółowo

Zadania ze statystyki cz.8. Zadanie 1.

Zadania ze statystyki cz.8. Zadanie 1. Zadania ze statystyki cz.8. Zadanie 1. Wykonano pewien eksperyment skuteczności działania pewnej reklamy na zmianę postawy. Wylosowano 10 osobową próbę studentów, których poproszono o ocenę pewnego produktu,

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Wydział Matematyki. Testy zgodności. Wykład 03

Wydział Matematyki. Testy zgodności. Wykład 03 Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy

Bardziej szczegółowo

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. imię, nazwisko, nr indeksu: Ekonometria egzamin 02/02/2011 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.

Bardziej szczegółowo

Spis treści 3 SPIS TREŚCI

Spis treści 3 SPIS TREŚCI Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe

Bardziej szczegółowo

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Natalia Nehrebecka Stanisław Cichocki. Wykład 10 Natalia Nehrebecka Stanisław Cichocki Wykład 10 1 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów

Bardziej szczegółowo

Wykład 9 Wnioskowanie o średnich

Wykład 9 Wnioskowanie o średnich Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i

Bardziej szczegółowo

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną

Bardziej szczegółowo

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu, z którego pochodzi próbka. Hipotezy dzielimy na parametryczne i nieparametryczne. Parametrycznymi

Bardziej szczegółowo

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)

Bardziej szczegółowo

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie

Bardziej szczegółowo

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15 VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady

Bardziej szczegółowo

Wprowadzenie do analizy dyskryminacyjnej

Wprowadzenie do analizy dyskryminacyjnej Wprowadzenie do analizy dyskryminacyjnej Analiza dyskryminacyjna to zespół metod statystycznych używanych w celu znalezienia funkcji dyskryminacyjnej, która możliwie najlepiej charakteryzuje bądź rozdziela

Bardziej szczegółowo

Egzamin z ekonometrii wersja IiE, MSEMAT

Egzamin z ekonometrii wersja IiE, MSEMAT Egzamin z ekonometrii wersja IiE, MSEMAT 04-02-2016 Pytania teoretyczne 1. Za pomocą jakiego testu weryfikowana jest normalność składnika losowego? Jakiemu założeniu KMRL odpowiada w tym teście? Jakie

Bardziej szczegółowo

Wprowadzenie W ostatnich latach metody mikroekonometryczne zdobywają coraz większą popularność i uznanie badaczy. Jest to związane przede wszystkim z rozwojem technik gromadzenia i przetwarzania danych.

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez statystycznych

Bardziej szczegółowo

Badania eksperymentalne

Badania eksperymentalne Badania eksperymentalne Analiza CONJOINT mgr Agnieszka Zięba Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa Najpopularniejsze sposoby oceny wyników eksperymentu w schematach

Bardziej szczegółowo

Modele quasi-eksperymentalne: Model regresji nieciągłej

Modele quasi-eksperymentalne: Model regresji nieciągłej Warsztaty szkoleniowe z zakresu oceny oddziaływania instrumentów aktywnej polityki rynku pracy Modele quasi-eksperymentalne: Model regresji nieciągłej Maciej Wilamowski, Gdańsk, 22 lutego 2017 r. Metody

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

Żródło:

Żródło: Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Zmienne muszą być zmiennymi ilościowym (liczymy i porównujemy średnie!) Są to testy parametryczne Test

Bardziej szczegółowo

Modele quasi-eksperymentalne: Różnica w różnicy oraz inne metody

Modele quasi-eksperymentalne: Różnica w różnicy oraz inne metody Warsztaty szkoleniowe z zakresu oceny oddziaływania instrumentów aktywnej polityki rynku pracy Modele quasi-eksperymentalne: Różnica w różnicy oraz inne metody Celine Ferre, Gdańsk, 22 lutego 2017 r. Metody

Bardziej szczegółowo

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH WERYFIKACJA HIPOTEZ STATYSTYCZNYCH I. TESTY PARAMETRYCZNE II. III. WERYFIKACJA HIPOTEZ O WARTOŚCIACH ŚREDNICH DWÓCH POPULACJI TESTY ZGODNOŚCI Rozwiązania zadań wykonywanych w Statistice przedstaw w pliku

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych 9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej

Bardziej szczegółowo

Badania sondażowe. Schematy losowania. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa

Badania sondażowe. Schematy losowania. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa Badania sondażowe Schematy losowania Agnieszka Zięba Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa 1 Próba jako miniatura populacji CELOWA subiektywny dobór jednostek

Bardziej szczegółowo

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Zmienne muszą być zmiennymi ilościowym (liczymy i porównujemy średnie!) Są to testy parametryczne Nazwa

Bardziej szczegółowo

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie. SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:

Bardziej szczegółowo

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12 Stanisław Cichocki Natalia Nehrebecka Wykład 12 1 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne 2. Autokorelacja o Testowanie autokorelacji 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne

Bardziej szczegółowo

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, 2018 Spis treści Przedmowa 13 O Autorach 15 Przedmowa od Tłumacza 17 1. Wprowadzenie i statystyka opisowa 19 1.1.

Bardziej szczegółowo

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi) Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi) Czy miejsce zamieszkania różnicuje uprawianie sportu? Mieszkańcy

Bardziej szczegółowo

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu

Bardziej szczegółowo

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji

Bardziej szczegółowo

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA Opis zakładanych efektów kształcenia na studiach podyplomowych Nazwa studiów: BIOSTATYSTYKA PRAKTYCZNE ASPEKTY STATYSTYKI W BADANIACH MEDYCZNYCH Typ studiów: doskonalące Symbol Efekty kształcenia dla studiów

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM

Bardziej szczegółowo

Projektowanie eksperymentu część 2

Projektowanie eksperymentu część 2 Warsztaty szkoleniowe z zakresu ewaluacji wpływu instrumentów Aktywnych Polityk Rynku Pracy Projektowanie eksperymentu część 2 Lucilla Bruni, Kraków, 5 czerwca 2017 r. Idealne badanie eksperymentalne klony

Bardziej szczegółowo

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl

Bardziej szczegółowo

Zmienne zależne i niezależne

Zmienne zależne i niezależne Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }

Bardziej szczegółowo

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński Mikroekonometria 5 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.medexp3.dta przygotuj model regresji kwantylowej 1. Przygotuj model regresji kwantylowej w którym logarytm wydatków

Bardziej szczegółowo

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4. Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ

Bardziej szczegółowo

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

Pobieranie prób i rozkład z próby

Pobieranie prób i rozkład z próby Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.

Bardziej szczegółowo

Wnioskowanie statystyczne. Statystyka w 5

Wnioskowanie statystyczne. Statystyka w 5 Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających

Bardziej szczegółowo

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. dr hab. Jerzy Nakielski Katedra Biofizyki i Morfogenezy Roślin Plan wykładu: 1. Etapy wnioskowania statystycznego 2. Hipotezy statystyczne,

Bardziej szczegółowo

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie Wyznaczanie przedziału 95%CI oznaczającego, że dla 95% prób losowych następujące nierówności są prawdziwe: X t s 0.025 n < μ < X + t s

Bardziej szczegółowo

Zadania ze statystyki, cz.6

Zadania ze statystyki, cz.6 Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z

Bardziej szczegółowo

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej) Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej) 1 Podział ze względu na zakres danych użytych do wyznaczenia miary Miary opisujące

Bardziej szczegółowo

Warsztat: Randomizacja w programie Excel

Warsztat: Randomizacja w programie Excel Warsztaty szkoleniowe z zakresu ewaluacji wpływu instrumentów Aktywnych Polityk Rynku Pracy Warsztat: Randomizacja w programie Excel Piotr Ćwiakowski Tomasz Gajderowicz, Kraków, 5 czerwca 2017 r. Przydział

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wprowadzenie

Testowanie hipotez statystycznych. Wprowadzenie Wrocław University of Technology Testowanie hipotez statystycznych. Wprowadzenie Jakub Tomczak Politechnika Wrocławska jakub.tomczak@pwr.edu.pl 10.04.2014 Pojęcia wstępne Populacja (statystyczna) zbiór,

Bardziej szczegółowo

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 Zadanie 1 a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 b) W naszym przypadku populacja są inżynierowie w Tajlandii. Czy można jednak przypuszczać, że na zarobki kobiet-inżynierów

Bardziej szczegółowo

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,

Bardziej szczegółowo

Analiza regresji - weryfikacja założeń

Analiza regresji - weryfikacja założeń Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.

Bardziej szczegółowo

Estymacja punktowa i przedziałowa

Estymacja punktowa i przedziałowa Temat: Estymacja punktowa i przedziałowa Kody znaków: żółte wyróżnienie nowe pojęcie czerwony uwaga kursywa komentarz 1 Zagadnienia 1. Statystyczny opis próby. Idea estymacji punktowej pojęcie estymatora

Bardziej szczegółowo

Modele quasi-eksperymentalne: Różnica w różnicy oraz inne metody

Modele quasi-eksperymentalne: Różnica w różnicy oraz inne metody Warsztaty szkoleniowe z zakresu oceny oddziaływania instrumentów aktywnej polityki rynku pracy Modele quasi-eksperymentalne: Różnica w różnicy oraz inne metody Celine Ferre, Gdańsk, 22 lutego 2017 r. Metody

Bardziej szczegółowo

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech TATYTYKA wykład 8 Wnioskowanie Weryfikacja hipotez Wanda Olech Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną

Bardziej szczegółowo

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii SPIS TREŚCI Przedmowa... 11 Wykaz symboli... 15 Litery alfabetu greckiego wykorzystywane w podręczniku... 15 Symbole wykorzystywane w zagadnieniach teorii mnogości (rachunku zbiorów)... 16 Symbole stosowane

Bardziej szczegółowo