Propensity Score Matching
|
|
- Jan Kubiak
- 6 lat temu
- Przeglądów:
Transkrypt
1 Zajęcia 5
2 Plan na dziś 1 Dehejia i Wahba (1999)
3 Dehejia i Wahba (1999) Causal Effects in Nonexperimental Studies: Reevaluating the Evaluation of Training Programs Rajeev H. Dehejia, Sadek Wahba, Journal of the American Statistical Association, vol. 94, nr. 448, str
4 wyników LaLonde (1986) W artykule pokazany jest sposób szacowania efektów oddziaływania na podstawie danych nieeksperymentalnych W artykule wykorzystano dane z artykułu LaLonde (1986) Celem badania LaLonde (1986) było pokazanie który sposób szacowania efektów oddziaływania na podstawie danych przekrojowych (nieeksperymentalnych) pozwala uzyskać nieobciążone oszacowanie zgodne z wynikiem eksperymentu Wnioskiem z badania LaLonde było, że metody nieeksperymentalne dają mniej dokładne wyniki w stosunku do metod eksperymentalnych lub te wyniki są zależne od wybranej specyfikacji modelu
5 Cel artykułu Dehejia i Wahba (1999) W artykule autorzy wykorzystują metody propensity score do danych z badania LaLonde (1986) W celu budowania grupy kontrolnej wykorzystują technikę propensity score matching Zauważają, że uwzględnienie różnic wszystkich charakterystyk sprzed interwencji jest trudne w przypadku, gdy jest duża liczba takich charakterystyk lub gdy grupa eksperymentalna różni się znacznie od potencjalnych jednostek kontrolnych Oszacowana wartość propensity score jest jedną liczbą podsumowującą wartości wszystkich charakterystyk dla danej obserwacji
6 Cel artykułu Dehejia i Wahba (1999) Oszacowane wartości propensity score mogą być wykorzystane do kontroli różnic pomiędzy grupą poddaną oddziaływaniu eksperymentalnemu i oddziaływaniu kontrolnemu Metoda PSM opiera się na założeniu, że przydzielenie oddziaływania jest powiązane wyłącznie z obserwowanymi charakterystykami przed interwencją (ignorable treatment, selection on observables) Badanie pokazało, że wykorzystanie techniki propensity score matching do danych LaLonde pozwala na uzyskane oszacowań bliższych oszacowaniom eksperymentalnym niż wyniki LaLonde (1986)
7 Informacje ogólne Dehejia i Wahba (1999) National Supported Work Demonstration był programem czasowego zatrudnienia dla osób pozbawionych podstawowych kwalifikacji Program był zarządzany przez Manpower Demonstration Research Corporation Uczestnicy programu byli przydzielani do różnego typu działań w sposób losowy Pomoc otrzymała jedynie część aplikujących. W rezultacie schemat programu zapewnił istnienie grupy odniesienia
8 Program szkoleń NSW Program prowadzono w dziesięciu miejscach w Stanach Zjednoczonych Ameryki Północnej (Atlanta, Chicago, Hartford, Jersey City, Newark, Nowy Jork, Oakland, Filadelfia, San Francisco, Wisconsin) Program trwał od 6 do 18 miesięcy Od wszystkich potencjalnych uczestników zebrano dane, a następnie ankietowano po zakończeniu programu W artykule ograniczono się do analizy danych dla mężczyzn Uzasadnieniem wyboru był brak odporności wyników uzyskanych przez LaLonde na zmiany specyfikacji formy funkcyjnej modelu, szczególnie dla tej grupy
9 Program szkoleń NSW Kandydaci byli włączani do programu w okresie od marca 1975 do lipca 1977 Jedną z konsekwencji jest fakt, iż osoby przyjęte w początkowym okresie do programu różniły się pod względem charakterystyk ekonomicznych i demograficznych od osób przyjętych w późniejszym okresie Dodatkowo różnią się one pod względem czasu ekspozycji na oddziaływanie eksperymentalne By temu przeciwdziałać LaLonde zdyskontował uzyskiwane zarobki
10 Ograniczenie próby Dehejia i Wahba (1999) LaLonde ograniczył próbę do osób przyjętych do programu po grudniu 1975, którzy zakończyli uczestnictwo w programie przed styczniem 1978 Dzięki temu mógł potraktować zarobki z roku 1975 jako wartość niezależną od oddziaływania (ang. preintervention variable) a zarobki z roku 1978 jako jego wynik Literatura pokazuje, że w przypadku oceny programu aktywizacji na rynku pracy uwzględnienie zarobków tylko z jednego roku może być niewystarczające W związku z tym, autorzy ograniczają próbę LaLonde do osób dla których dostępna jest informacja o wysokości zarobków w 1974 roku
11 Losowość próby Dehejia i Wahba (1999) Podpróba jest wybierana na podstawie miesiąca przystąpienia do programu i historii zatrudnienia, preintervention variables Przy spełnionym założeniu, że pierwotna randomizacja była niezależna od charakterystyk osób sprzed interwencji ograniczona próba zachowuje cechy danych eksperymentalnych W grupie eksperymentalnej i kontrolnej rozkłady charakterystyk sprzed interwencji są identyczne LaLonde (1986) wykorzystał próbę eksperymentalną liczącą 297 obserwacji i grupę kontrolną liczącą 425 obserwacji Dehejia i Wahba ograniczyli liczebność próby eksperymentalnej do 185 obserwacji, a grupy kontrolnej do 260 obserwacji
12 Charakterystyki próby Dehejia i Wahba (1999) Podpróba danych eksperymentalnych Dehejia i Wahba (1999) różni się od danych LaLonde (1986) Najważniejszą różnicą jest wysokość zarobków w 1975 roku Jest to suma efektu kohorty i faktu, że w próbie Dehejia i Wahba jest większa liczba osób, które przed programem były bezrobotne Różnice w rozkładzie charakterystyk sprzed programu nie są statystycznie istotne poza zmienną no degree
13 Tabela 1.Charakterystyka danych
14 Grupy odniesienia Dehejia i Wahba (1999) PSID-1: Wszystkie gospodarstwa które uczestniczyły w badaniu w latach , głową był mężczyzna w wieku i nie był na emeryturze w 1975 PSID-2: PSID-1 ograniczone do mężczyzn nie pracujących w 1976 PSID-3: PSID-1 ograniczone do mężczyzn nie pracujących w 1975 i 1976 CPS-1: Wszyscy mężczyźni z CPS w wieku do 55 lat CPS-2: Wszyscy mężczyźni z CPS w wieku do 55 lat, nie pracujący wiosną 1975 CPS-3: CPS-1 ograniczone do bezrobotnych mężczyzn w 1976, których dochód w 1975 był poniżej linii ubóstwa
15 Grupy odniesienia Dehejia i Wahba (1999) Próby PSID-1 - PSID-3 oraz CPS-1 są identyczne jak w badaniu LaLonde, prób CPS-2 i CPS-3 autorom nie udało się dokładnie odtworzyć, użyto prób podobnych Dehejia i Wahba zauważają, że rozkłady cech w podpróbach różnią się od rozkładów tych cech w grupie eksperymentalnej
16 Tabela 1. Charakterystyka grup odniesienia
17 Charakterystyka grup odniesienia Rozkłady charakterystyk w grupach PSID-1 oraz CPS-1 różnią się w sposób istotny statystycznie od rozkładu w grupie eksperymentalnej W przypadku dodatkowych grup skonstruowanych przez LaLonde różnice w wartościach charakterystyk są mniejsze, ale pozostają statystycznie istotne na poziomie istotności 1 %
18 Oszacowania efektu uczestnictwa w programie W kolejnym kroku autorzy odtworzyli oryginalne wyniki artykułu LaLonde (1986) (tabela A) W modelu regresji jako zmiennych kontrolnych użyto: age, age squared, years of schooling, high school dropout status, black, hispanic oraz w przypadku tabeli C zarobków w 1974 roku (tabela C) Następnie zastosowali te same techniki analizy do wybranego podzbioru danych w dwóch wariantach bez dodatkowej zmiennej wysokość zarobków w 1974 roku (tabela B) z dodatkową zmienną wysokość zarobków w 1974 roku (tabela C)
19 Oszacowania efektu uczestnictwa w programie Dehejia i Wahba uzyskali wyższą wartość oszacowania dla efektu uczestnictwa w programie Wyższy jest efekt uczestnictwa w programie dla osób, które wcześniej przystąpiły do programu oraz osób bezrobotnych przed programem Oszacowania w kolumnie 5, gdzie użyto pełnego zestawu zmiennych kontrolnych, są najbliższe wynikom eksperymentalnym
20 Tabela 2. Dane LaLonde (1986)
21 Tabela 2. Podpróba Dehejia i Wahba (1999)
22 Oszacowania efektu szkolenia Uwzględnienie dodatkowej zmiennej poprawia oszacowania względem zaprezentowanych w części B tabeli 2. Część oszacowań nadal ma wartość ujemną ale bliższą wartości zero Wartości w kolumnie (4) i (5) są bliższe wynikom eksperymentalnym niż odpowiadające im rezultaty z tabeli 2B najbliższe eksperymentalnym uzyskano dla próby CPS-3.
23 Tab 2. Podpróba Dehejia i Wahba (1999) z zarobkami 1974
24 Metoda szacowania Dehejia i Wahba (1999) W pierwszym kroku szacowane jest propensity score dla każdej próby Autorzy wybrali model logistyczny Początkowo wprowadzono zmienne w pierwszej potędze Autorzy grupowali obserwacje ze względu na oszacowaną wartość propensity score i weryfikowali zbilansowanie rozkładów charakterystyk w każdej warstwie W artykule nie jest to wprost napisane, ale zapewne podzielili przedział [0, 1] na dwadzieścia warstw o szerokości 0,05 W każdej warstwie przeprowadzili test równości rozkładu oparty o dwa pierwsze momenty (średnia i wariancja)
25 Metoda szacowania Dehejia i Wahba (1999) W przypadku braku istotnych różnic autorzy akceptowali specyfikację formy funkcyjnej modelu W przypadku istotnych statystycznie różnic, autorzy dodawali czynniki wyższego rzędu (zmienne w kolejnych potęgach) oraz interakcje między zmiennymi. Czynność była powtarzana do uzyskania zbilansowania rozkładów W drugim kroku szacowano rozmiar efektu wykorzystując nieparametryczny model regresji z jedną zmienną objaśniającą. Nieparametryczną metodą była stratyfikacja albo matching
26 Stratyfikacja Dehejia i Wahba (1999) Obserwacje są sortowane względem oszacowanej wartości propensity score od najmniejszej do największej Obserwacje z wartością propensity score mniejszą niż minimum i większą niż maksimum dla grupy eksperymentalnej są usuwane Warstwy, definiowane na postawie wartości propensity score są ustalane tak, by rozkłady zmiennych były w każdej warstwie zbilansowane Ważona różnica między średnim wynikiem w grupie eksperymentalnej i kontrolnej jest oszacowaniem przeciętnego efektu oddziaływania wobec jednostek poddanych oddziaływaniu (ATT), wagami są liczby obserwacji w grupie eksperymentalnej
27 Matching Dehejia i Wahba (1999) Każda jednostka z grupy eksperymentalnej jest łączona ze zwracaniem z najbliższą jednostką z grupy kontrolnej pod względem wartości propensity score. Ta technika nosi nazwę łączenia najbliższych sąsiadów (ang. nearest neighbour matching) Jednostki nie poddane oddziaływaniu, które nie zostaną połączone nie są brane pod uwagę przy obliczaniu oszacowania efektu oddziaływania
28 Uzasadnienie podejścia dwuetapowego z wykorzystaniem regresji nieparametrycznej będzie narażone na problem wielowymiarowości Ten problem powoduje, że do szacowania propensity score jest wykorzystywany model parametryczny Dzięki temu oszacowania są mniej czułe na zmiany specyfikacji modelu dla propensity score Przyjęta metoda weryfikacji poprawności szacowania propensity score powoduje, że charakterystyki sprzed interwencji są zbilansowane Jest to warunkiem dostatecznym dla uzyskania nieobciążonych oszacowań dla ATT
29 Liczebność grup kontrolnych Większość obserwacji z PSID (1333 z 2490) oraz CPS (12611 z 15992) nie jest uwzględnianych podczas szacowania wartości efektu oddziaływania, ponieważ wartość propensity score jest niższa niż minimum w grupie eksperymentalej Pomimo tego pierwsza warstwa zawiera większość jednostek z grupy kontrolnej i tylko kilka z grupy eksperymentalnej W przypadku dużej liczby warstw liczebność grupy eksperymentalnej przewyższa liczebność grupy kontrolnej Wspólna część przedziału określoności dla wartości propensity score (overlap) jest niewielka
30 Histogram propensity score dla PSID
31 Histogram propensity score dla CPS
32 Szacowanie wartości oddziaływania Autorzy wykorzystali warstwowanie w celu pogrupownia jednostek z grupy eksperymentalnej Wartość efektu oddziaływania obliczono osobno dla każdej warstwy jako różnicę w średnich zarobkach w 1978 roku dla grupy eksperymentalnej i kontrolnej Następnie utworzono ważoną średnią, w której wagami były liczebności warstw w grupie eksperymentalnej (kolumna 4) Alternatywnym sposobem szacowania efektu oddziaływania była regresja wewnątrz warstw (kolumna 5) Wykorzystano również propensity score matching (kolumna 7, przed łączeniem i 8 po łączeniu)
33 Formy funkcyjne modelu a: regresja RE78 na wskaźnik oddziaływania oraz age, age squared, education, no degree, black, hispanic, RE74, RE75 b: regresja RE78 na wskaźnik oddziaływania oraz propensity score i propensity score2 d: ważona MNK, specyfikacja jak w (a). e: PSID1: logit dla Pr(T=1)=f(age, age2, education, education2, married, nodegree, black, hispanic, RE74, RE75, RE74 2, RE75 2, u74 black) f: PSID2 oraz PSID3: logit dla Pr(T=1)=f(age, age2, education, education2, married, nodegree, black, hispanic, RE74, RE75, RE74 2, RE75 2, u74, u75) g: CPS: logit dla Pr(T=1)=f(age, age2, education, educaion2, married, nodegree, black, hispanic, RE74, RE75, u74, u75, education RE74, age3)
34 Oszacowania wartości efektu Dla próby PSID Oszacowanie metodą warstwowania wynosi 1608$ Oszacowanie metodą propensity score wynosi 1691$ Obie wartości są bliskie wynikowi eksperymentalnemu Uwzględnienie dodatkowych zmiennych wpływa w niewielkim stopniu na wartość oszacowania efektu Dla próby CPS Oszacowanie metodą warstwowania wynosi 1713$ Oszacowanie metodą propensity score wynosi 1582$ Obie wartości są bliskie wynikowi eksperymentalnemu Uwzględnienie dodatkowych zmiennych wpływa w niewielkim stopniu na wartość oszacowania efektu są znacznie bliższe wynikom eksperymentalnym niż w artykule LaLonde (1986)
35 Tabela 3. Oszacowania wartości efektów programu
36 Oszacowania wartości efektu Dla mniej liczebnych podprób oszacowania są bliższe wartościom z eksperymentu Aczkolwiek nadal rozrzut (wariancja) uzyskanych oszacowań jest znaczna Wyjaśnienia dlaczego tak się dzieje dostarcza tabela 4 prezentująca statystyki opisowe dla mniej liczebnych grup odniesienia Próby PSID-1 oraz CPS-1 są zbliżone pod względem rozkładu charakterystyk do grupy eksperymentalnej, mniej liczebne podpróby mają inne rozkłady dla poszczególnych charakterystyk Szczególnie duże rozbieżności w rozkładach są widoczne dla danych PSID
37 Tabela 4. Statystyki opisowe grup odniesienia
38 Charakterystyki grup odniesienia Połączona część (ang. matched subset) prób CPS-1 oraz PSID-1 jest po względem rozkładu cech bardzo podobna do cech jednostek z grupy eksperymentalnej W przypadku mniej liczebnych podzbiorów już tak nie jest. Jest to szczególnie widoczne w podgrupach z badania PSID
39 Ważna cecha PSM Dehejia i Wahba (1999) Ważną cechą metod wykorzystujących propensity score jest fakt, że podpróby zbudowane metodą ad-hoc nie są ani potrzebne ani pożądane. Podpróby zbudowane na podstawie rozkładu jednej charakterystyki mogą być wystarczające do zbilansowania rozkładu pozostałych charakterystyk Wektor propensity score uwzględnia równocześnie wszystkie charakterystyki, większą wagę przykładając do najbardziej odpowiednich jednostek porównawczych pod względem wszystkich cech, nie tylko wybranej jednej
40 Komentarz do wyników Pomimo tego, że oszacowania wykorzystujące propensity score matching są bliższe wynikom eksperymentalnym niż oszacowania wykorzystujące modele regresji, odchylenia standardowe oszacowań są znacznie większe. Dla prób CPS i PSID wynoszą odpowiednio 1152 oraz 1581 podczas, gdy na podstawie modeli regresji 550 i 886 Różnica wynika z faktu, że oszacowania wykorzystujące propensity score matching wykorzystują mniejszą liczbę obserwacji Gdy przy łączeniu wykorzystywane są dodatkowe zmienne, błędy standardowe są zbliżone (Tabela 3, kolumna 8)
41 Wrażliwość wyników na specyfikację propensity score Okazuje się, że wyniki nie są wrażliwe na niewielkie modyfikacje specyfikacji wektora propensity score Usunięcie wyższych potęg oraz interakcji zmiennych objaśniających w niewielkim stopniu wpływ a na wartości uzyskanych oszacowań efektów programu Zmiany w wartości oszacowania efektu są niższe od jednego odchylenia standardowego Jednak warto zauważyć, że wartości oszacowań są dalsze od wyników eksperymentalnych w porównaniu z wynikami z Tabeli 3
42 Tabela 5. Wrażliwość oszacowań ATT na zmiany specyfikacji propensity score
43 Wrażliwość wyników na dobór zmiennych Ważnym założeniem metody PSM jest to, że w modelu powinny być uwzględnione wszystkie zmienne wpływające na przydział oddziaływania i wszystkie zmienne skorelowane ze zmienną wynikową Z tego powodu Dehejia i Wahba ograniczyli próbę LaLonde W celu sprawdzenia poprawności założenia oszacowali modele bez uwzględniania zmiennej zarobki w 1974 roku zależą od uwzględnienia tej zmiennej, ale w każdej próbie w inny sposób
44 Tabela 5. Wrażliwość oszacowań ATT na zmiany specyfikacji propensity score
45 (1) Dehejia i Wahba (1999) Dehejia i Wahba pokazali w jaki sposób można wykorzystać technikę propensity score matching do oszacowania efektów oddziaływania na podstawie danych nie pochodzących z eksperymentu Wartości oszacowań uzyskane na podstawie połączonych zbiorów danych nieeksperymentalnych i eksperymentalnych (zbiory LaLonde) są bliskie wynikom eksperymentalnym i są odporne na wybór grupy odniesienia oraz specyfikację formy funkcyjnej wektora propensity score
46 (2) Dehejia i Wahba (1999) Podstawą skuteczności metody jest ograniczenie analizy do podzbioru danych, który jest podobny pod względem charakterystyk do grupy eksperymentalnej Dodatkowo, analiza pokazała, że w dużym zbiorze jednostek nie poddanych działaniu eksperymentalnemu tylko kilka może być podobnych pod względem istotnych charakterystyk do jednostek z grupy eksperymentalnej Nawet nieliczna grupa odniesienia (grupa kontrolna) jest wystarczająca do oszacowania efektu programu Jednak, metoda wykorzystująca wektory propensity score nie jest uniwersalnym remedium na wszystkie problemy. Jeżeli ważna charakterystyka skorelowana z przydziałem do oddziaływania lub zmienną wynikową jest nieobserwowana to metoda nie daje dobrych rezultatów
Propensity Score Matching
Zajęcia 4 Plan na dziś 1 Potencjalne i obserwowane wyniki Regresja dla danych eksperymentalnych 2 Angrist i Pischke, 2009 Potencjalne i obserwowane wyniki Regresja dla danych eksperymentalnych Mostly Harmless
Propensity Score Matching
Zajęcia 7 Plan na dziś Deheija (2005) 1 Deheija (2005) Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników 2 PSM dla danych NSW Testy bilansowania Powtórzenie wyników
Propensity Score Matching
Zajęcia 6 Plan na dziś 1 Does matching overcome LaLonde s critique of nonexperimental estimators Jeffrey A. Smith, Petra E. Todd (2005) Journal of Econometrics, vol. 125, str. 305-353. Brak zgody w literaturze
Propensity score matching (PSM)
Propensity score matching (PSM) Jerzy Mycielski Uniwersytet Warszawski Maj 2010 Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 1 / 18 Badania ewaluacyjne Ocena wpływu
Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:
Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności
Zastosowanie schematu analizy difference-in-differences w badaniach politycznych. Adam Gendźwiłł Tomasz Żółtak Uniwersytet Warszawski
Zastosowanie schematu analizy difference-in-differences w badaniach politycznych Adam Gendźwiłł Tomasz Żółtak Uniwersytet Warszawski Potential outcomes framework Indywidualny efekt przyczynowy różnica
TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.
TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe
Testy nieparametryczne
Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów
LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej
LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Monte Carlo, bootstrap, jacknife
Monte Carlo, bootstrap, jacknife Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej: http://www.ssc.wisc.edu/~bhansen/econometrics/ Monte Carlo: rozdział 8.8, 8.9 Bootstrap: rozdział
Wykład 4: Statystyki opisowe (część 1)
Wykład 4: Statystyki opisowe (część 1) Wprowadzenie W przypadku danych mających charakter liczbowy do ich charakterystyki można wykorzystać tak zwane STATYSTYKI OPISOWE. Za pomocą statystyk opisowych można
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
WNIOSKOWANIE STATYSTYCZNE
STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.
Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w
weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)
PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.
STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z
Szkice rozwiązań z R:
Szkice rozwiązań z R: Zadanie 1. Założono doświadczenie farmakologiczne. Obserwowano przyrost wagi ciała (przyrost [gram]) przy zadanych dawkach trzech preparatów (dawka.a, dawka.b, dawka.c). Obiektami
Wykład 2: Tworzenie danych
Wykład 2: Tworzenie danych Plan: Statystyka opisowa a wnioskowanie statystyczne Badania obserwacyjne a eksperyment Planowanie eksperymentu, randomizacja Próbkowanie z populacji Rozkłady próbkowe Wstępna/opisowa
Testowanie hipotez statystycznych
Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom
Zastosowanie techniki Propensity Score Matching w badaniach ewaluacyjnych
Zastosowanie techniki Propensity Score Matching w badaniach ewaluacyjnych III Międzyregionalna Konferencja Ewaluacyjna Dariusz Majerek Katedra Matematyki Stosowanej Wydział Podstaw Techniki Politechniki
Modele quasi-eksperymentalne: Model regresji nieciągłej
Warsztaty szkoleniowe z zakresu oceny oddziaływania instrumentów aktywnej polityki rynku pracy Modele quasi-eksperymentalne: Model regresji nieciągłej Maciej Wilamowski, Gdańsk, 22 lutego 2017 r. Metody
Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.
imię, nazwisko, nr indeksu: Ekonometria egzamin 0/0/0. Egzamin trwa 90 minut.. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu. Złamanie
Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski
Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem
Stanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów 5. Testowanie
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Modele quasi-eksperymentalne: Model regresji nieciągłej
Warsztaty szkoleniowe z zakresu ewaluacji wpływu instrumentów Aktywnych Polityk Rynku Pracy Modele quasi-eksperymentalne: Model regresji nieciągłej Maciej Wilamowski, Kraków, 6 czerwca 2017 r. Metody ewaluacji
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25
Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane
Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8
Stanisław Cichocki Natalia Nehrebecka Zajęcia 8 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów
Kolokwium ze statystyki matematycznej
Kolokwium ze statystyki matematycznej 28.05.2011 Zadanie 1 Niech X będzie zmienną losową z rozkładu o gęstości dla, gdzie 0 jest nieznanym parametrem. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę
Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.
tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1
PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
Jednoczynnikowa analiza wariancji
Jednoczynnikowa analiza wariancji Zmienna zależna ilościowa, numeryczna Zmienna niezależna grupująca (dzieli próbę na więcej niż dwie grupy), nominalna zmienną wyrażoną tekstem należy w SPSS przerekodować
Analiza korespondencji
Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy
Zadania ze statystyki cz.8. Zadanie 1.
Zadania ze statystyki cz.8. Zadanie 1. Wykonano pewien eksperyment skuteczności działania pewnej reklamy na zmianę postawy. Wylosowano 10 osobową próbę studentów, których poproszono o ocenę pewnego produktu,
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Wydział Matematyki. Testy zgodności. Wykład 03
Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy
Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.
imię, nazwisko, nr indeksu: Ekonometria egzamin 02/02/2011 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.
Spis treści 3 SPIS TREŚCI
Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Wprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
Testowanie hipotez statystycznych. Wnioskowanie statystyczne
Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy
Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
Natalia Nehrebecka Stanisław Cichocki. Wykład 10
Natalia Nehrebecka Stanisław Cichocki Wykład 10 1 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów
Wykład 9 Wnioskowanie o średnich
Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i
Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka
Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną
Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu, z którego pochodzi próbka. Hipotezy dzielimy na parametryczne i nieparametryczne. Parametrycznymi
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa
Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie
VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15
VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady
Wprowadzenie do analizy dyskryminacyjnej
Wprowadzenie do analizy dyskryminacyjnej Analiza dyskryminacyjna to zespół metod statystycznych używanych w celu znalezienia funkcji dyskryminacyjnej, która możliwie najlepiej charakteryzuje bądź rozdziela
Egzamin z ekonometrii wersja IiE, MSEMAT
Egzamin z ekonometrii wersja IiE, MSEMAT 04-02-2016 Pytania teoretyczne 1. Za pomocą jakiego testu weryfikowana jest normalność składnika losowego? Jakiemu założeniu KMRL odpowiada w tym teście? Jakie
Wprowadzenie W ostatnich latach metody mikroekonometryczne zdobywają coraz większą popularność i uznanie badaczy. Jest to związane przede wszystkim z rozwojem technik gromadzenia i przetwarzania danych.
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez statystycznych
Badania eksperymentalne
Badania eksperymentalne Analiza CONJOINT mgr Agnieszka Zięba Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa Najpopularniejsze sposoby oceny wyników eksperymentu w schematach
Modele quasi-eksperymentalne: Model regresji nieciągłej
Warsztaty szkoleniowe z zakresu oceny oddziaływania instrumentów aktywnej polityki rynku pracy Modele quasi-eksperymentalne: Model regresji nieciągłej Maciej Wilamowski, Gdańsk, 22 lutego 2017 r. Metody
166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
Żródło:
Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Zmienne muszą być zmiennymi ilościowym (liczymy i porównujemy średnie!) Są to testy parametryczne Test
Modele quasi-eksperymentalne: Różnica w różnicy oraz inne metody
Warsztaty szkoleniowe z zakresu oceny oddziaływania instrumentów aktywnej polityki rynku pracy Modele quasi-eksperymentalne: Różnica w różnicy oraz inne metody Celine Ferre, Gdańsk, 22 lutego 2017 r. Metody
WERYFIKACJA HIPOTEZ STATYSTYCZNYCH
WERYFIKACJA HIPOTEZ STATYSTYCZNYCH I. TESTY PARAMETRYCZNE II. III. WERYFIKACJA HIPOTEZ O WARTOŚCIACH ŚREDNICH DWÓCH POPULACJI TESTY ZGODNOŚCI Rozwiązania zadań wykonywanych w Statistice przedstaw w pliku
Testowanie hipotez statystycznych
9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Weryfikacja hipotez statystycznych za pomocą testów statystycznych
Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej
Badania sondażowe. Schematy losowania. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa
Badania sondażowe Schematy losowania Agnieszka Zięba Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa 1 Próba jako miniatura populacji CELOWA subiektywny dobór jednostek
Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich
Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Zmienne muszą być zmiennymi ilościowym (liczymy i porównujemy średnie!) Są to testy parametryczne Nazwa
SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.
SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych
Stanisław Cichocki. Natalia Nehrebecka. Wykład 12
Stanisław Cichocki Natalia Nehrebecka Wykład 12 1 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne 2. Autokorelacja o Testowanie autokorelacji 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne
Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści
Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, 2018 Spis treści Przedmowa 13 O Autorach 15 Przedmowa od Tłumacza 17 1. Wprowadzenie i statystyka opisowa 19 1.1.
Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)
Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi) Czy miejsce zamieszkania różnicuje uprawianie sportu? Mieszkańcy
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu
REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji
Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji
Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA
Opis zakładanych efektów kształcenia na studiach podyplomowych Nazwa studiów: BIOSTATYSTYKA PRAKTYCZNE ASPEKTY STATYSTYKI W BADANIACH MEDYCZNYCH Typ studiów: doskonalące Symbol Efekty kształcenia dla studiów
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM
Projektowanie eksperymentu część 2
Warsztaty szkoleniowe z zakresu ewaluacji wpływu instrumentów Aktywnych Polityk Rynku Pracy Projektowanie eksperymentu część 2 Lucilla Bruni, Kraków, 5 czerwca 2017 r. Idealne badanie eksperymentalne klony
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl
Zmienne zależne i niezależne
Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }
Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 5 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.medexp3.dta przygotuj model regresji kwantylowej 1. Przygotuj model regresji kwantylowej w którym logarytm wydatków
Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.
Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ
Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego
Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Pobieranie prób i rozkład z próby
Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.
Wnioskowanie statystyczne. Statystyka w 5
Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. dr hab. Jerzy Nakielski Katedra Biofizyki i Morfogenezy Roślin Plan wykładu: 1. Etapy wnioskowania statystycznego 2. Hipotezy statystyczne,
12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez
Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie Wyznaczanie przedziału 95%CI oznaczającego, że dla 95% prób losowych następujące nierówności są prawdziwe: X t s 0.025 n < μ < X + t s
Zadania ze statystyki, cz.6
Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z
Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)
Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej) 1 Podział ze względu na zakres danych użytych do wyznaczenia miary Miary opisujące
Warsztat: Randomizacja w programie Excel
Warsztaty szkoleniowe z zakresu ewaluacji wpływu instrumentów Aktywnych Polityk Rynku Pracy Warsztat: Randomizacja w programie Excel Piotr Ćwiakowski Tomasz Gajderowicz, Kraków, 5 czerwca 2017 r. Przydział
Testowanie hipotez statystycznych. Wprowadzenie
Wrocław University of Technology Testowanie hipotez statystycznych. Wprowadzenie Jakub Tomczak Politechnika Wrocławska jakub.tomczak@pwr.edu.pl 10.04.2014 Pojęcia wstępne Populacja (statystyczna) zbiór,
Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1
Zadanie 1 a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 b) W naszym przypadku populacja są inżynierowie w Tajlandii. Czy można jednak przypuszczać, że na zarobki kobiet-inżynierów
Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ
Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,
Analiza regresji - weryfikacja założeń
Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.
Estymacja punktowa i przedziałowa
Temat: Estymacja punktowa i przedziałowa Kody znaków: żółte wyróżnienie nowe pojęcie czerwony uwaga kursywa komentarz 1 Zagadnienia 1. Statystyczny opis próby. Idea estymacji punktowej pojęcie estymatora
Modele quasi-eksperymentalne: Różnica w różnicy oraz inne metody
Warsztaty szkoleniowe z zakresu oceny oddziaływania instrumentów aktywnej polityki rynku pracy Modele quasi-eksperymentalne: Różnica w różnicy oraz inne metody Celine Ferre, Gdańsk, 22 lutego 2017 r. Metody
STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech
TATYTYKA wykład 8 Wnioskowanie Weryfikacja hipotez Wanda Olech Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną
Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii
SPIS TREŚCI Przedmowa... 11 Wykaz symboli... 15 Litery alfabetu greckiego wykorzystywane w podręczniku... 15 Symbole wykorzystywane w zagadnieniach teorii mnogości (rachunku zbiorów)... 16 Symbole stosowane