Propensity Score Matching

Wielkość: px
Rozpocząć pokaz od strony:

Download "Propensity Score Matching"

Transkrypt

1 Zajęcia 7

2 Plan na dziś Deheija (2005) 1 Deheija (2005) Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników 2 PSM dla danych NSW Testy bilansowania

3 Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników Practical : a reply to Smith and Todd Rajeev H. Deheija (2005) Journal of Econometrics, vol. 125, str

4 Cel artykułu Deheija (2005) Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników Metoda PSM wymaga oddzielnej specyfikacji formy funkcyjnej propensity score dla każdej kombinacji grupy eksperymentalnej i kontrolnej wykorzystali specyfikację Dehejia i Wahba do dwóch prób, wobec których nie musi być ona prawidłowa Ocena wrażliwości wyników na zmiany w specyfikacji formy funkcyjnej propensity score Metoda PSM działa dobrze dla zbioru NSW. Dla zbioru Dehejia i Wahba pozwala uzyskać rzetelne i odporne oszacowania Jednak PSM nie jest dobrą metodą do analizy zbioru LaLonde oraz Smith i Todd ponieważ wyniki są wrażliwe na niewielkie zmiany w specyfikacji formy funkcyjnej propensity score

5 Wnioski Dehejia i Wahba Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników The method we suggest are not relevant in all situations. There may be important unobservable covariates... However, rather than giving up, or relying on assumptions about the unobserved variables, there is substantial reward in exploring first the information contained in the variables that are observed. In this regard, propensity score methods can offer both a diagnostic on the quality of the comparison group and a means to estimate the treatment impact Dehejia i Wahba (1999), str. 1062

6 Wnioski Dehejia i Wahba Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników The methods that we discuss in the paper should be viewed as a complement to the standard techniques in the researcher s arsenal. By starting with a propensity score analysis, the researcher will have better sense of the extent to which the treatment and comparison groups overlap and consequently of how sensitive estimates will be to the choince of functional form Dehejia i Wahba (2002), str. 106

7 Wnioski Dehejia i Wahba Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników Autorzy nie twierdzą, że PSM zawsze pozwala uzyskać rzetelne wyniki dla wartości efektów oddziaływania szacowanych na podstawie danych nieeksperymentalnych Pokazują, że PSM pozwala na uzyskanie rzetelnych oszacowań efektów oddziaływania, oraz starają się określić warunki w których te metody mogą być skuteczne

8 Wnioski Dehejia i Wahba Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników Fakt, że propensity score matching nie pozwala na uzyskanie odpornych oszacowań dla zbioru LaLonde daje się wywnioskować z artykułów Dehejia i Wahb (1999, 2002) Zbiór danych Dehejia i Wahba został zaprojektowany tak, aby była dostępna informacja o wysokości zarobków z dwóch lat przed rozpoczęciem programu Dehejia i Wahba pokazali, że dla zbioru danych zawierającego tylko informacje o wysokości zarobków na rok przed programem oszacowania nie są odporne na niewielkie zmiany w specyfikacji propensity score

9 Próby Deheija (2005) Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników LaLonde (1986) - PSID LaLonde (1986) - CPS - PSID - CPS

10 Forma funkcyjna Deheija (2005) Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników Dehejia i Wahba (2005) podkreślają wagę różnej specyfikacji propensity score dla różnych zbiorów (a) stała, age, age squared, years of schooling, years of schooling squared, high school dropout status, black, hispanic, married, (Re74=0), (Re75=0), educationxre74, age cubic (b) stała, age, age squared, years of schooling, years of schooling squared, high school dropout status, black, hispanic, married, Re74, Re74 squared, Re75, Re75 squared, (Re74=0)Xblack

11 Zbilansowanie prób Deheija (2005) Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników

12 Komentarz do tabeli 1 Deheija (2005) Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników Nie ma powodu by przypuszczać, że specyfikacja wektora propensity score dobrana do próby Dehejia i Wahba będzie bilansować rozkłady w innych próbach Wyniki pokazują iż rzeczywiście tak jest Wyniki uzyskane przez Smith i Todd (2002) dla innych prób nie są zaskakujące ponieważ wektor propensity score nie bilansuje rozkładów charakterystyk Profesor Dehejia zauważa, że zazwyczaj osobna specyfikacja propensity score jest konieczna do zbilansowania różnych kombinacji grupy eksperymentalnej i kontrolnej

13 Wnioski Deheija (2005) Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników Tabela 2 prezentuje wykorzystane w artykule formy funkcyjne wektora propensity score Zostały one wybrane na podstawie zbilansowania rozkładów cech sprzed programu

14 Specyfikacje wektora propensity score Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników

15 Wyniki Deheija (2005) Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników Wyniki oszacowań dla ATT uzyskano wykorzytując łączenie najbliższego sąsiada (ang. nearest neighbour matching) Błędy standardowe szacunku uzyskano wykorzystując technikę bootstrap We wszystkich sześciu przypadkach wyniki nieeksperymentalne są bliskie rezultatom eksperymentu

16 Oszacowania efektów programu Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników Zatem, wykorzystując PSM można odworzyć wyniki eksperymentalne Jednak, istotne jest sprawdzenie odporności rezultatów na niewielkie zmiany specyfikacji propensity score

17 Metoda analizy (1/2) Deheija (2005) Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników Zastosowanie specyfikacji wektora propensity score do pozostałych pięciu kombinacji grupy eksperymentalnej i kontrolnej Oczekiwane jest, że taka specyfikacja wektora propensity score nie będzie w stanie skutecznie zbilansować rozkładów dla innych grup Rozszerzenie specyfikacji wektora propensity score o interakcje i kolejne potęgi (do czwartej) zmienych

18 Oszacowania efektów programu Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników

19 Metoda analizy (2/2) Deheija (2005) Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników W przypadku rozszerzenia specyfikacji oszacowano wszystkie możliwe modele Na podstawie wartości kryterium informacyjnego Schwarza wybrano z nich 10 najlepszych, które bilansowały rozkłady charakterystyk w sześciu równomiernie rozmieszczonych warstwach Rezultaty wskazują, że specyfikacja propensity score jest poprawna wyłącznie dla zbioru Dehejia i Wahba

20 Wrażliwość rezultatów, PSID Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników

21 Wrażliwość rezultatów, CPS Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników

22 Podsumowanie Deheija (2005) Powtórzenie wyników Dehejia i Wahba Oszacowania propensity score Analiza wrażliwości wyników Oddzielna i odpowiednia specyfikacja wektora propensity score musi być dobrana dla każdej pary grupy eksperymentalnej i grupy kontrolnej Po oszacowaniu rozmiaru efektu należy przeprowadzić analizę wrażliwości Propensity score matching does not provide a silver-bullet, black box technique that can estimate the treatment effect under all circumstances; neither the developers of the technique nor Dehejia and Wahba have claimed otherwise. However, with input and judgment from the researcher, it can be a useful and powerful tool

23 PSM dla danych NSW Testy bilansowania Rejoinder Jeffrey A. Smith, Petra E. Todd (2005) Journal of Econometrics, vol. 125, str

24 Motywacja Deheija (2005) PSM dla danych NSW Testy bilansowania Artykuły Dehejia i Wahba (1999, 2002) w dużym stopniu przyczyniły się do popularności techniki Propensity Score Matching nawet w przypadku słabych danych. Smith i Todd wierzą, że w tym przypadku PSM jest nieefektywny. Analiza dotyczy wyników artykułów Dehejia i Wahba (1999,2002) ponieważ mają one duży wpływ na literaturę Autorzy pokazują, że PSM nie rozwiązuje problemu oceny programu nawet w próbie Dehejia i Wahba

25 Czy PSM jest rozwiązaniem? PSM dla danych NSW Testy bilansowania Dehejia (2005) twierdzi, że PSM pozwala uzyskać rzetelne i odporne oszacowania efektów programu dla podpróby Dehejia i Wahba Jednak Dehejia (2005) nie uzasadnia wyboru wykorzystanej podpróby, który był kwestionowany przez Brakuje wyjaśnienia dlaczego do próby włączono osoby przystępujące do programu po kwietniu 1976 z zerowymi zarobkami w okresie miesiące przed początkiem programu, a nie włączono osób przystępujących do programu po kwietniu 1976 z niezerowymi zarobkami w okresie miesiące przed początkiem programu

26 Czy PSM jest rozwiązaniem? PSM dla danych NSW Testy bilansowania Smith i Todd zgadzają się, że różne zbiory danych wymagają rożnych specyfikacji wektora propensity score, ale niewielkie modyfikacje zbioru danych nie powinny powodować konieczności dużych zmian w specyfikacji propensity score

27 PSM dla danych NSW Testy bilansowania Analiza wrażliwości Autorzy szacują 18 modeli dla próby PSID i 18 modeli dla grupy CPS Wykorzystują łączenie metodą najbliższego sąsiada ze zwracaniem (ang. nearest neighbour matching with replcement) Wykorzystano specyfikacja wektora propensity score zaproponowaną przez artykuł Dehejia (2005) Dla każdej z grup odniesienia oszacowane wartości obiciążenia estymatora różniły się w zależności od tego czy model dla propensity score był szacowany z wykorzystaniem grupy eksperymentalnej, grupy kontrolnej, czy obu naraz; czy obciążenie szacowano na podstawie jednostek z grupy eksperymentalnej, grupy kontrolnej, czy obu naraz; i wyboru ziarna dla generatora liczb losowych!

28 Tabela 1 Deheija (2005) PSM dla danych NSW Testy bilansowania Dla każdej grupy odniesienia pierwsza kolumna pokazuje obciążenie oszacowania ATT wykorzystującego oryginalną grupę eksperymentalną i nieeksperymentalną grupę odniesienia Dla każdej grupy odniesienia druga kolumna pokazuje obciążenie oszacowania ATT wykorzystującego oryginalną grupę kontrolną i nieeksperymentalną grupę odniesienia W każdym przypadku obciążenie powinno wynosić 0

29 PSM dla danych NSW Testy bilansowania Technika szacowania efektów oddziaływania Smith i Todd wykorzystali łączenie według wartości propensity score Nie narzucali warunku wspólnego przedziału określoności Ćwiczenie powtórzono dla różnych wartości ziarna by sprawdzić w jakim stopniu kolejność łączenia obserwacji wpływa na wyniki. Kolejność może być istotna w przypadku prób o małej liczebności

30 Obciążenie oszacowań Deheija (2005) PSM dla danych NSW Testy bilansowania

31 Wnioski Deheija (2005) PSM dla danych NSW Testy bilansowania Wartości obciążenia różnią się znacznie między grupami Te zróżnicowanie autorzy przypisują efektowi prób o małej liczebności Wykorzystanie grupy eksperymentalnej do oszacowania wartości propensity score i obciążenia prowadzi do uzyskania oszacowań o niewielkim obciążeniu Obciążenie oszacowań uzyskane na podstawie porównania eksperymentalnej i nieeksperymentalnych grup kontrolnych są znaczne W przypadku próby CPS wyniki zależą od ustawienia generatora liczb losowych

32 PSM dla danych NSW Testy bilansowania Dlaczego rezultaty zależą od liczb losowych W przypadku próby CPS występuje duża liczba obserwacji o identycznych wartościach cech a w konsekwencji identycznych wartościach propensity score Ale takie obserwacje znacznie różnią się pod względem wartości zmiennej wynikowej - zarobki w 1978 roku Występowanie grup obserwacji o jednakowej wartości propensity score zwiększa wariancję oszacowań W takim przypadku dobrze jest powtórzyć kilkukrotnie łączenie

33 PSM dla danych NSW Testy bilansowania Wyniki łączenia z wykorzystaniem jądra Aby pokazać, że niestabilność wyników w Tabeli 1 nie jest powodowana wyłącznie przez łączenie metodą najbliższego sąsiada powtórzono obliczenia wykorzystując łączenie oparte na jądrze (ang. kernel matching) Estymator jądrowy w porównaniu z estymatorem metody najbliższego sąsiada ma wyższe obciążenie, ale jest bardziej efektywny, gdyż wykorzystuje więcej informacji Wybrano jądro Epanechnikova i pięć wartości dla pasma (ang. bandwidth. Wyniki oszacowań nie zależą od liczb losowych, ale od wartości pasma

34 PSM dla danych NSW Testy bilansowania Wyniki łączenia z wykorzystaniem jądra

35 PSM dla danych NSW Testy bilansowania Wyniki łączenia z wykorzystaniem jądra Wzrost efektywności oszacowań można łatwo zauważyć porównując odchylenia standardowe ocen parametrów. W tabeli 2 są niższe niż w tabeli 1 Wyniki w tabeli 2 są wrażliwe na to czy szacowane jest obciążenie grupy eksperymentalnej czy kontrolnej oraz na podstawie jakiej próby szacowana propensity score Oszacowania wykorzystujące estymator jądrowy mają wyższe obciążenie niż łączenie metodą najbliższego sąsiada (1 do 1)

36 Test standaryzowanych różnic PSM dla danych NSW Testy bilansowania Test standaryzowanych różnic zaproponowany przez Rosenbauma i Rubina (1985) 1 n SDIFF (Z k ) = i I 1 (Z ki j I 0 w(i, j)z kj ) vari I1 (Z ki )+var j I0 (Z kj ) Standaryzowana różnica dla zmiennej Z k jest różnicą w średnich wartościach zmiennej pomiędzy grupą eksperymentalną i dołączoną (ważoną) grupą kontrolną dzieloną przez pierwiastek kwadratowy przeciętnej wariancji Z k w nieważonej grupie eksperymentalnej i kontrolnej Statystyka nie ma krytycznej wartości. Rosenbaum i Rubin sugerują, że wartość 20 jest duża. Niedogodnością jest fakt, iż można obniżyć standaryzowane obciążenie dodając obserwacje do grupy odniesienia 2

37 Test Hotellinga Deheija (2005) PSM dla danych NSW Testy bilansowania Test Hotellinga T 2 weryfikuje hipotezę że średnie wartości cech w dwóch grupach są indentyczne Test traktuje wagi jako stałe, podczas gdy w rzeczywistości są losowe Moc testu zależy od korelacji między wariancją próby a wariancją wag, która nie jest obserwowana

38 Test wykorzystujący regresję PSM dla danych NSW Testy bilansowania Dla każdej zmiennej należącej do wektora propesity score szacowana jest regresja pomocnicza Z k = β 0 + β 1 P(Z) + β 2 P(Z) 2 + β 3 P(Z) 3 + β 4 P(Z) 4 + β 5 D + β 6 DP(Z) + β 7 DP(Z) 2 + β 8 DP(Z) 3 + β 9 P(Z) 4 + η i weryfikowana jest hipoteza β 5 = β 6 = β 7 = β 8 = β 9 = 0 Sprawdzane jest czy wskaźnik przydzielenia do grupy niesie informacje o wartości propensity score. Jeżeli próby są zbilansowane nie powinien.

39 Zbilansowanie Deheija (2005) PSM dla danych NSW Testy bilansowania Pierwszy wiersz pokazuje 5 największą wartość oraz największą wartość standaryzowanego obciążenia Drugi wiersz pokazuje wartość p dla testu Hotellinga Trzeci wiersz liczbę wartości p mniejszych od 0,01; 0,05 oraz 0,1

40 Zbilansowanie Deheija (2005) PSM dla danych NSW Testy bilansowania

41 Zbilansowanie Deheija (2005) PSM dla danych NSW Testy bilansowania Wyniki testów zbilansowania są słabe Test Hotellinga i test wykorzystujący regresję wskazują na brak zbilansowania w każdym przypadku W niektórych przypadkach różne testy wskazują na różny wynik dotyczący zbilansowania rozkładów charakterystyk Niskie obciążenie w próbie Dehejia i Whba jest efektem tego, że w próbie o małej liczebności wektor propensity score o słabych właściwościach statystycznych może generować niskie obciążenie

42 Podsumowanie Deheija (2005) PSM dla danych NSW Testy bilansowania PSM nie rozwiązuje problemu selekcji w zbiorze danych NSW Małe liczebności prób wykorzystane do szacowania efektów programu powodują dużą wrażliwość wyników na niewielkie zaburzenia Błędy standardowe oszacowań są relatywnie wysokie zarówno w artykule Dehejia i Wahba jak i Smith i Todd Przyczyną wysokich błędów standardowych jest fakt, że w PSID oraz CPS jest niewielka liczba obserwacji podobnych do eksperymentalnych

Propensity Score Matching

Propensity Score Matching Zajęcia 5 Plan na dziś 1 Dehejia i Wahba (1999) Dehejia i Wahba (1999) Causal Effects in Nonexperimental Studies: Reevaluating the Evaluation of Training Programs Rajeev H. Dehejia, Sadek Wahba, Journal

Bardziej szczegółowo

Propensity Score Matching

Propensity Score Matching Zajęcia 6 Plan na dziś 1 Does matching overcome LaLonde s critique of nonexperimental estimators Jeffrey A. Smith, Petra E. Todd (2005) Journal of Econometrics, vol. 125, str. 305-353. Brak zgody w literaturze

Bardziej szczegółowo

Propensity score matching (PSM)

Propensity score matching (PSM) Propensity score matching (PSM) Jerzy Mycielski Uniwersytet Warszawski Maj 2010 Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 1 / 18 Badania ewaluacyjne Ocena wpływu

Bardziej szczegółowo

Propensity Score Matching

Propensity Score Matching Zajęcia 4 Plan na dziś 1 Potencjalne i obserwowane wyniki Regresja dla danych eksperymentalnych 2 Angrist i Pischke, 2009 Potencjalne i obserwowane wyniki Regresja dla danych eksperymentalnych Mostly Harmless

Bardziej szczegółowo

Właściwości testu Jarque-Bera gdy w danych występuje obserwacja nietypowa.

Właściwości testu Jarque-Bera gdy w danych występuje obserwacja nietypowa. Właściwości testu Jarque-Bera gdy w danych występuje obserwacja nietypowa. Paweł Strawiński Uniwersytet Warszawski Wydział Nauk Ekonomicznych 16 stycznia 2006 Streszczenie W artykule analizowane są właściwości

Bardziej szczegółowo

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8 Stanisław Cichocki Natalia Nehrebecka Zajęcia 8 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.

Bardziej szczegółowo

Monte Carlo, bootstrap, jacknife

Monte Carlo, bootstrap, jacknife Monte Carlo, bootstrap, jacknife Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej: http://www.ssc.wisc.edu/~bhansen/econometrics/ Monte Carlo: rozdział 8.8, 8.9 Bootstrap: rozdział

Bardziej szczegółowo

Wprowadzenie W ostatnich latach metody mikroekonometryczne zdobywają coraz większą popularność i uznanie badaczy. Jest to związane przede wszystkim z rozwojem technik gromadzenia i przetwarzania danych.

Bardziej szczegółowo

Propensity Score Matching

Propensity Score Matching Zajęcia 2 Plan dzisiejszych zajęć 1 Doświadczenia Idealne doświadczenie Nie-idealne doświadczenia 2 Idealne doświadczenie Nie-idealne doświadczenia Plan idealnego doświadczenia (eksperymentu) Plan doświadczenia

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych 9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :

Bardziej szczegółowo

Zastosowanie techniki Propensity Score Matching w badaniach ewaluacyjnych

Zastosowanie techniki Propensity Score Matching w badaniach ewaluacyjnych Zastosowanie techniki Propensity Score Matching w badaniach ewaluacyjnych III Międzyregionalna Konferencja Ewaluacyjna Dariusz Majerek Katedra Matematyki Stosowanej Wydział Podstaw Techniki Politechniki

Bardziej szczegółowo

Zmienne zależne i niezależne

Zmienne zależne i niezależne Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }

Bardziej szczegółowo

Pobieranie prób i rozkład z próby

Pobieranie prób i rozkład z próby Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.

Bardziej szczegółowo

Oszacowanie i rozkład t

Oszacowanie i rozkład t Oszacowanie i rozkład t Marcin Zajenkowski Marcin Zajenkowski () Oszacowanie i rozkład t 1 / 31 Oszacowanie 1 Na podstawie danych z próby szacuje się wiele wartości w populacji, np.: jakie jest poparcie

Bardziej szczegółowo

Natalia Neherbecka. 11 czerwca 2010

Natalia Neherbecka. 11 czerwca 2010 Natalia Neherbecka 11 czerwca 2010 1 1. Konsekwencje heteroskedastyczności i autokorelacji 2. Uogólniona MNK 3. Stosowalna Uogólniona MNK 4. Odporne macierze wariancji i kowariancji b 2 1. Konsekwencje

Bardziej szczegółowo

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)

Bardziej szczegółowo

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

Kolokwium ze statystyki matematycznej

Kolokwium ze statystyki matematycznej Kolokwium ze statystyki matematycznej 28.05.2011 Zadanie 1 Niech X będzie zmienną losową z rozkładu o gęstości dla, gdzie 0 jest nieznanym parametrem. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę

Bardziej szczegółowo

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne Wykład 4 Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym 2. Rozkłady próbkowe 3. Centralne twierdzenie graniczne Przybliżenie rozkładu dwumianowego rozkładem normalnym Niech Y ma rozkład

Bardziej szczegółowo

Wykład 9 Wnioskowanie o średnich

Wykład 9 Wnioskowanie o średnich Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i

Bardziej szczegółowo

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności: Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności

Bardziej szczegółowo

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

Metoda Monte Carlo. Jerzy Mycielski. grudzien Jerzy Mycielski () Metoda Monte Carlo grudzien / 10

Metoda Monte Carlo. Jerzy Mycielski. grudzien Jerzy Mycielski () Metoda Monte Carlo grudzien / 10 Metoda Monte Carlo Jerzy Mycielski grudzien 2012 Jerzy Mycielski () Metoda Monte Carlo grudzien 2012 1 / 10 Przybliżanie całek Powiedzmy, że mamy do policzenia następującą całkę: b f (x) dx = I a Założmy,

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

Analiza niepewności pomiarów

Analiza niepewności pomiarów Teoria pomiarów Analiza niepewności pomiarów Zagadnienia statystyki matematycznej Dr hab. inż. Paweł Majda www.pmajda.zut.edu.pl Podstawy statystyki matematycznej Histogram oraz wielobok liczebności zmiennej

Bardziej szczegółowo

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wprowadzenie

Testowanie hipotez statystycznych. Wprowadzenie Wrocław University of Technology Testowanie hipotez statystycznych. Wprowadzenie Jakub Tomczak Politechnika Wrocławska jakub.tomczak@pwr.edu.pl 10.04.2014 Pojęcia wstępne Populacja (statystyczna) zbiór,

Bardziej szczegółowo

Metody Statystyczne. Metody Statystyczne.

Metody Statystyczne. Metody Statystyczne. gkrol@wz.uw.edu.pl #4 1 Sprawdzian! 5 listopada (ok. 45-60 minut): - Skale pomiarowe - Zmienne ciągłe i dyskretne - Rozkład teoretyczny i empiryczny - Miary tendencji centralnej i rozproszenia - Standaryzacja

Bardziej szczegółowo

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1. Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w

Bardziej szczegółowo

Ekonometria egzamin 07/03/2018

Ekonometria egzamin 07/03/2018 imię, nazwisko, nr indeksu: Ekonometria egzamin 07/03/2018 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów

Bardziej szczegółowo

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Wprowadzenie do teorii ekonometrii Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Zajęcia Wykład Laboratorium komputerowe 2 Zaliczenie EGZAMIN (50%) Na egzaminie obowiązują wszystkie informacje

Bardziej szczegółowo

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej Ekonometria Ćwiczenia nr 3 Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Ćwiczenia 3 Własności składnika losowego 1 / 18 Agenda KMNK przypomnienie 1 KMNK przypomnienie 2 3 4 Jakub Mućk

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński Mikroekonometria 5 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.medexp3.dta przygotuj model regresji kwantylowej 1. Przygotuj model regresji kwantylowej w którym logarytm wydatków

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

Sterowanie wielkością zamówienia w Excelu - cz. 3

Sterowanie wielkością zamówienia w Excelu - cz. 3 Sterowanie wielkością zamówienia w Excelu - cz. 3 21.06.2005 r. 4. Planowanie eksperymentów symulacyjnych Podczas tego etapu ważne jest określenie typu rozkładu badanej charakterystyki. Dzięki tej informacji

Bardziej szczegółowo

S t a t y s t y k a, część 3. Michał Żmihorski

S t a t y s t y k a, część 3. Michał Żmihorski S t a t y s t y k a, część 3 Michał Żmihorski Porównanie średnich -test T Założenia: Zmienne ciągłe (masa, temperatura) Dwie grupy (populacje) Rozkład normalny* Równe wariancje (homoscedasticity) w grupach

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

Regresja logistyczna (LOGISTIC)

Regresja logistyczna (LOGISTIC) Zmienna zależna: Wybór opcji zachodniej w polityce zagranicznej (kodowana jako tak, 0 nie) Zmienne niezależne: wiedza o Unii Europejskiej (WIEDZA), zamieszkiwanie w regionie zachodnim (ZACH) lub wschodnim

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów 5. Testowanie

Bardziej szczegółowo

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Magdalena Frąszczak Wrocław, 21.02.2018r Tematyka Wykładów: Próba i populacja. Estymacja parametrów z wykorzystaniem metody

Bardziej szczegółowo

Zróżnicowanie poziomu ubóstwa w Polsce z uwzględnieniem płci

Zróżnicowanie poziomu ubóstwa w Polsce z uwzględnieniem płci Zróżnicowanie poziomu ubóstwa w Polsce z uwzględnieniem płci Łukasz Wawrowski Katedra Statystyki Uniwersytet Ekonomiczny w Poznaniu Zróżnicowanie poziomu ubóstwa w Polsce z uwzględnieniem płci 2 / 23 Plan

Bardziej szczegółowo

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...

Bardziej szczegółowo

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re Wykład 4 Wybór najlepszej procedury. Estymacja parametrów regresji z wykorzystaniem metody bootstrap. Wrocław, 22.03.2017r Wybór najlepszej procedury - podsumowanie Co nas interesuje przed przeprowadzeniem

Bardziej szczegółowo

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Natalia Nehrebecka Stanisław Cichocki. Wykład 10 Natalia Nehrebecka Stanisław Cichocki Wykład 10 1 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka

Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE Joanna Sawicka Plan prezentacji Model Poissona-Gamma ze składnikiem regresyjnym Konstrukcja optymalnego systemu Bonus- Malus Estymacja

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych STATYSTYKA MATEMATYCZNA WYKŁAD 3 Populacje i próby danych POPULACJA I PRÓBA DANYCH POPULACJA population Obserwacje dla wszystkich osobników danego gatunku / rasy PRÓBA DANYCH sample Obserwacje dotyczące

Bardziej szczegółowo

Spis treści 3 SPIS TREŚCI

Spis treści 3 SPIS TREŚCI Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe

Bardziej szczegółowo

Szkice rozwiązań z R:

Szkice rozwiązań z R: Szkice rozwiązań z R: Zadanie 1. Założono doświadczenie farmakologiczne. Obserwowano przyrost wagi ciała (przyrost [gram]) przy zadanych dawkach trzech preparatów (dawka.a, dawka.b, dawka.c). Obiektami

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka Statystyka opisowa. Wykład V. e-mail:e.kozlovski@pollub.pl Spis treści 1 Prosta regresji cechy Y względem cech X 1,..., X k. 2 3 Wyznaczamy zależność cechy Y od cech X 1, X 2,..., X k postaci Y = α 0 +

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12 Stanisław Cichocki Natalia Nehrebecka Wykład 12 1 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne 2. Autokorelacja o Testowanie autokorelacji 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne

Bardziej szczegółowo

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, 诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów

Bardziej szczegółowo

Zmienna bazowa. 100(1 α)% przedział ufności dla µ: 100(α)% test hipotezy dla µ = µ 0; odrzucić, jeżeli Ȳ nie jest w przedziale

Zmienna bazowa. 100(1 α)% przedział ufności dla µ: 100(α)% test hipotezy dla µ = µ 0; odrzucić, jeżeli Ȳ nie jest w przedziale Wprowadzenie Wprowadzenie Wnioskowanie podsumowanie Zdefiniuj populację, która będzie przedmiotem badań Zbierz parametry, które będą przedmiotem wnioskowania Wybierz losową próbę z populacji Przeprowadź

Bardziej szczegółowo

Zastosowanie schematu analizy difference-in-differences w badaniach politycznych. Adam Gendźwiłł Tomasz Żółtak Uniwersytet Warszawski

Zastosowanie schematu analizy difference-in-differences w badaniach politycznych. Adam Gendźwiłł Tomasz Żółtak Uniwersytet Warszawski Zastosowanie schematu analizy difference-in-differences w badaniach politycznych Adam Gendźwiłł Tomasz Żółtak Uniwersytet Warszawski Potential outcomes framework Indywidualny efekt przyczynowy różnica

Bardziej szczegółowo

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. imię, nazwisko, nr indeksu: Ekonometria egzamin 0/0/0. Egzamin trwa 90 minut.. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu. Złamanie

Bardziej szczegółowo

Zadania ze statystyki cz.8. Zadanie 1.

Zadania ze statystyki cz.8. Zadanie 1. Zadania ze statystyki cz.8. Zadanie 1. Wykonano pewien eksperyment skuteczności działania pewnej reklamy na zmianę postawy. Wylosowano 10 osobową próbę studentów, których poproszono o ocenę pewnego produktu,

Bardziej szczegółowo

Próbkowanie. Wykład 4 Próbkowanie i rozkłady próbkowe. Populacja a próba. Błędy w póbkowaniu, cd, Przykład 1 (Ochotnicy)

Próbkowanie. Wykład 4 Próbkowanie i rozkłady próbkowe. Populacja a próba. Błędy w póbkowaniu, cd, Przykład 1 (Ochotnicy) Wykład 4 Próbkowanie i rozkłady próbkowe µ = średnia w populacji, µ=ey, wartość oczekiwana zmiennej Y σ= odchylenie standardowe w populacji, σ =(Var Y) 1/2, pierwiastek kwadratowy wariancji zmiennej Y,

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12 Stanisław Cichocki Natalia Nehrebecka Wykład 1 1 1. Testy diagnostyczne Testowanie stabilności parametrów modelu: test Chowa. Heteroskedastyczność Konsekwencje Testowanie heteroskedastyczności 1. Testy

Bardziej szczegółowo

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński Mikroekonometria 5 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.hedonic.dta przygotuj model oszacowujący wartość kosztów zewnętrznych rolnictwa 1. Przeprowadź regresję objaśniającą

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010

STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010 STATYSTYKA MATEMATYCZNA WYKŁAD 14 18 stycznia 2010 Model statystyczny ROZKŁAD DWUMIANOWY ( ) {0, 1,, n}, {P θ, θ (0, 1)}, n ustalone P θ {K = k} = ( ) n θ k (1 θ) n k, k k = 0, 1,, n Geneza: Rozkład Bernoulliego

Bardziej szczegółowo

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem

Bardziej szczegółowo

ANALIZA ZDOLNOŚCI PROCESU O ZALEŻNYCH CHARAKTERYSTYKACH

ANALIZA ZDOLNOŚCI PROCESU O ZALEŻNYCH CHARAKTERYSTYKACH Małgorzata Szerszunowicz Uniwersytet Ekonomiczny w Katowicach ANALIZA ZDOLNOŚCI PROCESU O ZALEŻNYCH CHARAKTERYSTYKACH Wprowadzenie Statystyczna kontrola jakości ma na celu doskonalenie procesu produkcyjnego

Bardziej szczegółowo

SMOP - wykład. Rozkład normalny zasady przenoszenia błędów. Ewa Pawelec

SMOP - wykład. Rozkład normalny zasady przenoszenia błędów. Ewa Pawelec SMOP - wykład Rozkład normalny zasady przenoszenia błędów Ewa Pawelec 1 iepewność dla rozkładu norm. Zamiast dodawania całych zakresów uwzględniamy prawdopodobieństwo trafienia dwóch wartości: P x 1, x

Bardziej szczegółowo

Rozdział 8. Regresja. Definiowanie modelu

Rozdział 8. Regresja. Definiowanie modelu Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność

Bardziej szczegółowo

Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński Mikroekonometria 6 Mikołaj Czajkowski Wiktor Budziński Metody symulacyjne Monte Carlo Metoda Monte-Carlo Wykorzystanie mocy obliczeniowej komputerów, aby poznać charakterystyki zmiennych losowych poprzez

Bardziej szczegółowo

WYKŁAD 2: PSYCHOLOGIA POZNAWCZA JAKO NAUKA EKSPERYMENTALNA

WYKŁAD 2: PSYCHOLOGIA POZNAWCZA JAKO NAUKA EKSPERYMENTALNA WYKŁAD 2: PSYCHOLOGIA POZNAWCZA JAKO NAUKA EKSPERYMENTALNA Psychologia poznawcza dr Mateusz Hohol METODA NAUKOWA (1) problem badawczy (2) hipoteza (4) analiza danych (3) eksperyment (5) wniosek: potwierzenie

Bardziej szczegółowo

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota Ekonometria ćwiczenia 3 Prowadzący: Sebastian Czarnota Strona - niezbędnik http://sebastianczarnota.com/sgh/ Normalność rozkładu składnika losowego Brak normalności rozkładu nie odbija się na jakości otrzymywanych

Bardziej szczegółowo

Inteligentna analiza danych

Inteligentna analiza danych Numer indeksu 150946 Michał Moroz Imię i nazwisko Numer indeksu 150875 Grzegorz Graczyk Imię i nazwisko kierunek: Informatyka rok akademicki: 2010/2011 Inteligentna analiza danych Ćwiczenie I Wskaźniki

Bardziej szczegółowo

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym Wrocław, 08.03.2017r Model 1 Testowanie hipotez dla średniej w rozkładzie normalnym ze znaną

Bardziej szczegółowo

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;

Bardziej szczegółowo

Elementy statystyki STA - Wykład 5

Elementy statystyki STA - Wykład 5 STA - Wykład 5 Wydział Matematyki i Informatyki Uniwersytet im. Adama Mickiewicza 1 ANOVA 2 Model jednoczynnikowej analizy wariancji Na model jednoczynnikowej analizy wariancji możemy traktować jako uogólnienie

Bardziej szczegółowo

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane

Bardziej szczegółowo

Redukcja wariancji w metodach Monte-Carlo

Redukcja wariancji w metodach Monte-Carlo 14.02.2006 Seminarium szkoleniowe 14 lutego 2006 Plan prezentacji Wprowadzenie Metoda losowania warstwowego Metoda próbkowania ważonego Metoda zmiennych kontrolnych Metoda zmiennych antytetycznych Metoda

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona

KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y 2. Współczynnik korelacji Pearsona 3. Siła i kierunek związku między zmiennymi 4. Korelacja ma sens, tylko wtedy, gdy związek między zmiennymi

Bardziej szczegółowo

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną Wydział: Zarządzanie i Finanse Nazwa kierunku kształcenia: Finanse i Rachunkowość Rodzaj przedmiotu: podstawowy Opiekun: prof. nadzw. dr hab. Tomasz Kuszewski Poziom studiów (I lub II stopnia): II stopnia

Bardziej szczegółowo

Wykład 4: Statystyki opisowe (część 1)

Wykład 4: Statystyki opisowe (część 1) Wykład 4: Statystyki opisowe (część 1) Wprowadzenie W przypadku danych mających charakter liczbowy do ich charakterystyki można wykorzystać tak zwane STATYSTYKI OPISOWE. Za pomocą statystyk opisowych można

Bardziej szczegółowo

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe

Bardziej szczegółowo

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( ) Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Stanisław Cichocki Natalia Nehrebecka. Wykład 7 Stanisław Cichocki Natalia Nehrebecka Wykład 7 1 1. Metoda Największej Wiarygodności MNW 2. Założenia MNW 3. Własności estymatorów MNW 4. Testowanie hipotez w MNW 2 1. Metoda Największej Wiarygodności

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 3. Zmienne losowe 4. Populacje i próby danych 5. Testowanie hipotez i estymacja parametrów 6. Test t 7. Test

Bardziej szczegółowo

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny

Bardziej szczegółowo

Wprowadzenie do programu RapidMiner, część 4 Michał Bereta

Wprowadzenie do programu RapidMiner, część 4 Michał Bereta Wprowadzenie do programu RapidMiner, część 4 Michał Bereta www.michalbereta.pl 1. Wybór atrybutów (ang. attribute selection, feature selection). Jedną z podstawowych metod analizy współoddziaływania /

Bardziej szczegółowo

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Stosowana Analiza Regresji

Stosowana Analiza Regresji prostej Stosowana Wykład I 5 Października 2011 1 / 29 prostej Przykład Dane trees - wyniki pomiarów objętości (Volume), średnicy (Girth) i wysokości (Height) pni drzew. Interesuje nas zależność (o ile

Bardziej szczegółowo

Jednoczynnikowa analiza wariancji

Jednoczynnikowa analiza wariancji Jednoczynnikowa analiza wariancji Zmienna zależna ilościowa, numeryczna Zmienna niezależna grupująca (dzieli próbę na więcej niż dwie grupy), nominalna zmienną wyrażoną tekstem należy w SPSS przerekodować

Bardziej szczegółowo

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną

Bardziej szczegółowo

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie. SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:

Bardziej szczegółowo

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. imię, nazwisko, nr indeksu: Ekonometria egzamin 02/02/2011 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.

Bardziej szczegółowo