O zgodności procedur jednoczesnego testowania zastosowanych do problemu selekcji zmiennych w modelu liniowym
|
|
- Alicja Dziedzic
- 4 lat temu
- Przeglądów:
Transkrypt
1 O zgodności procedur jednoczesnego testowania zastosowanych do problemu selekcji zmiennych w modelu liniowym Konrad Furmańczyk Katedra Zastosowań Matematyki SGGW Wis a 2010
2 Plan referatu 1. Modele liniowe 2. Wybór zmiennych jako problem multitestowania 3. Warunki zgodności selekcji zmiennych
3 Niech Y = X + ", (1) gdzie j 6= 0 dla j 2 I 0 oraz j = 0 dla j 2 I 1, I 1 := f1; :::; pgni 0 ( ji 0 j = p 0 ), Y = (Y 1 ; :::; Y n ) T, X - macierz nielosowych elementów x ij, 1 i n; 1 j p, = 1 ; :::; p - wektor parametrów modelu. Rozpatrujemy nast ¾epuj ¾ace modele: M1 " = (" 1 ; :::; " n ) T i.i.d. z rozk adu N(0; ), gdzie jest znane; M2 " = (" 1 ; :::; " n ) T i.i.d. z rozk adu N(0; ), gdzie jest nieznane; M3 " = (" 1 ; :::; " n ) T jest wektorem o zale znych wspó rz ¾ednych.
4 Zak adamy, ze liczba zmiennych objaśniaj ¾acych p mo ze rosn ¾ać wraz z n, ale liczba istotnych zmiennych w modelu p 0 jest niezale zna od n. Niech ^i = MNK( i ) dla modelu (1). B ¾edziemy przyjmowali, ze modelu M1 se ^i p = mii oraz se ^i = S p mii w modelach M2-M3, gdzie m ii jest elementem diagonalnym macierzy X T X 1 oraz S jest zgodnym estymatorem. Rozwa zamy problem testowania (selekcji zmiennych) h 0 ) H i : i = 0 lub H 0 i : i 6= 0 dla i = 1; :::; p na podstawie statystyki testowej t ni = ^i =se ^i.
5 B ¾edziemy zak adali tak jak ([2]), ze p-wartości dla pojedynczych hipotez s ¾a postaci p i (t ni ) = 2 (1 (jt ni j)), gdzie jest dystrybuant ¾a ze standardowego rozk adu normalnego.
6 Procedura stepdown Niech p 1 ; :::; p p -p-wartości dla pojedynczych testów, niech p (1) ::: p (p) -uporz ¾adkowane p-wartości, H (1) ; :::; H (p) odpowiednie hipotezy zerowe. Niech 1 ::: p. Jeśli p (1) > 1, to nie odrzucamy zadnej hipotezy. W przeciwnym przypadku gdy h 1 ) p (1) 1 ; :::; p (r) r, odrzucamy H (1) ; :::; H (r), gdzie r jest najwi ¾eksze spe niaj ¾ace h 1 ).
7 Zgodność procedury wyboru zmiennych P(^I n = I 0 )! 1 przy n! 1, gdzie ^I n to zbiór odrzuconych hipotez H i, zaś I 0 to zbiór fa szywych hipotez H i (odpowiadaj ¾ace istotnym parametrom j 6= 0). atwo zauwa zyć, ze procedura wyboru zmiennych jest zgodna gdy P (R = p 0 ; V = 0)! 1 przy n! 1, gdzie R- liczba odrzuconych hipotez w problemie testowania h 0 ), V - liczba fa szywie odzrzuconych hipotez.
8 Oczywiście procedura selekcji jest zgodna gdy P (V 1)! 0 P (R 6= p 0 )! 0 przy n! 1. Zapisuj ¾ac to w terminach hipotezy stepdown otrzymujemy nast ¾epuj ¾ace warunki zgodności: i 1 ) P X j2i 1 I n pj j o 1 1 A! 0 i 2 ) p 0 X j=1 P n p (j) > j o +P n p(p0 +1) p 0 +1o! 0 przy n! 1.
9 Rozwa zmy nast ¾epuj ¾ace warunki: a 1 ) p max j! 0 j2f1;:::;pg a 2 ) p max j2i 0 (1 F j ( j ))! 0 przy n! 1, gdzie F j - dystrybuanta dla p-wartości odpowiadaj ¾aca fa szywym hipotezom zerowym. Stwierdzenie ([5]) Warunki a 1 )-a 2 ) implikuj ¾a zgodność procedury selekcji modelu liniowego.
10 B ¾edziemy sprawdzali warunek a 2 ). Rozwa zmy warunki: a 3 ) p max j2i 0 log 2 j! = o(n 2 ), a 4 ) przy n! 1. m 1 log n
11 Zgodność w modelu M1 Oczywiście 1 F j ( j ) = 1 (1 = o(1). 1 (1! j 2 ) j p m jj j 2 ) j p m jj Na mocy warunków a 3 )-a 4 ), wi ¾ec otrzymujemy warunek a 2 ).!
12 Zgodność w modelach M2 i M3 Rozwa zmy warunek a 5 ) kg ni k 1 = O (c n ) dla pewnego c n! 0, gdzie G ni jest dystrybuant ¾a zmiennej losowej ~t ni = ^ i i p m ii.
13 Wtedy 1 F j j Gnj Cj;n j Gnj Cj;n j, gdzie j = j p m jj, C j;n = 2 1 (1 Korzystaj ¾ac z warunków a 3 ) a 5 ) j 2 ). 1 F j j = O c n + C j;n j C j;n j + o(1). Rozumuj ¾ac jak w modelu M1 C j;n j st ¾ad dostajemy warunek a 2 ). C j;n j = o(1),
14 Uwagi do warunku a 5 ) W przypadku modelu M2 mo zna pokazać, ze c n = q max h kk 1kn ( [2]) przy za o zeniu E j" 1 j 3 < 1 oraz q max h kk! 0 1kn gdy n! 1, gdzie h kk jest elementem diagonalnym macierzy X X T X 1 X T.
15 Uwagi do warunku a 5 ) w modelu M3 Niech oraz r := q max h kk, 1kn a 6 ) r = O n 1=2.
16 Rozpatrzmy nast ¾epuj ¾acy model zale zności b ¾edów losowych: (LP) (" i ) jest procesem liniowym gdzie " i = X r2z b r i r, X r2z jb r j < 1 (2) oraz ci ¾ag innowacji ( i ) jest ściśle stacjonarnym ci ¾agiem ró znic martynga owych wzgl ¾edem ltracji (F i ) i2z z L 3 spe niaj ¾acym warunek 1X n=1 1 n 1=2 gdzie 2 := E 2 0. E 2 n j F 0 2 3=2 < 1,
17 Niech a 1;n ; :::; a n;n b ¾edzie i-tym wierszem macierzy X T X 1 X T Rozwa zmy nast ¾epuj ¾acy warunek: (d) ci ¾ag a k;n jest niemalej ¾acy oraz P 1i=1 b i a i;n 6= 0. Lemat ([5]) Jeśli (" i ) spe nia warunek (LP) oraz spe nione s ¾a warunki a 6 ), (d), to zachodzi warunek a 5 ) dla c n = n 1=4q log n.
18 Komentarz do warunków a 1 ), a 3 ) Uwaga Gdy p = O (n ) dla pewnego 0 < < 1, wtedy spe nione s ¾a warunki a 1 ), a 3 ) dla a) procedury Holma j = q n p + 1 j, b) uogólnionej procedury Holma ( [6]) j = ([j] + 1) q n p + [j] + 1 dla pewnego 0 < < 1, j
19 c) dla procedury Benjamini-Yekuteliego( [1]) j = jq n p P p i=1 1=i, gdzie q n n dla pewnego >, oraz dla procedury Bonferonniego j = q n p, gdzie q n n dla pewnego > 0.
20 References [1] Benjamini, Y. and Yekutieli, D. (2001). The control of the false discovery rate in multiple testing under dependency. Ann. Statist. 29, [2] Bunea, F., Wegkamp, M.H. and Auguste, A. (2006). Consistent variable selection in high dimensional regression via multiple testing. Journal of Statistical Planning and Inference 136, 12, [3] Caraux, G. and Gascuel, O. (1992). Bounds on distribution functions of order statistics for dependent variates. Statist. Probab. Lett. 14, [4] Dedecker, J. and Merlevede, F. (2010). Rates of convergence in the central limit theorem for linear statistics of martingale di erences. orence/linearraterevisedversion.pdf
21 [5] Furmańczyk, K, (2010). The stepdown procedures with application to consistent variable selection in linear regression. Preprint [6] Lehmann, E.L. and Romano, J.P. (2005). Generalizations of the familywise error rate. Ann. Statist. 28, 1-25.
Asymptotyczna kontrola FDR dla zaleznych testowań wielu hipotez statystycznych. Konrad Furmańczyk Wydzia Zastosowań Informatyki i Matematyki SGGW
Asymptotyczna kontrola FDR dla zaleznych testowań wielu hipotez statystycznych Konrad Furmańczyk Wydzia Zastosowań Informatyki i Matematyki SGGW 1 PLAN REFERATU Sformuowanie zagadnienia testowania wielu
Bardziej szczegółowo1 Rozk ad normalny. Szczególnym przypadkiem jest standardowy rozk ad normalny N (0; 1), wartości
Studia podyplomowe w zakresie technik internetowych i komputerowej analizy danych Podstawy statystyki matematycznej Adam Kiersztyn 2 godziny lekcyjne 2011-10-23 8.20-9.50 1 Rozk ad normalny Jednym z najwa
Bardziej szczegółowoPochodne cz ¾astkowe i ich zastosowanie.
Pochodne cz ¾astkowe i ich zastosowanie. Adam Kiersztyn Lublin 2013 Adam Kiersztyn () Pochodne cz ¾astkowe i ich zastosowanie. maj 2013 1 / 18 Zanim przejdziemy do omawiania pochodnych funkcji wielu zmiennych
Bardziej szczegółowo1 Praktyczne metody wyznaczania podstawowych miar bez zastosowania komputerów
Kurs w zakresie zaawansowanych metod komputerowej analizy danych Podstawy statystycznej analizy danych 8.03.014 - godziny ćwiczeń autor: Adam Kiersztyn 1 Praktyczne metody wyznaczania podstawowych miar
Bardziej szczegółowoWprowadzenie do równań ró znicowych i ró zniczkowych.
Wprowadzenie do równań ró znicowych i ró zniczkowych. Adam Kiersztyn Lublin 2013 Adam Kiersztyn () Wprowadzenie do równań ró znicowych i ró zniczkowych. maj 2013 1 / 11 Przyjmijmy nast ¾epuj ¾ace oznaczenia:
Bardziej szczegółowoWyznaczniki, macierz odwrotna, równania macierzowe
Wyznaczniki, macierz odwrotna, równania macierzowe Adam Kiersztyn Katolicki Uniwersytet Lubelski Jana Paw a II Lublin 013 Adam Kiersztyn (KUL) Wyznaczniki, macierz odwrotna, równania macierzowe marzec
Bardziej szczegółowoWyk ad II. Stacjonarne szeregi czasowe.
Wyk ad II. Stacjonarne szeregi czasowe. W wi ekszości przypadków poszukiwanie modelu, który dok adnie by opisywa zachowanie sk adnika losowego " t, polega na analizie pewnej klasy losowych ciagów czasowych
Bardziej szczegółowoEkstrema funkcji wielu zmiennych.
Ekstrema funkcji wielu zmiennych. Adam Kiersztyn Lublin 2013 Adam Kiersztyn () Ekstrema funkcji wielu zmiennych. kwiecień 2013 1 / 13 Niech dana b ¾edzie funkcja f (x, y) określona w pewnym otoczeniu punktu
Bardziej szczegółowoFunkcje dwóch zmiennych
Funkcje dwóch zmiennych Je zeli ka zdemu punktowi P o wspó rzednych x; y) z pewnego obszaru D na p aszczyźnie R 2 przyporzadkujemy w sposób jednoznaczny liczb e rzeczywista z, to przyporzadkowanie to nazywamy
Bardziej szczegółowoNormy wektorów i macierzy
Rozdzia l 3 Normy wektorów i macierzy W tym rozdziale zak ladamy, że K C. 3.1 Ogólna definicja normy Niech ψ : K m,n [0, + ) b edzie przekszta lceniem spe lniaj acym warunki: (i) A K m,n ψ(a) = 0 A = 0,
Bardziej szczegółowoRozdzia l 11. Przestrzenie Euklidesowe Definicja, iloczyn skalarny i norma. iloczynem skalarnym.
Rozdzia l 11 Przestrzenie Euklidesowe 11.1 Definicja, iloczyn skalarny i norma Definicja 11.1 Przestrzenia Euklidesowa nazywamy par e { X K,ϕ }, gdzie X K jest przestrzenia liniowa nad K, a ϕ forma dwuliniowa
Bardziej szczegółowoProblemy jednoczesnego testowania wielu hipotez statystycznych i ich zastosowania w analizie mikromacierzy DNA
Problemy jednoczesnego testowana welu hpotez statystycznych ch zastosowana w analze mkromacerzy DNA Konrad Furmańczyk Katedra Zastosowań Matematyk SGGW Plan referatu Testowane w analze mkromacerzy DNA
Bardziej szczegółowo1 Analiza wariancji H 1 : 1 6= 2 _ 1 6= 3 _ 1 6= 4 _ 2 6= 3 _ 2 6= 4 _ 3 6= 4
Studia podyplomowe w zakresie technik internetowych i komputerowej analizy danych Statystyczna analiza danych Adam Kiersztyn 5 godzin lekcyjnych 2012-02-04 13.00-17.00 1 Analiza wariancji Na wst¾epie zapoznamy
Bardziej szczegółowoWNIOSKOWANIE W MODELU REGRESJI LINIOWEJ
WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ Dana jest populacja generalna, w której dwuwymiarowa cecha (zmienna losowa) (X, Y ) ma pewien dwuwymiarowy rozk lad. Miara korelacji liniowej dla zmiennych (X, Y
Bardziej szczegółowoPowtórzenie wiadomości z rachunku prawdopodobieństwa i statystyki.
Powtórzenie wiadomości z rachunku prawdopodobieństwa i statystyki. Zaj ecia 5 Natalia Nehrebeceka 04 maja, 2010 Plan zaj eć 1 Rachunek prawdopodobieństwa Wektor losowy Wartość oczekiwana Wariancja Odchylenie
Bardziej szczegółowoTestowanie hipotez statystycznych
Testowanie hipotez statystycznych Wyk lad 8 Natalia Nehrebecka Stanis law Cichocki 29 listopada 2015 Plan zajeć 1 Rozk lad estymatora b Rozk lad sumy kwadratów reszt 2 Hipotezy proste - test t Badanie
Bardziej szczegółowoOcena ryzyka kredytowego
Marcin Studniarski http://math.uni.lodz.pl/marstud/ marstud@math.uni.lodz.pl Ocena ryzyka kredytowego (semestr letni 2013/14) 1 Informacje wst epne Celem tego rozdzia u jest powtórzenie pewnych wiadomości
Bardziej szczegółowo1 Regresja liniowa cz. I
Regresja liniowa cz. I. Model statystyczny Model statystyczny to zbiór za o zeń. Wprowadzamy model, który mo zliwie najlepiej opisuje ineresujacy ¾ nas fragment rzeczywistość. B ¾edy modelu wynikaja¾ z
Bardziej szczegółowoZadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.
tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1
Bardziej szczegółowo1 Testy statystyczne. 2 Rodzaje testów
1 Testy statystyczne Podczas sprawdzania hipotez statystycznych moga¾ wystapić ¾ dwa rodzaje b ¾edów. Prawdopodobieństwo b ¾edu polegajacego ¾ na odrzuceniu hipotezy zerowej (H 0 ), gdy jest ona prawdziwa,
Bardziej szczegółowoTestowanie hipotez statystycznych
round Testowanie hipotez statystycznych Wyk lad 9 Natalia Nehrebecka Stanis law Cichocki 13 grudnia 2014 Plan zajeć 1 Rozk lad estymatora b Rozk lad sumy kwadratów reszt 2 Hipotezy proste - test t Badanie
Bardziej szczegółowoTestowanie hipotez statystycznych
Testowanie hipotez statystycznych Wyk lad 9 Natalia Nehrebecka Stanis law Cichocki 28 listopada 2018 Plan zaj eć 1 Rozk lad estymatora b 2 3 dla parametrów 4 Hipotezy l aczne - test F 5 Dodatkowe za lożenie
Bardziej szczegółowoWeryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Bardziej szczegółowoStatystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
Bardziej szczegółowoWłasności estymatorów regresji porządkowej z karą LASSO
Własności estymatorów regresji porządkowej z karą LASSO Uniwersytet Mikołaja Kopernika w Toruniu Uniwersytet Warszawski Badania sfinansowane ze środków Narodowego Centrum Nauki przyznanych w ramach finansowania
Bardziej szczegółowoModel regresji wielokrotnej Wykład 14 ( ) Przykład ceny domów w Chicago
Model regresji wielokrotnej Wykład 14 (4.06.2007) Przykład ceny domów w Chicago Poniżej są przedstawione dane dotyczące cen domów w Chicago (źródło: Sen, A., Srivastava, M., Regression Analysis, Springer,
Bardziej szczegółowoEstymatory regresji rangowej oparte na metodzie LASSO
Estymatory regresji rangowej oparte na metodzie LASSO Wojciech Rejchel UMK Toruń Wisła 2013 Z = (X, Y ), Z = (X, Y ) - niezależne wektory losowe o tym samym rozkładzie P X, X X R m, Y, Y R Z = (X, Y ),
Bardziej szczegółowoRównania ró znicowe wg A. Ostoja - Ostaszewski "Matematyka w ekonomii. Modele i metody".
Równania ró znicowe wg A. Ostoja - Ostaszewski "Matematyka w ekonomii. Modele i metody". Przyk ad. Za ó zmy, ze w chwili t = 0 populacja liczy P 0 osób. Roczny wskaźnik urodzeń wynosi b = 00, a roczna
Bardziej szczegółowoPodstawowe działania w rachunku macierzowym
Podstawowe działania w rachunku macierzowym Marcin Detka Katedra Informatyki Stosowanej Kielce, Wrzesień 2004 1 MACIERZE 1 1 Macierze Macierz prostokątną A o wymiarach m n (m wierszy w n kolumnach) definiujemy:
Bardziej szczegółowoPRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR. Wojciech Zieliński
PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR Wojciech Zieliński Katedra Ekonometrii i Statystyki SGGW Nowoursynowska 159, PL-02-767 Warszawa wojtek.zielinski@statystyka.info
Bardziej szczegółowoWykład 12 Testowanie hipotez dla współczynnika korelacji
Wykład 12 Testowanie hipotez dla współczynnika korelacji Wrocław, 24 maja 2017 Współczynnik korelacji Niech będą dane dwie próby danych X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y n ). Współczynnikiem
Bardziej szczegółowo(wymiar macierzy trójk¹tnej jest równy liczbie elementów na g³ównej przek¹tnej). Z twierdzen 1 > 0. Zatem dla zale noœci
56 Za³ó my, e twierdzenie jest prawdziwe dla macierzy dodatnio okreœlonej stopnia n 1. Macierz A dodatnio okreœlon¹ stopnia n mo na zapisaæ w postaci n 1 gdzie A n 1 oznacza macierz dodatnio okreœlon¹
Bardziej szczegółowoPorównanie modeli regresji. klasycznymi modelami regresji liniowej i logistycznej
Porównanie modeli logicznej regresji z klasycznymi modelami regresji liniowej i logistycznej Instytut Matematyczny, Uniwersytet Wrocławski Małgorzata Bogdan Instytut Matematyki i Informatyki, Politechnika
Bardziej szczegółowoWłasności statystyczne regresji liniowej. Wykład 4
Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności
Bardziej szczegółowoWykład 4 Wybór najlepszej procedury. Estymacja parametrów re
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów regresji z wykorzystaniem metody bootstrap. Wrocław, 22.03.2017r Wybór najlepszej procedury - podsumowanie Co nas interesuje przed przeprowadzeniem
Bardziej szczegółowoPodsadny þ jest winien. róúzne. W prawodawstwie wielu krajów przyjmuje sie, þ úze pierwszy bład þ jest bardziej dotkliwy - sady þ skazujaþ
1 Wykład 6 Przykład 1.1 Podczas rozprawy sadowej, wykorzystujac zebrane dowody i zeznania świadków, sedzia musi odpowiedzieć napytanie:czy prawda jest,úze podsadny jest winien? Zadanie to moúzna przedstawić
Bardziej szczegółowoProste Procesy Stochastyczne i ich zastosowania.
Proste Procesy Stochastyczne i ich zastosowania. Pawe J. Szab owski March 27 Pawe J. Szab owski () Wyk ad 1 March 27 1 / 17 Plan wyk adu: 1-3. Wst ¾ep i preliminaria- przyk ady szeregów czasowych.. Zagadnienie
Bardziej szczegółowo1 Wieloczynnikowa analiza wariancji
Studia podyplomowe w zakresie technik internetowych i komputerowej analizy danych Statystyczna analiza danych Adam Kiersztyn 5 godzin lekcyjnych 2012-02-04 13.00-17.00 1 Wieloczynnikowa analiza wariancji
Bardziej szczegółowoStatystyka w analizie i planowaniu eksperymentu
29 marca 2011 Przestrzeń statystyczna - podstawowe zadania statystyki Zdarzeniom losowym określonym na pewnej przestrzeni zdarzeń elementarnych Ω można zazwyczaj na wiele różnych sposobów przypisać jakieś
Bardziej szczegółowoOdporność statystyk według Ryszarda Zielińskiego a porządki stochastyczne
Odporność statystyk według Ryszarda Zielińskiego a porządki stochastyczne Jarosław Bartoszewicz Uniwersytet Wrocławski Zieliński (1977) wprowadził następującą definicję odporności statystycznej. M 0 =
Bardziej szczegółowoWykład 12 Testowanie hipotez dla współczynnika korelacji
Wykład 12 Testowanie hipotez dla współczynnika korelacji Wrocław, 23 maja 2018 Współczynnik korelacji Niech będą dane dwie próby danych X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y n ). Współczynnikiem
Bardziej szczegółowoStatystyka w analizie i planowaniu eksperymentu
31 marca 2014 Przestrzeń statystyczna - podstawowe zadania statystyki Zdarzeniom losowym określonym na pewnej przestrzeni zdarzeń elementarnych Ω można zazwyczaj na wiele różnych sposobów przypisać jakieś
Bardziej szczegółowoEkonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Ćwiczenia nr 3 Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Ćwiczenia 3 Własności składnika losowego 1 / 18 Agenda KMNK przypomnienie 1 KMNK przypomnienie 2 3 4 Jakub Mućk
Bardziej szczegółowoStanisław Cichocki Natalia Nehrebecka. Zajęcia 8
Stanisław Cichocki Natalia Nehrebecka Zajęcia 8 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów
Bardziej szczegółowoMonte Carlo, bootstrap, jacknife
Monte Carlo, bootstrap, jacknife Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej: http://www.ssc.wisc.edu/~bhansen/econometrics/ Monte Carlo: rozdział 8.8, 8.9 Bootstrap: rozdział
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka. Wykład 9
Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności
Bardziej szczegółowoPierwiastki aproksymatywne. niecharakterystyczne. S. Brzostowski
1 Pierwiastki aproksymatywne niecharakterystyczne S. Brzostowski Denicja pierwiastka aproksymatywnego. 2 2 Denicja pierwiastka aproksymatywnego. Denicja 1. R - pierscien przemienny z 1, f 2 R[Y ] - wielomian
Bardziej szczegółowoWyk lad 14 Formy kwadratowe I
Wyk lad 14 Formy kwadratowe I Wielomian n-zmiennych x 1,, x n postaci n a ij x i x j, (1) gdzie a ij R oraz a ij = a ji dla wszystkich i, j = 1,, n nazywamy forma kwadratowa n-zmiennych Forme (1) można
Bardziej szczegółowoBłędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa
Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów
STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów
Bardziej szczegółowoDane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.
STATISTICA INSTRUKCJA - 1 I. Wprowadzanie danych Podstawowe / Nowy / Arkusz Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą
Bardziej szczegółowo1 Macierze i wyznaczniki
1 Macierze i wyznaczniki 11 Definicje, twierdzenia, wzory 1 Macierzą rzeczywistą (zespoloną) wymiaru m n, gdzie m N oraz n N, nazywamy prostokątną tablicę złożoną z mn liczb rzeczywistych (zespolonych)
Bardziej szczegółowoWyk lad 7 Metoda eliminacji Gaussa. Wzory Cramera
Wyk lad 7 Metoda eliminacji Gaussa Wzory Cramera Metoda eliminacji Gaussa Metoda eliminacji Gaussa polega na znalezieniu dla danego uk ladu a x + a 2 x 2 + + a n x n = b a 2 x + a 22 x 2 + + a 2n x n =
Bardziej szczegółowo1 Praktyczne metody wyznaczania podstawowych miar przy zastosowaniu programu EXCEL
Kurs w zakresie zaawansowanych metod komputerowej analizy danych Podstawy statystycznej analizy danych 9.03.2014-3 godziny ćwiczeń autor: Adam Kiersztyn 1 Praktyczne metody wyznaczania podstawowych miar
Bardziej szczegółowoMaszyny wektorów podpierajacych w regresji rangowej
Maszyny wektorów podpierajacych w regresji rangowej Uniwersytet Mikołaja Kopernika Z = (X, Y ), Z = (X, Y ) - niezależne wektory losowe o tym samym rozkładzie X X R d, Y R Z = (X, Y ), Z = (X, Y ) - niezależne
Bardziej szczegółowoWYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 11 i 12 1 / 41 TESTOWANIE HIPOTEZ - PORÓWNANIE
Bardziej szczegółowoZASADA SZUFLADKOWA DIRICHLETA
ZASADA SZUFLADKOWA DIRICHLETA Andrzej FRYSZKOWSKI SZCZECIN, 27 MARCA 2014 Andrzej FRYSZKOWSKI () ZASADA SZUFLADKOWA DIRICHLETA SZCZECIN, 27 MARCA 2014 1 / 25 BROSZURA OMG I (2005/2006) (opracowanie: Joanna
Bardziej szczegółowoEstymatory kwantylowe i estymacja kwantyli
Tomasz Rychlik Instytut Matematyczny PAN Chopina 12, 87 100 Toruń e-mail: trychlik@impan.gov.pl XXXVIII Konferencja Statystyka Matematyczna Sesja poświȩcona pamiȩci prof. Ryszarda Zielińskiego Wisła, 3
Bardziej szczegółowoMATEMATYKA 4 INSTYTUT MEDICUS FUNKCJA KWADRATOWA. Kurs przygotowawczy na studia medyczne. Rok szkolny 2010/2011. tel. 0501 38 39 55 www.medicus.edu.
INSTYTUT MEDICUS Kurs przygotowawczy na studia medyczne Rok szkolny 00/0 tel. 050 38 39 55 www.medicus.edu.pl MATEMATYKA 4 FUNKCJA KWADRATOWA Funkcją kwadratową lub trójmianem kwadratowym nazywamy funkcję
Bardziej szczegółowoTestowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.
Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ
Bardziej szczegółowo1 Rekodowanie w podgrupach i obliczanie wartości w podgrupach
1 Rekodowanie w podgrupach i obliczanie wartości w podgrupach Czasami chcemy rekodować jedynie cz ¾eść danych zawartych w pewnym zbiorze. W takim przypadku stosujemy rekodowanie z zastosowaniem warunku
Bardziej szczegółowoWyk lad 3 Wyznaczniki
1 Określenie wyznacznika Wyk lad 3 Wyznaczniki Niech A bedzie macierza kwadratowa stopnia n > 1 i niech i, j bed a liczbami naturalnymi n Symbolem A ij oznaczać bedziemy macierz kwadratowa stopnia n 1
Bardziej szczegółowoZastosowanie uogólnionych modeli liniowych i uogólnionych mieszanych modeli liniowych do analizy danych dotyczacych występowania zębiniaków
Zastosowanie uogólnionych modeli liniowych i uogólnionych mieszanych modeli liniowych do analizy danych dotyczacych występowania zębiniaków Wojciech Niemiro, Jacek Tomczyk i Marta Zalewska Uniwersytet
Bardziej szczegółowoStatystyka w analizie i planowaniu eksperymentu
28 marca 2012 Analiza wariancji klasyfikacja jednokierunkowa - wst ep Przypuśćmy, że chcemy porównać wieksz a (niż dwie) liczbe grup. Aby porównać średnie w kilku grupach, można przeprowadzić analize wariancji.
Bardziej szczegółowoEkonometryczne modele nieliniowe
Ekonometryczne modele nieliniowe Wykład 10 Modele przełącznikowe Markowa Literatura P.H.Franses, D. van Dijk (2000) Non-linear time series models in empirical finance, Cambridge University Press. R. Breuning,
Bardziej szczegółowoRozdzia l 10. Formy dwuliniowe i kwadratowe Formy dwuliniowe Definicja i przyk lady
Rozdzia l 10 Formy dwuliniowe i kwadratowe 10.1 Formy dwuliniowe 10.1.1 Definicja i przyk lady Niech X K b edzie przestrzenia liniowa nad cia lem K, dim(x K ) = n. Definicja 10.1 Przekszta lcenie ϕ : X
Bardziej szczegółowoWielokryterialne harmonogramowanie portfela projektów. Bogumiła Krzeszowska Katedra Badań Operacyjnych
Wielokryterialne harmonogramowanie portfela projektów Bogumiła Krzeszowska Katedra Badań Operacyjnych Problem Należy utworzyć harmonogram portfela projektów. Poprzez harmonogram portfela projektów będziemy
Bardziej szczegółowoWykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
Bardziej szczegółowoTemat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, Ŝe 40% owoców ulega uszkodzeniu podczas pakowania automatycznego.
Bardziej szczegółowoEkonometria I Weryfikacja: współliniowość i normalność. Dr Michał Gradzewicz Szkoła Główna Handlowa w Warszawie
Ekonometria I Weryfikacja: współliniowość i normalność Dr Michał Gradzewicz Szkoła Główna Handlowa w Warszawie 1 Współliniowość 2 Przypomnienie: Założenia MNK Założenia MNK: 1. Zmienne objaśniające są
Bardziej szczegółowo1 Próba a populacja. Nasze rozwa zania zaczniemy od przedyskutowania podstawowych poj ¾eć statystycznych,
Kurs w zakresie zaawansowanych metod komputerowej analizy danych Podstawy statystycznej analizy danych 9.03.04 - godziny konwersatorium autor Adam Kiersztyn Próba a populacja Nasze rozwa zania zaczniemy
Bardziej szczegółowoJan Olek. Uniwersytet Stefana Kardynała Wyszyńskiego. Procesy z Opóźnieniem. J. Olek. Równanie logistyczne. Założenia
Procesy z Procesy z Jan Olek Uniwersytet Stefana ardynała Wyszyńskiego 2013 Wzór równania logistycznego: Ṅ(t)=rN(t)(1- N ), gdzie Ṅ(t) - przyrost populacji w czasie t r - rozrodczość netto, (r > 0) N -
Bardziej szczegółowoNatalia Neherbecka. 11 czerwca 2010
Natalia Neherbecka 11 czerwca 2010 1 1. Konsekwencje heteroskedastyczności i autokorelacji 2. Uogólniona MNK 3. Stosowalna Uogólniona MNK 4. Odporne macierze wariancji i kowariancji b 2 1. Konsekwencje
Bardziej szczegółowo1 Poj ¾ecie szeregu czasowego
Studia podyplomowe w zakresie przetwarzania, zarz¾adzania i statystycznej analizy danych Analiza szeregów czasowych 24.11.2013-2 godziny konwersatorium autor: Adam Kiersztyn 1 Poj ¾ecie szeregu czasowego
Bardziej szczegółowo1 Testy statystyczne. 2 Rodzaje testów
1 Testy statystyczne Podczas sprawdzania hipotez statystycznych moga¾ wystapić ¾ dwa rodzaje b ¾edów. Prawdopodobieństwo b ¾edu polegajacego ¾ na odrzuceniu hipotezy zerowej (H 0 ), gdy jest ona prawdziwa,
Bardziej szczegółowoWyk lad 11 Przekszta lcenia liniowe a macierze
Wyk lad 11 Przekszta lcenia liniowe a macierze 1 Izomorfizm przestrzeni L(V ; W ) i M m n (R) Twierdzenie 111 Niech V i W bed a przestrzeniami liniowymi o bazach uporzadkowanych (α 1,, α n ) i (β 1,, β
Bardziej szczegółowoBadanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa
Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa Test serii (test Walda-Wolfowitza) Założenie. Rozpatrywane rozkłady są ciągłe. Mamy dwa uporządkowane
Bardziej szczegółowoJądrowe klasyfikatory liniowe
Jądrowe klasyfikatory liniowe Waldemar Wołyński Wydział Matematyki i Informatyki UAM Poznań Wisła, 9 grudnia 2009 Waldemar Wołyński () Jądrowe klasyfikatory liniowe Wisła, 9 grudnia 2009 1 / 19 Zagadnienie
Bardziej szczegółowoO ŚREDNIEJ STATYSTYCZNEJ
O ŚREDNIEJ STATYSTYCZNEJ Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków Rachunek Prawdopodobieństwa i Statystyka Kraków, 20 26 IX 2009 r. WYNIKI OBSERWACJI X 1, X 2,..., X n WYNIKI
Bardziej szczegółowoStatystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych
Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej
Bardziej szczegółowoStatystyka matematyczna. Wykład VI. Zesty zgodności
Statystyka matematyczna. Wykład VI. e-mail:e.kozlovski@pollub.pl Spis treści 1 Testy zgodności 2 Test Shapiro-Wilka Test Kołmogorowa - Smirnowa Test Lillieforsa Test Jarque-Bera Testy zgodności Niech x
Bardziej szczegółowoStatystyczna analiza danych (molekularnych) analiza wariancji ANOVA
Statystyczna analiza danych (molekularnych) analiza wariancji ANOVA Anna Gambin 19 maja 2013 Spis treści 1 Przykład: Model liniowy dla ekspresji genów 1 2 Jednoczynnikowa analiza wariancji 3 2.1 Testy
Bardziej szczegółowoTemat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1
Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT Anna Rajfura 1 Przykład W celu porównania skuteczności wybranych herbicydów: A, B, C sprawdzano, czy masa chwastów na poletku zaleŝy
Bardziej szczegółowoStosowana Analiza Regresji
Stosowana Analiza Regresji Wykład VI... 16 Listopada 2011 1 / 24 Jest to rozkład zmiennej losowej rozkład chi-kwadrat Z = n i=1 X 2 i, gdzie X i N(µ i, 1) - niezależne. Oznaczenie: Z χ 2 (n, λ), gdzie:
Bardziej szczegółowoTestowanie hipotez statystycznych.
Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie
Bardziej szczegółowoUogólniona Metoda Momentów
Uogólniona Metoda Momentów Momenty z próby daż a do momentów teoretycznych (Prawo Wielkich Liczb) plim 1 n y i = E (y) n i=1 Klasyczna Metoda Momentów (M M) polega na szacowaniu momentów teoretycznych
Bardziej szczegółowo(α + β) a = α a + β a α (a + b) = α a + α b (α β) a = α (β a). Definicja 4.1 Zbiór X z dzia laniami o wyżej wymienionych w lasnościach
Rozdzia l 4 Przestrzenie liniowe 4.1 Przestrzenie i podprzestrzenie 4.1.1 Definicja i podstawowe w lasności Niech X z dzia laniem dodawania + b edzie grupa przemienna (abelowa). Oznaczmy przez 0 element
Bardziej szczegółowoUWAGI O TESTACH JARQUE A-BERA
PRZEGLĄD STATYSTYCZNY R. LVII ZESZYT 4 010 CZESŁAW DOMAŃSKI UWAGI O TESTACH JARQUE A-BERA 1. MIARY SKOŚNOŚCI I KURTOZY W literaturze statystycznej prezentuje się wiele miar skośności i spłaszczenia (kurtozy).
Bardziej szczegółowo... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).
Egzamin ze Statystyki Matematycznej, WNE UW, wrzesień 016, zestaw B Odpowiedzi i szkice rozwiązań 1. Zbadano koszt 7 noclegów dla 4-osobowej rodziny (kwatery) nad morzem w sezonie letnim 014 i 015. Wylosowano
Bardziej szczegółowoSTATYSTYKA
Wykład 1 20.02.2008r. 1. ROZKŁADY PRAWDOPODOBIEŃSTWA 1.1 Rozkład dwumianowy Rozkład dwumianowy, 0 1 Uwaga: 1, rozkład zero jedynkowy. 1 ; 1,2,, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym
Bardziej szczegółowoAnaliza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń Problem Przykłady
Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń 1. Problem ozwaŝamy zjawisko (model): Y = β 1 X 1 X +...+ β k X k +Z Ηβ = w r Hipoteza alternatywna: Ηβ w r
Bardziej szczegółowoIV. UK ADY RÓWNAÑ LINIOWYCH
IV. UK ADY RÓWNAÑ LINIOWYCH 4.1. Wprowadzenie Uk³ad równañ liniowych gdzie A oznacza dan¹ macierz o wymiarze n n, a b dany n-elementowy wektor, mo e byæ rozwi¹zany w skoñczonej liczbie kroków za pomoc¹
Bardziej szczegółowoWYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU
Zał. nr 4 do ZW WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU Nazwa w języku polskim STATYSTYCZNA ANALIZA DANYCH Nazwa w języku angielskim STATISTICAL DATA ANALYSIS Kierunek studiów (jeśli dotyczy):
Bardziej szczegółowoWspółliniowość zmiennych objaśniających: test Walda i test Studenta w badaniu istotności zmiennych objaśniających - przykłady.
Współliniowość zmiennych objaśniających: test Walda i test Studenta w badaniu istotności zmiennych objaśniających - przykłady. Przykład: Test Walda a test Studenta w badaniu istotności zmiennych objaśniających.
Bardziej szczegółowoTEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.
TEST STATYSTYCZNY Testem statystycznym nazywamy regułę postępowania rozstrzygająca, przy jakich wynikach z próby hipotezę sprawdzaną H 0 należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia.
Bardziej szczegółowoWYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
Bardziej szczegółowoEgzamin z ekonometrii wersja IiE, MSEMAT
Egzamin z ekonometrii wersja IiE, MSEMAT 04-02-2016 Pytania teoretyczne 1. Za pomocą jakiego testu weryfikowana jest normalność składnika losowego? Jakiemu założeniu KMRL odpowiada w tym teście? Jakie
Bardziej szczegółowoWyk ady z algorytmów genetycznych Cz¾eść 2: Model algorytmu genetycznego przy dowolnej reprezentacji rozwi azań ¾
Wyk ady z algorytmów genetycznych Cz¾eść 2: Model algorytmu genetycznego przy dowolnej reprezentacji rozwi azań ¾ Marcin Studniarski Wydzia Matematyki i Informatyki Uniwersytetu ódzkiego Algorytm RHS i
Bardziej szczegółowoAnaliza danych ilościowych i jakościowych
Wydział Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego 8 kwietnia 2010 Plan prezentacji 1 Zbiory danych do analiz 2 3 4 5 6 Implementacja w R Badanie depresji Depression trial data Porównanie
Bardziej szczegółowoTeoretyczne podstawy algorytmów komputerowego modelowania procesów Markowa
Teoretyczne podstawy algorytmów komputerowego modelowania procesów Markowa Adam Kiersztyn 28 czerwca 20 Streszczenie W tej pracy przedstawimy najwa zniejsze rezultaty zawarte w przygotowywanej rozprawie
Bardziej szczegółowo