KOMPUTEROWE MODELOWANIE WIELOWYMIAROWYCH DANYCH Z WYKORZYSTANIEM KOPUŁ
|
|
- Marta Kozak
- 7 lat temu
- Przeglądów:
Transkrypt
1 Zeszyty Naukowe Wydziału Informatyki Wyższej Szkoły Informatyki Stosowanej i Zarzadzania Informatyka Stosowana Nr 1/214 KOMPUTEROWE MODELOWANIE WIELOWYMIAROWYCH DANYCH Z WYKORZYSTANIEM KOPUŁ Hubert Czobodziński Wyższa Szkoła Informatyki Stosowanej i Zarządzania ul. Newelska 6, Warsaw, Poland Streszczenie Przedmiotem pracy jest implementacja metody modelowania cenzorowanych danych wielowymiarowych z wykorzystaniem kopuły przedstawionej w artykule Chen i Fan (27). Praca zawiera podstawowe informacje o kopułach, zagadnieniach analizy przeżycia i niezawodności oraz omówienie wybranych aspektów modelowania danych wielowymiarowych. Przestawiono w niej szczegóły implementacji jednej z metod modelowania danych cenzorowanych oraz wyniki doświadczeń numerycznych, przeprowadzonych przy użyciu sztucznie wygenerowanych danych losowych. Słowa kluczowe: kopuły, dane wielowymiarowe, dane cenzorowane, modelowanie, niezawodność 1 Wstęp Wiele dziedzin, w których wykorzystywane są narzędzia statystyczne boryka się z problemem modelowania danych empirycznych pochodzących z rozkładów daleko odbiegających od dwuwymiarowego rozkładu normalnego. Problemy o takim charakterze pojawiają się między innymi w geostatystyce, finansach, ubezpieczeniach czy badaniach epidemiologicznych (Frees, Valdez, 1998). Ostatni z przykładów jest szczególnie istotny także z uwagi na tematykę niniejszej pracy gdyż pojawiają się w nim dodatkowe kwestie, charakterystyczne dla analizy przeżycia i niezawodności. Jedną z nadziei na poprawę tego stanu są kopuły narzędzie do modelowania rozkładów wielowymiarowych o skomplikowanych strukturach zależności, zdobywające coraz większą popularność i z powodzeniem stosowane w wymienionych wyżej dziedzinach.
2 H. Czobodziński 2 Kopuły 2.1 Definicja Definicja 1 Dwuwymiarowa kopuła to funkcja C : [, 1] 2 [, 1] o następujacych własnościach: 1. Dla dowolnych u, v [, 1] oraz C(u, ) = C(, v) = (1) C(u, 1) = u C(1, v) = v. (2) 2. Dla dowolnych u 1, u 2, v 1, v 2 [, 1], takich że u 1 u 2 i v 1 v 2 C(u 2, v 2 ) C(u 2, v 1 ) C(u 1, v 2 ) + C(u 1, v 1 ). (3) Wprost z definicji wynika, że kopuła jest dystrybuantą łączną dwuwymiarowego rozkładu o jednostajnych rozkładach brzegowych, określonego na kwadracie jednostkowym. Kolejnym wnioskiem z definicji jest następująca nierówność, prawdziwa dla każdej kopuły C i każdego (u, v) [, 1] 2 : W (u, v) C(u, v) M(u, v). (4) gdzie W (u, v) = max(u + v 1, ) oraz M(u, v) = min(u, v). Funkcje W i M (również będące kopułami) nazywane są granicami Frécheta-Hoeffdinga. 2.2 Twierdzenie Sklara Jednym z najistotniejszych elementów teorii kopuł i fundamentem dużej części przypadków zastosowania jej w statystyce, jest twierdzenie Sklara. Twierdzenie 1 (Sklar) Niech F (x, y) będzie dystrybuanta łaczn a rozkładu dwuwymiarowego o dystrybuantach brzegowych F x (x) i F y (y). Istnieje kopuła C, taka że: F (x, y) = C(F x (x), F y (y)). (5) Jeśli F x i F y sa ciagłe to C jest jednoznacznie określona. W przeciwnym przypadku C jest jednoznacznie określona na iloczynie kartezjańskim przeciwdziedzin F x i F y. Prawdziwe jest również twierdzenie odwrotne: jeśli C jest kopuła a F x i F y dystrybuantami to funkcja F zdefiniowana przez (5) jest dystrybuanta łaczn a rozkładu dwuwymiarowego o dystrybuantach brzegowych F x i F y. 64
3 Komputerowe modelowanie wielowymiarowych danych z wykorzystaniem kopuł Twierdzenie to pojawiło się po raz pierwszy w pracy Sklara (1959). Nazwa kopuła 1 ma obrazować sposób w jaki funkcja ta łączy dystrybuantę rozkładu łącznego z rozkładami brzegowymi. Twierdzenie Sklara, z punktu widzenia statystyki, czyni kopuły narzędziem pozwalającym na badanie struktury zależności wielowymiarowych zmiennych losowych w oderwaniu od ich rozkładów brzegowych. 2.3 Kopuły archimedesowskie Nazwa kopuły archimedesowskie określa kopuły postaci: C(u, v) = φ [ 1] (φ(u) + φ(v)), (6) gdzie φ : [, 1] [, ) jest ciągłą, wypukłą funkcją malejącą, spełniającą warunek φ(1) =, a φ [ 1] jej pseudo-odwrotnością: φ [ 1] = { φ 1 (t) t φ() φ() < t. (7) Funkcja φ nazywana jest generatorem kopuły. Obszerny przegląd kopuł archimedesowskich wraz z wykresami losowych próbek danych znaleźć można w pracy Armstrong (23). Kopuły archimedesowskie są szczególnie interesujące z punktu widzenia zastosowań praktycznych, ponieważ przy prostej formie obejmują wiele różnych struktur zależności zmiennych. Funkcja: 2.4 Dystrybuanta kopuły Dwuwymiarowa kopuła może być traktowana jako zmienna losowa: C : [, 1] 2 [, 1]. (8) K(v) = P (C(X, Y ) V ) (9) jest dystrybuantą zmiennej losowej C. Dystrybuanta ta, w przypadku kopuł archimedesowskich może być wyrażona za pomocą generatora kopuły: K(v) = v φ(v) φ (v). (1) Ponadto, jak wskazują autorzy pracy Genest, Rivest (1993), w tej klasie kopuł istnieje wzajemnie jednoznaczne odwzorowanie między kopułą a jej dystrybuantą, co umożliwia w praktycznych zastosowaniach wykorzystanie K(v) do estymacji parametrów kopuł archimedesowskich. 1 łaciński rzeczownik copula oznacza łączenie lub wiązanie 65
4 H. Czobodziński 2.5 Tau Kendalla Współczynnik τ Kendalla jest jedną z miar monotonicznej zależności między zmiennymi, zdefiniowaną jako (Kendall, 1948): τ = P [(x 1 x 2 )(y 1 y 2 ) > ] P [(x 1 x 2 )(y 1 y 2 ) < ]. (11) Warto zwrócić uwagę, że o ile powszechnie stosowany współczynnik korelacji liniowej określa jedynie siłę liniowej zależności między zmiennymi, o tyle τ Kendalla pozwala na badanie także bardziej złożonych form zależności monotonicznej. Jeśli X i Y są zmiennymi losowymi o charakterze ciągłym, to zależność (11) może być wyrażona w terminach kopuł: τ = C X,Y (u, v)dc X,Y (u, v) 1, (12) co w przypadku kopuł archimedesowskich pozwala na wyznaczenie τ Kendalla na podstawie generatora kopuły (Genest, MacKay, 1986): τ = 4 1 φ(v) φ dv + 1. (13) (v) 3 Analiza przeżycia i niezawodności Analiza przeżycia i niezawodności jest szczególnym działem statystyki. Szczególnym ze względu na zagadnienia, którymi się zajmuje, charakterystyczne problemy w nich występujące oraz specyficzne narzędzia. Obszar zainteresowań analizy przeżycia i niezawodności to zmienne losowe odpo-wiadające czasowi upływającemu do momentu wystąpienia jakiegoś zdarzenia. Zda-rzeniem takim może być śmierć osobnika w wybranej populacji (stąd nazwa analiza przeżycia), ale też moment wystąpienia awarii pewnego urządzenia, czy czas pozostawania bezrobotnym po utracie pracy. 3.1 Funkcja przeżycia Podstawowym obiektem zainteresowania analizy przeżycia i niezawodności jest funk-cja przeżycia: F (x) = P (X > x). (14) Jest ona ściśle związana z dystrybuantą zmiennej losowej: F (x) = 1 F (x) (15) i określa prawdopodobieństwo wystąpienia zdarzenia po czasie dłuższym niż x (np. prawdopodobieństwo przeżycia czasu dłuższego niż x). 66
5 Komputerowe modelowanie wielowymiarowych danych z wykorzystaniem kopuł Dla dwuwymiarowej zmiennej losowej funkcja przeżycia jest określona jako F (x, y) = P (X > x, Y > y), (16) a jej związek z dystrybuantą jest następujący F (x, y) = 1 F x (x) F y (y) + F (x, y), (17) gdzie F x (x) i F y (y) są dystrybuantami brzegowymi. Granice dwuwymiarowej funkcji przeżycia: oraz F x (x) = lim F (x, y) (18) y F y (y) = lim F (x, y) (19) x są jednowymiarowymi funkcjami przeżycia. 3.2 Funkcja hazardu Specyfika niektórych zastosowań analizy przeżycia i niezawodności sprawia, że ważne staje się negatywne uzupełnienie informacji niesionej przez funkcję przeżycia. Realizowane jest ono przez funkcję hazardu: λ(x)dx = P (x X < x + dx T x) = F (x) dx. (2) F (x) Funkcja hazardu określa prawdopodobieństwo zajścia zdarzenia w jednostce cza-su, pod warunkiem, że w danym przypadku do zdarzenia jeszcze nie doszło. Alternatywną reprezentacją funkcji hazardu jest skumulowana funkcja hazardu: Λ(x) = x h(t)dt = log( F (x)). (21) 3.3 Obserwacje ucięte Cechą charakterystyczną zjawisk, którymi zajmuje się analiza przeżycia i niezawodności jest występowanie obserwacji uciętych (cenzorowanych). Pojawiają się one w najogólniejszym przypadku wtedy, gdy wiadomo jedynie, że prawdziwy czas do wystąpienia pewnego zdarzenia jest nie mniejszy niż czas zaobserwowany. Najczęstszą przyczyną cenzorowania jest konieczność zakończenia badań przed wystąpieniem oczekiwanego zdarzenia. Analiza przeżycia wyróżnia jednak wiele rodzajów cenzorowania, kategoryzując je według różnych kryteriów (Elektroniczny Podręcznik Statystyki, 26): 67
6 H. Czobodziński jedno- i wielokrotne w zależności od tego, czy obserwacja wszystkich obiektów kończy się w tym samym momencie, czy też ucięcia są od siebie niezależne, typu I i II obserwację kończy się w ustalonym momencie, lub po wystąpieniu badanego zdarzenia u założonej frakcji obiektów, prawo- i lewostronne ucinanie może dotyczyć początku lub końca przedziału czasowego. Formalnie, jeśli przez T oznaczymy czas do wystąpienia zdarzenia, a przez Z czas cenzorowania, to obserwacja 2 będzie uporządkowaną parą (X, δ), gdzie X = min(t, Z) a δ jest zmienną indykatorowa δ = T Z. 3 Obserwacje ucięte choć w pewnym sensie niepełnowartościowe wnoszą jednak dodatkową wiedzę o badanym zjawisku i narzędzia stosowane w analizie przeżycia muszą ten fakt uwzględniać. 3.4 Nieparametryczna estymacja funkcji przeżycia Estymator Kaplana-Meiera Jednowymiarowa funkcja przeżycia może być estymowana za pomocą estymatora Kaplana-Meiera (1958), będącego estymatorem największej wiarogodności. Jego istotną cechą jest branie pod uwagę obserwacji cenzorowanych. Niech t 1 t 2... t n będzie n-elementową próbą uporządkowaną, n i liczbą obiektów, u których zdarzenie nie wystąpiło przed czasem t i, a d i liczbą zdarzeń w momencie t i. Estymator Kaplana-Meiera określony jest wzorem: F (t) = ti<t n i d i n i. (22) Odpowiednikiem estymatora Kaplana-Meiera dla skumulowanej funkcji hazardu jest estymator Nelsona-Aalena: H(t) = t i t d i n i. (23) 2 Dotyczy to przypadku cenzorowania prawostronnego. 3 Zapis p oznacza funkcję przyjmującą wartość 1, kiedy zdanie p jest prawdziwe i wartość w przeciwnym przypadku. 68
7 Komputerowe modelowanie wielowymiarowych danych z wykorzystaniem kopuł Estymacja dwuwymiarowej funkcji przeżycia Sytuacja znacznie komplikuje się w przypadku dwuwymiarowym, kiedy każda ze zmiennych może być cenzorowana niezależnie nie istnieje prosty odpowiednik estymatora Kaplana-Meiera. Literatura przedmiotu zawiera szereg propozycji nieparametrycznych estymatorów dwuwymiarowych funkcji przeżycia. Dobrymi własnościami wyróżnia się estymator Dąbrowskiej (1988, 1989). Jest on jednak (podobnie jak inne propozycje) skomplikowany, przez co trudny w implementacji i wymagający sporych nakładów obliczeniowych. Niech: T 1, T 2 Z 1, Z 2 dwuwymiarowa zmienna losowa, niezależne czasy cenzorowania, X 1, X 2 dwuwymiarowa zmienna losowa X i = min(t i, Z i ), {(x 1i, x 2i, δ 1i, δ 2i ), i = 1... n} - n-elementowa próba losowa, gdzie δ ji = x ji z ji. Dla uproszczenie i skrócenia zapisu przyjęto następującą konwencję: f( s, t) = f(s, t) f(s, t), (24) f(s, t) = f(s, t) f(s, t ), (25) f( s, t) = f(s, t) f(s, t ) f(s, t) + f(s, t ). (26) Niech H ij będą pomocniczymi funkcjami przeżycia, odpowiednio: H (s, t) = P (X 1 > s, X 2 > t), (27) H 1 (s, t) = P (X 1 > s, X 2 > t, δ 1 = 1), (28) H 1 (s, t) = P (X 1 > s, X 2 > t, δ 2 = 1), (29) H 11 (s, t) = P (X 1 > s, X 2 > t, δ 1 = 1, δ 2 = 1). (3) Funkcje H ij pozwalają na wyznaczenie skumulowanych funkcji hazardu: Λ 11 (s, t) = s t s Λ 1 (s, t) = H 11 (du, dv) H (u, v ), (31) H 1 (du, t) H (u, t), (32) t H 1 (s, dv) Λ 1 (s, t) = H (s, v ). (33) 69
8 H. Czobodziński Estymacja funkcji H ij jest stosunkowo prosta: Ĥ (s, t) = 1 x 1i > s x 2i > t, (34) n i Ĥ 1 (s, t) = 1 x 1i > s x 2i > t δ 1 = 1, (35) n i Ĥ 1 (s, t) = 1 x 1i > s x 2i > t δ 2 = 1, (36) n i Ĥ 11 (s, t) = 1 x 1i > s x 2i > t δ 1 = 1 δ 2 = 1, (37) n i co umożliwia z kolei estymację skumulowanych funkcji hazardu: ˆΛ 11 (s, t) = s t s ˆΛ 1 (s, t) = t ˆΛ 1 (s, t) = Ĥ 11 (du, dv) Ĥ (u, v ), (38) Ĥ 1 (du, t) Ĥ (u, t), (39) Ĥ 1 (s, dv) Ĥ (s, v ). (4) Ostatecznie estymator dwuwymiarowej funkcji przeżycia wyznaczany jest z zależności: ˆF (s, t) = ˆF (s, ) ˆF [ (, t) 1 ˆL( u, ] v), (41) gdzie: <u s <v t ˆL( u, v) = ˆΛ 1 ( u, v )ˆΛ 1 (u, v) ˆΛ 11 ( u, v) [ 1 ˆΛ ] [ 1 ( u, v ) 1 ˆΛ ]. (42) 1 (u, v) ˆF (s, ) i ˆF (, t) są jednowymiarowymi estymatorami Kaplana-Meiera: ˆF (s, ) = [ 1 ˆΛ ] 1 ( u, ), u s (43) ˆF (, t) = [ 1 ˆΛ ] 1 (, v). v t (44) 7
9 Komputerowe modelowanie wielowymiarowych danych z wykorzystaniem kopuł Dla danych niecenzorowanych estymator ten sprowadza się do zwykłej empirycznej funkcji przeżycia. 3.5 Kopuły w analizie przeżycia i niezawodności Między dwuwymiarową funkcją przeżycia a jej jednowymiarowymi granicami zachodzi zależność analogiczna do tej, którą w terminach dystrybuant opisuje twierdzenie Sklara. Niech C będzie kopułą zmiennej losowej (X, Y ). Łatwo wykazać, że: gdzie: F (x, y) = Ĉ( F x (x), F y (y)), (45) Ĉ(u, v) = u + v 1 + C(1 u, 1 v). (46) Warto w tym miejscu zwrócić szczególną uwagę na fakt kluczowy dla problemów poruszanych w niniejszej pracy że funkcja Ĉ jest kopuła, zatem dystrybuantą nie funkcją przeżycia zmiennej losowej o jednostajnych rozkładach brzegowych. 4 Modelowanie danych wielowymiarowych Modelowanie wielowymiarowych danych przy użyciu kopuł jest zagadnieniem złożo-nym, nawet w przypadku ograniczenia obszaru zainteresowania do grupy kopuł archi-medesowskich z jednym parametrem. Pierwszy z problemów to konieczność jednoczesnego wyboru rodziny kopuł i oszacowania wartości jej parametru. Oszacowanie wartości parametru kopuły nie jest możliwe bez znajomości jej postaci. Z drugiej strony, wybór dopasowanego do danych empirycznych modelu kopuły nie jest możliwy w oderwaniu od wartości jej parametru. Zagadnieniu temu poświęcony jest w przeważającej części ten rozdział. Drugim problemem jest weryfikacja wyników modelowania. Może mieć ona dwojaką formę: potwierdzenie, że wybrany model lepiej od innych opisuje dane empiryczne, potwierdzenie, że wybrany model odpowiada prawdziwej strukturze zależności w badanej próbie losowej. Propozycją odpowiedzi na pierwsze z tych pytań jest opisany w dalszej części rozdziału test istotności. Druga z kwestii wykracza poza tematykę niniejszej pracy. Dodatkowe komplikacje pojawiają się w przypadku modelowania danych cenzorowanych. Najważniejszą z nich, poruszaną już w rozdziale 3.4, jest estymacja wielowymiarowej funkcji przeżycia. 71
10 H. Czobodziński 4.1 Wybrane aspekty zastosowania kopuł w modelowaniu danych wielowymiarowych Algorytm będący przedmiotem niniejszej pracy został zaprezentowany w artykule Chen, Fan (27) i jest rozwinięciem koncepcji pojawiających się wcześniej w pracach Claytona (1978), Genesta i Rivesta (1993) oraz Wanga i Wellsa (2). Pierwsza z tych koncepcji, zaproponowana w pracy Genest, Rivest (1993), to wykorzystanie nieparametrycznego estymatora dystrybuanty kopuły K(v) do wyznaczenia parametrów kopuły. Jest to możliwe dzięki udowodnionej przez autorów wzajemnie jednoznacznej relacji między kopułą archimedesowską a jej dystrybuantą: K(v) = v φ(θ) φ (θ). (47) Ponadto autorzy wskazują na możliwość pominięcia etapu pośredniego jakim jest budowa dwuwymiarowej dystrybuanty empirycznej (formalnie niezbędnej do estymacji K(v)) oraz proponują oparcie estymatora parametru θ kopuły o dekompozycję współczynnika τ Kendalla. Koncepcja powyższa znalazła rozwinięcie w pracy Wanga i Wellsa (2). Jednak inaczej niż poprzednicy autorzy skoncentrowali się nad modelowaniem struktury zależności dla danych cenzorowanych, występujących w zagadnieniach analizy przeżycia i niezawodności. Ważną konsekwencją takiego podejścia była konieczność wykorzystania nieparametrycznego estymatora dwuwymiarowej funkcji przeżycia do estymacji dystrybuanty kopuły K(v). Niech x 1,..., x n oraz y 1,..., y n będą uporządkowanymi obserwacjami z dwuwymiarowej próby losowej (x i, y i ), i = 1,..., n. Proponowany przez Wanga i Wellsa (2) estymator K(v) ma następującą postać: ˆK(v) = 1 n i=1 y=1 n ˆF (x i, y i ) > v ˆF ( x i, y i ), (48) gdzie F jest nieparametrycznym estymatorem dwuwymiarowej funkcji przeżycia, natomiast: ˆF ( x i, y j ) = ˆF (x i, y j ) ˆF (x i 1, y j ) ˆF (x i, y j 1 ) + ˆF (x i 1, y j 1 ). (49) Prezentowane podejście do estymacji K(v) czyni tę procedurę bardziej elastyczną, pozwalając na dobór strategii estymacji dwuwymiarowej funkcji przeżycia odpowiednio do charakteru analizowanych danych losowych, w szczególności do rodzaju cenzorowania. Następnie Wang i Wells (2) proponują użycie ˆK(v) do wyboru modelu najlepiej pasującego do analizowanych danych eksperymentalnych spośród arbitralnie wybranego zbioru rodzin kopuł archimedesowskich. 72
11 Komputerowe modelowanie wielowymiarowych danych z wykorzystaniem kopuł Podejście to wymaga wskazania jakiejś miary dopasowania poszczególnych modeli do danych losowych oraz kryterium wyboru modelu dopasowanego najlepiej. Miarą zaproponowaną w omawianej pracy jest scałkowany kwadrat różnicy między teoretyczną wartością dystrybuanty kopuły a jej wyestymowanym odpowiednikiem: S(α) = 1 ξ [ ] 2 ˆK(v) Kα (v) dv, (5) zaś metoda wyboru najlepiej dopasowanego modelu sprowadza się do wyboru kopuły, dla której S(α) ma wartość najmniejszą. Wyznaczenie K α (v) (a co za tym idzie S(α)) dla konkretnego modelu wymaga estymacji parametru α, która może bazować na współczynniku τ Kendalla, dzięki przedstawionej w rozdziale 2.5 zależności: 1 φ α (v) τ = 4 φ dv + 1. (51) α(v) Zależność ta pozwala wprawdzie na stosunkowo proste wyznaczenie parametru α na postawie wartości τ, zasadniczym problemem jest jednak nieparametryczna estymacja współczynnika τ dla danych cenzorowanych. 4.2 Algorytm wyboru modelu i estymacji parametrów kopuły Przestawione w rozdziale 4.1 koncepcje zostały usystematyzowane i rozszerzone w pracy Chen, Fan (27). Położono w niej nacisk na praktyczne aspekty zastosowania przedstawionej w niej procedury. Przejawia się to między innymi konsekwentnie stosowanym i podkreślanym w pracy założeniem, że żadna z rodzin kopuł kandydatów może nie opisywać prawdziwej zależności w rozkładzie, z którego pochodzi próba losowa. Jest to podejście bliskie zagadnieniom praktycznym, w których konieczne jest wybranie, spośród ograniczonego zbioru dostępnych modeli, jednego najlepiej odpowiadającego danym eksperymentalnym. Niech: T x, T y Z x, Z y dwuwymiarowa zmienna losowa, - niezależne czasy cenzorowania, X, Y dwuwymiarowa zmienna losowa: X = min(t x, Z x ), Y = min(t y, Z y ), {(x i, y i, δ xi, δ yi ), i = 1... n} - n-elementowa próba losowa, gdzie δ xi = x i z xi, δ yi = y i z yi, {C j (u, v, α j ), j = 1... m} m-elementowy zbiór kopuł archimedesowskich potencjalnych modeli, 73
12 H. Czobodziński {K j (v, α j ), j = 1... m} dystrybuanty kopuł {C j }. Procedura wyboru modelu i estymacji jego parametrów ma następujący przebieg: 1. nieparametryczna estymacja dwuwymiarowej funkcji przeżycia F (x, y), 2. nieparametryczna estymacja dystrybuanty kopuły K(v), 3. estymacja parametru α dla każdej kopuły ze zbioru modeli kandydujących, 4. wybór modelu najlepiej dopasowanego do danych losowych, 5. test istotności dla kryterium wyboru modelu. Punkty 1 i 2 nie różnią się od omawianych już propozycji zawartych w pracy Wanga i Wellsa (2). Estymator dwuwymiarowej funkcji przeżycia F (x, y) jest jednym z parametrów procedury i jego konkretna postać, zależna jest jedynie od własności próby losowej. Estymacja dystrybuanty kopuły K(v) odbywa się na podstawie znanej już zależności: ˆK(v) = 1 n i=1 j=1 n ˆF (x i, y j ) > v ˆF ( x i, y j ), (52) gdzie: x 1 x 2... x n oraz y 1 y 2... y n są uporządkowanymi obserwacjami z próby losowej {(x i, y i ), i = 1... n}, oraz: ˆF ( x i, y j ) = ˆF (x i, y j ) ˆF (x i 1, y j ) ˆF (x i, y j 1 ) + ˆF (x i 1, y j 1 ). (53) Innowacją w stosunku do omawianych wcześniej metod jest estymacja parametrów poszczególnych kopuł oparta o minimalizację scałkowanego kwadratu różnicy: Ŝ j (α j ) = 1 ξ [ ] 2 ˆK(v) Kj (v, α j ) dv, (54) która w zastosowaniach praktycznych może być zastąpiona sumą Riemanna (Wang, Wells, 2): Ŝ j (α j ) = n i=1 [ ] 2 ˆK(vi ) K j (v i, α j ) (vi v i 1 ), (55) gdzie: v =, natomiast v 1 v 2... v n to uporządkowany zbiór wartości {v i = ˆF (x i, y i ), i = 1... n}. 74
13 Komputerowe modelowanie wielowymiarowych danych z wykorzystaniem kopuł Dla każdej z kopuł estymatorem parametru α jest wartość, dla której scałkowany kwadrat różnicy osiąga minimum: 1 [ ] 2 ˆα j = arg min ˆK(v) Kj (v, α j ) dv = arg min Ŝ j (α j ). (56) α j ξ α j Należy zwrócić w tym miejscu uwagę na fakt, że nie wszystkie modele {C j } opisują prawdziwą formę zależności w rozkładzie, z którego pochodzi próba losowa (w szczególnym, choć nie rzadkim w praktyce, przypadku żaden z nich). Zatem formalnie ˆα j nie jest estymatorem prawdziwej wartości α j a jedynie takiej wartości parametru αj, która najlepiej dopasowuje dany model do analizowanych danych. Kryterium wyboru najlepiej dopasowanego modelu jest wartość Ŝj(ˆα j ). Ze zbioru kopuł {C j } wybierana jest ta, dla której Ŝj(ˆα j ) osiąga wartość najmniejszą. 4.3 Test istotności dla kryterium wyboru modelu Ostatnim elementem procedury proponowanej w pracy Chen, Fan (27), nie mającym odpowiednika w innych z omawianych prac jest statystyczny test istotności dla kryterium wyboru modelu. Wyjaśnienie jego idei ułatwia rozważenie przypadku, gdy zbiór dostępnych modeli kopuł {C j (u, v, α)} jest dwuelementowy, a najmniejszą wartość Ŝj(ˆα j ) uzyskano dla modelu C 1. Hipoteza zerowa i hipoteza alternatywna byłyby w takim przypadku następujące: H : S 1 (α 1) S 2 (α 2), H 1 : S 1 (α 1) > S 2 (α 2). Odrzucenie hipotezy zerowej skutkowałoby wybraniem modelu C 2, w przypadku braku podstaw do jej odrzucenia wybrany zostałby model C 1. Hipoteza zerowa i alternatywna wymagają nieco innej konstrukcji w przypadku, kiedy zbiór rozpatrywanych modeli ma więcej elementów. Podobnie jak poprzednio założono, że modelem odniesienia jest kopuła C 1 : H : [ max S1 (α1) S j (αj ) ] [, H 1 : max S1 (α1) S j (αj ) ] >. j=2,...,m j=2,...,m Tym razem, w przypadku odrzucenia hipotezy zerowej wybrany zostałby model ze zbioru {C j, j = 2,..., m}, dla którego wartość Ŝj(ˆα j ) byłaby najmniejsza. Jak podkreślają autorzy pracy, tak sformułowany test nie wymaga, aby którakolwiek z kopuł C j odpowiadała prawdziwej kopule w badanym rozkładzie, również w przypadku przyjęcia hipotezy zerowej. Statystyką testową w tym teście jest: T n = max ntjn = max n [Ŝ1 (ˆα 1 ) Ŝj(ˆα j )], (57) j=2,...,m j=2,...,m 75
14 H. Czobodziński a kryterium odrzucenia hipotezy H : T n > Z α, (58) gdzie Z α jest górnym α-percentylem rozkładu statystyki testowej. Rozkład ten w ogólnym przypadku jest nieznany. Autorzy proponują zastosowanie procedury naiwnego boostrapu do aproksymacji nieznanego rozkładu statystyki testowej: 1. niech {(x i, y i, δ xi, δ yi ), i = 1,..., n} będzie próbą losowaną ze zwracaniem z oryginalnej próby losowej {(x i, y i, δ xi, δ yi ), i = 1,..., n} a ˆF, ˆK i ˆα j będą wyznaczonymi na podstawie tej próby odpowiednikami ˆF, ˆK oraz ˆαj, 2. niech T n = max j=2,...,m n ( T jn T jn ), gdzie T jn jest odpowiednikiem T jn wyznaczonym na podstawie próby bootstrap, 3. kroki 1-2 należy powtórzyć wielokrotnie i użyć dystrybuanty empirycznej uzyskanych wartości T n do aproksymacji rozkładu statystyki testowej. 5 Implementacja algorytmu Metoda modelowania danych losowych, omówiona w poprzednim rozdziale, została zaimplementowana w postaci aplikacji bifail, napisanej w języku Java. Z uwagi na dość skomplikowany algorytm modelowania, celem jaki postawiono było stworzenie poprawnie działającego prototypu, a nie aplikacji przeznaczonej dla użytkownika końcowego. Jedyną biblioteką zewnętrzną wykorzystaną w aplikacji bifail jest biblioteka Apache Math Commons 4. Aplikacja używa udostępnianej przez nią implementacji algorytmu Brenta, przeznaczonego do poszukiwania minimów funkcji rzeczywistych (Brent, 1973). Algorytm ten zastosowano do estymacji parametru α kopuły na podstawie scałkowanego kwadratu różnicy między teoretyczną dystrybuantą kopuły a jej empirycznym odpowiednikiem. 6 Eksperymenty numeryczne 6.1 Modelowanie danych Eksperymenty numeryczne przeprowadzono na sztucznie wygenerowanych danych losowych pochodzących z rozkładów o ustalonych funkcjach przeżycia. Podzielono je na trzy etapy
15 Komputerowe modelowanie wielowymiarowych danych z wykorzystaniem kopuł Najpierw przetestowano działanie algorytmu dla danych niecenzorowanych, następnie dla danych cenzorowanych o jednostajnych rozkładach brzegowych. Ostatni etap eksperymentów dotyczył danych cenzorowanych o rozkładach brzegowych normalnych. Każdy z etapów składał się z trzech eksperymentów: 1. kopuła Claytona, α =.86 (τ =.3), 2. kopuła Claytona, α = 4.67 (τ =.7), 3. kopuła Gumbela, α = 2.33 (τ =.7). W każdym z eksperymentów przeprowadzono analizę 1 losowych próbek, pochodzących z identycznych rozkładów, składających się z 2 obserwacji. Zbiór kopuł archimedesowskich używanych w charakterze modeli składał się z kopuł Claytona, Franka i Gumbela. Na podstawie analizy wykresów rozrzutu obszar poszukiwań dla ˆα ograniczono, identycznie dla każdego z modeli, do przedziału 1, Dane niecenzorowane Wyniki doświadczeń z danymi niecenzorowanymi przedstawiono w tabeli 1. W przypadku kopuły Claytona o parametrze α =.86 model został niepoprawnie rozpoznany w 2 przypadkach i w każdym z tych przypadków wybierana była kopuła Franka. Wyjaśnieniem tego zjawiska może być niewielki poziom zależności w analizowanych danych (τ =.3). Wraz ze spadkiem wartości bezwzględnej tego współczynnika różnice pomiędzy poszczególnymi kopułami zaczynają się zacierać. Średnie wartości ˆα i Ŝ(ˆα) wyznaczono na podstawie tylko tych przypadków, w których kopuła została zidentyfikowana prawidłowo. Tak postępowano również we wszystkich kolejnych doświadczeniach. Wyniki testu istotności nie dały podstaw do odrzucenia hipotezy zerowej w żadnym z przypadków (również w tych, w których wybrany został błędny model). Minimalna wartość granicznego poziomu istotności p-value wyniosła.75 dla kopuły Claytona i.5 dla kopuły Franka. Liczba nieprawidłowo rozpoznanych modeli zmalała do jednego w przypadku kopuły Claytona o parametrze α = W jednym przypadku najlepiej dopasowanym modelem okazała się ponownie kopuła Franka. Wzrosła też dokładność oszacowania parametru kopuły. Tak jak poprzednio w żadnej z analiz nie odrzucono hipotezy zerowej, a minimalna p-value wyniosła.87. Ostatnią kopułą była kopuła Gumbela (α = 2.33). W czterech przypadkach została rozpoznana jako kopuła Franka. Minimalna wartość p-value wyniosła
16 H. Czobodziński Jednostajne rozkłady brzegowe Drugi etap eksperymentów przeprowadzono na danych pochodzących z rozkładów identycznych jak w etapie pierwszym, ale każda z próbek była cenzorowana (niezależnie) rozkładem Weibulla (k = 3, λ = 1.2). Przy doborze parametrów rozkładu Weibulla kierowano się przede wszystkim założonym odsetkiem obserwacji cenzorowanych wynoszącym ok..25. W przypadku kopuły Claytona (α =.86) i kopuły Gumbela liczba przypadków błędnej identyfikacji modelu wzrosła. Kopuła Claytona (α = 4.67) została rozpoznana bezbłędnie. Podobnie jak w przypadku danych niecenzorowanych, nie odnotowano odrzucenia hipotezy zerowej, a minimalne wartości granicznego poziomu istotności nie odbiegały od wyników uzyskanych w poprzednim etapie. kopuła Clayton Gumbel α τ błędne rozpoznanie średnia ˆα średnia Ŝ(ˆα) odrzucenie H Table 1: Wyniki eksperymentów dla danych niecenzorowanych kopuła Clayton Gumbel α τ częstość cenzorowania błędne rozpoznanie 26 7 średnia ˆα średnia Ŝ(ˆα) odrzucenie H Table 2: Wyniki eksperymentów dla danych cenzorowanych o jednostajnych rozkładach brzegowych 78
17 Komputerowe modelowanie wielowymiarowych danych z wykorzystaniem kopuł Normalne rozkłady brzegowe Ostatnim etapem eksperymentów była analiza danych o rozkładach brzegowych normalnych N(.5,.25). Parametry rozkładów brzegowych zostały dobrane tak, aby utrzymać częstość cenzorowania na poziomie podobnym jak w etapie poprzednim (parametry kopuł i rozkładu Weibulla pozostały bez zmian). Niejednostajne rozkłady brzegowe wpłynęły na prawie dwukrotny wzrost błędnych identyfikacji w przypadku kopuły Claytona o słabszej zależności i kopuły Gumbela (choć tutaj ich liczba nadal pozostawała niewielka). Kopuła Claytona o silniejszej zależności, podobnie jak w przypadku eksperymentów z danymi niecenzorowanymi, nie została rozpoznana tylko raz. W tym przypadku spadła dość wyraźnie dokładność oszacowania parametru kopuły. Ponownie nie zaobserwowano wartości p-value dającej podstawy do odrzucenia hipotezy zerowej. kopuła Clayton Gumbel α τ częstość cenzorowania błędne rozpoznanie średnia ˆα średnia Ŝ(ˆα) odrzucenie H Table 3: Wyniki eksperymentów dla danych cenzorowanych o rozkładach brzegowych normalnych 6.2 Wnioski Przeprowadzone eksperymenty numeryczne potwierdziły poprawne działanie algorytmu modelowania. Pokazały też (możliwe do przewidzenia) zmniejszanie się jego efektywności dla danych o słabej zależności. Wyraźny wpływ na działanie algorytmu mają też rozkłady brzegowe prób, choć wpływ ten słabnie przy danych o silniejszych zależnościach. Nie udało się zaobserwować przypadku odrzucenia hipotezy zerowej. Wynik ten nie jest jednak zaskakujący dla sztucznie generowanych zestawów danych. 79
18 H. Czobodziński Bibliografia Armstrong M. (23) Copula catalogue, part 1: Bivariate archimedean copulas, dostępne ( ) na stronie 559_Copula_ catalogue._part_1_bivariate_archimedean_copulas. Brent R. P. (1973) Algorithms for Minimization without Derivatives, Prentice-Hall, Englewood Cliffs, N.J. Chen X., Fan Y. (27) A model selection test for bivariate failure-time data,econometric Theory, 23, ,. Clayton D. G. (1978) A model for association in bivariate life tables and its application in epidemiological studies of familial tendency in chronic disease incidence, Biometrika, 65, Dąbrowska D. M. (1988) Kaplan-Meier estimate on the plane, The Annals of Statistics, 16: Dąbrowska D. M. (1989) Kaplan-Meier estimate on the plane: Weak convergence, LIL and the bootstrap, Journal of Multivariate Analysis, 29, Elektroniczny Podręcznik Statystyki PL (26) StatSoft, Kraków, pl/text book/stathome.html. Frees E. W., Valdez E. A. (1998) Understanding relationships using copulas, North American Actuarial Journal, 2(1), Genest Ch., MacKay J. (1986) The joy of copulas: Bivariate distributions with uniform marginals, The American Statistician, 4, Genest Ch., Rivest L. P. (1993) Statistical inference procedures for bivariate archimedean copulas, Journal of the American Statistical Association, 88, Kaplan E. L., Meier P. (1958) Nonparametric estimation from in complete observations, Journal of the American Statistical Association, 53, Kendall M. G. (1948) Rank correlation methods, Griffin, London. Sklar A. (1959) Fonctions de répartition á n dimensions et leurs marges, Inst. Statist. Univ. Paris, Paris. Wang W., Wells M. T. (2) Model selection and semiparametric inference for bivariate failure-time data, Journal of the American Statistical Association, 95,
19 Komputerowe modelowanie wielowymiarowych danych z wykorzystaniem kopuł COMPUTER MODELLING OF MULTIVARIATE DATA USING COPULAS Abstract: The subject of the paper is constituted by the implementation of the method of modelling of the censored multidimensional data with the use of the copula, proposed in the paper by Wang and Wells (2). The paper provides the basic information on the copulas, the issues related to survival and reliability questions, as well as consideration of selected aspects of modelling of the multidimensional data. Then, details are presented of the implementation of a method for modelling of censored data, along with the results from the numerical experiments, carried out with the artificially generated random data. Keywords: copulas, multidimensional data, censored data, modelling, reliability 81
20
Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie
MIARY ZALEŻNOŚCI OPARTE NA KOPULACH
Studia Ekonomiczne. Zeszyty Naukowe Uniwersytetu Ekonomicznego w Katowicach ISSN 2083-8611 Nr 246 2015 Współczesne Finanse 3 Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie Wydział Matematyczno-Przyrodniczy.
Ekonometria Finansowa II EARF. Michał Rubaszek
Ekonometria Finansowa II EARF Michał Rubaszek 1 Cele - Zapoznanie z charakterystykami szeregów finansowych - Omówienie jednowymiarowych metod liczenia VaR - Omówienie wielowymiarowych metod liczenia VaR
166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
Wykorzystanie funkcji powiązań do pomiaru ryzyka rynkowego. Katarzyna Kuziak
Wykorzystanie funkcji powiązań do pomiaru ryzyka rynkowego Katarzyna Kuziak Cel: łączenie różnych rodzajów ryzyka rynkowego za pomocą wielowymiarowej funkcji powiązań 2 Ryzyko rynkowe W pomiarze ryzyka
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
W4 Eksperyment niezawodnościowy
W4 Eksperyment niezawodnościowy Henryk Maciejewski Jacek Jarnicki Jarosław Sugier www.zsk.iiar.pwr.edu.pl Badania niezawodnościowe i analiza statystyczna wyników 1. Co to są badania niezawodnościowe i
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 4 1 / 23 ZAGADNIENIE ESTYMACJI Zagadnienie
STATYSTYKA
Wykład 1 20.02.2008r. 1. ROZKŁADY PRAWDOPODOBIEŃSTWA 1.1 Rozkład dwumianowy Rozkład dwumianowy, 0 1 Uwaga: 1, rozkład zero jedynkowy. 1 ; 1,2,, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym
Statystyka w przykładach
w przykładach Tomasz Mostowski Zajęcia 10.04.2008 Plan Estymatory 1 Estymatory 2 Plan Estymatory 1 Estymatory 2 Własności estymatorów Zazwyczaj w badaniach potrzebujemy oszacować pewne parametry na podstawie
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Testowanie hipotez statystycznych
9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :
Monte Carlo, bootstrap, jacknife
Monte Carlo, bootstrap, jacknife Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej: http://www.ssc.wisc.edu/~bhansen/econometrics/ Monte Carlo: rozdział 8.8, 8.9 Bootstrap: rozdział
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka
Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną
Testowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu
Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotności, p-wartość i moc testu Wrocław, 01.03.2017r Przykład 2.1 Właściciel firmy produkującej telefony komórkowe twierdzi, że wśród jego produktów
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.
Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ
VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15
VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady
... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).
Egzamin ze Statystyki Matematycznej, WNE UW, wrzesień 016, zestaw B Odpowiedzi i szkice rozwiązań 1. Zbadano koszt 7 noclegów dla 4-osobowej rodziny (kwatery) nad morzem w sezonie letnim 014 i 015. Wylosowano
Testowanie hipotez statystycznych. Wnioskowanie statystyczne
Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy
Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów
Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,
Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski
Modelowanie zależności pomiędzy zmiennymi losowymi Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski P Zmienne losowe niezależne - przypomnienie Dwie rzeczywiste zmienne losowe X i Y
Spis treści 3 SPIS TREŚCI
Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe
TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.
TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe
Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa
Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie
Wnioskowanie statystyczne i weryfikacja hipotez statystycznych
Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.
Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych
Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej
Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1
Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie
6.4 Podstawowe metody statystyczne
156 Wstęp do statystyki matematycznej 6.4 Podstawowe metody statystyczne Spóbujemy teraz w dopuszczalnym uproszczeniu przedstawić istotę analizy statystycznej. W szczególności udzielimy odpowiedzi na postawione
Analiza przeżycia. Wprowadzenie
Wprowadzenie Przedmiotem badania analizy przeżycia jest czas jaki upływa od początku obserwacji do wystąpienia określonego zdarzenia, które jednoznacznie kończy obserwację na danej jednostce. Analiza przeżycia
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 11 i 12 1 / 41 TESTOWANIE HIPOTEZ - PORÓWNANIE
Testowanie hipotez statystycznych. Wprowadzenie
Wrocław University of Technology Testowanie hipotez statystycznych. Wprowadzenie Jakub Tomczak Politechnika Wrocławska jakub.tomczak@pwr.edu.pl 10.04.2014 Pojęcia wstępne Populacja (statystyczna) zbiór,
Przykład 1. (A. Łomnicki)
Plan wykładu: 1. Wariancje wewnątrz grup i między grupami do czego prowadzi ich ocena 2. Rozkład F 3. Analiza wariancji jako metoda badań założenia, etapy postępowania 4. Dwie klasyfikacje a dwa modele
Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Weryfikacja hipotez dotyczących postaci nieznanego rozkładu -Testy zgodności.
W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:
W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: Zmienne losowe skokowe (dyskretne) przyjmujące co najwyżej przeliczalnie wiele wartości Zmienne losowe ciągłe
Wydział Matematyki. Testy zgodności. Wykład 03
Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy
Metody probabilistyczne
Metody probabilistyczne 13. Elementy statystki matematycznej I Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 17.01.2019 1 / 30 Zagadnienia statystki Przeprowadzamy
Własności statystyczne regresji liniowej. Wykład 4
Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności
Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:
Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności
Ważne rozkłady i twierdzenia c.d.
Ważne rozkłady i twierdzenia c.d. Funkcja charakterystyczna rozkładu Wielowymiarowy rozkład normalny Elipsa kowariacji Sploty rozkładów Rozkłady jednostajne Sploty z rozkładem normalnym Pobieranie próby
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
Kolokwium ze statystyki matematycznej
Kolokwium ze statystyki matematycznej 28.05.2011 Zadanie 1 Niech X będzie zmienną losową z rozkładu o gęstości dla, gdzie 0 jest nieznanym parametrem. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę
Wykład 10 Testy jednorodności rozkładów
Wykład 10 Testy jednorodności rozkładów Wrocław, 16 maja 2018 Test Znaków test jednorodności rozkładów nieparametryczny odpowiednik testu t-studenta dla prób zależnych brak normalności rozkładów Test Znaków
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
Wnioskowanie statystyczne. Statystyka w 5
Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających
STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów
STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów
Prawdopodobieństwo i statystyka r.
Prawdopodobieństwo i statystyka 9.06.999 r. Zadanie. Rzucamy pięcioma kośćmi do gry. Następnie rzucamy ponownie tymi kośćmi, na których nie wypadły szóstki. W trzeciej rundzie rzucamy tymi kośćmi, na których
Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego
Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Redakcja i korekta Bogdan Baran Projekt graficzny okładki Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2011 ISBN
PORÓWNANIE METOD ESTYMACJI PARAMETRU W KLASIE WYBRANYCH DWUWYMIAROWYCH KOPULI ARCHIMEDESOWYCH
Studia Ekonomiczne. Zeszyty Naukowe Uniwersytetu Ekonomicznego w Katowicach ISSN 2083-8611 Nr 297 2016 Andrzej Stryjek Szkoła Główna Handlowa w Warszawie Instytut Ekonometrii astryj@sgh.waw.pl PORÓWNANIE
Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).
PRZYKŁADY TESTÓW NIEPARAMETRYCZNYCH. Test zgodności χ 2. Ten test służy testowaniu hipotezy, czy rozważana zmienna ma pewien ustalony rozkład, czy też jej rozkład różni się od tego ustalonego. Tym testem
Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych
dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo
Statystyka i eksploracja danych
Wykład II: i charakterystyki ich rozkładów 24 lutego 2014 Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa, cz. II Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa,
Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11
Testy zgodności Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki Szczecińskiej 27. Nieparametryczne testy zgodności Weryfikacja
Sterowanie wielkością zamówienia w Excelu - cz. 3
Sterowanie wielkością zamówienia w Excelu - cz. 3 21.06.2005 r. 4. Planowanie eksperymentów symulacyjnych Podczas tego etapu ważne jest określenie typu rozkładu badanej charakterystyki. Dzięki tej informacji
MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ
MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ Opracowała: Milena Suliga Wszystkie pliki pomocnicze wymienione w treści
Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4
Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4 Konrad Miziński, nr albumu 233703 31 maja 2015 Zadanie 1 Wartości oczekiwane µ 1 i µ 2 oszacowano wg wzorów: { µ1 = 0.43925 µ = X
Testowanie hipotez statystycznych
Temat Testowanie hipotez statystycznych Kody znaków: Ŝółte wyróŝnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Idea i pojęcia teorii testowania hipotez
Wprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
Statystyka Matematyczna Anna Janicka
Statystyka Matematyczna Anna Janicka wykład IX, 25.04.2016 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Plan na dzisiaj 1. Hipoteza statystyczna 2. Test statystyczny 3. Błędy I-go i II-go rodzaju 4. Poziom istotności,
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.
Opracowała: Joanna Kisielińska ZMIENNE LOSOWE Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R tzn. X: R. Realizacją zmiennej losowej
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy
Prawdopodobieństwo i statystyka r.
Zadanie. Niech (X, Y) ) będzie dwuwymiarową zmienną losową, o wartości oczekiwanej (μ, μ, wariancji każdej ze współrzędnych równej σ oraz kowariancji równej X Y ρσ. Staramy się obserwować niezależne realizacje
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl
Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie
Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie Jarosław Kotowicz Instytut Matematyki Uniwersytet w
Estymacja w regresji nieparametrycznej
Estymacja w regresji nieparametrycznej Jakub Kolecki Politechnika Gdańska 28 listopada 2011 1 Wstęp Co to jest regresja? Przykład regresji 2 Regresja nieparametryczna Założenia modelu Estymacja i jej charakterystyki
Estymacja parametrów w modelu normalnym
Estymacja parametrów w modelu normalnym dr Mariusz Grządziel 6 kwietnia 2009 Model normalny Przez model normalny będziemy rozumieć rodzine rozkładów normalnych N(µ, σ), µ R, σ > 0. Z Centralnego Twierdzenia
KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański
KARTA KURSU (do zastosowania w roku akademickim 2015/16) Nazwa Statystyka 2 Nazwa w j. ang. Statistics 2 Kod Punktacja ECTS* 3 Koordynator Dr hab. Tadeusz Sozański (koordynator, konwersatorium) Zespół
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Testowanie hipotez statystycznych
Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom
Statystyczna analiza awarii pojazdów samochodowych. Failure analysis of cars
Wydawnictwo UR 2016 ISSN 2080-9069 ISSN 2450-9221 online Edukacja Technika Informatyka nr 1/15/2016 www.eti.rzeszow.pl DOI: 10.15584/eti.2016.1.1 ROMAN RUMIANOWSKI Statystyczna analiza awarii pojazdów
STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2
STATYSTYKA Rafał Kucharski Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2 Karl Popper... no matter how many instances of white swans we may have observed, this does not
Prawa wielkich liczb, centralne twierdzenia graniczne
, centralne twierdzenia graniczne Katedra matematyki i ekonomii matematycznej 17 maja 2012, centralne twierdzenia graniczne Rodzaje zbieżności ciągów zmiennych losowych, centralne twierdzenia graniczne
PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
Analiza autokorelacji
Analiza autokorelacji Oblicza się wartości współczynników korelacji między y t oraz y t-i (dla i=1,2,...,k), czyli współczynniki autokorelacji różnych rzędów. Bada się statystyczną istotność tych współczynników.
Wykład 9 Testy rangowe w problemie dwóch prób
Wykład 9 Testy rangowe w problemie dwóch prób Wrocław, 18 kwietnia 2018 Test rangowy Testem rangowym nazywamy test, w którym statystyka testowa jest konstruowana w oparciu o rangi współrzędnych wektora
Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego
Rozdział 1 Statystyki Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego X = (X 1,..., X n ). Uwaga 1 Statystyka jako funkcja wektora zmiennych losowych jest zmienną losową
Detekcja rozkładów o ciężkich ogonach
Detekcja rozkładów o ciężkich ogonach J. Śmiarowska, P. Jamer Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska 24 kwietnia 2012 J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja
Stopę zbieżności ciagu zmiennych losowych a n, takiego, że E (a n ) < oznaczamy jako a n = o p (1) prawdopodobieństwa szybciej niż n α.
Stopy zbieżności Stopę zbieżności ciagu zmiennych losowych a n, takiego, że a n oznaczamy jako a n = o p (1 p 0 a Jeśli n p n α 0, to a n = o p (n α i mówimy a n zbiega według prawdopodobieństwa szybciej
Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym
Wiesława MALSKA Politechnika Rzeszowska, Polska Anna KOZIOROWSKA Uniwersytet Rzeszowski, Polska Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym Wstęp Wnioskowanie statystyczne
ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x
ZJAZD 4 KORELACJA, BADANIE NIEZALEŻNOŚCI, ANALIZA REGRESJI Analiza korelacji i regresji jest działem statystyki zajmującym się badaniem zależności i związków pomiędzy rozkładami dwu lub więcej badanych
Ekonometria. Zajęcia
Ekonometria Zajęcia 16.05.2018 Wstęp hipoteza itp. Model gęstości zaludnienia ( model gradientu gęstości ) zakłada, że gęstość zaludnienia zależy od odległości od okręgu centralnego: y t = Ae βx t (1)
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Biostatystyka, # 3 /Weterynaria I/
Biostatystyka, # 3 /Weterynaria I/ dr n. mat. Zdzisław Otachel Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, p. 221 bud. CIW, e-mail: zdzislaw.otachel@up.lublin.pl
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 4 Wrocław, 17 października 2011 Temat. Weryfikacja hipotez statystycznych dotyczących wartości oczekiwanej w dwóch populacjach o rozkładach normalnych. Model 3. Porównanie średnich
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium JAVA Zadanie nr 2 Rozpoznawanie liter autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z problemem klasyfikacji
b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:
ROZWIĄZANIA I ODPOWIEDZI Zadanie A1. Można założyć, że przy losowaniu trzech kul jednocześnie kolejność ich wylosowania nie jest istotna. A więc: Ω = 20 3. a) Niech: - wśród trzech wylosowanych opakowań
III. ZMIENNE LOSOWE JEDNOWYMIAROWE
III. ZMIENNE LOSOWE JEDNOWYMIAROWE.. Zmienna losowa i pojęcie rozkładu prawdopodobieństwa W dotychczas rozpatrywanych przykładach każdemu zdarzeniu była przyporządkowana odpowiednia wartość liczbowa. Ta
METODY ESTYMACJI PUNKTOWEJ. nieznanym parametrem (lub wektorem parametrów). Przez X będziemy też oznaczać zmienną losową o rozkładzie
METODY ESTYMACJI PUNKTOWEJ X 1,..., X n - próbka z rozkładu P θ, θ Θ, θ jest nieznanym parametrem (lub wektorem parametrów). Przez X będziemy też oznaczać zmienną losową o rozkładzie P θ. Definicja. Estymatorem
Stanisław Cichocki Natalia Nehrebecka. Wykład 7
Stanisław Cichocki Natalia Nehrebecka Wykład 7 1 1. Metoda Największej Wiarygodności MNW 2. Założenia MNW 3. Własności estymatorów MNW 4. Testowanie hipotez w MNW 2 1. Metoda Największej Wiarygodności
Komputerowa Analiza Danych Doświadczalnych
Komputerowa Analiza Danych Doświadczalnych Prowadząca: dr inż. Hanna Zbroszczyk e-mail: gos@if.pw.edu.pl tel: +48 22 234 58 51 konsultacje: poniedziałek, 10-11, środa: 11-12 www: http://www.if.pw.edu.pl/~gos/students/kadd