DYNAMICZNA ESTYMACJA WARUNKOWEGO ROZKŁADU PRAWDOPODOBIEŃSTWA w STRUMIENIOWEJ ANALIZIE DANYCH EKONOMICZNYCH

Wielkość: px
Rozpocząć pokaz od strony:

Download "DYNAMICZNA ESTYMACJA WARUNKOWEGO ROZKŁADU PRAWDOPODOBIEŃSTWA w STRUMIENIOWEJ ANALIZIE DANYCH EKONOMICZNYCH"

Transkrypt

1 DYNAMICZNA ESTYMACJA WARUNKOWEGO ROZKŁADU PRAWDOPODOBIEŃSTWA w STRUMIENIOWEJ ANALIZIE DANYCH EKONOMICZNYCH Daiel Kosiorowski Katedra Statystyki UEK w Krakowie Posiedzeie Rady Wydziału Zarządzaia Kraków

2 PLAN REFERATU. Czym jest strumieiowe przetwarzaie daych. 2. Strumieiowa aaliza daych vs. aaliza ekoometrycza wielowymiarowego procesu stochastyczego. 3. Strumieie daych ekoomiczych modele i zagadieia badawcze (przekleństwo wielowymiarowości iestacjoarość procesu złożoość obliczeiowa procedury statystyczej). 4. Wybrae zagadieia ieparametryczej estymacji warukowego rozkładu prawdopodobieństwa (WRP). 5. Propozycje dyamiczych procedur estymacji WRP. 6. Własości propozycji. 7. Kokluzje i play a przyszłość.

3 WPROWADZENIE. Koieczość szacowaia warukowego rozkładu prawdopodobieństwa bezpośredio lub pośredio pojawia się w większości procedur statystyczych wykorzystywaych w ekoomii credit scorig ubezpieczeia a życie ale także audit fiasowy aaliza wskaźikowa przewidywaie wpływów z podatku VAT progozy iflacji sodaże opiii publiczej itd. 2. Nowe zjawiska w ekoomii jak p. strumieiową aaliza (aalizą o lie) wielkich wielowymiarowych zbiorów daych geerowaych przez złośliwe modele staowią wyzwaie dla statystyków i ekoometryków (Cox Rubi Huber 20). Nowe zjawiska ie przystają do możliwości klasyczej statystyki wywodzącej się z postulatów R. A Fishera z lat 20 ubiegłego wieku. Nasza próba ie ma końca procedura ie może być zbyt złożoa obliczeiowo

4 JAK ROZUMIEĆ STRUMIEŃ DANYCH? Strumień daych może zostać ieformalie zdefiioway jako ciąg obserwacji o ieokreśloej długości (Szewczyk 200). Strumieie daych to geerowae z wysoką prędkością zbiory daych które są wyzwaiem dla systemów obliczeiowych w związku z koieczością ich przetwarzaia magazyowaia oraz wioskowaia co do ich (Gaber 202). Termiologia wywodzi się z teoretyczej iformatyki gdzie strumieie były rozważae po raz pierwszy (zobacz p. Aggerwal 2007 Muthukrisha 2006 Imieliński 20 Idyk 200 ). W ekoomii z wykorzystujemy stochastycze podejście metodologicze odwołujące się do teorii ieliiowych szeregów czasowych i tzw. machie learig. Nasze ispiracje: Dooho D. High-dimesioal Data Aalysis: The Curses ad Blessigs of Dimesioality Mauscript AMS Fa J. Yao Q. Noliear Time Series: Noparametric ad Parametric Methods Spriger New York 2005.

5 Jiaqig Fa David Dooho Muthu Muthukrisha Tomasz Imieliński statystyka + ekoometria teoretycza iformatyka

6 PRZYKŁADY STRUMIENI DANYCH (zaledwie sześć współrzędych )

7 MONITOROWANIE FUNKCJI WIELOWYMIAROWEGO STRUMIENIA DANYCH - NAPREŻĘNIA NA POLSKIM RYNKU AKCJI a podstawie ideksów brażowych Źródło: Obliczeia włase dae Parkiet.

8 STRUMIENIOWA ANALIZA DANYCH VS. ANALIZA EKONOMETRYCZNA Strumieie daych staowią waże źródło wiedzy które umożliwia am podejmowaie decyzje w tzw. czasie rzeczywistym (systemy bezpieczeństwa roboty przemysłowe ale też wypowiedzi w sieci Iteret akcje społecze zapisy ze stacji meteorologiczych W przypadku aalizy procesu stochastyczego powiedzmy { X t } zakładamy ustaloy (ajczęściej czasowy) przedział badaia T powiedzmy [0 ]. Wszelkie asze obliczeia dotyczą tego przedziału wioskujemy a podstawie iformacji zawartej w tym przedziale. W przypadku aalizy strumieia daych ie ustalamy przedziału badaia każda koleja chwila ozacza ową aalizę stochastyczą.

9 Nowe zjawiska w ekoomii takie jak wielowymiarowe fiasowe dae wysokiej częstości hadel elektroiczy przeszukiwaie sieci Iteret za pomocą automatów moitorowaie opiii publiczej sieci teleiformatycze roboty przemysłowe propozycje owych procedur statystyczych które odbiegają od paradygmatu statystyki R. A. Fishera. Trzy reżimy strumieia daych i dwie obserwacje odstające. Moitorowaie strumieia a podstawie ruchomego oka. ZŁOŻONOŚĆ OBLICZENIOWA PROCEDURY POWINNA 32 O ( )!!! Metody DATA MINING to w istocie klasycza statystyka opisowa!!!

10 CECHY CHARAKTERYSTYCZNE STRUMIENIOWEGO PRZETWARZANIA DANYCH EKONOMICZNYCH. Dae geerowae są przez procesy ieliiowe. 2. Strumieie daych cechuje występowaie wielu reżimów. 3. Sygał iesioy przez strumień może pojawiać w ieregularych odstępach czasu oraz powiie być przetwarzay o-lie. Przez sygał rozumiemy relację pomiędzy charakterystykami liczbowymi procesu a ie jako wyik usuięcia tzw. szumu ze strumieia. 4. Aalizujemy strumień a podstawie stale uaktualiaej próby ruchomego oka bądź okie (oka mogą się różić długością jeżeli iteresują as róże skale czasowe częstością odświeżaia ). 5. Strumieie geerują wielkie zbiory wielowymiarowych daych które zawierają obserwacje odstające. W związku z rozmiarem dae te często ie mogą być magazyowae w pamięci komputera.

11 ISTNIEJĄCE PODEJŚCIA DO STRUMIENIOWEJ ANALIZY DANYCH. Techiki dwufazowe (Aggarwal i i. 2007) podsumowaie daych olie z wykorzystaiem mikroklastrów. p. algorytm CluStream bądź algorytm HPStream aaliza skupisk opierająca się o projekcje wielowymiarowych strumiei daych. 2. Techiki wykorzystujące teorię Hoeffdiga Domigos i Hulte (2000) bardzo szybkie machie learig (VFML). Strategia aalizy daych wiąże się z osiągaiem pewego górego ograiczeia dla fukcji straty (p. wyrażającej dokładość oszacowaia średiej) zależej od liczby obserwacji w kolejym kroku algorytmu. 3. Aproksymacja symbolicza (SAX) reprezetacja szeregu czasowego zapropoowaa przez Koegh i i Reprezetacja szeregu czasowego w tzw. przestrzei staów - zalezieie ajczęstszych oraz ajbardziej różiących się wzajemie jego podciągów. Pierwszy krok to zagregowaa aproksymacja po podprzedziałach wartości szeregu (Piecewise Aggregate Approximatio - PAA). Drugi krok to dyskretyzacja symbolicza szeregu agregaty zastępujemy tzw. zakami (Symbolic Discretizatio). W końcowym kroku liczymy odległości pomiędzy zakami. 4. Techiki wieloziariste (ag. graularity based techiques): Zapropoowae przez Gaber i i. (2009) takie modyfikacje techik data miig aby za ich pomocą moża było badać dae pochodzące z różych źródeł (różej częstości wymiaru itd.)

12 MODEL STRUMIENIA DANYCH EKONOMICZNYCH W teoretyczej iformatyce jeżeli wprowadza się model probabilistyczy daych to przeważie jest to model daych iezależych o tym samym rozkładzie główy akcet badawczy to zmiejszeie złożoości obliczeiowej zagadieia przy zadowalającej dokładości wiarygodości teoria grafów kombiatoryka modele graficze przetwarzaie rówoległe W ekoomii w zasadzie rozważmy jedyie probabilistycze modele strumiei odwołujemy się przy tym do teorii procesów iestacjoarych procesów o wielu reżimach. Zakładamy że strumieie mogą zawierać obserwacje odstające różego typu (outliers iliers odstające pod warukiem kokretego reżimu itd.) Model strumieia moża wprowadzić w oparciu o zae w ekoometrii modele szeregów o wielu reżimach p. SETAR FTAR itd. Próby: Kosiorowski (20) Kosiorowski (202a) (202b) Kosiorowski (203a) (203b) (203c) Kosiorowski i Sarska (202) Kosiorowski i Zawadzki (203) pośredio Kosiorowski i Bocia (203) Kosiorowski i Węgrzykiewicz (203).

13 OGÓLNY SCHEMAT DLA STRUMIENIA DANYCH EKONOMICZNYCH CHARME (Coditioal Vector Heteroscedastic Autoregressive Mixture of Experts) (zobacz Stockis i i. 200) to ogólych schemat modelowaia szeregów czasowych o wielu reżimach. W szczególości obejmuje wiele zaych modeli liiowych i ieliiowych jak p. modele autoregresyje modele TAR SETAR FAR GARCH czy SV (Frases i Va Dijk 2000). Modelując strumień za pomocą CHARME umawiamy się że Odczytać sygał iesioy przez strumień = wskazać który z reżimów modelu geeruje dae. Niech X strumień daych ( X... X d ) d X ( X... X d )... ozacza d-wymiarowy Oko W i się w x i o wielkości tz. Wi ( xi... x i). ozacza ciąg puktów kończących

14 W modelu CHARME dyamiką procesu { X t } zawiaduje ukryty łańcuch Q t Markowa { } a skończoej przestrzei staów {2... K }. Model defiiujemy za pomocą rówaia: K X S ( m ( X... X ) ( X... X ) ) b Θ t tk k t t p k t t p t t t k gdzie S tk dla k... K Qt są pewymi fukcjami k oraz S tk 0 w przeciwym wypadku t m k ozaczają zmiee losowe iezależe o tym samym rozkładzie o wartości oczekiwaej zero czło b t Θ t k wiąże się z obserwacjami odstającymi b t jest biarą zmieą losową wskazującą pojawieie się obserwacji odstającej w chwili t oraz Θ t to (losowa) wartość odstająca. Zakładamy że Q t zmieia rzadko swą wartość tz. obserwoway proces podlega temu samemu reżimowi przez względie długi czas zaim astąpi zmiaa reżimu.

15 PRZYKŁADY PROBLEMÓW DO ROZWIĄZANIA Dalej rozważamy jedowymiarowy strumień daych oraz wioskowaie w oparciu o ruchome oko ustaloej długości. Dalsze uogólieie patrz Kosiorowski (202) uogólieia wielowymiarowe patrz Kosiorowski i Sarska (202) (203). PROBLEM : Moitorujemy jedowymiarowy strumień X X2... oraz aszym zadaiem jest wykrycie zmia w bezwarukowym rozkładzie a podstawie ruchomego oka A i W i i 2... tz. zmia X i P( X A) i PROBLEM 2: Moitorujemy jedowymiarowy strumień X X... 2 i aszym zadaiem jest wykryć zmiay w rozkładzie warukowym X i pod warukiem obserwowaego oka W i i 2... tz. zmiay P( X A W x ) A i i i

16 W celu rozwiązaia powyższych problemów skupiamy aszą uwagę a zmodyfikowaym estymatorze Nadaraya Watsoa warukowej dystrybuaty który został zapropooway przez Halla i i. (999). Autorzy założyli że dae dostępe są w formie ściśle stacjoarego Y X procesu stochastyczego {( )} gdzie i i Y i jest skalarem oraz X i jest d- wymiarowym wektorem. Autorzy zapropoowali dwie procedury szacowaia warukowej dystrybuaty F( y x) P( Y y X x) metodę lokalej regresji logistyczej oraz zmodyfikoway estymator Nadaraya-Watsoa które mają lepsze własości statystycze iż zae podejścia lokale i lub ieparametrycze. Ich propozycje ie były jedakże odpore Jak rozumieć odporość estymatora dystrybuaty? i i

17 ESTYMATOR JĄDROWY GĘSTOŚCI PRAWD. (por. Tsybakov 200) Niech X... X ozaczają iezależe zmiee losowe o tym samym rozkładzie o gęstości prawdopodobieństwa f względem miary Lebesque a a. x Pamiętamy że dystrybuatę tej zmieej defiiujemy jako F( x) f( t) dt. Jej odpowiedik z próby to tzw. dystrybuata empiryczą F( x) I( Xi x) i gdzie I() ozacza fukcję wskaźikową. Z mocego prawa wielkich liczb wiemy że a pewo gdy każdego x.. Dlatego też F () x F ( x ) F ( x ) jest zgodym estymatorem x prawie Fx () dla Dla dostateczie małego h 0 ma miejsce aproksymacja gęstości fx () fx () F( x h) F( x h) 2h.

18 Zastępując dystrybuatę F poprzez jej oszacowaie F możemy zdefiiować tzw. estymator Roseblatta ˆ R F ( ) ( ) () x h F x h f x 2 h. Możemy zapisać te estymator w astępującej postaci gdzie ˆ R X ( ) ( ) i f x I x h X x h K0 2h h h K 0 ( u) 2 I( u ) i i i. x Poprzez proste uogólieie mamy ˆ f () x K h i X i h x gdzie K : jest całkowalą fukcją spełiającą K( u) du (jądrem). Fukcja x fˆ () x Parzea Roseblata. azywaa jest estymatorem jądrowym bądź estymatorem

19 Przykłady wykorzystywaych jąder: K( u) I( u ) 2 (jądro prostokąte) 3 2 K( u) ( u ) I( u ) 4 (jądro Epaechikowa) 2 K( u) exp u / 2 2

20 OCENA JAKOŚCI ESTYMATORA JĄDROWEGO Podstawową miarą jakości estymatora jądrowego jest jego błąd średiokwadratowy (ryzyko średiokwadratowe) liczoe w dowolym lecz ustaloym pukcie x 0 : MSE MSE( x ) E fˆ ( x ) f( x ) 0 p gdzie E p ozacza wartość oczekiwaą liczoą względem rozkładu (... ) X X. Uwaga: MSE= obciążeie + wariacja estymatora ˆ f w pukcie x 0. Waże globale kryterium to scałkoway błąd średiokwadratowy MISE E fˆ ( x ) f ( x ) dx MSE ( x ) dx p 2.

21

22 ESTYMATOR JĄDROWY W PRZYPADKU WIELOWYMIAROWYM Dla x d d potrzebujemy jądra K : d Najczęściej korzysta się z tzw. jądra produktowego. gdzie K j do współrzędej ormie wektora : j K( u) K ( u ) j d to jedowymiarowe jądra szerokości pasm oraz h h h K( u) K( u ) d j j h j w odiesieiu bądź stosuje się jądra określoych a dla stosowie wybraej ormy a W awiązaiu do aalizy szeregów czasowych ajczęściej stosujemy jądra produktowe estimator gęstości ma wówczas postać d. x f() x K h h d ij j i j j j x j gdzie h ˆ h wiąże się z oszacowaiem odchyleia std. dla j-tej współrzędej j j (oszacowaia jądrowe i szeregi czasowe - zjawisko ag. whiteig by a widowig priciple zobacz Hart 994)

23 PRZYKŁAD: OSZACOWANIE JĄDROWE 2D wiek vs. log(płaca) we Włoszech

24 SZACOWANIE WARUNKOWEJ GĘSTOŚCI Y X Niech ( ) z y gęstości fyx ( ) oraz fx () x Wtedy warukowa gęstość x d d ozacza wektor losowy o łączej iech będzie gęstością brzegową X. gy ( X x) fy ( x) fx () x może być szacowaa poprzez podstawieie estymatora jądrowego do liczika i miaowika wzoru a. Wybierając fukcje jądrowe g( y x) K oraz szerokości pasm gęstości warukowej. d h i odpowiedio h K( y x) K ( y) K( x) uzyskujemy estymator jądrowy g i i h y y xi x h K K h ( y x ). xi x K h i

25 PRZYKŁADY SZACOWANIA GĘSTOŚCI WARUNKOWEJ Kluczową kwestią w estymacji jądrowej jest właściwy wybór szerokości pasma wybór jądra ma zaczeie drugorzęde (por Tsybakow 202 Krzyśko 202 Wad & Johes 996)

26 SZEREG DOBRYCH METOD WYBORU PASMA JEST CZĘSTO BARDZO ZŁOŻONYCH OBLICZENIOWO BEZUŻYTECZNYCH W PRZYPADKU ANALIZY STRUMIENI (ag. - cross validatio (uwiarygodiaie krzyżowe) pilot desity method (metoda podstawień) rules of thumb (reguły kciuka) referece desity methods )

27 ODPORNOŚĆ JĄDROWEGO ESTYMATORA GĘSTOŚCI W przypadku wielu ekoomiczych zbiorów daych często apotykamy obserwacje odbiegające od większości daych. Takie obserwacje mogą powodować trudości poieważ mogą wpływać a wyiki aalizy ekoomiczej. Jedym z celów statystyki odporej jest wykrywaie obserwacji odstających poprzez poszukiwaie modelu dopasowywaych do większości obserwacji. Przypuśćmy że mamy obserwacje pięciu miesięczych wyagrodzeń (w zł) w Polsce w 20 roku: 3225; 303; 2944; 300; 23 oraz aszym celem jest oszacowaie prawdziwej wartości cetralego wyagrodzeia średia = 2699; media = 300; SD=886.63; MAD=85.23 X { X... X } SD / ( Xi X ) 2 MAD MED X MED{ X } i i

28 ODPORNOŚĆ ZWYKŁEGO WSPÓŁCZYNNIKA KORELACJI Z PRÓBY 20 obserwacji wygeerowaych z dwuwymiarowego rozkładu ormalego o jedostkowych wariacjach i wsp. korelacji 0.8. Wsp. korelacji z próby wyosi 0.8. Na rysuku B występują dwie obserwacje odstające (tz. 0% daych): zamieioo pozycje dwóch puktów. Zwykłe oszecowaie wsp. korelacji spada teraz do (przykład Maroy i Yohai a). A B Pomiar odporości ogóle podejście Getoa i Lucasa (2002) Szukamy frakcji obserwacji odstających która sprawia że estymator bądź szerzej pewa miara jakości procedury przyjmuje jedyie skończoą liczbę wartości pomimo kotiuum możliwych realizacji próby.

29 ODPORNOŚĆ ESTYMATORA JĄDROWEGO GĘSTOŚCI? Pomiar odporości w kategoriach miary dobroci estymatora fˆ - błędu średiokwadratowego w dowolym ustaloym pukcie x 0? Jedakże jeżeli dae geerowae są przez mieszaię rozkładów to estymator jądrowy ujmuje wszystkie składowe mieszaiy co jeśli chcielibyśmy pomiąć jedą ze składowych mieszaiy?

30 PROPOZYCJE: W duchu propozycji Hall i i. (999) iech i p p x i i () dla ozacza wagi (fukcje daych x... x jak rówież x) o tej własości że każde p i 0 i p ( x)( X x) K ( X x) 0 i i h i i Możemy zdefiiować astępujące estymatory bezwarukowej p i. oraz warukowej gęstości gy ( x) f ( x) pi( x) Kh( xi x) i h i gdzie K jest jądrem (p. Gaussowskim) jedowymiarowymi h K ( y y) p ( y x) K ( x x) i i i h i p ( x) K ( x x) i h i Kh () h K ( / h ) K ozacza jądro d-wymiarowe d 2 h K h jest jądrem h to szerokość pasma.

31 Możemy uodporić podejście Hall i i. (999) wybierając wagi będącej wartościami zmodyfikowaej fukcji głębi z próby. pi () x Głębia daych to sposób pomiaru głębi bądź odstawaia daego puktu względem wielowymiarowej chmury daych bądź wielowymiarowego rozkładu prawdopodobieństwa który tę chmurę geeruje. Statystycza fukcja głębi umożliwia porządkowaie obserwacji a podstawie ich odstawaia od cetrum. Taki porządek umożliwia pomiar wielu cech wielowymiarowej populacji wielowymiarowej skośości wielowymiarowej kurtozy propoowaie wielowymiarowych testów Wilcoxoa wykresów kwatyl-kwatyl wielowymiarowych wykresów pudełkowych itd.

32 Odwiedź: Depth Procedures R package {depthproc} 202 https://r-forge.r-project.org/projects/depthproc/

33 d Niech X { X... X } ozacza próbę losową z rozkładu G () w. Niech zachodzi oraz I() ozacza fukcję wskaźikową tz. IA ( ) 0 w przeciwym wypadku. IA ( ) d jeżeli A Dyspoując próbą X defiiujemy głębię symplicjalą z próby (głębię Liu) puktu x d za pomocą D( x X ) I( x s[ Xi... X ]) i d d (*) gdzie (*) przebiega wszystkie możliwe podzbiory X wielkości d s[ X... X ] ozacza domkięty sympleks z wierzchołkami i i d X... X. i i d

34 Prof. Regia Y. Liu (za jej sprawą statystycze fukcje głębi zyskały rozgłos)

35 Gdy rozkład G defiiujemy jako jest zay wtedy głębię symplicjalą x względem G D( x G) P { x s[ X... X ]} G d gdzie d obserwacjami losowymi z G s ozacza sympleks. X... Xd są

36 o PROPOZYCJA : Niech wielkości Wj { x j... x j} ozacza oko ze strumieia w chwili j l... W celu dyamiczej estymacji bezwarukowego rozkładu strumieia determiowaej za pomocą fukcji gęstości f propoujemy liczyć w kolejych chwilach f ( x) K ( x x) D( x W ) j h ij j i j l... gdzie K ozacza fukcję jądrową Kh () h K( / h ) D( x W j ) ozacza zmodyfikowaą głębię z próby x x ij W j i... j l...

37 PROPOZYCJA 2: Niech ozacza N Wj N { xj N... xj N } okie ze strumieia o długości Wj { x j... x j} j l... kn N k. Niech N X j {( x... x )...( x... x )} j k N j N j k j j j N { x... x } N j j N j j Y { x... x x } j j N { y... y }. W celu dyamiczej estymacji warukowego rozkładu X j determiowaego przez f j pod warukiem przeszłości ( X... X ) j j k k 23 propoujemy liczyć w kolejych chwilach gdzie f ( y ( X... X ) x) f j j j j k N j N N j h K yi y D y Yj j K h h i i N N j D x Xj Kh( xi x) i ( ) ( x)( X ) ( x x) jest zmodyfikowaym estymatore jądrowym K () K ( / ) ( ) h h h D jest zmodyfikowaą głębią z próby. f j j l... K () to jądro

38 W przypadku obu propozycji początkowo w celu wyboru szerokości pasma h wykorzystywaliśmy wariat uwiarygodiaia krzyżowego (cross-validatio) a podstawie Hall i i stosoway do ajbardziej cetralych puktów oka względem pewej próby referecyjej tz.{: ( ) } g Y ozacza próbę referecyją N j y Y D y Y D( ) to fukcja głębi. g gdzie Jedakże w związku z wielką złożoością procedury zdecydowaliśmy się wykorzystywać dyamiczą regułę kciuka i h opt = MAD{W i } /4 i= która prowadziła do zadowalających wyików.

39 WŁASNOŚCI PROPOZYCJI - SYMULACJE MONTE CARLO Geerowao po 500 razy trajektorie złożoe z 5000 obs. z wielu zaych w ekoometrii liiowych i ieliiowych modeli daych. Rozpatrywao ruchome oka o ustaloej długości obs. oraz próby zawierające do 5% tzw. addytywych obs. odstających (AO). X. SETAR MODEL t X X 3 t t t 0.9X X 3 t t t ~ t to iezależe zm. losowe o rozkładzie Studeta t(3) każda. Y t 0 0.9Y Y 3 t t t 0.9Y Y 3 t t t

40 X 2. MODELE CHARME złożoe z dwóch podmodeli AR()-GARCH() 5 0.X t t t t tzt t 0.75 t gdzie Z t ~ X rozkład ormaly N(0)skośy rozkład Studeta T skośy rozkład ormaly SN(0) skośy rozkład GED.

41 WYNIKI SYMULACJI (wybór) MODEL SETAR i szacowaie rozkładu bezwarukowego

42 SETAR + 5% OBS. ODSTAJĄCYCH TYPU AO SETAR + 5% OBS. ODSTAJĄCYCH TYPU AO

43 MODEL 2 AR()-GARCH() i szacowaie rozkładu warukowego Cod skewed t(4) Cod ormal N(0) Cod skewed N(0)

44 CHARME: przeskoki pomiędzy AR()-GARCH() z rozkładem warukowym skośym T(4) i tym samym AR()- GARCH() ale z warukowym rozkładem N(0)

45 AR()-GARCH() ze skośym T(4) + 5% odstających AO AR()-GARCH() ze skośym T(4) + 0% odstających AO

46 PODSUMOWANIE I DALSZE STUDIA ZAGADNIENIA Jeżeli złożoość procedury 32 O ( ) wtedy uzaje się ją za zbyt złożoą do aalizy wielkich zbiorów daych tym samym do aalizy ekoomiczych strumiei daych. Niestety wiele propozycji odporych procedur statystyczych cechuje wielka złożoość obliczeiowa. jedakże Assume you are cofroted with a huge data set (0 0 bytes or 0 gigabytes). If a meaigful aalysis is possible with a % radom subsample the problem is solved - we are back to large sets. Except for validatio ad cofirmatio we might ot eve eed the other 99%. P. Huber (20) - ostatio pojawia się szereg obiecujących podejść do przybliżoego obliczaia fukcji głębi oraz do przybliżoego obliczaia optymalej szerokości pasma wygładzaia. Propozycje Kosiorowski i Zawadzki (203) Kosiorowski i Sarska (203) Kosiorowski Rydlewski i Sarska (203).

47 oraz koleja myśl I probably sped more time turig messy source data ito somethig usable tha I do o the rest of the data aalysis process combied. P. Warde (20) - czyżby reesas tzw. podejścia merytoryczego (Zeliaś 998) w statystyczej aalizie daych? - być może kolejy wymiar stosowaia tzw. subiektywej aalizy bayesowskiej (Press 2009)? DZIĘKUJĘ!

48 WYBÓR LITERATURY [] Aggerwal Ch. C. (ed.) Data Streams Models ad Algorithms Spriger New York [2] Bocia M. Kosiorowski D. Węgrzykiewicz A. Zawadzki Z. Depth Procerures R package {depthproc} 202 https://r-forge.r-project.org/projects/depthproc/ [retrieved: Feb. 203] [3] Dooho D. High-dimesioal Data Aalysis: The Curses ad Blessigs of Dimesioality Mauscript [4] Fa J. Yao Q. Noliear Time Series: Noparametric ad Parametric Methods Spriger New York [5] Frases P. H. Va Dijk D. (2000) No-liear Time Series Models i Empirical Fiace Cambridge: Cambridge Uiversity Press [6] Hart J.D. (994). Smoothig time-depedet data: a survey of data drive methods. Joural of Noparametric Statistics [7] Gaber M. M. (202) Advaces i data stream miig WIREs Data Miig Kowl Discov 202 2: doi: 0.002/widm.52 [8] Geto M. G. Lucas A. Comprehesive Defiitios of Breakdow Poits for Idepedet ad Depedet Observatios Joural of the Royal Statistical Society Series B [9] Hall P. Rodey C. L. ad Yao Q. Methods for Estimatig a Coditioal Distributio Fuctio. Joural of the America Statistical Associatio vol pp [0] Hall P. Racie J. Li Q Cross-Validatio ad the Estimatio of Coditioal Probability Desities Joural of the America Statistical Associatio vol. 99 pp

49 [] Hahsler M. Duhamr H. M. EMM: Extesible Markov Model for Data Stream Clusterig i R Joural of Statistical Software vol pp [2] Härdle W. Hautsch N. ad Overbeck L. Applied Quatitative Fiace 2d editio Spriger Heidelberg [3] Jacod J. Shiryaev A.N. Limit Theorems for Stochastic Processes Secod ed. Spriger-Verlag New York [4] Kosiorowski D. Studet Depth i Robust Ecoomic Data Stream Aalysis Colubi A. (Ed.) Proceedigs COMPSTAT 202 ISI/IASC 202 pp [5] Kosiorowski D. Sarska M. Robust Moitorig of a Multivariate Data Stream 203 upublished https://r-forge.r-project.org/projects/depthproc/ [retrieved: Feb. 203] [6] Li J. Liu R. Y. New Noparametric Tests of Multivariate Locatios ad Scales Usig Data Depth. Statistical Sciece vol pp [7] Maroa R. A. Marti R. D. Yohai V. J. Robust Statistics - Theory ad Methods. Chichester: Joh Wiley & Sos Ltd [8] Muthukrisha S. Data Streams: Algorithms ad Applicatios Now Publishers [9] Ramsay J. O. Hooker G. Graves S. Fuctioal Data Aalysis with R ad Matlab New York Spriger [20] Racie J. S. (2008) Noparametric Ecoometrics: A Primer Foudatios ad Treds i Ecoometrics vol 3 o 88. [2] Wad M. P. Joes M. C. (995) Kerel Smoothig Moographs o Statistics ad Applied Probability 60 Chapma ad Hall Lodo

50 [22] Shalizi C. R. Kotorovich A. Almost Noe of the Theory of Stochastic Processes A Course o Radom Processes [Feb. 203] [23] Serflig R. Depth Fuctios i Noparametric Multivariate Iferece I: Liu R.Y. Serflig R. Souvaie D. L. (Eds.): Series i Discrete Mathematics ad Theoretical Computer Sciece AMS vol pp [24] Stockis J-P.Frake J. Kamgaig J. T. O Geometric Ergodicity of CHARME Models Joural of the Time Series Aalysis vol pp [25] Szewczyk W. Streamig Data Wiley Iterdiscipliary Rev.: Computatioal Statistics vol [26] Torti F. Perrotta D. Atkiso A. C Riai M. Bechmark Testig of Algorithms for Very Robust Regressio Computatioal Statistics ad Data Aalysis vol pp [27] Tsybakov A. B. (200) Itroductio to Noparametric Estimatio Spriger New York. [28] Shao W. ZuoY. (202). Simulated Aealig for Higher Dimesioal Projectio Depth. Computatioal Statistics ad Data Aalysis vol pp

METODY ILOŚCIOWE W BADANIACH EKONOMICZNYCH

METODY ILOŚCIOWE W BADANIACH EKONOMICZNYCH METODY ILOŚCIOWE W BADANIACH EKONOMICZNYCH QUANTITATIVE METHODS IN ECONOMICS Vol. XI, No. Szkoła Główa Gospodarstwa Wiejskiego Wydział Zastosowań Iformatyki i Matematyki Katedra Ekoometrii i Statystyki

Bardziej szczegółowo

5. METODY MONTE CARLO A SYMULACJA POTOKÓW RUCHU (wg Drew, 1968)

5. METODY MONTE CARLO A SYMULACJA POTOKÓW RUCHU (wg Drew, 1968) 5. MEODY MONE CARLO A SYMULACJA POOKÓW RUCHU (wg Drew, 968) 5.. Wprowadzeie Moeta jest rzucaa aż do osiągięcia orła. Jeżeli to zdarzy się w pierwszym rzucie, gracz otrzymuje zł od baku. Jeżeli poraz pierwszy

Bardziej szczegółowo

BADANIA DOCHODU I RYZYKA INWESTYCJI

BADANIA DOCHODU I RYZYKA INWESTYCJI StatSoft Polska, tel. () 484300, (60) 445, ifo@statsoft.pl, www.statsoft.pl BADANIA DOCHODU I RYZYKA INWESTYCJI ZA POMOCĄ ANALIZY ROZKŁADÓW Agieszka Pasztyła Akademia Ekoomicza w Krakowie, Katedra Statystyki;

Bardziej szczegółowo

Metody oceny projektów inwestycyjnych

Metody oceny projektów inwestycyjnych Metody ocey projektów iwestycyjych PRZEDMIIOT : EFEKTYWNOŚĆ SYSTEMÓW IINFORMATYCZNYCH Pla wykładu Temat: Metody ocey projektów iwestycyjych 5 FINANSOWE METODY OCENY PROJEKTÓW INWESTYCYJNYCH... 4 5.1. WPROWADZENIE...

Bardziej szczegółowo

2.2 Funkcje wyceny. Wśród autorów przeważa pogląd, iż wycenie można przypisać cztery podstawowe funkcje:

2.2 Funkcje wyceny. Wśród autorów przeważa pogląd, iż wycenie można przypisać cztery podstawowe funkcje: . Cele wycey przedsiębiorstw. Przedsiębiorstwa w rozwiiętej gospodarce rykowej są powszechie przedmiotem różorakich trasakcji hadlowych co implikuje potrzebę uzyskaia szacuków ich wartości przy pomocy

Bardziej szczegółowo

ASYMPTOTYCZNIE EFEKTYWNA STRATEGIA ODRZUCANIA GIER OBARCZONYCH ZBYT DUŻYM RYZYKIEM

ASYMPTOTYCZNIE EFEKTYWNA STRATEGIA ODRZUCANIA GIER OBARCZONYCH ZBYT DUŻYM RYZYKIEM PRZEGLĄD STATYSTYCZNY R. LVII ZESZYT 00 EWA DRABIK ASYMPTOTYCZNIE EFEKTYWNA STRATEGIA ODRZUCANIA GIER OBARCZONYCH ZBYT DUŻYM RYZYKIEM. WSTĘP W iektórych grach bilas ryzyka, strat i zagrożeń przewyższa

Bardziej szczegółowo

Wybrane estymatory parametrów prostej regresji w strumieniowym przetwarzaniu danych

Wybrane estymatory parametrów prostej regresji w strumieniowym przetwarzaniu danych Uniwersytet Ekonomiczny w Krakowie Praca licencjacka Wybrane estymatory parametrów prostej regresji w strumieniowym przetwarzaniu danych Zygmunt Zawadzki Kierunek: Finanse i Rachunkowość Specjalność: Rynki

Bardziej szczegółowo

PERSPECTIVES OF STATISTICAL METHODS IN DESIGN OF TRADING STRATEGIES FOR FINANCIAL MARKETS USING HIERARCHICAL STRUCTURES AND REGULARIZATION

PERSPECTIVES OF STATISTICAL METHODS IN DESIGN OF TRADING STRATEGIES FOR FINANCIAL MARKETS USING HIERARCHICAL STRUCTURES AND REGULARIZATION STUDIA INFORMATICA 2013 Volume 34 Number 2A (111) Alia MOMOT Politechika Śląska, Istytut Iformatyki Michał MOMOT Istytut Techiki i Aparatury Medyczej ITAM PERSPEKTYWY ZASTOSOWAŃ METOD STATYSTYCZNYCH W

Bardziej szczegółowo

Opracowanie i analiza materiału statystycznego 419[01].O1.04

Opracowanie i analiza materiału statystycznego 419[01].O1.04 MINISTERSTWO EDUKACJI NARODOWEJ Ewa Kawczyńska-Kiełbasa Opracowaie i aaliza materiału statystyczego 419[01].O1.04 Poradik dla uczia Wydawca Istytut Techologii Eksploatacji Państwowy Istytut Badawczy Radom

Bardziej szczegółowo

Podpis elektroniczny. zastosowanie i korzyści

Podpis elektroniczny. zastosowanie i korzyści Podpis elektroiczy sposób działaia, zastosowaie i korzyści Miisterstwo Gospodarki Warszawa 2005 Nadzór merytoryczy: Departamet Przedsiębiorczości Miisterstwa Gospodarki Autorzy: Artur Kruk Uizeto Techologies

Bardziej szczegółowo

ZESZYTY NAUKOWE POLITECHNIKI GDAŃSKIEJ

ZESZYTY NAUKOWE POLITECHNIKI GDAŃSKIEJ ZESZYTY NAUKOWE POLITECHNIKI GDAŃSKIEJ Nr 573 Ekoomia XXXIX 2001 BŁAŻEJ PRUSAK Katedra Ekoomii i Zarządzaia Przedsiębiorstwem METODY OCENY PROJEKTÓW INWESTYCYJNYCH Celem artykułu jest przedstawieie metod

Bardziej szczegółowo

Rozdział. Grzegorz Michalski. Innowacyjne podejście do zarządzania aktywami bieżącymi

Rozdział. Grzegorz Michalski. Innowacyjne podejście do zarządzania aktywami bieżącymi Rozdział Grzegorz Michalski Iowacyje podejście do zarządzaia aktywami bieżącymi 1. Wstęp Kapitał pracujący etto, czyli aktywa bieżące pomiejszoe o iefiasowe pasywa bieżące, to środki, które przedsiębiorstwo

Bardziej szczegółowo

Dlaczego problem jakości energii elektrycznej w systemach okrętowych zasługuje na szczególną uwagę?

Dlaczego problem jakości energii elektrycznej w systemach okrętowych zasługuje na szczególną uwagę? Jausz Midykowski Akademia Morska w Gdyi, Katedra Elektroeergetyki Okrętowej Dlaczego problem jakości eergii elektryczej w systemach okrętowych zasługuje a szczególą uwagę? Streszczeie. W pracy przedstawioo

Bardziej szczegółowo

Analiza drgań wybranych dźwigarów powierzchniowych metodą elementów brzegowych

Analiza drgań wybranych dźwigarów powierzchniowych metodą elementów brzegowych a prawach rękopisu Istytut Iżyierii Lądowej Politechiki Wrocławskiej Aaliza drgań wybraych dźwigarów powierzchiowych metodą elemetów brzegowych Raport serii PRE r 5/ Praca doktorska autor mgr iż. Jacek

Bardziej szczegółowo

euro info Program LIFE dla małych i średnich przedsiębiorstw Wschód ISSN 1505-781X przedsiębiorstwa na rynkach Afryki Południowej

euro info Program LIFE dla małych i średnich przedsiębiorstw Wschód ISSN 1505-781X przedsiębiorstwa na rynkach Afryki Południowej listopad (157) 2014 ISSN 1505-781X euro ifo dla małych i średich przedsiębiorstw www.ee.org.pl Marketig Małe i średie iteretowy przedsiębiorstwa a rykach Afryki Połudiowej Program LIFE Iowacyje startupy

Bardziej szczegółowo

Nieparametryczne estymatory jądrowe regresji w zastosowaniach ekonomicznych

Nieparametryczne estymatory jądrowe regresji w zastosowaniach ekonomicznych Uniwersytet Ekonomiczny w Krakowie Praca magisterska Nieparametryczne estymatory jądrowe regresji w zastosowaniach ekonomicznych Anna Węgrzynkiewicz Kierunek: Informatyka i Ekonometria Specjalność: Modelowanie

Bardziej szczegółowo

Czynnik czasu a modyfikacja dynamicznych miar oceny efektywności inwestycji

Czynnik czasu a modyfikacja dynamicznych miar oceny efektywności inwestycji ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO r 803 Fiase, Ryki Fiasowe, Ubezpieczeia r 66 (2014) s. 111 121 Czyik czasu a modyfikacja dyamiczych miar ocey efektywości iwestycji Jarosław Kaczmarek * Streszczeie:

Bardziej szczegółowo

Entropia w układach dynamicznych

Entropia w układach dynamicznych Etropia w układach dyamiczych Wstęp Środowiskowe studia doktorackie Uiwersytet Jagielloński Kraków, marzec-kwiecień 203 Tomasz Dowarowicz Część II Etropia topologicza i zasada wariacyja Zaczijmy od początku.

Bardziej szczegółowo

Zarządzanie finansami

Zarządzanie finansami STOWARZYSZENIE KSIĘGOWYCH W POLSCE ODDZIAŁ W POZNANIU Zarządzaie fiasami DR LESZEK CZAPIEWSKI - POZNAŃ - WARTOŚĆ PIENIĄDZA W CZASIE Pieiądze posiadają określoą wartość. Wartość w diu dzisiejszym omialej

Bardziej szczegółowo

BIULETYN MATURALNY NR 4 CENTRALNEJ KOMISJI EGZAMINACYJNEJ MATEMATYKA

BIULETYN MATURALNY NR 4 CENTRALNEJ KOMISJI EGZAMINACYJNEJ MATEMATYKA BIULETYN MATURALNY NR 4 CENTRALNEJ KOMISJI EGZAMINACYJNEJ MATEMATYKA SPIS TREŚCI Rozdział I O egzamiie... Rozdział II Elemety matematyki fiasowej dr hab. Michał Szurek... 6 Rozdział III Wzory... 9 Rozdział

Bardziej szczegółowo

Obligacje indeksowane do inflacji

Obligacje indeksowane do inflacji Szkoła Główa Hadlowa w Warszawie Studium Dyplomowe Kieruek: Fiase i Bakowo Piotr urawski Nr Albumu: 2400 Obligacje ideksowae do iflacji Praca magisterska apisaa w Katedrze Skarbowoci pod kierukiem aukowym

Bardziej szczegółowo

Zarządzanie ryzykiem finansowym w przedsiębiorstwach transportowych i spedycyjnych

Zarządzanie ryzykiem finansowym w przedsiębiorstwach transportowych i spedycyjnych Zeo Marciiak Zarządzaie ryzykiem fiasowym w przedsiębiorstwach Szkoła Główa Hadlowa Kolegium Gospodarki Światowej Istytut Polityki Hadlu Zagraiczego i Studiów Europejskich Warszawa SPIS TREŚCI. SYSTEM

Bardziej szczegółowo

Profilaktyka instytucjonalna

Profilaktyka instytucjonalna RAPORT Z BADANIA: Profilaktyka istytucjoala W WOJEWÓDZTWIE ŚLĄSKIM Katowice, 9 wrzesień 2014 r. Projekt 1.16 Koordyacja a rzecz aktywej itegracji jest współfiasoway ze środków Uii Europejskiej w ramach

Bardziej szczegółowo

Zastosowanie modeli czynnikowych w zarządzaniu portfelowym ryzykiem kredytowym na przykładzie kredytów hipotecznych i gotówkowych

Zastosowanie modeli czynnikowych w zarządzaniu portfelowym ryzykiem kredytowym na przykładzie kredytów hipotecznych i gotówkowych MBA. CE 5/202 Artuł 3 Maagemet ad Busiess Admiistratio. Cetral Europe 5/202 (8): s. 3 28, ISSN 2084 3356, Copright b Aademia Leoa Koźmińsiego Zastosowaie modeli cziowch w zarządzaiu portfelowm rziem redtowm

Bardziej szczegółowo

Historia tworzenia pewnej spółdzielni Zlecanie zadań podmiotom ekonomii społecznej Dla przedsiębiorstw społecznych jest Targes.pl

Historia tworzenia pewnej spółdzielni Zlecanie zadań podmiotom ekonomii społecznej Dla przedsiębiorstw społecznych jest Targes.pl Historia tworzeia pewej spółdzieli Zlecaie zadań podmiotom ekoomii społeczej Dla przedsiębiorstw społeczych jest Targes.pl lipiec r 2 (146) 2012 rok XVI OD REDAKCJI Ekoomia społecza to idea, którą warto

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA Będlewo 2014

STATYSTYKA MATEMATYCZNA Będlewo 2014 G XL Konferencja STATYSTYKA MATEMATYCZNA Będlewo 2014 Będlewo, 1-5 grudnia 2014 Organizatorzy konferencji Komisja Statystyki Matematycznej Komitetu Matematyki PAN Międzynarodowe Centrum Matematyczne im.

Bardziej szczegółowo

OCENA DOKŁADNOŚCI GLOBALNYCH MODELI GEOPOTENCJAŁU EGM96 I EGM08 NA OBSZARZE DOLNEGO ŚLĄSKA 1

OCENA DOKŁADNOŚCI GLOBALNYCH MODELI GEOPOTENCJAŁU EGM96 I EGM08 NA OBSZARZE DOLNEGO ŚLĄSKA 1 Acta Sci. Pol., Geodesia et Descriptio Terrarum 8(1) 2009, 19-30 OCENA DOKŁADNOŚCI GLOBALNYCH MODELI GEOPOTENCJAŁU EGM96 I EGM08 NA OBSZARZE DOLNEGO ŚLĄSKA 1 Marek Trojaowicz Uiwersytet Przyrodiczy we

Bardziej szczegółowo

XXXIII Konferencja Statystyka Matematyczna Wisła 2007

XXXIII Konferencja Statystyka Matematyczna Wisła 2007 XXXIII Konferencja Statystyka Matematyczna Wisła 2007 3-7 grudnia 2007 Optymalny wybór pary statystyk porządkowych do konstrukcji obszaru ufności dla parametrów położenia i skali Magdalena Alama-Bućko

Bardziej szczegółowo

Wybór systemu klasy ERP metod AHP

Wybór systemu klasy ERP metod AHP BIULETYN INSTYTUTU SYSTEMÓW INFORMATYCZNYCH 5 3-22 (200) Wybór systemu klasy ERP metod AHP A. CHOJNACI, O. SZWEDO e-mail: adrzej.chojacki@wat.edu.pl Wydzia Cyberetyki WAT ul. S. aliskiego 2, 00-908 Warszawa

Bardziej szczegółowo

euro info Program LIFE dla małych i średnich przedsiębiorstw polskiego eksportu ISSN 1505-781X walory regionu czynnikiem rozwoju przedsiębiorczości

euro info Program LIFE dla małych i średnich przedsiębiorstw polskiego eksportu ISSN 1505-781X walory regionu czynnikiem rozwoju przedsiębiorczości wrzesień (155) 2014 ISSN 1505-781X euro ifo dla małych i średich przedsiębiorstw www.ee.org.pl Marketig Marka regioala. iteretowy walory regiou czyikiem rozwoju przedsiębiorczości Program LIFE Niezamówioa

Bardziej szczegółowo