Zastosowanie teorii wartości ekstremalnych w prognozowaniu ostrzegawczym dla ciągu niezależnych zmiennych o rozkładzie normalnym
|
|
- Natalia Wojciechowska
- 8 lat temu
- Przeglądów:
Transkrypt
1 239 Zeszyty Naukowe Wyższej Szkoły Bankowej we Wrocławiu Nr 2(34)/2013 Łukasz Kuźmiński Uniwersytet Ekonomiczny we Wrocławiu Zastosowanie teorii wartości ekstremalnych w prognozowaniu ostrzegawczym dla ciągu niezależnych zmiennych o rozkładzie normalnym Streszczenie. Artykuł dotyczy zastosowań teorii granicznych rozkładów dla ekstremów w prognozach ostrzegawczych dla ciągu zmiennych losowych o rozkładzie normalnym. W początkowej części zawiera elementy teorii dotyczącej statystyk pozycyjnych, natomiast w dalszej przedstawione są podstawowe twierdzenia związane z teorią rozkładów typów ekstremalnych i dziedzin przyciągania. Na koniec zaprezentowano badania empiryczne, w których budowany jest model prognoz ostrzegawczych dla charakterystyk hydrologicznych. Wykorzystane w pracy dane dotyczą stanów wód na dwóch wybranych rzekach Dolnego Śląska. Słowa kluczowe: statystyki pozycyjne, dystrybuanta graniczna, typy rozkładów ekstremalnych, prognoza ostrzegawcza, charakterystyki hydrologiczne. Wstęp Ekstremalne wartości określonych charakterystyk w różnych dziedzinach są w większości przypadków zjawiskiem o niekorzystnym działaniu. Charakterystyki meteorologiczne i hydrologiczne, przyjmując ekstremalne wartości, powodują szereg różnego rodzaju zjawisk o działaniu katastroficznym. Na rynkach finansowych ekstremalne wartości pewnych charakterystyk powodują olbrzymie straty finansowe. Tak naprawdę niepożądany efekt oddziaływania wartości ekstremalnych występuje prawie w każdej dziedzinie życia społeczno-gospodarczego.
2 240 Łukasz Kuźmiński Wpływu wartości ekstremalnych nie da się powstrzymać. Można jedynie przygotować się odpowiednio wcześnie na efekt ich działania. Aby można przygotować określone działania mające na celu niwelację efektów oddziaływań wartości ekstremalnych określonych charakterystyk lub zabezpieczenie się przed tymi efektami w możliwie jak największym stopniu, trzeba odpowiednio wcześnie uzyskać informacje o czasie wystąpienia tych efektów. Do tego celu wykorzystuje się systemy prognoz ostrzegawczych. W tym opracowaniu przedstawione zostanie podejście do procesu budowy prognoz ostrzegawczych oparte na granicznych rozkładach ekstremów analizowanej zmiennej. Ekstrema to określony rodzaj statystyk pozycyjnych. W tym przypadku zmienna będzie miała powszechnie znany i stosowany rozkład normalny. Rozpatrywany będzie przypadek, w którym zostało założone, że zmienne losowe są niezależne. Prognozowaną charakterystyką będzie stan wody na rzekach Nysa Kłodzka i Nysa Łużycka w konkretnych punktach pomiarowych, które zostaną podane w dalszej części pracy. 1. Ekstrema jako szczególny rodzaj statystyk pozycyjnych i ich rozkłady Jeśli zmienne losowe ξ 1,..., ξ n ułożymy w kolejności według rzędu wielkości i zapiszemy je jako ξ (1)... ξ (n), (1) to ξ (i) będziemy określać jako i-tą statystykę pozycyjną zmiennych losowych, natomiast F (i) (x) oznaczać będzie dystrybuantę i-tej statystyki pozycyjnej. Zakładamy, że ξ 1,..., ξ n będzie ciągiem n zmiennych losowych o identycznych rozkładach prawdopodobieństwa lub inaczej mówiąc o wspólnej dystrybuancie F(x). Przez x 1, x 2,..., x n oznaczymy odpowiednio realizacje zmiennych losowych ξ 1,..., ξ n. Zgodnie z oznaczeniami wcześniejszymi X (n) oznaczać będzie n-tą statystykę pozycyjną, która jest jednym z ekstremów, a mianowicie maksimum, które można zapisać również w postaci X (n) = max(ξ 1..., ξ n ) (2) oraz oznaczyć przez M n, jak proponują inni autorzy. Podobnie oznaczać będziemy minimum przez X (1), czyli pierwszą statystykę pozycyjną, którą można zapisać jako X (1) = min(ξ 1..., ξ n ) (3) oraz oznaczyć przez m n, zgodnie z propozycjami innych autorów 1. 1 H.A. David, H.N. Nagaraja, Order Statistics, A John Wiley & Sons, Inc., 2003.
3 Zastosowanie teorii wartości ekstremalnych w prognozowaniu ostrzegawczym Dystrybuanta największej statystyki pozycyjnej oznaczona będzie jako F (n) (x) i określona następującym wzorem: F (n) (x) = P{X (n) x} = P{wszystkie X i x} = F n (x), (4) gdzie F(x) jest dystrybuantą zmiennej losowej ξ i. Podobnie jest dla statystyki będącej drugim ekstremum, czyli minimum. Oznaczamy ją jako X (1) i odpowiednio jej dystrybuantę F (1) (x), którą określa następujący wzór: F (1) (x) = P{X (1) x} = 1 P{X (1) > x} = 1 P{wszystkie X i > x} = = 1 [1 F(x)] n. Statystyki ekstremalne minimum i maksimum stanowią szczególne przypadki ogólnego rezultatu dla dystrybuanty r-tej statystyki pozycyjnej F (r) (x), która określona jest wzorem: F (r) (x) = P{X (r) x} = P{przynajmniej r z X i x} = (5) (6) gdyż składnikiem sumy po prawej stronie wzoru jest prawdopodobieństwo rozkładu binominalnego, że dokładnie i spośród X 1,..., X n są mniejsze lub równe x. Więcej na temat dystrybuanty F (r) wraz z jej alternatywnymi formami można znaleźć w pracy H.A. Davida Asymptotyczne rozkłady ekstremów elementy teorii W rozdziale tym przedstawimy zarys teorii asymptotycznych rozkładów dla ekstremów zmiennych losowych jedynie na potrzeby niniejszego opracowania. Klasyczna teoria wartości ekstremalnych w szczególności określa możliwe postacie dystrybuant granicznych dla ekstremów (maksimów i minimów) w ciągach niezależnych zmiennych losowych o identycznych rozkładach. Z uwagi na asymptotyczny charakter tej teorii, zajmuje się ona rozkładami dla maksimów X (n) (lub M n ), zgodnie z oznaczeniami z poprzedniego podrozdziału oraz w szczególności ich własnościami, gdy n. Oczywiście wszystkie wyniki uzyskane dla maksimów X (n) (lub M n ) prowadzą do otrzymania wyników dla minimów X (1) przez prostą relację: 2 Ibidem.
4 242 Łukasz Kuźmiński X (1) = min(ξ 1,..., ξ n ) = max( ξ 1,..., ξ n ). (7) W skończonych warunkach dystrybuanta statystyki X (n) jest dana wzorem (4). Teoria dla warunków skończonych jest szeroko stosowana. W tym miejscu można sobie postawić pytanie: Po co zgłębiać i stosować teorię rozkładów asymptotycznych dla ekstremów, skoro teoria w warunkach skończonych jest dobrze znana i daje dobre wyniki? Odpowiedź jest bardzo prosta. W teorii asymptotycznej nie musimy znać dystrybuanty rozkładu zbyt precyzyjnie, żeby swobodnie stosować ją do rozwiązywania rzeczywistych problemów. Przykładem może być centralne twierdzenie graniczne Lindeberga-Levy ego dotyczące rozkładu sum zmiennych losowych o dowolnej dystrybuancie. Podobna sytuacja ma miejsce w teorii rozkładów asymptotycznych dla ekstremów. W rzeczywistości niezdegenerowana dystrybuanta rozkładu X (n) musi należeć do jednej z trzech możliwych rodzin dystrybuant, niezależnie od oryginalnej dystrybuanty F(x) zmiennych ξ i (i = 1,..., n). Ponadto nie jest potrzebna znajomość szczegółowa dystrybuanty F(x). Wystarczy wiedzieć, do której dziedziny przyciągania (ang. domain of attrction) i której z trzech rodzin dystrybuant należy rozpatrywany rozkład ekstremum. Pojęciu dziedziny przyciągania zostanie poświęcony punkt 3 niniejszej pracy. Identyfikacja, do której dziedziny przyciągania należy rozpatrywany rozkład ekstremum, w dużej mierze zależy od zachowania się ogona dystrybuanty F(x) dla dużych wartości x. W związku z tym dużo można powiedzieć o asymptotycznych własnościach maksimum, opierając to na raczej ograniczonej wiedzy o własnościach F(x). Na początku powinniśmy zainteresować się warunkami, przy których, dla odpowiednio znormalizowanych stałych a n > 0 i b n, P{a n (M n b n ) x} w G(x), (8) (gdzie w oznacza, że zbieżność pojawia się przy ciągłych punktach G, chociaż tak naprawdę zgłębiając asymptotyczną teorię dla rozkładów ekstremów okazuje się, że wszystkie analizowane funkcje G są ciągłe). Teoria ta ukazuje również, że niezdegenerowane dystrybuanty G, które mogą pojawić się jako ograniczenia w (8) tworzą dokładnie klasę rozkładów max-stabilnych i odwrotnie, każdy max-stabilny rozkład G ma jedną z trzech parametrycznych form podanych poniżej i nazywanych rozkładami wartości ekstremalnych 3. (9) 3 R. Leadbetter, G. Lindgren, H. Rootzen, Extremes and related properties of random sequences and processes, Springer Verlag New York Heidelberg, New York 1983.
5 Zastosowanie teorii wartości ekstremalnych w prognozowaniu ostrzegawczym (9 cd.) Powyższe stwierdzenia dokładnie opisuje twierdzenie, które pojawi się w dalszej części pracy. Wykorzystując (4) i (8) możemy zapisać, że: F n (a n 1 x + b n ) w G(x), (10) gdzie ponownie w oznacza zbieżność tylko przy ciągłych punktach funkcji granicznej. Jeśli (10) jest spełnione dla pewnych stałych {a n > 0}, {b n }, to oznacza, że F należy do obszaru przyciągania (dla maksimów) funkcji G, co zapisuje się jako F c D(G). Więcej szczegółowych informacji na temat tej teorii można znaleźć w pracach R. Leadbettera i J. Galambosa Ogólna teoria dziedzin przyciągania Rozdział ten rozpoczniemy od przedstawienia dwóch istotnych twierdzeń związanych z dziedzinami przyciągania. Pierwsze z nich mówi, że dystrybuanta określonego rozkładu jest max-stabilna jeśli i tylko jeśli jest takiego samego typu jak jedna z dystrybuant rozkładów wartości ekstremalnych. Twierdzenie 1 5. Każdy max-stabilny rozkład jest typem wartości ekstremalnych (ang. extreme value type), np. równa się G(ax + b) dla pewnych a > 0 i b, gdzie dla (11) Odwrotnie, każdy rozkład typu wartości ekstremalnych jest max-stabilny. Szczegółowy dowód tego twierdzenia można znaleźć w pracy R. Leadbettera 6. 4 R. Leadbetter, op. cit.; J. Galambos, The asymptotic Theory of Extreme Order Statistics, Wiley, New York Por. R. Leadbetter, op. cit. 6 Ibidem.
6 244 Łukasz Kuźmiński Drugie twierdzenie dotyczy typów ekstremalnych i nosi nazwę twierdzenia o typach ekstremalnych. Twierdzenie 2. Niech M n = max(ξ 1,..., ξ n ), gdzie ξ i są niezależnymi zmiennymi losowymi o identycznych rozkładach. Jeśli dla pewnych stałych a n > 0, b n mamy: P{a n (M n b n ) x} w G(x) (12) dla pewnej niezdegenerowanej dystrybuanty G, to wtedy G jest jedną z trzech dystrybuant granicznych typów wartości ekstremalnych opisanych powyżej. Odwrotnie, każda dystrybuanta G typów wartości ekstremalnych może występować jako ograniczenie w (12), faktycznie występuje, kiedy G sama sobie jest dystrybuantą każdej zmiennej ξ i 7. Można przypuszczać, że jeżeli ξ 1,..., ξ n nie są koniecznie niezależne, ale M n = max(ξ 1,..., ξ n ) ma asymptotycznie dystrybuantę G w sensie wyrażenia (12), to zbieżność F n (a nk 1 x + b n ) w G 1/k (x), gdy n (13) jest prawdziwa dla k = 1, gdzie F n jest dystrybuantą zmiennej losowej M n. Powyższa zbieżność jest podstawą następującego twierdzenia: Twierdzenie 3. (i) Niezdegenerowana dystrybuanta jest max-stabilna, jeśli i tylko jeśli istnieje ciąg {F n } dystrybuant i stałych a n > 0 i b n taki, że: F n (a nk 1 x + b n ) w G 1/k (x), gdy n (14) dla każdego 8 k = 1, 2, (ii) W szczególności jeśli G jest niezdegenerowana, D(G) jest niepusty, jeśli i tylko jeśli G jest max-stabilna. Wtedy również G c D(G). Stąd klasa niezdegenerowanych dystrybuant, która pojawia się jako prawa graniczne w (8) (dla ciągu niezależnych zmiennych losowych o identycznych rozkładach ξ 1,..., ξ n ) pokrywa się z klasą dystrybuant max-stabilnych. Skoro można pokazać, że jeśli (14) jest spełnione dla k = 1, to jest też spełnione dla wszystkich k, to z tego będzie wynikać, że G jest max-stabilna z twierdzenia 3 i że G jest typem wartości ekstremalnych (dystrybuantą graniczną dla ekstremów). Tak więc kiedy będziemy rozważać przypadek dla zmiennych zależnych, będzie łatwo pokazywać, że przy odpowiednich założeniach prawdziwość wyrażenia (14) dla k = 1 implikuje prawdziwość tego wyrażenia dla wszystkich k, z którego twierdzenie o typach ekstremalnych znowu wynika. Zauważmy teraz, że twierdzenie 2 zakłada, iż a n (M n b n ) ma niezdegenerowaną dystrybuantę graniczną i wtedy dowodzi, że G musi mieć jedną z trzech 7 R. Leadbetter, op. cit. 8 Ibidem.
7 Zastosowanie teorii wartości ekstremalnych w prognozowaniu ostrzegawczym określonych form. Można skonstruować ciągi niezależnych zmiennych losowych o identycznych rozkładach {ξ n }, dla których taka dystrybuanta graniczna G nie istnieje. Zobaczmy prosty przykład. Wygodne będzie tutaj (i później również) użycie oznaczenia x F dla prawego punktu końcowego dystrybuanty F, tzn. x F = sup{x; F(x) < 1} ( ), (15) co oznacza, że F(x) < 1 dla x < x F i F(x) = 1 dla wszystkich x x F. Załóżmy teraz, że każda ξ n ma dystrybuantę F taką, że x F < i że F ma skok w punkcie x F, tzn. F( x F ) < 1 = F(x F ). Wtedy wynika z łatwością, że jeśli {u n } jest pewnym ciągiem i P{M n u n } ρ, to ρ = 0 lub 1. Stąd jeśli P{a n (M n b n ) x} G(x), to biorąc u n = x/a n + b n otrzymujemy, że G(x) = 0 lub 1 dla każdego x tak, że G(x) jest zdegenerowana. Przykładem takiego ciągu, który nie ma granicznej dystrybuanty dla ekstremów jest przypadek, gdzie każda ξ n ma rozkład Poissona. Praktycznym aspektem w teorii dziedzin przyciągania jest to, żeby wiedzieć, której z trzech dystrybuant granicznych określonych wzorem (9) użyć, kiedy każda zmienna losowa ξ n ma rozkład opisany przez dystrybuantę F podkreślając, że postać dystrybuanty nie musi być precyzyjnie określona. Znane są różne warunki potrzebne i wystarczające dla każdego z trzech typów dystrybuant granicznych. Z uwagi na to, iż dowody tych warunków są zbyt długie i mało przydatne na potrzeby tego opracowania, pominiemy je. W poniższych twierdzeniach przedstawimy pewne proste i użyteczne, a zarazem wystarczające warunki, które stosuje się, kiedy dystrybuanta rozkładu F ma funkcję gęstości prawdopodobieństwa f, do sprawdzenia, do której z trzech dziedzin przyciągania należy dystrybuanta maksimum rozpatrywanego ciągu {ξ n }. Twierdzenie 4 9. Zakładamy, że dystrybuanta F zmiennych losowych w ciągu niezależnych zmiennych losowych o identycznych rozkładach {ξ n } jest całkowicie ciągła z funkcją gęstości prawdopodobieństwa f. Wtedy wystarczające warunki przynależności dystrybuanty F do trzech możliwych dziedzin przyciągania są następujące: Typ I: f ma ujemną pochodną f ' dla wszystkich x w pewnym przedziale (x 0, x F ), (x F ), f(x) = 0 dla x x F i (16) 9 Por. R. Leadbetter, op. cit.
8 246 Łukasz Kuźmiński Typ II: f (x) > 0 dla wszystkich x x 0 skończonych i (17) Typ III: f(x) > 0 dla wszystkich x w pewnym skończonym przedziale (x 0, x F ), f(x) = 0 dla x > x F i (18) Twierdzenie Potrzebne i wystarczające warunki dla dystrybuanty F zmiennych losowych w ciągu niezależnych zmiennych losowych o identycznych rozkładach {ξ n } przynależności do każdego z trzech typów dystrybuant granicznych są następujące: Typ II: x F = i Typ III: x F < i Typ I: Istnieje pewna ściśle dodatnia funkcja g(t) taka, że: (19) (20) (21) Można wykazać, że, kiedy utrzymany jest typ I ograniczenia i odpowiedni wybór funkcji g, takiej że: dla t < x F. Wniosek z powyższego twierdzenia podany poniżej ma istotne znaczenie praktyczne, ponieważ zawiera równości, za pomocą których można otrzymać stałe normujące a n i b n ze zbieżności danej wzorem (8). Wniosek 1. Stałe a n, b n w zbieżności P{a n (M n b n ) x} G(x) mogą być wzięte dla każdego przypadku (typu) w postaci: 10 Por. R. Leadbetter, op. cit.
9 Zastosowanie teorii wartości ekstremalnych w prognozowaniu ostrzegawczym Typ II:I a n = γ n 1, b n = 0, Typ III: a n = (x F γ n ) 1, b n = x F, (22) Typ I:II a n = [g(γ n )] 1, b n = γ n, gdzie γ n = F 1 (1 1/n) = inf {x; F(x) 1 1/n}. (Ciąg γ n musi być taki, że 1 F(γ n ) = n 1 ). Jeżeli określony rozkład prawdopodobieństwa ma dystrybuantę graniczną dla ekstremum, to w myśl twierdzenia 2 jest ona jedną z trzech typów danych wzorem (9). W niniejszej pracy będziemy się zajmować danymi o powszechnie znanym rozkładzie normalnym. Poniższe twierdzenie pokazuje, do którego typu należy dystrybuanta graniczna rozkładu maksimum i jak wyznaczyć stałe normujące a n i b n w przypadku, gdy zmienne losowe mają standardowy rozkład normalny. Twierdzenie 6. Jeśli {ξ i } jest ciągiem niezależnych zmiennych losowych o standardowym rozkładzie normalnym, to asymptotyczna dystrybuanta zmiennej losowej M n = max(ξ 1,...,ξ n ) jest typu I. Szczegółowo: gdzie i P{a n (M n b n ) x} exp( e x ), (23) a n = (2 log n) 1/2 (24) (25) Szczegółowy dowód powyższego twierdzenia znajduje się w pracy R. Leadbettera Prognozy ostrzegawcze w hydrologii W niniejszym paragrafie wprowadzone zostanie pojęcie prognozy ostrzegawczej jako zapowiedzi wystąpienia zdarzenia traktowanego przez odbiorcę jako niekorzystne. Bardziej precyzyjnie prognozę ostrzegawczą określa definicja 1, która jest jedną z wielu, jakie można spotkać w literaturze przedmiotu, ale najbardziej pasuje do problematyki niniejszego opracowania. 11 Ibidem.
10 248 Łukasz Kuźmiński Definicja 1. Prognozą ostrzegawczą jest stan zmiennej w momencie lub okresie należącym do przyszłości, gdy przewiduje się niekorzystne kształtowanie się kontrolowanej zmiennej na podstawie informacji dostarczonej przez szereg czasowy. Zadaniem prognozy ostrzegawczej jest dostarczenie na czas informacji o wystąpieniu w przyszłości niekorzystnej wartości monitorowanej charakterystyki. Jak z tego wynika, prognozy ostrzegawcze stanowią specyficzny rodzaj przewidywania, nie dotyczą bowiem wyznaczania przyszłej wartości monitorowanej zmiennej, lecz tylko faktu, że wartość monitorowanej zmiennej przekroczy wyznaczony poziom lub będzie niższa od danego poziomu w zależności od charakteru badanego zjawiska. W takim kontekście prognoza ostrzegawcza jest prognozą jakościową, ponieważ dotyczy zdarzenia lub sytuacji, które można zapisać w arytmetyce binarnej (+), ( ) lub 0, Ograniczając szerokie zastosowanie prognoz ostrzegawczych jedynie do dziedziny hydrologii, należy również ograniczyć zbiór zmiennych kontrolowanych w procesie prognozowania ostrzegawczego. W hydrologii jednym z wielu zadań prognoz ostrzegawczych jest monitorowanie takiej charakterystyki jak stany wód w rzekach, w celu ochrony przeciwpowodziowej. Charakterystykę wymienionej zmiennej prezentuje definicja 2. Definicja 2. Stan wody jest to wzniesienie zwierciadła wody w cieku ponad umowny poziom odniesienia (co nie jest równoznaczne z głębokością cieku). Należy rozróżnić pojęcia stan wody i poziom wody. Są to te same wielkości fizyczne, jednak podawane względem różnych odniesień. Poziomy terenu liczymy od przyjętego poziomu morza, dlatego wysokość, na której znajdują się obiekty na Ziemi, wyrażamy w metrach nad poziomem morza. W Polsce sieć wodowskazowa odniesiona jest obecnie do poziomu morza w Kronsztadzie w Rosji. Dla uproszczenia zapisu wzniesienie zwierciadła wody liczymy od ustalonego zera wodowskazu. Taki pomiar nazywamy stanem wody, w odróżnieniu od poziomów liczonych względem przyjętego zera niwelacji. W praktyce zera ustalane są poniżej najniższego stanu wody w celu uniknięcia wartości ujemnych wynikających z możliwej erozji dennej pogłębiającej dno np. rzeki. Rzędna zera każdego wodowskazu określona jest w odniesieniu do państwowej sieci niwelacyjnej, dlatego mając tę informację jesteśmy w stanie wyznaczyć poziom wody. Na podstawie wieloletnich pomiarów można określić charakterystyczny rozkład stanów wody dla danej rzeki w danym miejscu. Wyznacza się wówczas następujące strefy stanów wody: strefę stanów niskich, strefę stanów średnich, strefę stanów wysokich, 12 U. Siedlecka, Prognozy ostrzegawcze w gospodarce, PWE, Warszawa 1996.
11 Zastosowanie teorii wartości ekstremalnych w prognozowaniu ostrzegawczym stan ostrzegawczy, stan alarmowy. Wymienionym powyżej opisom dla danej rzeki w określonym miejscu przyporządkowane są konkretne wartości liczbowe, według których identyfikuje się rodzaj stanu wody w punkcie pomiaru na podstawie zaobserwowanego stanu w danym czasie t. W tym opracowaniu prognoza będzie budowana dla stanu wody obserwowanego na rzece Nysa Łużycka w stacji Zgorzelec oraz na rzece Nysa Kłodzka w stacji Nysa. Więcej na temat budowy prognoz zawarto w kolejnym paragrafie. 5. Budowa modelu prognoz ostrzegawczych na podstawie danych empirycznych W niniejszym opracowaniu analizie poddane zostały stany wód na dwóch polskich rzekach: Nysie Kłodzkiej i Nysie Łużyckiej. Wykorzystamy dzienne dane dotyczące stanów wód uzyskane ze stacji na wodach powierzchniowych w Nysie i Zgorzelcu, pochodzące z Instytutu Meteorologii i Gospodarki Wodnej w Warszawie. Na potrzeby budowy prognoz ostrzegawczych dysponujemy dziennymi stanami wód za okres r. ( obserwacji) ze stacji Nysa oraz za okres r. ( obserwacji) ze stacji w Zgorzelcu. Z uwagi na to, że w tej pracy zajmujemy się przypadkiem, w którym analizowane są ciągi niezależnych zmiennych losowych do budowy prognoz ostrzegawczych wzięte zostały stany wód pochodzące z co dziesiątego dnia. Taki zabieg miał na celu zminimalizowanie prawdopodobieństwa wystąpienia zależności pomiędzy danymi z sąsiadujących okresów. Oczywiste jest, że im większa odległość pomiędzy następującymi po sobie danymi, tym prawdopodobieństwo wystąpienia zależności pomiędzy nimi jest coraz mniejsze. Na potrzeby tej pracy pomijamy fakt występowania ewentualnej długoterminowej zależności pomiędzy danymi, zwanej inaczej efektem długiej pamięci. Istotnym, a zarazem pierwszym punktem w praktycznym zastosowaniu teorii dystrybuant granicznych dla ekstremów jest ustalenie, z populacji o jakim rozkładzie pochodzą analizowane dane. Tak naprawdę dobre dopasowanie teoretycznego rozkładu do danych empirycznych to problem, z jakim borykają się od wielu lat statystycy i naukowcy innych dziedzin, wykorzystujący w praktyce metody statystyczne. Sposobów na rozwiązanie tego problemu jest wiele, ale nie ma jednego uniwersalnego. W tej pracy przyjmujemy, że dwa badane ciągi zmiennych losowych ξ 1,..., ξ n1 oraz ζ 1, ζ 2,..., ζ n2 są ciągami niezależnych zmiennych losowych o rozkładach
12 250 Łukasz Kuźmiński normalnych. Zmienne losowe ξ s i ξ s + 1 są oddalone od siebie w czasie o 10 dni. To samo dotyczy zmiennych ζ i (i = 1, 2,..., n 2 ). Z uwagi na fakt, iż wstępne ciągi zmiennych losowych dotyczących dziennych stanów wód zostały na potrzeby analizy zastąpione przez ciągi zmiennych losowych przedstawiające stany wód co 10 dni, liczba zmiennych losowych w obu ciągach zmniejszyła się 10-krotnie. Dla ciągu zmiennych losowych ξ 1,..., ξ n1 n 1 = 1132, natomiast dla ciągu ζ 1, ζ 2,..., ζ n2 n 2 = Hipotezy o normalności dla dwóch analizowanych ciągów zmiennych losowych zostały poddane testowaniu za pomocą dwóch dobrze znanych testów na normalność: testu zgodności chi-kwadrat i testu zgodności Kołmogorowa. Wartości p-value dla obu testów i ciągów zmiennych losowych przedstawione są w tabeli 1. Tabela 1. Wartości p-value dla testów na normalność rozkładu Ciąg zmiennych losowych Test zgodności chi-kwadrat Test zgodności Kołmogorowa Ź r ó d ł o: opracowanie własne. ξ 1,..., ξ n1 p v = 0,0273 p v = 0,0389 ζ 1, ζ 2,..., ζ n2 p v = 0,0121 p v = 0,0238 Wyniki z tabeli 1 pokazują, że na poziomie istotności α = 0,01 możemy przyjąć, iż stany wód w obu badanych stacjach mają rozkład normalny. W związku z tymi wynikami do obliczenia prognoz ostrzegawczych dla badanych punktów pomiarowych wykorzystamy graniczną dystrybuantę typu I dla standardowego rozkładu normalnego, zgodnie z twierdzeniem 5. Przekształcając w prosty sposób wzór (23) otrzymujemy następujące wyrażenie: (26) z którego łatwo wyznaczymy prawdopodobieństwa dla określonych wartości maksimów badanych zmiennych. Prawdopodobieństwa osiągania przez badane zmienne określonych wartości stanowić będą prognozy ostrzegawcze. Stałe normujące a n i b n w wyrażeniu (26) dla obu ciągów zmiennych losowych wyznaczamy wykorzystując wzory (24) i (25). Wartości stałych normujących dla obu ciągów zmiennych losowych przedstawione są w tabeli 2. Prognozy ostrzegawcze będą prawdopodobieństwami przekroczenia stanu ostrzegawczego i alarmowego przez maksima zmiennych ξ i i ζ j w ciągach
13 Zastosowanie teorii wartości ekstremalnych w prognozowaniu ostrzegawczym Tabela 2. Stałe normujące dla badanych ciągów Ź r ó d ł o: opracowanie własne. Ciąg zmiennych losowych a n b n ξ 1,..., ξ n1, n 1 = ,471 2,346 ζ 1, ζ 2,..., ζ n2, n 2 = ,465 2,340 o liczebnościach n 1 i n 2. Stany ostrzegawcze i alarmowe oraz ich wartości standaryzowane dla obu badanych stacji pomiarowych podane są w tabeli 3. Do standaryzacji wykorzystane zostały parametry z prób: średnia i odchylenie standardowe z analizowanych ciągów danych. Tabela 3. Stany ostrzegawcze i alarmowe wraz z wartościami standaryzowanymi Stany wód Stacja Nysa Stacja Zgorzelec Stan ostrzegawczy 400 cm 340 cm Wartość standaryzowana dla stanu ostrzegawczego 5,52 4,2 Stan alarmowy 530 cm 400 cm Wartość standaryzowana dla stanu alarmowego 8,86 5,73 Ź r ó d ł o: opracowanie własne. Wyznaczone prognozy za pomocą wzoru (26) i danych z tabel 2 i 3 przedstawione są w tabeli 4. Tabela 4. Prognozy ostrzegawcze dla stacji Nysa i Zgorzelec Prognozy stanu wód Stacja Nysa Stacja Zgorzelec Prognoza stanu ostrzegawczego P(M n1 > 400) 0,0102 P(M n2 > 340) 0,0174 Prognoza stanu alarmowego P(M n1 > 530) 0,0026 P(M n2 > 400) 0,0094 Ź r ó d ł o: opracowanie własne. Analizując otrzymane wyniki widzimy, że w stacji Nysa jest 1,02% szans na to, iż stan ostrzegawczy zostanie przekroczony, a 0,26%, że przekroczony zostanie stan alarmowy. W stacji Zgorzelec jest 1,74% szans na przekroczenie stanu ostrzegawczego, a 0,94% szans na przekroczenie stanu alarmowego. Oczywiście wraz ze zmianą n 1 i n 2 w analizowanych ciągach zmiennych losowych prognozy w prosty sposób będą aktualizowane. Powoduje to, że przedstawiony model
14 252 Łukasz Kuźmiński prognoz ostrzegawczych ma charakter dynamiczny i na bieżąco może być aktualizowany, dając rzeczywisty obraz sytuacji. Faktem zasługującym na uwagę jest to, że jakość wyznaczanych prognoz jest wprost proporcjonalna do długości ciągu analizowanych zmiennych. Mówiąc wprost, im dłuższym szeregiem czasowym dysponujemy, tym uzyskiwane wyniki są lepsze. Oznacza to, że im dłużej prowadzimy monitoring, tym lepszej jakości prognozy uzyskujemy. Podsumowanie W pracy przedstawione zostało podejście do prognozowania ostrzegawczego oparte na granicznych rozkładach dystrybuant ekstremów obserwowanych charakterystyk. Wyznaczone zostały prognozy dotyczące stanów wód w dwóch wybranych stacjach pomiarowcy na rzekach Dolnego Śląska. Zwróciliśmy uwagę na to, że jedną z najważniejszych rzeczy przy takim podejściu do prognozowaniu ostrzegawczego jest odpowiednie dopasowanie rozkładu teoretycznego do analizowanych danych empirycznych. W rozpatrywanych przykładach poddaliśmy analizie ciągi zmiennych losowych o powszechnie znanym i stosowanym rozkładzie normalnym dla przypadku, w którym zmienne losowe są niezależne. Rozkłady inne niż normalne oraz przypadki dla zmiennych zależnych rozpatrywane będę w kolejnych pracach związanych z tą tematyką. Istotne jest, że zbudowany model prognoz ostrzegawczych ma charakter dynamiczny. Oznacza to, że może być na bieżąco aktualizowany. Daje to możliwość efektywnego monitoringu analizowanych charakterystyk i odpowiednio wczesnego reagowania na sygnały alarmujące. Oczywiście prezentowany model można stosować do budowy prognoz ostrzegawczych dla dowolnych charakterystyk z różnych dziedzin, np. do prognozowania danych finansowych na rynkach finansowych, charakterystyk związanych z jakością w różnych działach ekonomii i wielu innych. Literatura Cieślak M., Prognozowanie gospodarcze. Metody i zastosowania, WN PWN, Warszawa Czekała M., Statystyki pozycyjne w modelowaniu ekonometrycznym. Wybrane problemy, Wyd. Akademii Ekonomicznej im. Oskara Langego we Wrocławiu, Wrocław David H.A., Nagaraja H.N., Order Statistics, A John Wiley & Sons, Inc., New York Fisz M., Rachunek prawdopodobieństwa i statystyka matematyczna, PWN, Warszawa Galambos J., The asymptotic Theory of Extreme Order Statistics, Wiley, New York Jakubowski J., Sztencel R., Wstęp do teorii prawdopodobieństwa, SCRIPT, Warszawa 2004.
15 Zastosowanie teorii wartości ekstremalnych w prognozowaniu ostrzegawczym Leadbetter R., Lindgren G., Rootzen H., Extremes and related properties of random sequences and processes, Springer Verlag Heidelberg, New York Magiera R., Modele i metody statystyki matematycznej, Oficyna Wydawnicza GiS, Wrocław Siedlecka U., Prognozy ostrzegawcze w gospodarce, PWE, Warszawa Weron A., Weron R., Inżynieria finansowa, Wyd. Naukowo-Techniczne, Warszawa The application of the extreme values theory in warning predictions for random variables sequences with normal distribution Summary. The work refers to the application of the theory of limit distributions for extremes in warning predictions for random variables sequences with normal distribution. The beginning of the work contains theory components concerning order statistics. In the next part of the work basic theorems connected to the theory of types of distributions and gravity areas are presented. Ultimately, empirical research is given, in which a model of warning predictions for hydrological characteristic is built. Details used in the work concern water conditions at two selected rivers of Lower Silesia. Key words: order statistics, the limiting distribution function, types of extreme distributions, warning forecast, hydrological characteristics
16 254
ROZKŁADY WARTOŚCI EKSTREMALNYCH W ANALIZIE ZAGROŻENIA HYDROLOGICZNEGO NA DOLNYM ŚLĄSKU
STUDIA I PRACE WYDZIAŁU NAUK EKONOMICZNYCH I ZARZĄDZANIA NR 36 Łukasz Kuźmiński * Uniwersytet Ekonomiczny we Wrocławiu ROZKŁADY WARTOŚCI EKSTREMALNYCH W ANALIZIE ZAGROŻENIA HYDROLOGICZNEGO NA DOLNYM ŚLĄSKU
Prawa wielkich liczb, centralne twierdzenia graniczne
, centralne twierdzenia graniczne Katedra matematyki i ekonomii matematycznej 17 maja 2012, centralne twierdzenia graniczne Rodzaje zbieżności ciągów zmiennych losowych, centralne twierdzenia graniczne
Statystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 55 jacek.mercik@pwr.wroc.pl (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW Elementy wykładu.
Statystyka i eksploracja danych
Wykład II: i charakterystyki ich rozkładów 24 lutego 2014 Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa, cz. II Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa,
Wykład 10 Testy jednorodności rozkładów
Wykład 10 Testy jednorodności rozkładów Wrocław, 16 maja 2018 Test Znaków test jednorodności rozkładów nieparametryczny odpowiednik testu t-studenta dla prób zależnych brak normalności rozkładów Test Znaków
Rozkłady statystyk z próby
Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny
STATYSTYKA
Wykład 1 20.02.2008r. 1. ROZKŁADY PRAWDOPODOBIEŃSTWA 1.1 Rozkład dwumianowy Rozkład dwumianowy, 0 1 Uwaga: 1, rozkład zero jedynkowy. 1 ; 1,2,, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym
W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:
W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: Zmienne losowe skokowe (dyskretne) przyjmujące co najwyżej przeliczalnie wiele wartości Zmienne losowe ciągłe
STATYSTYKA wykład 5-6
TATYTYKA wykład 5-6 Twierdzenia graniczne Rozkłady statystyk z próby Wanda Olech Twierdzenia graniczne Jeżeli rozpatrujemy ciąg zmiennych losowych {X ; X ;...; X n }, to zdarza się, że ich rozkłady przy
Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału
Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału Magdalena Frąszczak Wrocław, 22.02.2017r Zasady oceniania Ćwiczenia 2 kolokwia (20 punktów każde) 05.04.2017 oraz 31.05.2017 2 kartkówki
Biostatystyka, # 3 /Weterynaria I/
Biostatystyka, # 3 /Weterynaria I/ dr n. mat. Zdzisław Otachel Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, p. 221 bud. CIW, e-mail: zdzislaw.otachel@up.lublin.pl
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Wybrane rozkłady zmiennych losowych. Statystyka
Wybrane rozkłady zmiennych losowych Statystyka Rozkład dwupunktowy Zmienna losowa przyjmuje tylko dwie wartości: wartość 1 z prawdopodobieństwem p i wartość 0 z prawdopodobieństwem 1- p x i p i 0 1-p 1
Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.
Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ
Wydział Matematyki. Testy zgodności. Wykład 03
Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy
166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
Ważne rozkłady i twierdzenia
Ważne rozkłady i twierdzenia Rozkład dwumianowy i wielomianowy Częstość. Prawo wielkich liczb Rozkład hipergeometryczny Rozkład Poissona Rozkład normalny i rozkład Gaussa Centralne twierdzenie graniczne
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).
PRZYKŁADY TESTÓW NIEPARAMETRYCZNYCH. Test zgodności χ 2. Ten test służy testowaniu hipotezy, czy rozważana zmienna ma pewien ustalony rozkład, czy też jej rozkład różni się od tego ustalonego. Tym testem
Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.
Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia. D A R I U S Z P I W C Z Y Ń S K I 2 2 ROZKŁAD ZMIENNEJ LOSOWEJ Polega na przyporządkowaniu
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
Prawdopodobieństwo i statystyka
Wykład II: Zmienne losowe i charakterystyki ich rozkładów 13 października 2014 Zmienne losowe Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa, cz. II Definicja zmiennej losowej i jej
POZIOM T-ROKU W ANALIZIE ZAGROŻENIA POWODZIOWEGO NA DOLNYM ŚLĄSKU
Studia Ekonomiczne. Zeszyty Naukowe Uniwersytetu Ekonomicznego w Katowicach ISSN 2083-86 Nr 297 206 Łukasz Kuźmiński Uniwersytet Ekonomiczny we Wrocławiu Wydział Inżynieryjno-Ekonomiczny Katedra Metod
III. ZMIENNE LOSOWE JEDNOWYMIAROWE
III. ZMIENNE LOSOWE JEDNOWYMIAROWE.. Zmienna losowa i pojęcie rozkładu prawdopodobieństwa W dotychczas rozpatrywanych przykładach każdemu zdarzeniu była przyporządkowana odpowiednia wartość liczbowa. Ta
Rozkłady statystyk z próby. Statystyka
Rozkłady statystyk z próby tatystyka Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających ten
Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych
Rozdział 1 Zmienne losowe, ich rozkłady i charakterystyki 1.1 Definicja zmiennej losowej Niech Ω będzie przestrzenią zdarzeń elementarnych. Definicja 1 Rodzinę S zdarzeń losowych (zbiór S podzbiorów zbioru
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie
Wykład 6 Estymatory efektywne. Własności asymptotyczne estym. estymatorów
Wykład 6 Estymatory efektywne. Własności asymptotyczne estymatorów Wrocław, 30 listopada 2016r Powtórzenie z rachunku prawdopodobieństwa Zbieżność Definicja 6.1 Niech ciąg {X } n ma rozkład o dystrybuancie
Statystyka matematyczna. Wykład III. Estymacja przedziałowa
Statystyka matematyczna. Wykład III. e-mail:e.kozlovski@pollub.pl Spis treści Rozkłady zmiennych losowych 1 Rozkłady zmiennych losowych Rozkład χ 2 Rozkład t-studenta Rozkład Fischera 2 Przedziały ufności
Wykład 9 Testy rangowe w problemie dwóch prób
Wykład 9 Testy rangowe w problemie dwóch prób Wrocław, 18 kwietnia 2018 Test rangowy Testem rangowym nazywamy test, w którym statystyka testowa jest konstruowana w oparciu o rangi współrzędnych wektora
Zmienne losowe. dr Mariusz Grzadziel. rok akademicki 2016/2017 semestr letni. Katedra Matematyki, Uniwersytet Przyrodniczy we Wrocławiu
Zmienne losowe dr Mariusz Grzadziel Katedra Matematyki, Uniwersytet Przyrodniczy we Wrocławiu rok akademicki 2016/2017 semestr letni Definicja 1 Zmienna losowa nazywamy dyskretna (skokowa), jeśli zbiór
Testowanie hipotez statystycznych. Wnioskowanie statystyczne
Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy
Wykład 2 Zmienne losowe i ich rozkłady
Wykład 2 Zmienne losowe i ich rozkłady Magdalena Frąszczak Wrocław, 11.10.2017r Zmienne losowe i ich rozkłady Doświadczenie losowe: Rzut monetą Rzut kostką Wybór losowy n kart z talii 52 Gry losowe Doświadczenie
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
Z Wikipedii, wolnej encyklopedii.
Rozkład normalny Rozkład normalny jest niezwykle ważnym rozkładem prawdopodobieństwa w wielu dziedzinach. Nazywa się go także rozkładem Gaussa, w szczególności w fizyce i inżynierii. W zasadzie jest to
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych
Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej
12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych
(pieczęć wydziału) KARTA PRZEDMIOTU Z1-PU7 WYDANIE N1 Strona 1 z 5 1. Nazwa przedmiotu: Rachunek prawdopodobieństwa i statystyka matematyczna 2. Kod przedmiotu: RPiS 3. Karta przedmiotu ważna od roku akademickiego:
Ważne rozkłady i twierdzenia c.d.
Ważne rozkłady i twierdzenia c.d. Funkcja charakterystyczna rozkładu Wielowymiarowy rozkład normalny Elipsa kowariacji Sploty rozkładów Rozkłady jednostajne Sploty z rozkładem normalnym Pobieranie próby
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =
HISTOGRAM W pewnych przypadkach interesuje nas nie tylko określenie prawdziwej wartości mierzonej wielkości, ale także zbadanie całego rozkład prawdopodobieństwa wyników pomiarów. W takim przypadku wyniki
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. dr hab. Jerzy Nakielski Katedra Biofizyki i Morfogenezy Roślin Plan wykładu: 1. Etapy wnioskowania statystycznego 2. Hipotezy statystyczne,
Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn
Wykład 10 Estymacja przedziałowa - przedziały ufności dla średniej Wrocław, 21 grudnia 2016r Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja 10.1 Przedziałem
Wykład 3 Momenty zmiennych losowych.
Wykład 3 Momenty zmiennych losowych. Wrocław, 19 października 2016r Momenty zmiennych losowych Wartość oczekiwana - przypomnienie Definicja 3.1: 1 Niech X będzie daną zmienną losową. Jeżeli X jest zmienną
Wykład 3 Momenty zmiennych losowych.
Wykład 3 Momenty zmiennych losowych. Wrocław, 18 października 2017r Momenty zmiennych losowych Wartość oczekiwana - przypomnienie Definicja 3.1: 1 Niech X będzie daną zmienną losową. Jeżeli X jest zmienną
Rozkłady i ich dystrybuanty 16 marca F X (t) = P (X < t) 0, gdy t 0, F X (t) = 1, gdy t > c, 0, gdy t x 1, 1, gdy t > x 2,
Wykład 4. Rozkłady i ich dystrybuanty 6 marca 2007 Jak opisać cały rozkład jedną funkcją? Aby znać rozkład zmiennej X, musimy umieć obliczyć P (a < X < b) dla dowolnych a < b. W tym celu wystarczy znać
Spis treści 3 SPIS TREŚCI
Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
Zadania ze statystyki, cz.6
Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z
Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1
Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie
Statystyka matematyczna. Wykład VI. Zesty zgodności
Statystyka matematyczna. Wykład VI. e-mail:e.kozlovski@pollub.pl Spis treści 1 Testy zgodności 2 Test Shapiro-Wilka Test Kołmogorowa - Smirnowa Test Lillieforsa Test Jarque-Bera Testy zgodności Niech x
Zmienne losowe. dr Mariusz Grządziel Wykład 12; 20 maja 2014
Zmienne losowe dr Mariusz Grządziel Wykład 2; 20 maja 204 Definicja. Zmienna losowa nazywamy dyskretna (skokowa), jeśli zbiór jej wartości x, x 2,..., można ustawić w ciag. Zmienna losowa X, która przyjmuje
Statystyka w przykładach
w przykładach Tomasz Mostowski Zajęcia 10.04.2008 Plan Estymatory 1 Estymatory 2 Plan Estymatory 1 Estymatory 2 Własności estymatorów Zazwyczaj w badaniach potrzebujemy oszacować pewne parametry na podstawie
12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych
(pieczęć wydziału) KARTA PRZEDMIOTU Z1-PU7 WYDANIE N1 Strona 1 z 5 1. Nazwa przedmiotu: Rachunek prawdopodobieństwa i statystyka matematyczna 2. Kod przedmiotu: RPiS 3. Karta przedmiotu ważna od roku akademickiego:
Testowanie hipotez statystycznych
Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom
Pochodne cząstkowe i ich zastosowanie. Ekstrema lokalne funkcji
Pochodne cząstkowe i ich zastosowanie. Ekstrema lokalne funkcji Adam Kiersztyn Lublin 2014 Adam Kiersztyn () Pochodne cząstkowe i ich zastosowanie. Ekstrema lokalne funkcji maj 2014 1 / 24 Zanim przejdziemy
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
Wnioskowanie statystyczne. Statystyka w 5
Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających
RACHUNEK PRAWDOPODOBIEŃSTWA WYKŁAD 3.
RACHUNEK PRAWDOPODOBIEŃSTWA WYKŁAD 3. ZMIENNA LOSOWA JEDNOWYMIAROWA. Zmienną losową X nazywamy funkcję (praktycznie każdą) przyporządkowującą zdarzeniom elementarnym liczby rzeczywiste. X : Ω R (dokładniej:
Zakładamy, że są niezależnymi zmiennymi podlegającymi (dowolnemu) rozkładowi o skończonej wartości oczekiwanej i wariancji.
Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Centralne Twierdzenie Graniczne 1.1 Twierdzenie Lindeberga Levy'ego 1.2 Dowód 1.2.1 funkcja tworząca sumy zmiennych niezależnych 1.2.2 pochodna funkcji
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl
Testowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA. Piotr Wiącek
PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA Piotr Wiącek ROZKŁAD PRAWDOPODOBIEŃSTWA Jest to miara probabilistyczna określona na σ-ciele podzbiorów borelowskich pewnej przestrzeni metrycznej. σ-ciało podzbiorów
Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28
Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych
Kilka uwag o testowaniu istotności współczynnika korelacji
341 Zeszyty Naukowe Wyższej Szkoły Bankowej we Wrocławiu Nr 20/2011 Piotr Peternek Uniwersytet Ekonomiczny we Wrocławiu Marek Kośny Uniwersytet Ekonomiczny we Wrocławiu Kilka uwag o testowaniu istotności
Statystyka. Wykład 2. Krzysztof Topolski. Wrocław, 11 października 2012
Wykład 2 Wrocław, 11 października 2012 Próba losowa Definicja. Zmienne losowe X 1, X 2,..., X n nazywamy próba losową rozmiaru n z rozkładu o gęstości f (x) (o dystrybuancie F (x)) jeśli X 1, X 2,...,
weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)
PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)
MODELE STATYSTYCZNE Punktem wyjścia w rozumowaniu statystycznym jest zmienna losowa (cecha) X i jej obserwacje opisujące wyniki doświadczeń bądź pomiarów. Zbiór wartości zmiennej losowej X (zbiór wartości
Prawdopodobieństwo i statystyka
Wykład VII: Rozkład i jego charakterystyki 22 listopada 2016 Uprzednio wprowadzone pojęcia i ich własności Definicja zmiennej losowej Zmienna losowa na przestrzeni probabilistycznej (Ω, F, P) to funkcja
Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa
Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie
Zadania o numerze 4 z zestawów licencjat 2014.
Zadania o numerze 4 z zestawów licencjat 2014. W nawiasie przy zadaniu jego występowanie w numerze zestawu Spis treści (Z1, Z22, Z43) Definicja granicy ciągu. Obliczyć granicę:... 3 Definicja granicy ciągu...
VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15
VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Weryfikacja hipotez dotyczących postaci nieznanego rozkładu -Testy zgodności.
Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.
Wykład 4 Rozkłady i ich dystrybuanty Dwa typy zmiennych losowych Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x, x 2,...}, to mówimy, że jest to zmienna dyskretna.
ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.
Opracowała: Joanna Kisielińska ZMIENNE LOSOWE Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R tzn. X: R. Realizacją zmiennej losowej
Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania
Prognozowanie i Symulacje. Wykład I. e-mail:e.kozlovski@pollub.pl Spis treści Szeregi czasowe 1 Szeregi czasowe 2 3 Szeregi czasowe Definicja 1 Szereg czasowy jest to proces stochastyczny z czasem dyskretnym
Generowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport
Generowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport Michał Krzemiński Streszczenie Projekt dotyczy metod generowania oraz badania własności statystycznych ciągów liczb pseudolosowych.
Kolokwium ze statystyki matematycznej
Kolokwium ze statystyki matematycznej 28.05.2011 Zadanie 1 Niech X będzie zmienną losową z rozkładu o gęstości dla, gdzie 0 jest nieznanym parametrem. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę
Rozdział 1. Zmienne losowe, ich rozkłady i charakterystyki. 1.1 Definicja zmiennej losowej
Rozdział 1 Zmienne losowe, ich rozkłady i charakterystyki 1.1 Definicja zmiennej losowej Zbiór możliwych wyników eksperymentu będziemy nazywać przestrzenią zdarzeń elementarnych i oznaczać Ω, natomiast
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 6 Wrocław, 7 listopada 2011 Temat. Weryfikacja hipotez statystycznych dotyczących proporcji. Test dla proporcji. Niech X 1,..., X n będzie próbą statystyczną z 0-1. Oznaczmy odpowiednio
Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015
Zmienne losowe, statystyki próbkowe Wrocław, 2 marca 2015 Zasady zaliczenia 2 kolokwia (każde po 20 punktów) projekt (20 punktów) aktywność Zasady zaliczenia 2 kolokwia (każde po 20 punktów) projekt (20
3. Modele tendencji czasowej w prognozowaniu
II Modele tendencji czasowej w prognozowaniu 1 Składniki szeregu czasowego W teorii szeregów czasowych wyróżnia się zwykle następujące składowe szeregu czasowego: a) składowa systematyczna; b) składowa
Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa
Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa Marek Kubiak Instytut Informatyki Politechnika Poznańska Plan wykładu Podstawowe pojęcia rachunku prawdopodobieństwa Rozkład
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, że 40% owoców ulega uszkodzeniu podczas pakowania automatycznego.
Wybrane rozkłady zmiennych losowych. Statystyka
Wybrane rozkłady zmiennych losowych Statystyka Rozkład dwupunktowy Zmienna losowa przyjmuje tylko dwie wartości: wartość 1 z prawdopodobieństwem p i wartość 0 z prawdopodobieństwem 1- p x i p i 0 1-p 1
Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)
Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne) Przygotował: Dr inż. Wojciech Artichowicz Katedra Hydrotechniki PG Zima 2014/15 1 TABLICE ROZKŁADÓW... 3 ROZKŁAD
Metody Ilościowe w Socjologii
Metody Ilościowe w Socjologii wykład 2 i 3 EKONOMETRIA dr inż. Maciej Wolny AGENDA I. Ekonometria podstawowe definicje II. Etapy budowy modelu ekonometrycznego III. Wybrane metody doboru zmiennych do modelu
Własności statystyczne regresji liniowej. Wykład 4
Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności
), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0
Testowanie hipotez Każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy nazywamy hipotezą statystyczną. Hipoteza określająca jedynie wartości nieznanych parametrów liczbowych badanej cechy
TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.
TEST STATYSTYCZNY Testem statystycznym nazywamy regułę postępowania rozstrzygająca, przy jakich wynikach z próby hipotezę sprawdzaną H 0 należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia.
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 2013/2014 Wykład 3 Zmienna losowa i jej rozkłady Zdarzenia losowe Pojęcie prawdopodobieństwa
Dokładne i graniczne rozkłady statystyk z próby
Dokładne i graniczne rozkłady statystyk z próby Przypomnijmy Populacja Próba Wielkość N n Średnia Wariancja Odchylenie standardowe 4.2 Rozkład statystyki Mówimy, że rozkład statystyki (1) jest dokładny,
Matematyka z el. statystyki, # 3 /Geodezja i kartografia II/
Matematyka z el. statystyki, # 3 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Akademicka 15, p.211a bud. Agro II, e-mail: zdzislaw.otachel@up.lublin.pl
VII. Elementy teorii stabilności. Funkcja Lapunowa. 1. Stabilność w sensie Lapunowa.
VII. Elementy teorii stabilności. Funkcja Lapunowa. 1. Stabilność w sensie Lapunowa. W rozdziale tym zajmiemy się dokładniej badaniem stabilności rozwiązań równania różniczkowego. Pojęcie stabilności w
SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY
SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY Weryfikacja hipotez statystycznych Statystyka i demografia PROJEKT DOFINANSOWANY ZE ŚRODKÓW NARODOWEGO BANKU POLSKIEGO URZĄD STATYSTYCZNY
Ćwiczenia 3 ROZKŁAD ZMIENNEJ LOSOWEJ JEDNOWYMIAROWEJ
Ćwiczenia 3 ROZKŁAD ZMIENNEJ LOSOWEJ JEDNOWYMIAROWEJ Zadanie 1. Zmienna losowa przyjmuje wartości -1, 0, 1 z prawdopodobieństwami równymi odpowiednio: ¼, ½, ¼. Należy: a. Wyznaczyć rozkład prawdopodobieństwa
Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego