GENEROWANIE TABLIC DWUDZIELCZYCH Z WYKORZYSTANIEM DWUWYMIAROWEGO ROZKŁADU NORMALNEGO UCIĘTEGO
|
|
- Barbara Gajda
- 8 lat temu
- Przeglądów:
Transkrypt
1 Studia Ekonomiczne. Zeszyty Naukowe Uniwersytetu Ekonomicznego w Katowicach ISSN Nr Informatyka i Ekonometria 5 Akademia Pomorska w Słupsku Wydział Matematyczno-Przyrodniczy Instytut Matematyki piotr.sulewski@apsl.edu.pl GENEROWANIE TABLIC DWUDZIELCZYCH Z WYKORZYSTANIEM DWUWYMIAROWEGO ROZKŁADU NORMALNEGO UCIĘTEGO Streszczenie: W artykule zaprezentowano procedurę generowania liczb losowych o dwuwymiarowym rozkładzie normalnym uciętym (DRNU). Opisano algorytm generowania tablicy dwudzielczej, wykorzystując próbę realizacji zmiennej losowej DRNU. Przedstawioną teorię wzbogacono konkretnymi przykładami, zrealizowanymi w edytorze VBA arkusza kalkulacyjnego Microsoft Excel. Słowa kluczowe: tablica dwudzielcza, metoda Monte Carlo, test niezależności, dwuwymiarowy rozkład normalny ucięty. Wprowadzenie Tablicę dwudzielczą (TD) w k zalicza się do podstawowych, często stosowanych narzędzi statystycznych. Wykorzystuje się ją do badania mocy testów, czyli prawdopodobieństwa odrzucenia H 0, gdy jest ona fałszywa. Do tego rodzaju badań niezbędne jest generowanie TD i określenie mocy testów za pomocą symulacji Monte Carlo. Terminem generowanie TD określono wypełnienie komórek TD liczbami pseudolosowymi. Gdy związku między badanymi cechami nie ma, generowanie TD jest rzeczą prostą. Można skorzystać z generatorów liczb o rozkładzie równomiernym i losowo generować numer wiersza oraz kolumny tablicy, określając w ten sposób przynależność danej realizacji do komórki. Zadaniem znacznie trudniejszym jest generowanie TD, gdy związek między cechami istnieje. Przystępując do badania właściwości testów statystycznych, trzeba dysponować narzędziem do modelowania populacji generalnej, czyli do nadawania
2 7 populacji generalnej określonej właściwości, jaką jest związek między cechami. W związku z czym dane podlegające opracowaniu, muszą być danymi pochodzącymi z generatora liczb losowych, a nie danymi wziętymi z praktyki. Należy wiedzieć, jaki jest rzeczywisty związek między cechami, inaczej zbadanie mocy testów będzie niemożliwe. W celu wyznaczenia empirycznej mocy testu niezbędne jest generowanie TD. Do generowania TD można skorzystać z: łańcuchów Markowa (ang. Markov Chain Monte Carlo) [Diaconis, Sturmfels, 998; Cryan, Dyer, 003; Chen i in., 005; Cryan i in., 006; Fishman, 0], sekwencyjnego próbkowania (ang. Sequential Importance Sampling) [Chen i in., 005; Chen, Dinwoodie, Sullivant, 006; Blitzstein, Diaconis, 0; Yoshida i in., 0], metody bootstrapowej (ang. bootstrap method) [Nandram, Bhatta, Bhadra, 03], techniki dziel i zwyciężaj (ang. probabilistic divide-and-conquer technique) [Desalvo, Zhao, 06]. Propozycję generowania TD dla ustalonych rozkładów brzegowych zaprezentowali R.B. Holmes i L.K. Jones [996]. Procedurę generowania TD za pomocą metody słupkowej, wykorzystującą liczby losowe o rozkładzie równomiernym zaproponował w swojej pracy P. Sulewski [04a]. Uogólniony rozkład gamma wykorzystano do generowania TD [Sulewski, 009] oraz TD k [Sulewski, 04b]. Przy testowaniu niezależności cech, najbardziej popularną statystyką testową dla TD jest statystyka χ Pearsona, która ma także swoje rozszerzenia dla tablic trójdzielczych i wyższych. Dla TD w k istnieją jednak ograniczenia stosowalności statystyki χ Pearsona, która ma asymptotyczny rozkład chi- w k stopniami swobody. W celu zniesienia tych ograniczeń kwadrat z ( )( ) wartości krytyczne można wyznaczać za pomocą symulacji komputerowych metodą Monte Carlo [Sulewski, 05], a do tego niezbędne jest generowanie TD. Także Lilliefors w teście Kołmogorowa dla rozkładu normalnego wyznaczał wartości krytyczne drogą symulacyjną, gdy parametry rozkładu były oszacowane z próby. Procedurę generowania TD z wykorzystaniem dwuwymiarowego rozkładu normalnego (DRN) oraz opis generatora liczb losowych o DRN przedstawiono w pracy P. Sulewskiego [04a]. Metoda ta wykorzystywana dla TD w k, w, k > posiada pewną wadę. Gdy się ją stosuje, w narożach tablicy ( ) pojawiają się komórki puste i w tej sytuacji nie można skorzystać, np. z niektórych statystyk chi-kwadrat (ang. power divergence statistics): statystyki G ilorazu wiarygodności, statystyki KL Kullbacka-Leiblera czy statystyki FT Freemana-Tukey a. Z tego też powodu w niniejszej pracy zaproponowano modyfikację wspomnianej metody, polegającą na zastosowaniu dwuwymiarowego rozkładu normalnego uciętego (DRNU). Powodem wyboru DRN do gene-
3 Generowanie tablic dwudzielczych rowania TD była nie tylko jego wielka popularność, ale także to, że K. Pearson [Pearson, 904] skorzystał z tego rozkładu w celu zdefiniowania współczynnika kontyngencji. Celem artykułu jest zaproponowanie narzędzia do generowania TD o ustalonym z góry związku między cechami. Przedstawiono w nim funkcję gęstości dwuwymiarowego rozkładu normalnego zarówno pełnego, jak i uciętego. Wyznaczono wartość współczynnika korelacji DRNU. Zaprezentowano procedurę gene- w k w, k >, rowania liczb losowych o DRNU. Opisano generowanie TD ( ) wykorzystując n elementową próbę realizacji zmiennej losowej DRNU. Przedstawioną teorię wzbogacono przykładami. Implementację komputerową wykonano w edytorze VBA arkusza kalkulacyjnego Excel.. Funkcja gęstości dwuwymiarowego rozkładu normalnego Zmienna losowa ( X, Y ) ma DRN, jeżeli jej funkcja gęstości dana jest wzorem [Kendall, Buckland, 986]: f ( x, y) = exp( Q) Q = πσ σ r x μ r x μ y μ y μ r + ( ) r σ σ σ σ gdzie r jest współczynnikiem korelacji liniowej Pearsona. Rozkład brzegowy zmiennej losowej X jest rozkładem normalnym N ( μ,σ ), zaś rozkład brzegowy zmiennej losowej Y rozkładem normalnym N ( μ,σ ). Rysunek przedstawia wykres funkcji gęstości DRN, gdy zmienne X oraz Y są nieskorelowane ( r = 0 ), natomiast rys. gdy zmienne X i Y są skorelowane ( r = 0, 4 ). Wartości pozostałych parametrów tego rozkładu to μ = μ = 0, σ = σ. = ()
4 74 Rys.. Wykres funkcji gęstości dwuwymiarowego rozkładu normalnego dla μ = μ 0, σ = σ =, r = 0 = Rys.. Wykres funkcji gęstości dwuwymiarowego rozkładu normalnego dla μ = μ 0, σ σ = σ =, r = 0,4 = Niech f ( x, y) będzie funkcją gęstości () dwuwymiarowej zmiennej losowej normalnej ( X, Y ). Wówczas funkcja gęstości zmiennej losowej ( X, Y ) uciętej do obszaru a, b c, d ma postać [Cramer, 958]: f u ( x, y, a, b, c, d ) = b d a c f f ( x, y) ( x, y) dxdy ()
5 Generowanie tablic dwudzielczych dla wszystkich ( x, y) a, b c, d Wartości i jest równa zeru poza tym obszarem. a, b, c, d mogą być także nieskończone. Na rys. 3 i 4 przedstawiono wykresy funkcji gęstości DRNU dla zestawów A i B wartości parametrów (tab. ). Tabela. Zestawy wartości parametrów dwuwymiarowego rozkładu normalnego uciętego Zestaw μ σ μ σ r a b c d A 0 0 0,4 - - B 0 0 0,4 - -0,5 0,5 Rys. 3. Wykres funkcji gęstości dwuwymiarowego rozkładu normalnego uciętego dla zestawu A wartości parametrów Rys. 4. Wykres funkcji gęstości dwuwymiarowego rozkładu normalnego uciętego dla zestawu B wartości parametrów
6 76. Współczynnik korelacji dwuwymiarowego rozkładu normalnego uciętego We wzorze () r jest współczynnikiem korelacji liniowej Pearsona, gdyż [Cramer, 958]: Jeżeli = 0 V ( X, Y ) ( X ) V ( Y ) cov = r r, to funkcja gęstości DRNU ma postać f ( x y) = f ( x) f ( y),, czyli zmienne losowe X i Y są niezależne. Badając testy niezależności, należy dysponować narzędziem do nadawania populacji generalnej określonej właściwości, jaką jest związek między cechami. Związek ten można różnicować za pomocą współczynnika korelacji, który dla DRNU wyraża się wzorem [Cramer, 958]: gdzie b d x y f ( x, y) ( x, y) α α α 0 0 r u = (3) α 0 α0 α 0 α 0 ( x) ( x) ( y) ( y) ( k, ) a c a a α =, α k 0 =, α0 = = b d b k d f dxdy f dx. f dy. a c dxdy b a x k Dla zestawów wartości parametrów (tab. ) obliczono na podstawie (3) wartość współczynnika korelacji DRNU. Uzyskane wyniki przedstawiono w tab. 3. Tabela. Zestawy wartości parametrów dwuwymiarowego rozkładu normalnego uciętego μ σ μ Zestaw C 0 0 0,5 - - D 0 0 0,5 - - E 0 0 0,5 -,5,5 -,5,5 F 0 0 0,7 -,5,5 -,5,5 f dx b c y k f dy σ r a b c d Tabela 3. Wartości współczynnika korelacji rozkładu uciętego dla różnych zestawów wartości parametrów dwuwymiarowego rozkładu normalnego uciętego Zestaw r u C 0,407 D 0,78 E 0,0 F 0,07
7 Generowanie tablic dwudzielczych Z tab. i 3 wynika, że wraz ze wzrostem wartości parametrów σ i σ (zestaw C i D) przy stałej wartości pozostałych parametrów, korelacja rozkładu maleje. Zwiększając cięcie, czyli zmniejszając pole obszaru a, b c, d (zestaw D i E), korelacja rozkładu maleje. Oczywiście wraz ze wzrostem korelacji rozkładu pełnego (zestaw E i F), rośnie także korelacja rozkładu uciętego. 3. Generowanie liczb losowych o dwuwymiarowym rozkładzie normalnym uciętym Do generowania liczb losowych o DRNU niezbędne są liczby losowe o rozkładzie normalnym N ( 0; ). Na podstawie centralnego twierdzenia granicznego zmienna losowa [Zieliński, Wieczorkowski, 997]: X = R i i= 6 ma w przybliżeniu N ( 0; ), gdzie R jest niezależną zmienną losową o rozkładzie równomiernym na przedziale (0;). Zauważmy, że E ( X ) = 0, V ( X ) =. Bardziej współczesnym sposobem jest generowanie liczb losowych o rozkładzie normalnym z wykorzystaniem transformacji Boxa-Mullera [Box, Muller, 958]. Jeżeli R, R są niezależnymi zmiennymi losowymi o rozkładzie równomiernym na przedziale (0;), to: U = ln( R ) cos( πr ), V ln( R ) sin( πr ) są niezależne i mają N ( 0,). Jeżeli zmienna losowa X ma rozkład N ( 0,) zmienna losowa X s + m ma rozkład N ( m, s). = (4) W celu otrzymania realizacji dwuwymiarowej zmiennej losowej normalnej (X, Y) o gęstości () należy skorzystać ze wzorów [Zieliński, Wieczorkowski, 997]: X = σ U + μ, = rσ U + σ V r + μ, to Y (5) gdzie V N 0;. W celu otrzymania realizacji dwuwymiarowej zmiennej losowej normalnej ( X, Y ), uciętej do obszaru a X b c Y d o gęstości () należy skorzystać z metody rejection sampling opisanej algorytmem [Zieliński, Wieczorkowski, 997]: U, są zmiennymi niezależnymi o ( )
8 78. Generuj U i V na podstawie (4).. Generuj X i Y na podstawie (5). 3. Jeżeli a X b oraz c Y d, to zwróć ( X, Y ). W sytuacji przeciwnej wróć do pkt.. Implementację komputerową metody rejection sampling generowania prób z wielowymiarowego rozkładu normalnego uciętego w języku R przedstawiono w pracy S. Wilhelma i B.G. Manjunatha [009]. Jeżeli tylko niewielki procent próbek wpada do obszaru a ; b c; d, to można skorzystać z metody Gibbs sampling, w której 00% próbek wpada do obszaru a ; b c; d [Kotecha, Djuric, 999; Horrace, 005]. Główną wadą Gibbs sampling jest to, że próbki nie są niezależne, lecz skorelowane. Badając właściwości testów statystycznych, należy nadać populacji generalnej określoną właściwość, jaką jest związek między cechami. Do wyznaczenia empirycznej mocy testów w dobie szybko rozwającej się komputeryzacji metoda rejection sampling jest wystarczająca. 4. Generowanie tablic dwudzielczych w k (w, k > ) W celu utworzenia TD w k ( w, k > ), wygenerowano n realizacji zmiennej losowej o DRNU za pomocą wzorów (5) i metody rejection sampling. Otrzymane w ten sposób wartości ( X i, Yi ) ( i =,,..., n) zapisano w układzie współrzędnych i na powstały w ten sposób obszar naniesiono TD w k. Rysunek 5 przedstawia próbę n = 00 elementową, uzyskaną odpowiednio dla zestawu A wartości parametrów, natomiast rys. 6 dla zestawu B (tab. ). Próba ta tworzy obszar wartości dwuwymiarowej zmiennej losowej normalnej uciętej, który został nałożony na TD o wymiarach 4.
9 Generowanie tablic dwudzielczych Y X Rys elementowy obszar wartości zmiennej losowej o dwuwymiarowym rozkładzie normalnym uciętym dla zestawu A wartości parametrów, nałożony na TD 4 0,5 Y 0-0,5 - -0,5 0 0,5 X Rys elementowy obszar wartości zmiennej losowej o dwuwymiarowym rozkładzie normalnym uciętym dla zestawu B wartości parametrów, nałożony na TD 4
10 80 W następnym kroku dla w wierszy i k kolumn obliczono szerokości poszczególnych klas za pomocą wzorów: h x b a =, w h y c d = k oraz wyznaczono punkty podziału osi układu współrzędnych tworzące klasy: Q = a + j h ( j = 0 w), P = c + i h ( i = 0 k) j x, i y, Następnie stwierdzono, ile punktów o współrzędnych X, ) ( i,,..., n) ( i Yi = należy do każdej z w k klas TD. Dla tak wypełnionej TD wyznaczono rozkłady brzegowe. TD 4 odpowiadającą rys. 5 przedstawiono w tab. 4, natomiast TD 4 odpowiadającą rys. 6 w tab. 5. Tabela 4. Tablica dwudzielcza 4 dla zestawu A wartości parametrów dwuwymiarowego rozkładu normalnego uciętego Y Y Y 3 Y 4 Razem X X Razem Tabela 5. Tablica dwudzielcza 4 dla zestawu B wartości parametrów dwuwymiarowego rozkładu normalnego uciętego Y Y Y 3 Y 4 Razem X X Razem Z tab. 4 i 5 wynika, że najmniej realizacji mają skrajne kolumny, natomiast liczebność wierszy jest podobna. Dla tab. 5 obszar wartości zmiennej losowej o DRNU został zmniejszony i dzięki stałej wartości r = 0, 4 w komórkach narożnych pojawiło się więcej realizacji niż w tab. 4. Przykład Korzystając z DRNU, opisanego zestawami G i H wartości parametrów (tab. 6) wygenerowano TD 4 4 złożoną z 300 elementów. Wartości parametrów dobrano w taki sposób, by każda z 6 komórek TD była większa od zera.
11 Generowanie tablic dwudzielczych... 8 Tabela 6. Zestawy wartości parametrów dwuwymiarowego rozkładu normalnego uciętego μ σ μ σ r a b c d Zestaw G 0 0 0,4 - - H 0 0 0, realizacji zmiennej losowej o DRNU, uzyskanych dla zestawów G i H wartości parametrów, naniesiono na układ współrzędnych (rys. 7A zestaw G; rys. 7B zestaw H). Następnie obliczono, ile realizacji wypełnia każdą z 6 klas, tworzących TD 4 4. Dla tak wypełnionej TD wyznaczono rozkłady brzegowe. Uzyskane wyniki prezentują tab. 7 i 8. 0,5 0,5 Y 0 Y 0-0,5-0,5 A ,5 0 0,5 X B ,5 0 0,5 X Rys elementowy obszar wartości zmiennej losowej o dwuwymiarowym rozkładzie normalnym uciętym nałożony na TD 4 4 Tabela 7. Tablica dwudzielcza 4 4 dla zestawu G wartości parametrów dwuwymiarowego rozkładu normalnego uciętego Y Y Y 3 Y 4 Razem X X X X Razem Tabela 8. Tablica dwudzielcza 4 4 dla zestawu H wartości parametrów dwuwymiarowego rozkładu normalnego uciętego Y Y Y 3 Y 4 Razem X X X X Razem
12 8 Dla tab. 7 i 8 obszar wartości zmiennej losowej o DRNU jest stały, jednak różne są wartości współczynnika korelacji. Wraz z jego wzrostem zmniejsza się liczba realizacji w lewym górnym oraz prawym dolnym narożu. Przykład Korzystając z DRNU, opisanego wartościami parametrów (tab. 9), wygenerowano zawartość TD 4 8 złożoną z 750 elementów. Wartości parametrów dobrano w taki sposób, by każda z 3 komórek TD była większa od zera. Tabela 9. Zestawy wartości parametrów dwuwymiarowego rozkładu normalnego uciętego μ σ μ σ r a b c d Zestaw I 0 0 0,9-0,5 0,5-0,5 0,5 J 0 0-0,9-0,5 0,5-0,5 0,5 750 realizacji zmiennej losowej o DRNU naniesiono na układ współrzędnych (zestaw I rys. 8A, zestaw J rys. 8B). Następnie obliczono, ile realizacji wypełnia każdą z 3 klas tworzących TD 4 8. Dla tak wypełnionej TD, wyznaczono rozkłady brzegowe. Uzyskane wyniki prezentują tab. 0 i. 0,5 0,5 0,5 0,5 Y 0 Y 0-0,5-0,5-0,5-0,5-0,375-0,5-0,5 0 0,5 0,5 0,375 0,5 X A -0,5-0,5-0,375-0,5-0,5 0 0,5 0,5 0,375 0,5 X Rys elementowy obszar wartości zmiennej losowej o dwuwymiarowym rozkładzie normalnym uciętym nałożony na TD 4 8. B Tabela 0. Tablica dwudzielcza 4 8 dla zestawu I wartości parametrów dwuwymiarowego rozkładu normalnego uciętego Y Y Y 3 Y 4 Y 5 Y 6 Y 7 Y 8 Razem X X X X Razem
13 Generowanie tablic dwudzielczych Tabela. Tablica dwudzielcza 4 8 dla zestawu J wartości parametrów dwuwymiarowego rozkładu normalnego uciętego Y Y Y 3 Y 4 Y 5 Y 6 Y 7 Y 8 Razem X X X X Razem Z tab. 0 i wynika, iż mimo silnej korelacji między zmiennymi X i Y komórki TD nie są puste, co miało miejsce w przypadku, gdy do generacji TD wykorzystano DRN. W tab. 9 najmniejsze wartości realizacji zmiennej losowej znajdują się w narożu lewym górnym oraz prawym dolnym (korelacja dodatnia). W tab. 0 najmniejsze wartości realizacji zmiennej losowej znajdują się w narożu lewym dolnym i prawym górnym (korelacja ujemna). Przykład 3 Wyznaczono empiryczną moc testów na poziomie istotności α = 0, dla tablicy dwudzielczej 3 3 oraz 4 4, liczebności próby odpowiednio n = 300 oraz n = 500, korzystając ze statystyk chi-kwadrat. Tablice dwudzielcze generowano za pomocą dwuwymiarowego rozkładu normalnego uciętego dla zestawu K wartości parametrów (tab. ). Wartości krytyczne wyznaczono symulacyjnie metodą Monte Carlo. Tabela. Wartości parametrów dwuwymiarowego rozkładu normalnego uciętego σ a b c d r μ σ μ Zestaw K ; 0,05;...;0,7 Postaci statystyk chi-kwadrat [Cressie, Read, 984] przedstawia tab. 3. Jak już to zostało wspomniane wcześniej, trzy z tych statystyk nie tolerują warunku n = 0 i =,..., w; j =,..., k. ( ) Tabela 3. Statystyki chi-kwadrat (ang. power divergence statistics) χ Pearsona G ilorazu wiarygodności Nazwa statystyki Postać statystyki w k n e χ = e i= j= w G = k i= j= ( ) n n ln e
14 84 cd. tabeli 3 N Neymanna KL Kullbacka-Leiblera N = KL = w k ( n e ) i= j= w k i= j= n e e ln n w k FT Freemana-Tukeya FT = 4 ( n e ) D Cressiego-Reada Oznaczenia: e liczebność oczekiwana i= j= /3 w k 9 n CR = n 5 i= j= e Rysunki 9 i 0 przedstawiają empiryczne moce testów dla danych wartości parametrów DRNU (tab. ). Wynika z nich, że testy niezależności wykorzystujące statystyki chi-kwadrat charakteryzują się podobną mocą dla wszystkich wartości współczynnika korelacji r i dla różnych rozmiarów TD. Analogiczna sytuacja miała miejsce w pracy P. Sulewskiego [06], gdzie TD generowano metodą słupkową, a do wyznaczenia mocy testów skorzystano z innej miary nieprawdziwości H 0.,0 0,9 χ G n=300; 3x3; α=0, 0,8 N KL 0,7 0,6 FT D Moc testu M 0,5 0,4 0,3 0, 0, 0,0 0 0, 0, 0,3 0,4 0,5 0,6 0,7 Współczynnik korelacji r Rys. 9. Empiryczne moce testów na poziomie istotności α = 0,, dla tablicy dwudzielczej 3 3 i liczebności próby n = 300
15 Generowanie tablic dwudzielczych... 85,0 0,9 χ G n=500; 4x4; α=0, 0,8 N KL 0,7 0,6 FT D Moc testu M 0,5 0,4 0,3 0, 0, 0,0 0 0, 0, 0,3 0,4 0,5 0,6 0,7 Współczynnik korelacji r Rys. 0. Empiryczne moce testów na poziomie istotności α = 0,, dla tablicy dwudzielczej 4 4 i liczebności próby n = 500 Podsumowanie Badając moc testów, należy wiedzieć, jaki jest rzeczywisty związek między cechami. W celu wyznaczenia empirycznej mocy testu niezbędne jest generowanie TD. Generowanie TD, gdy nie ma związku między badanymi cechami, nie przysparza trudności. Zadaniem niewątpliwie trudniejszym jest generowanie TD w sytuacji, gdy zachodzi związek między cechami. Generowanie TD z wykorzystaniem DRN napotyka na trudności związane z tym, iż jej komórki narożnikowe są puste. Zastosowanie DRNU sprawia, że nawet w sytuacji silnej korelacji między cechami, komórki TD nie są puste i zawierają wystarczającą liczbę realizacji. Z przykładu 3 wynika, że zaproponowana metoda generacji TD jest alternatywą dla metody słupkowej i nie tylko. Literatura Blitzstein J., Diaconis P. (0), A Sequential Importance Sampling Algorithm for Generating Random Graphs with Prescribed Degrees, Internet Mathematics, No. 6, s Box G.E.P., Muller M.E. (958), A Note on the Generation of Random Normal Deviates, The Annals of Mathematical Statistics, Vol. 9().
16 86 Chen Y., Diaconis P., Holmes S.P., Liu J.S. (005), Sequential Monte Carlo Methods for Statistical Analysis of Tables, Journal of the American Statistical Association, No. 00, s Chen Y., Dinwoodie I.H., Sullivant S. (006), Sequential Importance Sampling for Multiway Tables, The Annals of Statistics, s Cramer H. (958), Metody matematyczne w statystyce, PWN, Warszawa. Cressie N., Read T. (984), Multinomial Goodness-of-Fit Tests, Journal of the Royal Statistical Society: Series B (Statistical Methodology), No. 46, s Cryan M., Dyer M. (003), A Polynomial-time Algorithm to Approximately Count Contingency Tables When the Number of Rows is Constant, Journal of Computer and System Sciences, No. 67, s Cryan M., Dyer M., Goldberg L.A., Jerrum M., Martin R. (006), Rapidly Mixing Markov Chains for Sampling Contingency Tables with a Constant Number of Rows, SIAM Journal on Computing, No. 36, s Desalvo S., Zhao J.Y. (06), Random Sampling of Contingency Tables via Probabilistic Divide-and-Conquer, ArXiv preprint, arxiv: v4. Diaconis P., Sturmfels B. (998), Algebraic Algorithms for Sampling from Conditional Distributions, The Annals of Statistics, No. 6, s Fishman G.S. (0), Counting Contingency Tables via Multistage Markov Chain Monte Carlo, Journal of Computational and Graphical Statistics, No., s Holmes R.B., Jones L.K. (996), On Uniform Generation of Two-way Tables with Fixed Margins and the Conditional Volume test of Diaconis and Efron, The Annals of Statistics, Vol. 4(). Horrace W.C. (005), Some Results on the Multivariate Truncated Normal Distribution, Journal of Multivariate Analysis, No. 94. Kendall M.G., Buckland W.R. (986), Słownik terminów statystycznych, PWE, Warszawa. Kotecha J.H., Djuric P.M. (999), Gibbs Sampling Approach for Generation of Truncated Multivariate Gaussian Random Variables, IEEE Computer Society. Nandram B., Bhatta D., Bhadra D. (03), A Likelihood Ratio Test of Quasiindependence for Sparse Two-way Contingency Tables, Journal of Statistical Computation and Simulation, Vol. 85(), s Pearson K. (904), On the Theory of Contingency and its Relation to Association and Normal Correlation, K. Pearson, Early Papers. Sulewski P. (009), Two-by-two Contingency Table as a Goodness-of-fit test, Computational Methods in Science and Technology, Vol. 5(). Sulewski P. (04a), Statystyczne badanie współzależności cech typu dyskretne kategorie, Wydawnictwo Naukowe Akademii Pomorskiej, Słupsk. Sulewski P. (04b), Wykorzystanie uogólnionego rozkładu gamma do generowania tablicy dwudzielczej, Śląski Przegląd Statystyczny, nr (8).
17 Generowanie tablic dwudzielczych Sulewski P. (05), Wyznaczanie obszaru krytycznego przy testowaniu niezależności w tablicach wielodzielczych, Wiadomości Statystyczne, nr 3. Sulewski P. (06), Moc testów niezależności w tablicy dwudzielczej większej niż, Przegląd Statystyczny, nr 63(), s Wilhelm S., Manjunath B.G. (009), tmvtnorm: A Package for the Truncated Multivariate Normal Distribution, The R Journal, Vol. (). Yoshida R., Xi J., Wei S., Zhou F., Haws D. (0), Semigroups and Sequential Importance Sampling for Multiway Tables, arxiv preprint, arxiv:.658. Zieliński R., Wieczorkowski R. (997), Komputerowe generatory liczb losowych, WN-T, Warszawa. GENERATING THE TWO-WAY CONTINGENCY TABLES USING THE TRUNCATED TWO-DIMENSIONAL NORMAL DISTRIBUTION Summary: The procedure to generate random numbers of the truncated two-dimensional normal distribution (DRNU) was presented. The generating of two-way contingency table using random variable of DRNU was described. The presented theory has been enriched with specific examples, that were implemented in the VBA editor of spreadsheet Microsoft Excel. Keywords: two-way contingency tables, generating of Monte Carlo, independence test, truncated two-dimensional normal distribution.
Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych
dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo
MOC TESTÓW NIEZALEŻNOŚCI W TABLICY TRÓJDZIELCZEJ 2 2 2
PRZEGLĄD STATYSTYCZNY R. LXIII ZESZYT 4 2016 PIOTR SULEWSKI 1 MOC TESTÓW NIEZALEŻNOŚCI W TABLICY TRÓJDZIELCZEJ 2 2 2 1. WPROWADZENIE Moc testów to prawdopodobieństwo odrzucenia hipotezy zerowej, gdy nie
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie
ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna
Ćwiczenie 4 ANALIZA KORELACJI, BADANIE NIEZALEŻNOŚCI Analiza korelacji jest działem statystyki zajmującym się badaniem zależności pomiędzy rozkładami dwu lub więcej badanych cech w populacji generalnej.
Wielowymiarowe uogólnienie testu niezależności
Piotr SULEWSKI Wielowymiarowe uogólnienie testu niezależności W literaturze statystycznej znajdujemy głównie metody wnioskowania dotyczące jednej zmiennej. Jednak w badaniach statystycznych obiekty opisywane
Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych
Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej
Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.
Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ
Wykład 12 Testowanie hipotez dla współczynnika korelacji
Wykład 12 Testowanie hipotez dla współczynnika korelacji Wrocław, 23 maja 2018 Współczynnik korelacji Niech będą dane dwie próby danych X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y n ). Współczynnikiem
Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa
Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie
Wykład 12 Testowanie hipotez dla współczynnika korelacji
Wykład 12 Testowanie hipotez dla współczynnika korelacji Wrocław, 24 maja 2017 Współczynnik korelacji Niech będą dane dwie próby danych X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y n ). Współczynnikiem
Wykład 8 Dane kategoryczne
Wykład 8 Dane kategoryczne Wrocław, 19.04.2017r Zmienne kategoryczne 1 Przykłady zmiennych kategorycznych 2 Zmienne nominalne, zmienne ordynalne (porządkowe) 3 Zmienne dychotomiczne kodowanie zmiennych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
Właściwości testu Jarque-Bera gdy w danych występuje obserwacja nietypowa.
Właściwości testu Jarque-Bera gdy w danych występuje obserwacja nietypowa. Paweł Strawiński Uniwersytet Warszawski Wydział Nauk Ekonomicznych 16 stycznia 2006 Streszczenie W artykule analizowane są właściwości
Kilka uwag o testowaniu istotności współczynnika korelacji
341 Zeszyty Naukowe Wyższej Szkoły Bankowej we Wrocławiu Nr 20/2011 Piotr Peternek Uniwersytet Ekonomiczny we Wrocławiu Marek Kośny Uniwersytet Ekonomiczny we Wrocławiu Kilka uwag o testowaniu istotności
Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11
Testy zgodności Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki Szczecińskiej 27. Nieparametryczne testy zgodności Weryfikacja
Statystyka matematyczna. Wykład VI. Zesty zgodności
Statystyka matematyczna. Wykład VI. e-mail:e.kozlovski@pollub.pl Spis treści 1 Testy zgodności 2 Test Shapiro-Wilka Test Kołmogorowa - Smirnowa Test Lillieforsa Test Jarque-Bera Testy zgodności Niech x
MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ
MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ Opracowała: Milena Suliga Wszystkie pliki pomocnicze wymienione w treści
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).
Egzamin ze Statystyki Matematycznej, WNE UW, wrzesień 016, zestaw B Odpowiedzi i szkice rozwiązań 1. Zbadano koszt 7 noclegów dla 4-osobowej rodziny (kwatery) nad morzem w sezonie letnim 014 i 015. Wylosowano
Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI
ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI Korelacja 1. Współczynnik korelacji 2. Współczynnik korelacji liniowej definicja 3. Estymacja współczynnika korelacji 4. Testy istotności współczynnika korelacji
Zawartość. Zawartość
Opr. dr inż. Grzegorz Biesok. Wer. 2.05 2011 Zawartość Zawartość 1. Rozkład normalny... 3 2. Rozkład normalny standardowy... 5 3. Obliczanie prawdopodobieństw dla zmiennych o rozkładzie norm. z parametrami
Korelacja krzywoliniowa i współzależność cech niemierzalnych
Korelacja krzywoliniowa i współzależność cech niemierzalnych Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki Szczecińskiej
Wykład 7 Testowanie zgodności z rozkładem normalnym
Wykład 7 Testowanie zgodności z rozkładem normalnym Wrocław, 05 kwietnia 2017 Rozkład normalny Niech X = (X 1, X 2,..., X n ) będzie próbą z populacji o rozkładzie normalnym określonym przez dystrybuantę
Spis treści 3 SPIS TREŚCI
Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe
Prawdopodobieństwo i statystyka
Wykład VII: Metody specjalne Monte Carlo 24 listopada 2014 Transformacje specjalne Przykład - symulacja rozkładu geometrycznego Niech X Ex(λ). Rozważmy zmienną losową [X ], która przyjmuje wartości naturalne.
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Sposoby prezentacji problemów w statystyce
S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki
O testach wielowymiarowej normalności opartych na statystyce Shapiro-Wilka
O testach wielowymiarowej normalności opartych na statystyce Shapiro-Wilka Katedra Zastosowań Matematyki i Informatyki Uniwersytet Przyrodniczy w Lublinie Wisła 2012, 7.12.2012 Plan prezentacji 1 Wprowadzenie
Kolokwium ze statystyki matematycznej
Kolokwium ze statystyki matematycznej 28.05.2011 Zadanie 1 Niech X będzie zmienną losową z rozkładu o gęstości dla, gdzie 0 jest nieznanym parametrem. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
ZASTOSOWANIE METOD SYMULACYJNYCH W ANALIZIE WIELOWYMIAROWYCH TABLIC WIELODZIELCZYCH
Grzegorz Kończak Magdalena Chmielińska Uniwersytet Ekonomiczny w Katowicach ZASTOSOWANIE METOD SYMULACYJNYCH W ANALIZIE WIELOWYMIAROWYCH TABLIC WIELODZIELCZYCH Wprowadzenie W ostatnich latach w badaniach
Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW
Założenia do analizy wariancji dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW anna_rajfura@sggw.pl Zagadnienia 1. Normalność rozkładu cechy Testy: chi-kwadrat zgodności, Shapiro-Wilka, Kołmogorowa-Smirnowa
Weryfikacja hipotez statystycznych testy t Studenta
Weryfikacja hipotez statystycznych testy t Studenta JERZY STEFANOWSKI Marek Kubiak Instytut Informatyki Politechnika Poznańska Standardowy schemat postępowania (znane σ) Założenia: X ma rozkład normalny
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 6 Wrocław, 7 listopada 2011 Temat. Weryfikacja hipotez statystycznych dotyczących proporcji. Test dla proporcji. Niech X 1,..., X n będzie próbą statystyczną z 0-1. Oznaczmy odpowiednio
ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI
ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI ANALIZA KORELACJI Korelacja 1. Współczynnik korelacji 2. Współczynnik korelacji liniowej definicja 3. Estymacja współczynnika korelacji 4. Testy istotności
Monte Carlo, bootstrap, jacknife
Monte Carlo, bootstrap, jacknife Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej: http://www.ssc.wisc.edu/~bhansen/econometrics/ Monte Carlo: rozdział 8.8, 8.9 Bootstrap: rozdział
Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat
Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat Anna Rajfura 1 Przykład W celu porównania skuteczności wybranych herbicydów: A, B, C sprawdzano, czy masa chwastów na poletku zależy
Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)
Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne) Przygotował: Dr inż. Wojciech Artichowicz Katedra Hydrotechniki PG Zima 2014/15 1 TABLICE ROZKŁADÓW... 3 ROZKŁAD
Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015
Zmienne losowe, statystyki próbkowe Wrocław, 2 marca 2015 Zasady zaliczenia 2 kolokwia (każde po 20 punktów) projekt (20 punktów) aktywność Zasady zaliczenia 2 kolokwia (każde po 20 punktów) projekt (20
), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0
Testowanie hipotez Każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy nazywamy hipotezą statystyczną. Hipoteza określająca jedynie wartości nieznanych parametrów liczbowych badanej cechy
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, że 40% owoców ulega uszkodzeniu podczas pakowania automatycznego.
Testowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej
Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:
ROZWIĄZANIA I ODPOWIEDZI Zadanie A1. Można założyć, że przy losowaniu trzech kul jednocześnie kolejność ich wylosowania nie jest istotna. A więc: Ω = 20 3. a) Niech: - wśród trzech wylosowanych opakowań
Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa
Spis treści Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Romuald Kotowski Katedra Informatyki Stosowanej PJWSTK 2009 Spis treści Spis treści 1 Wstęp Bardzo często interesujący
12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych
(pieczęć wydziału) KARTA PRZEDMIOTU Z1-PU7 WYDANIE N1 Strona 1 z 5 1. Nazwa przedmiotu: Rachunek prawdopodobieństwa i statystyka matematyczna 2. Kod przedmiotu: RPiS 3. Karta przedmiotu ważna od roku akademickiego:
Badanie zależności skala nominalna
Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność
12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych
(pieczęć wydziału) KARTA PRZEDMIOTU Z1-PU7 WYDANIE N1 Strona 1 z 5 1. Nazwa przedmiotu: Rachunek prawdopodobieństwa i statystyka matematyczna 2. Kod przedmiotu: RPiS 3. Karta przedmiotu ważna od roku akademickiego:
Testowanie hipotez dla frakcji. Wrocław, 29 marca 2017
Testowanie hipotez dla frakcji Wrocław, 29 marca 2017 Powtórzenie z rachunku prawdopodobieństwa Centralne Twierdzenie Graniczne Niech X = (X 1, X 2,..., X n ) oznacza próbę z rozkładu o średniej µ i skończonej
Statystyka matematyczna. Wykład III. Estymacja przedziałowa
Statystyka matematyczna. Wykład III. e-mail:e.kozlovski@pollub.pl Spis treści Rozkłady zmiennych losowych 1 Rozkłady zmiennych losowych Rozkład χ 2 Rozkład t-studenta Rozkład Fischera 2 Przedziały ufności
Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie
Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie Jarosław Kotowicz Instytut Matematyki Uniwersytet w
Testowanie hipotez dla proporcji. Wrocław, 13 kwietnia 2015
Testowanie hipotez dla proporcji Wrocław, 13 kwietnia 2015 Powtórka z rachunku prawdopodobieństwa Centralne Twierdzenie Graniczne Niech X = (X 1, X 2,..., X n ) oznacza próbę z rozkładu o średniej µ i
Wnioskowanie statystyczne i weryfikacja hipotez statystycznych
Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
Statystyka matematyczna. Wykład V. Parametryczne testy istotności
Statystyka matematyczna. Wykład V. e-mail:e.kozlovski@pollub.pl Spis treści 1 Weryfikacja hipotezy o równości wartości średnich w dwóch populacjach 2 3 Weryfikacja hipotezy o równości wartości średnich
WSPÓŁCZYNNIK DWUMODALNOŚCI BC I JEGO ZASTOSOWANIE W ANALIZACH ROZKŁADÓW ZMIENNYCH LOSOWYCH
METODY ILOŚCIOWE W BADANIACH EKONOMICZNYCH Tom XV/3, 2014, str. 20 29 WSPÓŁCZYNNIK DWUMODALNOŚCI BC I JEGO ZASTOSOWANIE W ANALIZACH ROZKŁADÓW ZMIENNYCH LOSOWYCH Aleksandra Baszczyńska, Dorota Pekasiewicz
Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym
Wiesława MALSKA Politechnika Rzeszowska, Polska Anna KOZIOROWSKA Uniwersytet Rzeszowski, Polska Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym Wstęp Wnioskowanie statystyczne
Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału
Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału Magdalena Frąszczak Wrocław, 22.02.2017r Zasady oceniania Ćwiczenia 2 kolokwia (20 punktów każde) 05.04.2017 oraz 31.05.2017 2 kartkówki
Testowanie hipotez statystycznych
Temat Testowanie hipotez statystycznych Kody znaków: Ŝółte wyróŝnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Idea i pojęcia teorii testowania hipotez
Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).
PRZYKŁADY TESTÓW NIEPARAMETRYCZNYCH. Test zgodności χ 2. Ten test służy testowaniu hipotezy, czy rozważana zmienna ma pewien ustalony rozkład, czy też jej rozkład różni się od tego ustalonego. Tym testem
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Weryfikacja hipotez dotyczących postaci nieznanego rozkładu -Testy zgodności.
Wykład 11 Testowanie jednorodności
Wykład 11 Testowanie jednorodności Wrocław, 17 maja 2018 Test χ 2 jednorodności Niech X i, i = 1, 2,..., k będą niezależnymi zmiennymi losowymi typu dyskretnego przyjmującymi wartości z 1, z 2,..., z l,
STATYSTYKA
Wykład 1 20.02.2008r. 1. ROZKŁADY PRAWDOPODOBIEŃSTWA 1.1 Rozkład dwumianowy Rozkład dwumianowy, 0 1 Uwaga: 1, rozkład zero jedynkowy. 1 ; 1,2,, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym
POLITECHNIKA OPOLSKA
POLITECHNIKA OPOLSKA WYDZIAŁ MECHANICZNY Katedra Technologii Maszyn i Automatyzacji Produkcji Laboratorium Podstaw Inżynierii Jakości Ćwiczenie nr 4 Temat: Analiza korelacji i regresji dwóch zmiennych
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
1. Symulacje komputerowe Idea symulacji Przykład. 2. Metody próbkowania Jackknife Bootstrap. 3. Łańcuchy Markova. 4. Próbkowanie Gibbsa
BIOINFORMATYKA 1. Wykład wstępny 2. Bazy danych: projektowanie i struktura 3. Równowaga Hardyego-Weinberga, wsp. rekombinacji 4. Analiza asocjacyjna 5. Analiza asocjacyjna 6. Sekwencjonowanie nowej generacji
Wykorzystanie nowoczesnych technik prognozowania popytu i zarządzania zapasami do optymalizacji łańcucha dostaw na przykładzie dystrybucji paliw cz.
14.12.2005 r. Wykorzystanie nowoczesnych technik prognozowania popytu i zarządzania zapasami do optymalizacji łańcucha dostaw na przykładzie dystrybucji paliw cz. 2 3.2. Implementacja w Excelu (VBA for
Prawdopodobieństwo i statystyka
Wykład XI: Testowanie hipotez statystycznych 12 stycznia 2015 Przykład Motywacja X 1, X 2,..., X N N (µ, σ 2 ), Y 1, Y 2,..., Y M N (ν, δ 2 ). Chcemy sprawdzić, czy µ = ν i σ 2 = δ 2, czyli że w obu populacjach
Rozkłady statystyk z próby. Statystyka
Rozkłady statystyk z próby tatystyka Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających ten
dr hab. Dariusz Piwczyński, prof. nadzw. UTP
dr hab. Dariusz Piwczyński, prof. nadzw. UTP Cechy jakościowe są to cechy, których jednoznaczne i oczywiste scharakteryzowanie za pomocą liczb jest niemożliwe lub bardzo utrudnione. nominalna porządek
Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu
Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotności, p-wartość i moc testu Wrocław, 01.03.2017r Przykład 2.1 Właściciel firmy produkującej telefony komórkowe twierdzi, że wśród jego produktów
DOKŁADNA METODA BOOTSTRAPOWA NA PRZYKŁADZIE ESTYMACJI ŚREDNIEJ
METOY ILOŚCIOWE W BAANIACH EKONOMICZNYCH Tom XII/2, 20, str. 9 20 OKŁANA METOA BOOTSTRAPOWA NA PRZYKŁAZIE ESTYMACJI ŚRENIEJ Joanna Kisielińska Katedra Ekonomiki Rolnictwa i Międzynarodowych Stosunków Gospodarczych
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, Ŝe 40% owoców ulega uszkodzeniu podczas pakowania automatycznego.
Metody Ilościowe w Socjologii
Metody Ilościowe w Socjologii wykład 2 i 3 EKONOMETRIA dr inż. Maciej Wolny AGENDA I. Ekonometria podstawowe definicje II. Etapy budowy modelu ekonometrycznego III. Wybrane metody doboru zmiennych do modelu
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl
ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x
ZJAZD 4 KORELACJA, BADANIE NIEZALEŻNOŚCI, ANALIZA REGRESJI Analiza korelacji i regresji jest działem statystyki zajmującym się badaniem zależności i związków pomiędzy rozkładami dwu lub więcej badanych
Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
Wykład 10 Testy jednorodności rozkładów
Wykład 10 Testy jednorodności rozkładów Wrocław, 16 maja 2018 Test Znaków test jednorodności rozkładów nieparametryczny odpowiednik testu t-studenta dla prób zależnych brak normalności rozkładów Test Znaków
Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn
Wykład 10 Estymacja przedziałowa - przedziały ufności dla średniej Wrocław, 21 grudnia 2016r Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja 10.1 Przedziałem
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium JAVA Zadanie nr 2 Rozpoznawanie liter autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z problemem klasyfikacji
Testy dla dwóch prób w rodzinie rozkładów normalnych
Testy dla dwóch prób w rodzinie rozkładów normalnych dr Mariusz Grządziel Wykład 12; 18 maja 2009 Przykład Rozważamy dane wygenerowane losowo; ( podobne do danych z przykładu 7.2 z książki A. Łomnickiego)
Testowanie hipotez statystycznych
Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom
Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych
Wykład 12 (21.05.07): Testy dla dwóch prób w rodzinie rozkładów normalnych Przykład Rozważamy dane wygenerowane losowo; ( podobne do danych z przykładu 7.2 z książki A. Łomnickiego) n 1 = 9 poletek w dąbrowie,
LABORATORIUM 6 ESTYMACJA cz. 2
LABORATORIUM 6 ESTYMACJA cz. 2 TEORIA ESTYMACJI I 1. ODRZUCANIE WYNIKÓW WĄTPLIWYCH PRÓBA P (m) (m-elementowa) Obliczenie: ; s bez wyników wątpliwych Odrzucenie wyników z poza przedziału: 3s PRÓBA LOSOWA
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Magdalena Frąszczak Wrocław, 21.02.2018r Tematyka Wykładów: Próba i populacja. Estymacja parametrów z wykorzystaniem metody
Zadania ze statystyki, cz.6
Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z
Instytut Fizyki Politechniki Łódzkiej Laboratorium Metod Analizy Danych Doświadczalnych Ćwiczenie 3 Generator liczb losowych o rozkładzie Rayleigha.
Instytut Fizyki Politechniki Łódzkiej Laboratorium Metod Analizy Danych Doświadczalnych Generator liczb losowych o rozkładzie Rayleigha. Generator liczb losowych o rozkładzie Rayleigha. 1. Cel ćwiczenia
WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Było: Estymacja parametrów rozkładu teoretycznego punktowa przedziałowa Przykład. Cecha X masa owocu pewnej odmiany. ZałoŜenie: cecha X ma w populacji rozkład
Wnioskowanie statystyczne. Statystyka w 5
Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających
Pobieranie prób i rozkład z próby
Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.
PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa
Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa Test serii (test Walda-Wolfowitza) Założenie. Rozpatrywane rozkłady są ciągłe. Mamy dwa uporządkowane
Analiza autokorelacji
Analiza autokorelacji Oblicza się wartości współczynników korelacji między y t oraz y t-i (dla i=1,2,...,k), czyli współczynniki autokorelacji różnych rzędów. Bada się statystyczną istotność tych współczynników.
Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona
Badanie zależności między cechami Obserwujemy dwie cechy: X oraz Y Obiekt (X, Y ) H 0 : Cechy X oraz Y są niezależne Próba: (X 1, Y 1 ),..., (X n, Y n ) Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności
Prawdopodobieństwo i statystyka r.
Zadanie. Niech (X, Y) ) będzie dwuwymiarową zmienną losową, o wartości oczekiwanej (μ, μ, wariancji każdej ze współrzędnych równej σ oraz kowariancji równej X Y ρσ. Staramy się obserwować niezależne realizacje
Analiza Statystyczna
Lekcja 5. Strona 1 z 12 Analiza Statystyczna Do analizy statystycznej wykorzystać można wbudowany w MS Excel pakiet Analysis Toolpak. Jest on instalowany w programie Excel jako pakiet dodatkowy. Oznacza
Ćwiczenie: Wybrane zagadnienia z korelacji i regresji
Ćwiczenie: Wybrane zagadnienia z korelacji i regresji W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Stanisza r xy = 0 zmienne nie są skorelowane 0 < r xy 0,1