Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych



Podobne dokumenty
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Wykład 3 Hipotezy statystyczne

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Sterowanie wielkością zamówienia w Excelu - cz. 3

Ekonometria. Zajęcia

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)

SPIS TREŚCI. Do Czytelnika... 7

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

Wykład 14. Testowanie hipotez statystycznych - test zgodności chi-kwadrat. Generowanie liczb losowych.

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Zastosowanie Excela w matematyce

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Statystyka matematyczna dla leśników

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Kolokwium ze statystyki matematycznej

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Testowanie hipotez. 1 Testowanie hipotez na temat średniej

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Rozkład Gaussa i test χ2

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Rozdział 8. Regresja. Definiowanie modelu

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Wnioskowanie statystyczne. Statystyka w 5

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Analiza wariancji. dr Janusz Górczyński

wolne wolne wolne wolne

Wprowadzenie do analizy korelacji i regresji

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Analiza autokorelacji

Instytut Fizyki Politechniki Łódzkiej Laboratorium Metod Analizy Danych Doświadczalnych Ćwiczenie 3 Generator liczb losowych o rozkładzie Rayleigha.

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

Spis treści 3 SPIS TREŚCI

Kierunek i poziom studiów: Biologia, poziom drugi Sylabus modułu: Metody statystyczne w naukach przyrodniczych

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Zakres tematyczny dotyczący podstaw programowania Microsoft Office Excel za pomocą VBA

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Testy nieparametryczne

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Testowanie hipotez statystycznych

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

POLITECHNIKA WARSZAWSKA

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Prognozowanie na podstawie modelu ekonometrycznego

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Rok akademicki: 2012/2013 Kod: JFM s Punkty ECTS: 3. Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Weryfikacja hipotez statystycznych testy t Studenta

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Zawartość. Zawartość

Wszystkie wyniki w postaci ułamków należy podawać z dokładnością do czterech miejsc po przecinku!

Analiza Statystyczna

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

STATYSTYKA MATEMATYCZNA

Ekonometria. Weryfikacja modelu. Paweł Cibis 6 kwietnia 2006

Wydział Matematyki. Testy zgodności. Wykład 03

Testowanie hipotez statystycznych.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Wielowymiarowe uogólnienie testu niezależności

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

POLITECHNIKA OPOLSKA

Ekonometria. Weryfikacja modelu. Paweł Cibis 12 maja 2007

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Własności statystyczne regresji liniowej. Wykład 4

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Statystyka matematyczna i ekonometria

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka matematyczna i ekonometria

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2012/2013

Własności estymatora parametru lambda transformacji potęgowej. Janusz Górczyński, Andrzej Zieliński, Wojciech Zieliński

Testowanie hipotez statystycznych

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Analizy wariancji ANOVA (analysis of variance)

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Matematyka i statystyka matematyczna dla rolników w SGGW

Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Badanie normalności rozkładu

KORELACJE I REGRESJA LINIOWA

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Metody statystyczne w pedagogice Kod przedmiotu

Testowanie hipotez statystycznych cd.

Transkrypt:

dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo popularne wśród użytkowników komputerów są pakiety biurowe. W szczególności na uwagę - dzięki swym ogromnym możliwościom obliczeniowym zasługują arkusze kalkulacyjne. Wiele zagadnień ze statystyki rozwiązuje się metodą modelowania statystycznego i w związku z tym potrzebne są generatory liczb losowych. Celem tej publikacji jest porównanie generatorów liczb losowych równomiernych pochodzących z takich programów jak: Microsoft Excel 3, Quattro Pro 9, Star Office 5., Open Office1.1... Dostęp do kodów generatorów liczb losowych w większości środowisk programistycznych jest niemożliwy, dlatego jedynym sposobem porównywania i oceny jakości tych generatorów jest użycie metod statystycznych. Niniejszy artykuł poświęcony jest generatorom liczb losowych o rozkładzie równomiernym. Dokładne omówienie tego zagadnienia w literaturze polskiej można znaleźć w pracy [1]. Generatory te wykorzystywane są w profesjonalnych programach użytkowych tak bardzo popularnych dzięki szybkiemu rozwojowi technik komputerowych.. W pracy [] dokonano porównania generatorów liczb losowych równomiernych pochodzących z takich aplikacji jak: Excel, Visual Basic, Mathcad, Mathematica, Statistica. Trend i sezonowość Mając do dyspozycji każdy ze wspomnianych wcześniej arkuszy kalkulacyjnych, wygenerowano zestawy po mln liczb losowych każdy z przedziału (;1). W celu przeprowadzenia analizy porównawczej liczby te zostały zgromadzone w skoroszycie złożonym z czterech arkuszy (1 kolumn po. liczb każda), których nazwy odpowiadały danym programom. Na podstawie uzyskanych zestawów dokonano sprawdzenia trendu i sezonowości w ciągach 1 liczb pobranych w sposób losowy z przygotowanych wcześniej arkuszy. Teorię niezbędną do przeprowadzenia testów trendu i sezonowości oraz dokładny opis 1

ILOŚĆ FAZ realizacji programowej w edytorze Visual Basic for Applications [3] przedstawiono w pracy []. Wyniki przeprowadzonych testów przedstawiają tablice 1 i. Istotą pierwszego testu jest weryfikacja hipotezy zerowej o braku trendu w ciągach liczb losowych o rozkładzie równomiernym, natomiast istotą drugiego testu jest weryfikacja hipotezy Ho o braku zjawiska sezonowości. Tabl. 1. Wyniki testu trendu w ciągach liczb losowych uzyskanych z generatorów Excel Quattro Pro Star Office Open Office ilość znaków dodatnich 5 53 51 5 ujemnych 53 5 513 519 wartość krytyczna 1,9 1,9 1,9 1,9 statystyka testowa,,97,1, Hipoteza H przyjęta przyjęta przyjęta przyjęta Źródło: materiały własne we wszystkich tablicach i wykresach Tabl.. Wyniki testu sezonowości w ciągach liczb losowych uzyskanych z generatorów dł. fazy Excel Quattro Pro Star Office Open Office 1 1 3 7 17 17 1 17 3 7 9 5 13 9 1 5 1 1 3 1 7 wartość krytyczna 9, 9, 9, 11,7 statystyka testowa,15,533,3 7,73 Hipoteza H przyjęta przyjęta przyjęta przyjęta Na podstawie uzyskanych wyników można stwierdzić, że w ciągach 1 liczb losowych pochodzących z analizowanych arkuszy kalkulacyjnych nie występuje ani zjawisko trendu, ani zjawisko sezonowości. Omawiane testy dla każdej aplikacji zostały powtórzone 1 razy w celu przekonania się, czy zjawiska trendu i sezonowości nie występują w każdej przeprowadzonej próbie testowej. Tablica 3 zawiera wartości średnie stosownych statystyk testowych oraz ilość prób, w których hipoteza zerowa została przyjęta (wartość statystyki jest mniejsza od wartości krytycznej).

Tabl. 3. Trend i sezonowość w 1 przeprowadzonych testach Excel Quattro Pro Star Office Open Office trend sezonowość wartość średnia statystyk krotność przyjęcia hipotezy H o wartość średnia statystyk krotność przyjęcia hipotezy H o,79,73,3,71 9 9 93 95 5, 5,5 5,1 5,5 9 7 9 Dla trendu najlepiej zaprezentowały się Open Office oraz Excel, gdyż mają największą krotność przyjęcia hipotezy zerowej o braku zjawiska trendu oraz najmniejsza wartość średnią statystyk. W teście sezonowości najmniejszą średnią wartością testową oraz najmniejszą liczbą odrzuconych hipotez charakteryzuje się produkt Microsoftu. Zgodność z rozkładem równomiernym Test chi-kwadrat jest jednym z najczęściej stosowanych testów zgodności, a jego opis i tablice wartości krytycznych można znaleźć w wielu pracach, w tym między innymi w [1,,5]. W niniejszej pracy zastosowano test chi-kwadrat do badania zgodności uzyskanych realizacji zmiennej losowej z rozkładem równomiernym Liczby losowe wyprodukowane przez generatory zaimplementowane w omawiane aplikacje (n=1), zostały przypisane do jednej z k klas (k=1), którymi są przedziały i k i 1, i 1,..., k 1 k Do przeprowadzenia testu wykorzystano 1 liczb losowych (1 serii po 1), które zostały wykorzystane przez poniżej przedstawioną procedurę realizującą test chi-kwadrat (komentarze umieszczono po apostrofie). Wyniki testów zgodności liczb losowych z rozkładem równomiernym zostały zamieszczone na wykresach 1 -. Dla Microsoft Excel (wykres 1) tylko w dwóch przypadkach (seria nr 1 i 9) wartości statystyki chi-kwadrat były większe od wartości krytycznej, która przy poziomie istotności,5 wynosi 1,9. W Open Office (wykres ) tylko w seriach o numerach 5, 7, 9 została odrzucona hipoteza o zgodności rozkładu liczb losowych z rozkładem równomiernym. 3

W Quattro Pro (wykres ) oraz w Star Office (wykres 3) wartości statystyki chi-kwadrat przekroczyły poziom krytyczny kolejno w seriach 15, 1, 1, 5, 1 oraz,, 3,,. Sub chi_generator() 'deklaracja zmiennych Dim M(1) As Integer Dim i, j, u, seria As Byte 'losowy wybór wiersza wiersz = 1 + Int(1975 * Rnd) 'przypisanie wartości krytycznej do komórki C1 Worksheets("chi-kwadrat").Cells(1, 3) = Application.ChiInv(.5, 9) 'początek pętli "seria" For seria = 1 To 1 'zerowanie każdej z 1 klas For i = 1 To 1 M(i) = Next i 'wybór arkusza wybor = InputBox("Wybierz arkusz kalkulacyjny") Select Case wybor Case "excel" Worksheets("excel").Select Case "quattro" Worksheets("quattro").Select Case "star_office" Worksheets("star_office").Select Case "open_office" Worksheets("open_office").Select End Select 'przypisanie liczby losowej do jednej z 1 klas For j = 1 To 1 u = Int(1 * Cells(j + wiersz, seria)) + 1 M(u) = M(u) + 1 Next j 'obliczanie wartości statystyki chi-kwadrat chi = For u = 1 To 1 chi = chi + ((M(u) - 1.) ^ ) / 1. Next u 'wybór arkusza "chi-kwadrat" Worksheets("chi-kwadrat").Select 'zapisanie wyniku w kolumnie A Cells(seria, 1) = chi Next seria End Sub

wartości statystyki chi^ wartości statystyki chi^ Wykres 1. Wartości statystyki chi-kwadrat dla arkusza kalkulacyjnego Microsoft Excel 3 Microsoft Excel 3 1 wartość krytyczna 1,91977 1 1 1 1 1 3 5 7 9 1 numer serii Wykres. Wartości statystyki chi-kwadrat dla arkusza kalkulacyjnego Quattro Pro 9 Quattro Pro 9 1 wartość krytyczna 1,91977 1 1 1 1 1 3 5 7 9 1 numer serii 5

wartości statystyki chi^ wartości statystyki chi^ Wykres 3. Wartości statystyki chi-kwadrat dla arkusza kalkulacyjnego Star Office 5. Star Office 5. 1 wartość krytyczna 1,91977 1 1 1 1 1 3 5 7 9 1 numer serii Wykres. Wartości statystyki chi-kwadrat dla arkusza kalkulacyjnego Open Office 1.1.. Open Office 1.1.. 1 watość krytyczna 1,91977 1 1 1 1 s 1 3 5 7 9 1 numer serii

Funkcja gęstości miary rozbieżności chi^ Na wykresie 5 porównano funkcję gęstości rozkładu chi-kwadrat dla 9 stopni swobody z wyliczonymi w konkretnych testach i wyznaczonymi metodami Parzena [,] empirycznymi rozkładami rozbieżności chi-kwadrat. Wykres 5. Zgodność rozkładów generatorów z rozkładem chi-kwadrat uzyskanych metodą Parzena,1,1 Excel Quattro Pro Star Office Open Office chi^,1,,,, 1 1 1 1 1 Miara rozbiezności chi^ Analizując uzyskane wyniki dotyczące testowania chi-kwadrat można dojść do wniosku, że generatory pochodzące z omawianych arkuszy kalkulacyjnych charakteryzują się podobnymi własnościami statystycznymi. Dla 1 przeprowadzonych serii zachodziły nieliczne przypadki odrzucenia hipotezy o zgodności rozkładu generatora z rozkładem równomiernym. Podobnie jak dla testów trendu i sezonowości należy wyróżnić generatory pochodzące z Excela i Open Office a. Średnia i wariancja Dla 1 liczb losowych pochodzących z omawianych arkuszy kalkulacyjnych obliczono wartości średnie i wariancje (tablica ) oraz porównano je z wartościami teoretycznymi (tablica 5), które odpowiednio dla wartości średniej i wariancji wynoszą 1/ oraz 1/1. W celu posortowania wyników obliczono wartości bezwzględne z różnic pomiędzy wartościami doświadczalną i teoretyczną. 7

Tablica. Wartości średnie i wariancje generatorów Excel Quattro Pro Star Office Open Office wartości teoretyczne średnia,993,9,99,51,5 wariancja,,3,55,3,33 Tablica 5. Ranking generatorów według błędów oszacowań wartości średnich i wariancji od wartości teoretycznych wartość średnia wariancja oszacowanie błąd oszacowania generator oszacowanie błąd oszacowania generator,993,7 Excel,3,1 Open Office,51,13 Open Office,, Excel,9,31 Quattro Pro,3,11 Quattro Pro,99,5 Star Office,55,1 Star Office Podsumowanie Na podstawie wyników testów przeprowadzonych w niniejszym artykule można stwierdzić, że własności statystyczne generatorów pochodzących z różnych arkuszy kalkulacyjnych są podobne. Nie można jednak pominąć faktu, że w przeprowadzonych badaniach najlepiej wypadły generatory pochodzące z Excela i Open Office a. Można tutaj mówić o remisie, ze wskazaniem jednak na Open Office a jako programu zaliczanego do grupy freeware. W czasach drogiego oprogramowania jest to istotny czynniki, na który należy zwrócić uwagę. Streszczenie Artykuł poświęcony jest porównaniu generatorów liczb losowych równomiernych pochodzących z takich programów jak: Microsoft Excel 3, Quattro Pro 9, Star Office 5., Open Office1.1... Dostęp do kodów generatorów liczb losowych w większości środowisk programistycznych jest niemożliwy, dlatego jedynym sposobem porównywania i oceny

jakości tych generatorów jest użycie metod statystycznych. Zbadano zgodność uzyskanych wyników z rozkładem równomiernym, wykorzystano wartość średnią i wariancję oraz zastosowano testy trendu i sezonowości. BIBLIOGRAFIA [1] Wieczorkowski R., Zieliński R., Komputerowe generatory liczb losowych, WN-T, Warszawa 1997 [] Sulewski P., Zastosowanie numerycznych metod estymacji uogólnionego rozkładu gamma w badaniach niezawodnościowych, praca doktorska, Instytut Badań Systemowych PAN, Warszawa [3] Webb J., Użycie Visual Basic dla aplikacji w Excelu, Warszawa 1997 [] Sulewski P., Test trendu i sezonowości, Słupskie Prace Matematyczno Fizyczne nr 1, Słupsk 1, s. 111-11 [5] Brandt S., Analiza danych, PWN, Warszawa [] Sulewski P., Wyznaczanie położenia punktów doświadczalnych na siatce rozkładu normalnego, Wiadomości Statystyczne nr 11, Warszawa 3, s. 1-9 9