PROGNOZOWANIE Z WYKORZYSTANIEM METOD DATA MINING

Podobne dokumenty
ZASTOSOWANIE TECHNIK DATA MINING W BADANIACH NAUKOWYCH

TWORZENIE I STOSOWANIE MODELU PROGNOSTYCZNEGO Z WYKORZYSTANIEM STATISTICA ENTERPRISE

PODSTAWOWE ANALIZY I WIZUALIZACJA Z WYKORZYSTANIEM MAP W STATISTICA

DATA MINING W PROGNOZOWANIU ZAPOTRZEBOWANIA

Wprowadzenie do analizy korelacji i regresji

Analiza sezonowości. Sezonowość może mieć charakter addytywny lub multiplikatywny

Naszym zadaniem jest rozpatrzenie związków między wierszami macierzy reprezentującej poziomy ekspresji poszczególnych genów.

PRZYKŁAD PROGNOZOWANIA Z WYKORZYSTANIEM METOD DATA MINING

Regresja linearyzowalna

Wykład 5: Analiza dynamiki szeregów czasowych

7.4 Automatyczne stawianie prognoz

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

DATA MINING W STEROWANIU PROCESEM (QC DATA MINING)

PRZEWIDYWANIE WŁAŚCIWOŚCI PRODUKTU Z WYKORZYSTANIEM UCZENIA MASZYN

PROGNOZOWANIE SPRZEDAŻY STUDIUM PRZYPADKU

3. Modele tendencji czasowej w prognozowaniu

LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU

PRZYKŁAD ROZWIĄZANIA ZAGADNIENIA PREDYKCYJNEGO ZA POMOCĄ TECHNIK DATA MINING

WSPOMAGANIE ANALIZY DANYCH ZA POMOCĄ NARZĘDZI STATISTICA

5. Model sezonowości i autoregresji zmiennej prognozowanej

Dopasowywanie modelu do danych

Sposoby prezentacji problemów w statystyce

Aproksymacja funkcji a regresja symboliczna

4. Średnia i autoregresja zmiennej prognozowanej

Niestandardowa tabela częstości

Zagadnienie 1: Prognozowanie za pomocą modeli liniowych i kwadratowych przy wykorzystaniu Analizy regresji wielorakiej w programie STATISTICA

Wykład 6: Analiza danych czasowych Wykresy, indeksy dynamiki

Rozdział 8. Regresja. Definiowanie modelu

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.

DRZEWA REGRESYJNE I LASY LOSOWE JAKO

Data Mining podstawy analizy danych Część druga

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

Ćwiczenie 5 PROGNOZOWANIE

Wprowadzenie do analizy dyskryminacyjnej

ROZWIĄZYWANIE UKŁADÓW RÓWNAŃ NIELINIOWYCH PRZY POMOCY DODATKU SOLVER PROGRAMU MICROSOFT EXCEL. sin x2 (1)

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016

Analiza regresji - weryfikacja założeń

Analiza autokorelacji

Co trzeba wiedzieć korzystając z modelu ARIMA i które parametry są kluczowe?

Indeksy dynamiki (o stałej i zmiennej podstawie)

Co to jest analiza regresji?

Wykład 4: Statystyki opisowe (część 1)

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Analiza składowych głównych. Wprowadzenie

Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego

KREATOR REGRESJI LOGISTYCZNEJ

PRZYKŁADY BUDOWY MODELI REGRESYJNYCH I KLASYFIKACYJNYCH. Wprowadzenie do problematyki modelowania statystycznego

Opracowywanie wyników doświadczeń

Opisy przedmiotów do wyboru

Spis treści Szybki start... 4 Podstawowe informacje opis okien... 6 Tworzenie, zapisywanie oraz otwieranie pliku... 23

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Rys.1. Technika zestawiania części za pomocą polecenia WSTAWIAJĄCE (insert)

Analiza metod prognozowania kursów akcji

Ekonometria. Zajęcia

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Analiza zależności liniowych

Grzegorz Harańczyk, StatSoft Polska Sp. z o.o.

Testy nieparametryczne

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Metody Prognozowania

3. Analiza własności szeregu czasowego i wybór typu modelu

Prognozowanie krótkoterminowe w procesie planowania zasobów

Widzenie komputerowe (computer vision)

ALGORYTM UZUPEŁNIANIA BRAKUJĄCYCH DANYCH W ZBIORACH REJESTROWANYCH NA STACJACH MONITORINGU POWIETRZA

Szukanie rozwiązań funkcji uwikłanych (równań nieliniowych)

Nazwa przedmiotu: Informatyczne systemy statystycznej obróbki danych. Informatics systems for the statistical treatment of data Kierunek:

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

166 Wstęp do statystyki matematycznej

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Agnieszka Nowak Brzezińska

Prognoza terminu sadzenia rozsady sałaty w uprawach szklarniowych. Janusz Górczyński, Jolanta Kobryń, Wojciech Zieliński

Grupowanie materiału statystycznego

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Wykład 3: Prezentacja danych statystycznych

Zachowania odbiorców. Grupa taryfowa G

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

Arkusz kalkulacyjny Excel

Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica

Jak przekształcać zmienne jakościowe?

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1

MODELE LINIOWE. Dr Wioleta Drobik

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

PRZYKŁAD TWORZENIA KART KONTROLNYCH W STATISTICA

CO WIE SMARTFON? ROZPOZNAWANIE AKTYWNOŚCI CZŁOWIEKA METODAMI KLASYFIKACYJNYMI STATISTICA DATA MINER

Wstęp 7 Rozdział 1. OpenOffice.ux.pl Writer środowisko pracy 9

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Etapy modelowania ekonometrycznego

PRZEWIDYWANIE AWARII I PROBLEMÓW Z JAKOŚCIĄ

Kultywator rolniczy - dobór parametrów sprężyny do zadanych warunków pracy

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Analiza danych. TEMATYKA PRZEDMIOTU

INFORMATYKA W SELEKCJI

Monitoring procesów z wykorzystaniem systemu ADONIS. Krok po kroku

Wykład 2: Grupowanie danych (szeregi statystyczne) + porady dotyczące analizy danych w programie STATISTICA

Transkrypt:

PROGNOZOWANIE Z WYKORZYSTANIEM METOD DATA MINING Grzegorz Harańczyk, StatSoft Polska Sp. z o.o. Jednym z ważnych obszarów analizy danych jest prognozowanie szeregów czasowych. Któż nie chciałby znać przyszłości i móc wykorzystywać tej wiedzy w podejmowaniu decyzji i planowaniu własnych działań. Istnieje wiele metod prognozowania. Podczas prezentacji przedstawimy zastosowanie technik data mining w tym obszarze. Omawiane techniki zostaną zilustrowane przykładami analiz w programie STATISTICA Data Miner. Wprowadzenie Prognozowanie szeregów czasowych opiera się na wyszukiwaniu związków pomiędzy wartością szeregu w danym momencie oraz wartością ja poprzedzającą. Zakładając niezmienność tych wzorców, na podstawie znajomości bieżących wartości szeregu czasowego, można przewidzieć przyszłe wartości. Oprócz wartości opóźnionych samego szeregu czasowego często w modelach uwzględnia się również inne wielkości, które opisują zjawiska towarzyszące badanemu procesowi. Dla przykładu: przewidując wolumen sprzedaży na kolejny dzień można uwzględnić związek między sprzedażą oraz panującymi w danym momencie warunkami atmosferycznymi. Prognozując przyszłe wartości, będzie można uwzględnić wówczas prognozę pogody. Oprócz pewnych specyficznych cech, prognozowanie szeregów czasowych można sprowadzić w pewnym sensie do budowy modeli regresyjnych (zakładamy, że wartości opisujące badane przez nas zjawisko mierzone są na skali ilościowej). Naszym celem jest zatem zbadanie związków pomiędzy wskazaną zmienną zależną a określonym zbiorem predyktorów. Budując model regresyjne, można korzystać z klasycznych metod (np. model regresji liniowej) lub wykorzystać techniki nieparametryczne (data mining). W kolejnej części pokażemy pewną motywację do korzystania z technik data mining. Następnie zostanie zaprezentowany przykład ich wykorzystania w zakresie prognozowania szeregu czasowego oraz praca w programie STATISTICA Data Miner. Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 101

Modelowanie dwa podejścia Z jednej strony stale i szybko rośnie ilość dostępnych danych (wszystko jest monitorowane, a wyniki pomiarów gromadzone), z drugiej strony przed analizą danych stawiane są coraz ambitniejsze cele. Badane są coraz bardziej skomplikowane struktury i zależności, w związku z czym nie można od razu podać, czy choćby wstępnie zdefiniować modelu opisującego badane zjawisko. Dlatego coraz częściej wykorzystywane jest podejście oparte na danych (data driven modelling), a nie mechanizmie zjawiska. W klasycznym podejściu zakładamy, że znamy model opisujący badany proces generujący dane. Zakładamy na przykład, że mechanizm generujący dane jest pewnej postaci (np. model liniowy). Naszym celem jest jedynie oszacowanie jego parametrów lub przetestowanie zaplanowanej hipotezy. W drugim podejściu traktujemy badany mechanizm jako nieznany, chcemy go poznać, ale nie zakładamy na wstępie jego postaci, godzimy się z tym i szukamy jedynie związków pomiędzy wielkościami wejściowymi a wyjściowymi. Nie zakłada się tu często żadnej postaci modelu czy związku pomiędzy badanymi wielkościami, analiza oparta jest jedynie na danych. Wykorzystywane do takich celów metody analizy danych często określa się mianem nieparametrycznych. Stworzonych zostało wiele nowych algorytmów, często określanych również mianem technik data mining. Nazwa wywodzi się z głównej cechy tych algorytmów wielokrotnego iteracyjnego przeszukiwania zbioru danych w poszukiwaniu najlepszego modelu i ukrytych wzorców (kopania w danych). Data mining to jednak nie tylko nowe algorytmy analizy danych. Nowe techniki i algorytmy pociągają za sobą także nowe podejście i metodykę ocena modelu nie na podstawie istotności statystycznej, ale na podstawie poprawności na zbiorze testowym. Opis metod i podejścia przedstawiony jest na przykład w pracach [2-4]. Podejście to działa w praktyce, a nawet wydaje się, że w pewnych sytuacjach jest koniecznością. Szczególnie popularne i wykorzystywane jest w zastosowaniach komercyjnych. Coraz częściej wykorzystywane jest również z powodzeniem w badaniach naukowych. Musi być ono jednak umiejętnie stosowane (nie traktowane jako bezrefleksyjne i automatyczne samouczące się czarne skrzynki ). Jedno podejście oczywiście nie wyklucza drugiego, wręcz mogą się one uzupełniać na rożnych etapach procesu poznawczego. Często w pierwszym etapie wykorzystanie podejścia opartego jedynie na danych daje nam pewną wiedzę i pozwala wykorzystać ją na przykład na etapie planowania nowych badań, których celem będzie zweryfikowanie postawionych hipotez. Poniżej zaprezentujemy przykład, który zilustruje istotę metod nieparametrycznych. Podejście klasyczne Klasyczna analiza szeregów czasowych polega na identyfikacji trendu oraz wahań sezonowych. Wiele szeregów można w ten sposób skutecznie modelować. Zakładamy tu jednak prosty związek bieżących wartości szeregu z jego historią. Jeśli ta zależność jest bardziej 102 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2012

skomplikowana (w szczególności nieliniowa), to podejście klasyczne może sprawdzać się gorzej. Rys. 1. Klasyczna analiza szeregu czasowego model z trendem, model z wahaniem sezonowym oraz model uwzględniający trend i sezonowość. Przykład prognozowanie metodami nieparametrycznymi Załóżmy, że pewna wielkość x(t) mierzona była w równych odstępach czasu. Poniżej znajduje się wykres liniowy tego szeregu czasowego. Rys. 2. Przebieg wartości dla zmiennej x(t). Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 103

Podejdźmy do problemu klasycznie i zbadajmy na początek autokorelacje dla tego szeregu. Na rysunku poniżej widać brak istotnych autokorelacji. Czy zatem ten szereg można przewidywać na podstawie wcześniejszych wartości? Rys. 3. Autokorelacje i autokorelacje cząstkowe dla zmiennej x(t). Brak autokorelacji nie oznacza, że nie można zbudować modelu, obserwowane związki mogą być nieliniowe. Rys. 4. Projekt analizy dla danych Log.sta. Modelowanie badanej zależności przeprowadzimy za pomocą metody MARSplines. Można ją wykonać, wybierając z menu Data mining pozycję MARSplines (Multivariate Adaptive Regression Splines) lub pracując w przestrzeni roboczej programu STATISTICA Data Miner, wybrać węzeł MARSplines. W oknie definiowania analizy wybieramy zmienne: jako Ilościowe zależne zmienną x(t), natomiast jako Ilościowe predktory wybieramy x(t-1). Na karcie Ogólne węzła MARSplines zmieniamy wartość Kara za dodanie funkcji bazowej z 2 na 5. 104 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2012

Rys. 5. Okno definiowania analizy MARSplines. Zależność rzeczywista i wyznaczona przez model pomiędzy x(t) oraz x(t-1) została zaprezentowana na wykresie poniżej. Rys. 6. Zależność pomiędzy wartością x(t-1) a x(t). Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 105

Rys. 7. Wartości obserwowane i prognoza metodą MARSplines. Analizowane dane zostały wygenerowane za pomocą następującej formuły x t+1 =4x t (1-x t ). Szereg tego typu nie jest jednak wyłącznie tworem teoretycznym. Jest wiele procesów, które zachowują się według schematu tego typu. Jednym z nich jest, przedstawiony przez R. Maya [May, 1976], rozwój populacji. May badał zachowania populacji ryb: jeśli nie ma czynników hamujących (np. drapieżników), to populacja ryb rośnie, aż zapełni dostępne środowisko. Jednak gdy liczba ryb jest tak duża, że zaczyna brakować pożywienia, rozpoczyna się zmniejszanie populacji. Związki nieliniowe trudniej się modeluje, bo trzeba więcej wiedzieć o samym procesie. Trudniej jest zgadnąć postać równania, dlatego warto korzystać z metod nieparametrycznych, w których nie trzeba znać modelu już na początku procesu modelowania. W tym przypadku oczywiście postać badanej zależności jest wręcz trywialna, jednak w rzeczywistych zastosowaniach, gdzie uwzględniamy więcej wielkości wejściowych, a nie tylko poprzedni stan populacji, pojawiają się znacznie bardziej skomplikowane zależności. Przykład sprzedaż w centrum handlowym W tym przykładzie będziemy zajmować się szeregiem czasowym CentrumHandlowe.sta. Szereg ten zawiera dane dotyczące intensywności sprzedaży w pewnym centrum handlowym. Dane są danymi rzeczywistymi przekształconymi na potrzeby przykładu. W centrum handlowym badano intensywność sprzedaży. Zbierano dane godzinowe dotyczące wolumenu sprzedaży. Centrum otwarte jest w godzinach 8-21 (tj. 13 godzin dziennie). Załóżmy, że chcemy zaplanować zasoby na cały kolejny dzień pracy. Dla przykładu: we wtorek rano prognozujemy zapotrzebowanie na środę, jednak nie mamy jeszcze danych z wtorku, możemy więc co najwyżej skorzystać z danych z poniedziałku. Do naszej dyspozycji są również wszystkie wcześniejsze dane. W praktyce prognozujemy zatem na dwa 106 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2012

dni do przodu. Biorąc pod uwagę fakt, że pracujemy na danych godzinowych, opóźnienie wykorzystywanych danych musi wynosić co najmniej 26 obserwacji. Zatem będziemy badać związek pomiędzy wartością w danym momencie a wartościami opóźnionymi o co najmniej 27 godzin. Wcześniej zbadamy również wpływ innych zmiennych i wybrane z nich uwzględnimy w ostatecznym modelu. Rys. 8. Ilustracja horyzontu prognozy dla rozważanego problemu. Otwieramy plik CentrumHandlowe.sta. Po otwarciu arkusza widzimy jego strukturę. Kolejne wiersze zawierają dzienne dane o intensywności sprzedaży w rozbiciu godzinowym. Dane te będą wymagały przekształcenia do postaci, w której w wierszach znajdują się obserwacje dotyczące kolejnych godzin. Wszystkie czynności będziemy wykonywać w przestrzeni roboczej programu STATISTICA Data Miner. Rys. 9. Arkusz danych CentrumHandlowe.sta. Z menu Data mining wybieramy Przestrzenie robocze, a potem Data miner Wszystkie procedury. Klikamy na panelu okna przestrzeni roboczej w przycisk. Wskazujemy plik danych CentrumHandlowe.sta. Aby otrzymać klasyczny szereg czasowy, należy Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 107

przekształcić te dane, układając w stertę. Klikamy w przycisk Przeglądarka węzłów i z folderu Przekształcenia danych wybieramy węzeł Ułóż w stertę. Rys. 10. Rozrzucanie po zmiennych. Rys. 11. Arkusz danych CentrumHandlowe.sta po przekształceniu. W kolejnym kroku przyjrzymy się dokładniej temu szeregowi. Wykonamy wykres liniowy oraz zbadamy profile tygodniowe i dzienne (do tego celu wykorzystamy węzeł Przekroje i jednoczynnikowa ANOVA; znajduje się on w katalogu Statystyka > Statystyki podstawowe i tabele). 108 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2012

Rys. 12. Przebieg wartości dla szeregu CentrumHandlowe.sta. Dołączając węzeł Autokorelacje możemy zbadać korelację badanego szeregu z szeregiem opóźnionym. Widać, że występują korelacje między intensywnością sprzedaży w danej godzinie a intensywnością sprzedaży w tych samych godzinach we wcześniejszych dniach oraz silna korelacja tygodniowa (przesunięcie o 7 okresów o długości 13, czyli 91 obserwacji). Rys. 13. Wykres funkcji autokorelacji dla zmiennej Wartość. Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 109

Rys. 14. Powiększony fragment wykresu funkcji autokorelacji dla zmiennej Wartość. Rys. 15. Profile dzienne i tygodniowe dla szeregu CentrumHandlowe.sta 110 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2012

Warto zwrócić uwagę na charakterystyczne profile tygodniowe i dzienne. Widać, że profil godzinowy nieco zmienia się w zależności od dnia tygodnia. W związku z wyraźną sezonowością, widoczną na wykresach powyżej, dodano zmienne kodujące dzień tygodnia oraz godzinę. Dodanie nowych zmiennych wykonano za pomocą węzła Przekształcenia zmiennych z katalogu Przekształcenie danych. Podpinamy ten węzeł do pliku z danymi i w oknie definiowania parametrów węzła klikamy przycisk Edytuj i wpisujemy specyfikacje zmiennych do utworzenia. Polecenie lag powoduje utworzenie zmiennej z wartościami opóźnionymi o wskazaną liczbę okresów. Rys. 16. Okno węzła Przekształcanie zmiennych. Warto zwrócić uwagę na to, że w danych mamy zmienną definiującą podział na próbę uczącą i próbę testową. Jako próbę testową wybrano ostatnie dwa tygodnie szeregu czasowego. Różnica pomiędzy próbą uczącą i testową polega na tym, że ta druga nie jest używana do poszukiwania wzorców pomiędzy predykatorami a zmienną zależną. Sprawdzanie modelu na próbie testowej jest niczym próba generalna dla modelu. Oszacowane na próbie testowej błędy prognoz dają oszacowanie błędów uzyskiwanych po wdrożeniu modelu na nowych danych. Do budowy modelu zastosowano wiele metod w celu porównania ich wyników. I tak zastosowano: Ogólną regresję krokową i najlepszego podzbioru, Wzmacniane drzewa regresyjne, MARSplines dla zadań regresyjnych, Losowy las. Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 111

Rys. 17. Projekt prognozowania dla szeregu CentrumHandlowe.sta. Otrzymujemy prognozy uzyskane za pomocą kilku metod, docelowo możemy wykorzystać ich uśrednienie lub wybrać tę, która najlepiej sprawdziła się na próbie testowej. Wynik działania modelu można ocenić, wyznaczając odpowiednie miary jakości dopasowania modelu oraz ilustrując poprzez wykreślenie przebiegu obserwowanego i przewidywanego dla badanego szeregu czasowego. Model uchwycił charakter przebiegu badanego szeregu, a poziom błędów prognoz okazał się bardzo zadawalający. Rys. 18. Wartości obserwowane i przewidywane dla szeregu CentrumHandlowe.sta. 112 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2012

Podsumowanie Zaprezentowany przykład pokazuje zastosowanie technik data mining w obszarze prognozowania. Korzystanie z technik nieparametrycznych może pozwolić w łatwy sposób poprawić jakość tworzonych prognoz. Literatura 1. StatSoft, Inc. (2011). STATISTICA (data analysis software system), version 10. www.statsoft.com. 2. Mitsa T. (2010), Temporal data mining, CRC Press. 3. Weiss S. M., Indurkhya N. (1998), Predictive data mining a practical guide, 4. Hastie T., Tibshirani R., Friedman J. (2001), The elements of statistical learning. Data mining, inference and prediction, Springer Verlag. 5. May R. M., Simple mathematical models with very complicated dynamics, Nature, 1976, 261 (5560), 459-67. 6. Harańczyk G., Zastosowanie technik data mining w badaniach naukowych, StatSoft, 2010. Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 113