Wojciech Sikora 1 AGH w Krakowie Grzegorz Wiązania 2 AGH w Krakowie Maksymilian Smolnik 3 AGH w Krakowie Analiza możliwości szacowania parametrów mieszanin rozkładów prawdopodobieństwa za pomocą sztucznych sieci neuronowych 4 Wstęp Podejmowanie uzasadnionych decyzji dotyczących projektowania, wytwarzania, modernizacji i eksploatacji maszyn wymaga zaopatrzenia w informacje na temat zmian stanu technicznego wykorzystywanych obiektów. Do informacji tego rodzaju należą w szczególności dane o występujących awariach. Do charakteryzowania niezawodności eksploatowanych maszyn, wykorzystywane mogą być różne wskaźniki. Wyznaczanie żądanych funkcji umożliwiają rozkłady prawdopodobieństwa czasu pracy do uszkodzenia, stanowiące matematyczne modele obserwowanych zjawisk. Dokładność opisu zjawisk towarzyszących eksploatacji obiektów technicznych pozostaje związana z budową wykorzystywanych modeli, stąd w pewnych warunkach zastosowanie znaleźć mogą mieszaniny rozkładów, będące wynikiem syntezy mniej skomplikowanych modeli matematycznych (np. często wykorzystywanych w niezawodności rozkładów prawdopodobieństwa: wykładniczego i normalnego). Celem prezentowanych badań była analiza możliwości oszacowania parametrów mieszanin rozkładów (wybranych postaci) za pomocą sztucznych sieci neuronowych. Charakterystyka mieszaniny rozkładów Mieszaninę rozkładów definiuje się jako sumę rozkładów prawdopodobieństwa z przypisanymi odpowiednio wagami [2]. Można ją opisać wzorem (1): (1) gdzie: f i (t) funkcja gęstości i-tego rozkładu, w i waga przypisana do funkcji gęstości i-tego rozkładu. Dodatkowo muszą zostać spełnione następujące warunki:, (2) 1 2 3 4 W. Sikora, doktorant, AGH Akademia Górniczo-Hutnicza, Wydział Inżynierii Mechanicznej i Robotyki, Katedra Konstrukcji i Eksploatacji Maszyn. G. Wiązania, doktorant, AGH Akademia Górniczo-Hutnicza, Wydział Inżynierii Mechanicznej i Robotyki, Katedra Konstrukcji i Eksploatacji Maszyn. M. Smolnik, asystent, AGH Akademia Górniczo-Hutnicza, Wydział Inżynierii Mechanicznej i Robotyki, Katedra Konstrukcji i Eksploatacji Maszyn. Artykuł recenzowany. 1301
(3) Wykorzystanie mieszaniny rozkładów pozwala na tworzenie nowych modeli umożliwiających lepszy opis badanych zjawisk. Przykłady zastosowań mieszaniny rozkładów można znaleźć w literaturze (np. [3, 4]). W teorii niezawodności mieszanina rozkładów może być szczególnie przydatna do modelowania złożonych obiektów technicznych. Poszczególne elementy składowe takich obiektów mają zwykle różne rozkłady czasów pracy do uszkodzenia, a ich łączny rozkład można zastąpić ich mieszaniną z przyjętymi odpowiednio wagami. W praktycznych zastosowaniach przydatna może okazać się mieszanina rozkładów wykładniczego i normalnego, której funkcję gęstości opisuje wzór (4). (4) Taki rozkład pozwala opisać czasy pracy obiektów technicznych, których część elementów składowych znajduje się na etapie normalnej pracy, a część na etapie starzenia. Przydatność rozkładu prawdopodobieństwa jest zdeterminowana m. in. przez możliwość oszacowania wartości jego parametrów. Obecnie najlepszą metodą estymacji parametrów jest metoda największej wiarygodności. Polega ona na takim doborze wartości wektora parametrów rozkładu θ, aby funkcja wiarygodności (5) osiągnęła maksimum. (5) W praktyce łatwiej posługiwać się zlogarytmowaną funkcją wiarygodności (6). (6) Po podstawieniu wzoru (4) do (6) uzyskuje się zależność (7). Następnie, po obliczeniu pochodnych cząstkowych i przyrównaniu ich do zera otrzymuje się układ równań (8) - (12). (7) (8) (9) 1302
(10) (11) (12) Analityczne rozwiązanie takiego układu równań nie jest możliwe, a metody numeryczne nie dają oczekiwanych rezultatów. Zasadne jest więc poszukiwanie innej metody rozwiązania tego problemu. Charakterystyka metodyki badań Do oszacowania parametrów mieszaniny rozkładów, będącej w tym przypadku złożeniem rozkładu wykładniczego o parametrze λ oraz rozkładu normalnego o parametrach μ i σ, wykorzystano sztuczną sieć neuronową. Dane będące zbiorem wartości losowych mogą liczyć od kilkunastu do kilku tysięcy elementów. Wobec tego zachodzi potrzeba określenia zestawu wskaźników, które byłyby w stanie opisać statystycznie zbiór bez względu na jego liczebność. Dodatkowo, służyłyby one również jako dane wejściowe do sieci neuronowej. Istnieje wiele wskaźników, które z powodzeniem spełniałyby to zadanie. Jednak w celu ograniczenia liczby wejść sieci, do przygotowania zestawów uczących ostatecznie wytypowano tylko cztery z nich: wartość średnią, odchylenie standardowe, skośność oraz kurtozę. Wymienione wskaźniki są powiązane z parametrami mieszaniny rozkładów i niosą ze sobą informacje na temat ich wartości. Zadanie jakie starano się zrealizować to określenie tej zależności za pomocą sztucznej sieci neuronowej, którą można stosować do rozwiązywania tego typu zagadnień [1, 5]. Sposób postępowania pokazano na rysunku 1. Rys. 1. Sposób postępowania w ramach prowadzonych badań Struktura sieci przedstawia się następująco (rysunek 2) warstwa wejściowa składa się z 8 neuronów połączonych z czterema parametrami charakteryzującymi rozpatrywany zestaw liczb losowych. Następnie zlokalizowana jest pojedyncza warstwa ukryta licząca 10 neuronów i na końcu warstwa wyjściowa z 4 neuronami, które odpowiadają poszukiwanym parametrom mieszaniny rozkładów. 1303
średnia w odchylenie standardowe λ... parametry rozkładu... parametry zestawu... zestaw danych warstwa wejściowa warstwa ukryta warstwa wyjściowa skośność kurtoza µ σ Rys. 2. Struktura sztucznej sieci neuronowej Uczenie sztucznej sieci neuronowej odbywało się z wykorzystaniem generowanych zestawów liczb losowych. W próbce opisywanej mieszaniną rozkładów występują (w omawianym przypadku) dwie grupy elementów o rozkładzie wykładniczym oraz o rozkładzie normalnym. Liczba elementów w obu grupach zależy od wartości parametru w. W oparciu o to generowano zestawy danych korzystając z dwóch rozkładów podstawowych. Przykładowo, chcąc uzyskać próbę 100-elementową o parametrze w=0,6 generowano najpierw 60 wartości o rozkładzie wykładniczym a następnie 40 o rozkładzie normalnym. Wszystkie elementy razem tworzą pojedynczą próbę według mieszaniny rozkładów. By zwiększyć dokładność otrzymywanych wyników sieci były uczone na zestawach o stałych liczbach elementów. Przygotowano w ten sposób kilka sieci o tej samej strukturze, ale przystosowanych do innej liczby elementów w zestawie danych wejściowych. Prezentacja i analiza wyników badań Przykładowe rezultaty otrzymane ze sztucznej sieci neuronowej zostały przedstawione na rysunkach 3-5. Zestawy danych stanowiące podstawę do przeprowadzenia obliczeń zostały losowo wygenerowane dla mieszaniny rozkładów. Wartości parametrów użytych w tym celu zostały wylosowane z tego samego zakresu w którym uczona była sieć neuronowa. Graficzne reprezentacje uzyskanych wyników dowodzą użyteczności stosowanej metody. Krzywe dystrybuanty oraz gęstości prawdopodobieństwa, wyznaczone na podstawie parametrów otrzymanych ze sztucznej sieci neuronowej, wykazują się dobrą zbieżnością z przebiegami opartymi o zależności teoretyczne. Rys. 3. Przebiegi dystrybuanty i funkcji gęstości prawdopodobieństwa na podstawie wyników otrzymanych z sieci neuronowej dla próbki 200-elementowej o parametrach: k=0,506; λ=1,81; μ=4,86; σ=0,87 1304
Rys. 4. Przebiegi dystrybuanty i funkcji gęstości prawdopodobieństwa na podstawie wyników otrzymanych z sieci neuronowej dla próbki 200-elementowej o parametrach: k=0,317; λ=4,15; μ=4,2; σ=0,275 Rys. 5. Przebiegi dystrybuanty i funkcji gęstości prawdopodobieństwa na podstawie wyników otrzymanych z sieci neuronowej dla próbki 100-elementowej o parametrach: k=0,818; λ=3,31; μ=4,23; σ=1,258 Wartości uzyskiwane za pomocą sztucznych sieci neuronowych zawsze mają charakter przybliżony. Oprócz samej specyfiki sieci jako narzędzia, które zawsze dąży do uogólnienia zależności, które ma odwzorować w procesie uczenia, na rezultaty ma też wpływ dobór parametrów wejściowych sieci. Wspominane wcześniej wskaźniki (wartość średnia, kurtoza i in.) tym lepiej opisują jakieś zjawisko im bardziej liczny jest zestaw danych, który go dotyczy. Można zatem oczekiwać, że dokładność oszacowania parametrów rozkładu będzie wzrastać wraz z liczbą elementów rozpatrywanego zestawu danych. Wnioski Przeprowadzona analiza wykazała istnienie możliwości przybliżonego określania parametrów mieszanin rozkładów prawdopodobieństwa (w tym wypadku sumy rozkładu wykładniczego i normalnego) za pomocą sztucznych sieci neuronowych. Opracowane rozwiązanie może być tym samym 1305
pomocne zarówno w kształtowaniu niezawodności nowych maszyn, jak również w kierowaniu procesem eksploatacji istniejących obiektów technicznych. Z uwagi na własności wykorzystywanej mieszaniny rozkładów prawdopodobieństwa, uzasadnione wydaje się jej zastosowanie do opisu niezawodności złożonych obiektów technicznych, w tym: podzespołów zawierających elementy mechaniczne i elektroniczne, występujące, na przykład, w pojazdach, jak również do opisu niezawodności maszyn podlegających remontom uwzględniającym wymianę tylko niektórych części. Streszczenie W artykule przedstawiono analizę możliwości szacowania parametrów mieszanin rozkładów prawdopodobieństwa za pomocą sztucznych sieci neuronowych. Zawarto charakterystykę mieszanin rozkładów oraz metodyki przeprowadzonych badań. Omówiono sposób budowy wykorzystywanych sieci neuronowych, a także uzyskane wyniki, które potwierdzają możliwość wykorzystania opracowanych narzędzi do rozwiązania rozpatrywanego problemu. Słowa kluczowe: mieszanina rozkładów prawdopodobieństwa, szacowanie parametrów rozkładów prawdopodobieństwa, sztuczne sieci neuronowe. Analysis of the possibilities of estimating distributions mixtures parameters using artificial neural networks Abstract The paper presents the analysis of the possibilities of estimating distributions mixtures parameters with the use of artificial neural networks. The characteristics of the distributions mixtures as well as the conducted research method presentation were included. The description of how the neural networks had been built was shown. The obtained results, presented in the paper, give the reasons for using the developed tools for solving the considered problem. Key words: mixture of distributions, estimating the parameters of probability distributions, artificial neural networks. LITERATURA / BIBLIOGRAPHY [1]. Abbasi B., Hosseinifard S.Z., Coit D.W.: A neural network applied to estimate Burr XII distribution parameters. Reliability Engineering & System Safety. 2010, vol. 95, s. 647 654. [2]. Hasselblad V.: Estimation of Finite Mixtures of Distributions from the Exponential Family. Journal of the American Statistical Association. 1969, vol. 64, nr 328, s. 1459 1471. [3]. Jewell N. P.: Mixtures of Exponential Distributions. The Annals of Statistics. 1982, vol. 10, nr 2, s. 479 484. [4]. Richardson M., Smith T.: A Direct Test of the Mixture of Distributions Hypothesis: Measuring the Daily Flow of Information. Journal of Financial and Quantitative Analysis. 1994, vol. 29, nr 1, s. 101 116. [5]. Tadeusiewicz R.: Sieci Neuronowe. Akademicka Oficyna Wydawnicza. Warszawa, 1993. 1306