Analiza możliwości szacowania parametrów mieszanin rozkładów prawdopodobieństwa za pomocą sztucznych sieci neuronowych 4

Podobne dokumenty
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyczna analiza awarii pojazdów samochodowych. Failure analysis of cars

ZASTOSOWANIE SPLOTU FUNKCJI DO OPISU WŁASNOŚCI NIEZAWODNOŚCIOWYCH UKŁADÓW Z REZERWOWANIEM

WYZNACZANIE WARTOŚCI PODSTAWOWYCH PARAMETRÓW TECHNICZNYCH NOWOCZESNYCH KOMBAJNÓW ZBOŻOWYCH PRZY UŻYCIU SSN

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA

STOCHASTYCZNY MODEL BEZPIECZEŃSTWA OBIEKTU W PROCESIE EKSPLOATACJI

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa. Diagnostyka i niezawodność robotów

W4 Eksperyment niezawodnościowy

Modelowanie niezawodności prostych struktur sprzętowych

SPOTKANIE 6: Klasteryzacja: K-Means, Expectation Maximization

Określenie maksymalnego kosztu naprawy pojazdu

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki

METODY ESTYMACJI PUNKTOWEJ. nieznanym parametrem (lub wektorem parametrów). Przez X będziemy też oznaczać zmienną losową o rozkładzie

S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor

FORECASTING THE DISTRIBUTION OF AMOUNT OF UNEMPLOYED BY THE REGIONS

Estymacja parametrów w modelu normalnym

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 1

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

WYKORZYSTANIE SIECI NEURONOWEJ DO BADANIA WPŁYWU WYDOBYCIA NA SEJSMICZNOŚĆ W KOPALNIACH WĘGLA KAMIENNEGO. Stanisław Kowalik (Poland, Gliwice)

Pobieranie prób i rozkład z próby

Zadanie Tworzenie próbki z rozkładu logarytmiczno normalnego LN(5, 2) Plot Probability Distributions

PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Funkcje charakteryzujące proces. Dr inż. Robert Jakubowski

ZASTOSOWANIE SPLOTU FUNKCJI DO OPISU WŁASNOŚCI NIEZAWODNOŚCIOWYCH UKŁADÓW Z REZERWOWANIEM

Komputerowa analiza danych doświadczalnych

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)

WYKŁAD 5 TEORIA ESTYMACJI II

Szacowanie ryzyka z wykorzystaniem zmiennej losowej o pramatkach rozmytych w oparciu o język BPFPRAL

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Komputerowa analiza danych doświadczalnych

Spis treści 3 SPIS TREŚCI

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

WSPÓŁCZYNNIK DWUMODALNOŚCI BC I JEGO ZASTOSOWANIE W ANALIZACH ROZKŁADÓW ZMIENNYCH LOSOWYCH

Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa. Diagnostyka i niezawodność robotów

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI

1.1 Wstęp Literatura... 1

WPŁYW TECHNICZNEGO UZBROJENIA PROCESU PRACY NA NADWYŻKĘ BEZPOŚREDNIĄ W GOSPODARSTWACH RODZINNYCH

Koncepcja systemu informacyjnego wspomagającego kierowanie eksploatacją złożonych odnawialnych obiektów technicznych 2

W3 - Niezawodność elementu nienaprawialnego

Generowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

Optymalizacja ciągła

ZASTOSOWANIE AUTORSKIEJ METODY WYZNACZANIA WARTOŚCI PARAMETRÓW NOWOCZESNYCH SYSTEMÓW TECHNICZNYCH DO PŁUGÓW I OPRYSKIWACZY POLOWYCH

Rachunek prawdopodobieństwa WZ-ST1-AG--16/17Z-RACH. Liczba godzin stacjonarne: Wykłady: 15 Ćwiczenia: 30. niestacjonarne: Wykłady: 9 Ćwiczenia: 18

Akademia Morska w Szczecinie. Wydział Mechaniczny

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

PRZEWODNIK PO PRZEDMIOCIE

Rozkłady statystyk z próby

Metoda największej wiarogodności

KLASYFIKACJA. Słownik języka polskiego

Zestaw 2: Zmienne losowe. 0, x < 1, 2, 2 x, 1 1 x, 1 x, F 9 (x) =

Metody systemowe i decyzyjne w informatyce

Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa. Diagnostyka i niezawodność robotów

Zmienne losowe ciągłe i ich rozkłady

Streszczenie: Zasady projektowania konstrukcji budowlanych z uwzględnieniem aspektów ich niezawodności wg Eurokodu PN-EN 1990

MODELOWANIE ROZKŁADU TEMPERATUR W PRZEGRODACH ZEWNĘTRZNYCH WYKONANYCH Z UŻYCIEM LEKKICH KONSTRUKCJI SZKIELETOWYCH

PROGNOZOWANIE OSIADAŃ POWIERZCHNI TERENU PRZY UŻYCIU SIECI NEURONOWYCH**

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

ROZKŁAD NORMALNY. 2. Opis układu pomiarowego

Sztuczna Inteligencja Tematy projektów Sieci Neuronowe

Matematyka ubezpieczeń majątkowych r.

Sterowanie wielkością zamówienia w Excelu - cz. 3

Z Wikipedii, wolnej encyklopedii.

Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta

LABORATORIUM Z FIZYKI

Drugie kolokwium z Rachunku Prawdopodobieństwa, zestaw A

STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010

Politechnika Krakowska im. Tadeusza Kościuszki KARTA PRZEDMIOTU

Wstęp do teorii sztucznej inteligencji Wykład III. Modele sieci neuronowych.

Statystyka matematyczna dla leśników

WSPÓŁCZYNNIK GOTOWOŚCI SYSTEMU LOKOMOTYW SPALINOWYCH SERII SM48

Analiza danych. TEMATYKA PRZEDMIOTU

Streszczenie. Słowa kluczowe: modele neuronowe, parametry ciągników rolniczych

ZASTOSOWANIE MODELU GOMPERTZ A W INŻYNIERII ROLNICZEJ

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

dla t ściślejsze ograniczenie na prawdopodobieństwo otrzymujemy przyjmując k = 1, zaś dla t > t ściślejsze ograniczenie otrzymujemy przyjmując k = 2.

Zawartość. Zawartość

1. Historia 2. Podstawy neurobiologii 3. Definicje i inne kłamstwa 4. Sztuczny neuron i zasady działania SSN. Agenda

2. Ocena jakości konstrukcji budowli podziemnych w poszczególnych okresach jej istnienia

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

WPŁYW SZYBKOŚCI STYGNIĘCIA NA WŁASNOŚCI TERMOFIZYCZNE STALIWA W STANIE STAŁYM

SZTUCZNA INTELIGENCJA

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

SCENARIUSZ LEKCJI. Dzielenie wielomianów z wykorzystaniem schematu Hornera

Wymagania egzaminacyjne z matematyki. Klasa 3C. MATeMATyka. Nowa Era. Klasa 3

Statystyka matematyczna dla leśników

PARAMETRY, WŁAŚCIWOŚCI I FUNKCJE NIEZAWODNOŚCIOWE NAPOWIETRZNYCH LINII DYSTRYBUCYJNYCH 110 KV

Transkrypt:

Wojciech Sikora 1 AGH w Krakowie Grzegorz Wiązania 2 AGH w Krakowie Maksymilian Smolnik 3 AGH w Krakowie Analiza możliwości szacowania parametrów mieszanin rozkładów prawdopodobieństwa za pomocą sztucznych sieci neuronowych 4 Wstęp Podejmowanie uzasadnionych decyzji dotyczących projektowania, wytwarzania, modernizacji i eksploatacji maszyn wymaga zaopatrzenia w informacje na temat zmian stanu technicznego wykorzystywanych obiektów. Do informacji tego rodzaju należą w szczególności dane o występujących awariach. Do charakteryzowania niezawodności eksploatowanych maszyn, wykorzystywane mogą być różne wskaźniki. Wyznaczanie żądanych funkcji umożliwiają rozkłady prawdopodobieństwa czasu pracy do uszkodzenia, stanowiące matematyczne modele obserwowanych zjawisk. Dokładność opisu zjawisk towarzyszących eksploatacji obiektów technicznych pozostaje związana z budową wykorzystywanych modeli, stąd w pewnych warunkach zastosowanie znaleźć mogą mieszaniny rozkładów, będące wynikiem syntezy mniej skomplikowanych modeli matematycznych (np. często wykorzystywanych w niezawodności rozkładów prawdopodobieństwa: wykładniczego i normalnego). Celem prezentowanych badań była analiza możliwości oszacowania parametrów mieszanin rozkładów (wybranych postaci) za pomocą sztucznych sieci neuronowych. Charakterystyka mieszaniny rozkładów Mieszaninę rozkładów definiuje się jako sumę rozkładów prawdopodobieństwa z przypisanymi odpowiednio wagami [2]. Można ją opisać wzorem (1): (1) gdzie: f i (t) funkcja gęstości i-tego rozkładu, w i waga przypisana do funkcji gęstości i-tego rozkładu. Dodatkowo muszą zostać spełnione następujące warunki:, (2) 1 2 3 4 W. Sikora, doktorant, AGH Akademia Górniczo-Hutnicza, Wydział Inżynierii Mechanicznej i Robotyki, Katedra Konstrukcji i Eksploatacji Maszyn. G. Wiązania, doktorant, AGH Akademia Górniczo-Hutnicza, Wydział Inżynierii Mechanicznej i Robotyki, Katedra Konstrukcji i Eksploatacji Maszyn. M. Smolnik, asystent, AGH Akademia Górniczo-Hutnicza, Wydział Inżynierii Mechanicznej i Robotyki, Katedra Konstrukcji i Eksploatacji Maszyn. Artykuł recenzowany. 1301

(3) Wykorzystanie mieszaniny rozkładów pozwala na tworzenie nowych modeli umożliwiających lepszy opis badanych zjawisk. Przykłady zastosowań mieszaniny rozkładów można znaleźć w literaturze (np. [3, 4]). W teorii niezawodności mieszanina rozkładów może być szczególnie przydatna do modelowania złożonych obiektów technicznych. Poszczególne elementy składowe takich obiektów mają zwykle różne rozkłady czasów pracy do uszkodzenia, a ich łączny rozkład można zastąpić ich mieszaniną z przyjętymi odpowiednio wagami. W praktycznych zastosowaniach przydatna może okazać się mieszanina rozkładów wykładniczego i normalnego, której funkcję gęstości opisuje wzór (4). (4) Taki rozkład pozwala opisać czasy pracy obiektów technicznych, których część elementów składowych znajduje się na etapie normalnej pracy, a część na etapie starzenia. Przydatność rozkładu prawdopodobieństwa jest zdeterminowana m. in. przez możliwość oszacowania wartości jego parametrów. Obecnie najlepszą metodą estymacji parametrów jest metoda największej wiarygodności. Polega ona na takim doborze wartości wektora parametrów rozkładu θ, aby funkcja wiarygodności (5) osiągnęła maksimum. (5) W praktyce łatwiej posługiwać się zlogarytmowaną funkcją wiarygodności (6). (6) Po podstawieniu wzoru (4) do (6) uzyskuje się zależność (7). Następnie, po obliczeniu pochodnych cząstkowych i przyrównaniu ich do zera otrzymuje się układ równań (8) - (12). (7) (8) (9) 1302

(10) (11) (12) Analityczne rozwiązanie takiego układu równań nie jest możliwe, a metody numeryczne nie dają oczekiwanych rezultatów. Zasadne jest więc poszukiwanie innej metody rozwiązania tego problemu. Charakterystyka metodyki badań Do oszacowania parametrów mieszaniny rozkładów, będącej w tym przypadku złożeniem rozkładu wykładniczego o parametrze λ oraz rozkładu normalnego o parametrach μ i σ, wykorzystano sztuczną sieć neuronową. Dane będące zbiorem wartości losowych mogą liczyć od kilkunastu do kilku tysięcy elementów. Wobec tego zachodzi potrzeba określenia zestawu wskaźników, które byłyby w stanie opisać statystycznie zbiór bez względu na jego liczebność. Dodatkowo, służyłyby one również jako dane wejściowe do sieci neuronowej. Istnieje wiele wskaźników, które z powodzeniem spełniałyby to zadanie. Jednak w celu ograniczenia liczby wejść sieci, do przygotowania zestawów uczących ostatecznie wytypowano tylko cztery z nich: wartość średnią, odchylenie standardowe, skośność oraz kurtozę. Wymienione wskaźniki są powiązane z parametrami mieszaniny rozkładów i niosą ze sobą informacje na temat ich wartości. Zadanie jakie starano się zrealizować to określenie tej zależności za pomocą sztucznej sieci neuronowej, którą można stosować do rozwiązywania tego typu zagadnień [1, 5]. Sposób postępowania pokazano na rysunku 1. Rys. 1. Sposób postępowania w ramach prowadzonych badań Struktura sieci przedstawia się następująco (rysunek 2) warstwa wejściowa składa się z 8 neuronów połączonych z czterema parametrami charakteryzującymi rozpatrywany zestaw liczb losowych. Następnie zlokalizowana jest pojedyncza warstwa ukryta licząca 10 neuronów i na końcu warstwa wyjściowa z 4 neuronami, które odpowiadają poszukiwanym parametrom mieszaniny rozkładów. 1303

średnia w odchylenie standardowe λ... parametry rozkładu... parametry zestawu... zestaw danych warstwa wejściowa warstwa ukryta warstwa wyjściowa skośność kurtoza µ σ Rys. 2. Struktura sztucznej sieci neuronowej Uczenie sztucznej sieci neuronowej odbywało się z wykorzystaniem generowanych zestawów liczb losowych. W próbce opisywanej mieszaniną rozkładów występują (w omawianym przypadku) dwie grupy elementów o rozkładzie wykładniczym oraz o rozkładzie normalnym. Liczba elementów w obu grupach zależy od wartości parametru w. W oparciu o to generowano zestawy danych korzystając z dwóch rozkładów podstawowych. Przykładowo, chcąc uzyskać próbę 100-elementową o parametrze w=0,6 generowano najpierw 60 wartości o rozkładzie wykładniczym a następnie 40 o rozkładzie normalnym. Wszystkie elementy razem tworzą pojedynczą próbę według mieszaniny rozkładów. By zwiększyć dokładność otrzymywanych wyników sieci były uczone na zestawach o stałych liczbach elementów. Przygotowano w ten sposób kilka sieci o tej samej strukturze, ale przystosowanych do innej liczby elementów w zestawie danych wejściowych. Prezentacja i analiza wyników badań Przykładowe rezultaty otrzymane ze sztucznej sieci neuronowej zostały przedstawione na rysunkach 3-5. Zestawy danych stanowiące podstawę do przeprowadzenia obliczeń zostały losowo wygenerowane dla mieszaniny rozkładów. Wartości parametrów użytych w tym celu zostały wylosowane z tego samego zakresu w którym uczona była sieć neuronowa. Graficzne reprezentacje uzyskanych wyników dowodzą użyteczności stosowanej metody. Krzywe dystrybuanty oraz gęstości prawdopodobieństwa, wyznaczone na podstawie parametrów otrzymanych ze sztucznej sieci neuronowej, wykazują się dobrą zbieżnością z przebiegami opartymi o zależności teoretyczne. Rys. 3. Przebiegi dystrybuanty i funkcji gęstości prawdopodobieństwa na podstawie wyników otrzymanych z sieci neuronowej dla próbki 200-elementowej o parametrach: k=0,506; λ=1,81; μ=4,86; σ=0,87 1304

Rys. 4. Przebiegi dystrybuanty i funkcji gęstości prawdopodobieństwa na podstawie wyników otrzymanych z sieci neuronowej dla próbki 200-elementowej o parametrach: k=0,317; λ=4,15; μ=4,2; σ=0,275 Rys. 5. Przebiegi dystrybuanty i funkcji gęstości prawdopodobieństwa na podstawie wyników otrzymanych z sieci neuronowej dla próbki 100-elementowej o parametrach: k=0,818; λ=3,31; μ=4,23; σ=1,258 Wartości uzyskiwane za pomocą sztucznych sieci neuronowych zawsze mają charakter przybliżony. Oprócz samej specyfiki sieci jako narzędzia, które zawsze dąży do uogólnienia zależności, które ma odwzorować w procesie uczenia, na rezultaty ma też wpływ dobór parametrów wejściowych sieci. Wspominane wcześniej wskaźniki (wartość średnia, kurtoza i in.) tym lepiej opisują jakieś zjawisko im bardziej liczny jest zestaw danych, który go dotyczy. Można zatem oczekiwać, że dokładność oszacowania parametrów rozkładu będzie wzrastać wraz z liczbą elementów rozpatrywanego zestawu danych. Wnioski Przeprowadzona analiza wykazała istnienie możliwości przybliżonego określania parametrów mieszanin rozkładów prawdopodobieństwa (w tym wypadku sumy rozkładu wykładniczego i normalnego) za pomocą sztucznych sieci neuronowych. Opracowane rozwiązanie może być tym samym 1305

pomocne zarówno w kształtowaniu niezawodności nowych maszyn, jak również w kierowaniu procesem eksploatacji istniejących obiektów technicznych. Z uwagi na własności wykorzystywanej mieszaniny rozkładów prawdopodobieństwa, uzasadnione wydaje się jej zastosowanie do opisu niezawodności złożonych obiektów technicznych, w tym: podzespołów zawierających elementy mechaniczne i elektroniczne, występujące, na przykład, w pojazdach, jak również do opisu niezawodności maszyn podlegających remontom uwzględniającym wymianę tylko niektórych części. Streszczenie W artykule przedstawiono analizę możliwości szacowania parametrów mieszanin rozkładów prawdopodobieństwa za pomocą sztucznych sieci neuronowych. Zawarto charakterystykę mieszanin rozkładów oraz metodyki przeprowadzonych badań. Omówiono sposób budowy wykorzystywanych sieci neuronowych, a także uzyskane wyniki, które potwierdzają możliwość wykorzystania opracowanych narzędzi do rozwiązania rozpatrywanego problemu. Słowa kluczowe: mieszanina rozkładów prawdopodobieństwa, szacowanie parametrów rozkładów prawdopodobieństwa, sztuczne sieci neuronowe. Analysis of the possibilities of estimating distributions mixtures parameters using artificial neural networks Abstract The paper presents the analysis of the possibilities of estimating distributions mixtures parameters with the use of artificial neural networks. The characteristics of the distributions mixtures as well as the conducted research method presentation were included. The description of how the neural networks had been built was shown. The obtained results, presented in the paper, give the reasons for using the developed tools for solving the considered problem. Key words: mixture of distributions, estimating the parameters of probability distributions, artificial neural networks. LITERATURA / BIBLIOGRAPHY [1]. Abbasi B., Hosseinifard S.Z., Coit D.W.: A neural network applied to estimate Burr XII distribution parameters. Reliability Engineering & System Safety. 2010, vol. 95, s. 647 654. [2]. Hasselblad V.: Estimation of Finite Mixtures of Distributions from the Exponential Family. Journal of the American Statistical Association. 1969, vol. 64, nr 328, s. 1459 1471. [3]. Jewell N. P.: Mixtures of Exponential Distributions. The Annals of Statistics. 1982, vol. 10, nr 2, s. 479 484. [4]. Richardson M., Smith T.: A Direct Test of the Mixture of Distributions Hypothesis: Measuring the Daily Flow of Information. Journal of Financial and Quantitative Analysis. 1994, vol. 29, nr 1, s. 101 116. [5]. Tadeusiewicz R.: Sieci Neuronowe. Akademicka Oficyna Wydawnicza. Warszawa, 1993. 1306