Wprowadzenie do estymacji rozkładów w SAS Henryk.Maciejewski@pwr.wroc.pl 1
Plan Empiryczne modele niezawodności Estymacja parametryczna rozkładów zmiennych losowych Estymacja nieparametryczna
Empiryczne modele niezawodności Zadanie: na podstawie obserwowanych danych o uszkodzeniach obiektu wyznaczyć empiryczny model jego niezawodności Dane niezawodnościowe na ogół próby obcięte (dane cenzorowane) censor=0: czas życia obiektu censor=1: (dolne) ograniczenie czasu życia 3
Empiryczne modele niezawodności Dla obiektów nienaprawialnych modelujemy czas życia T obiektu jako zmienną losową Opis rozkładu zmiennej losowej: Dystrybuanta F(t) = Pr(T<t) Funkcja gęstości f(t) = F (t) Funkcja niezawodności R(t) = 1-F(t) Intensywność uszkodzeń (t) = f(t)/r(t) 4
Empiryczne modele niezawodności Dla obiektów nienaprawialnych modelujemy czas życia T obiektu jako zmienną losową Opis rozkładu zmiennej losowej: Kwantyle rozkładu: t p =F -1 (p) t p kwantyl na poziomie p [0,1] 5
Estymacja parametryczna rozkładów zmiennych losowych Estymacja na podstawie prób pełnych za pomocą procedur: PROC CAPABILITY (z modułu SAS/QC) PROC UNIVARIATE (z modułu Base SAS) Estymacja na podstawie prób obciętych PROC RELIABILITY (z modułu SAS/QC) 6
PROC CAPABILITY proc capability data=test; var t; histogram t / weibull ; run; Wykonaj analizę parametryczną rozkładu zmiennej t (zmienna numeryczna w zbiorze test) Polecenie histogram z opcją weibull realizuje dopasowanie rozkładu Weibulla do danych W wyniku dostajemy estymowane parametry rozkładu (patrz np. wykres histogramu z nałożoną funkcją gęstości) oraz wyniki testów zgodności rozkładów Możemy również użyć polecenia cdfplot oraz probplot 7
PROC CAPABILITY histogram i estymowana funkcja gęstości 8
PROC CAPABILITY test zgodności rozkładów H0: zakłada zgodność rozkładów (np. badana zmienna ma rozkład Weibulla) Jeśli pvalue<0.05 (założony poziom istotności testu), wówczas odrzucamy H0 Goodness-of-Fit Tests for Weibull Distribution Test Statistic DF p Value Cramer-von Mises W-Sq 0.1169997 Pr > W-Sq 0.063 Anderson-Darling A-Sq 0.8760160 Pr > A-Sq 0.024 Chi-Square Chi-Sq 20.3972448 9 Pr > Chi-Sq 0.016 9
PROC CAPABILITY szacowanie prawdopodobieństwa zdarzenia proc capability data=test; var t; run; spec lsl=0.8 usl=1.3; histogram / weibull; 10
PROC CAPABILITY szacowanie prawdopodobieństwa zdarzenia Percent Outside Specifications for Weibull Distribution Lower Limit Upper Limit LSL 0.800000 USL 1.30000 Obs Pct < LSL 6.572770 Obs Pct > USL 2.816901 Est Pct < LSL 8.967087 Est Pct > USL 1.405525 11
PROC RELIABILITY analiza prób proc reliability data=test; run; distribution Weibull; pplot t*censor( 1 ) / covb cfit = yellow cframe = ligr ccensor = red; inset / cfill = ywh; obciętych Wykonaj analizę parametryczną rozkładu zmiennej t, przy czym obserwacje w zbiorze test, w których zmienna censor przyjmuje wartość 1 należy traktować jako próby obcięte Polecenie distribution realizuje dopasowanie wskazanego rozkładu do danych W wyniku dostajemy parametry rozkładu estymowane na podst. próby obciętej oraz wykres pplot, na podstawie którego oceniamy zgodność rozkładów (jeśli próba pochodzi z rozkładu Weibulla, dane powinny układać się wzdłuż prostej). 12
PROC RELIABILITY - pplot 13
Estymacja nieparametryczna rozkładów zmiennych losowych Nie zakładamy parametrycznego rozkładu czasu życia Funkcja niezawodności, intensywności uszkodzeń i in. wyznaczane bezpośrednio z danych Estymacja na podstawie prób obciętych PROC LIFETEST (z modułu SAS/STAT) 14
PROC LIFETEST proc lifetest run; time t*censor( 1 ); data=test method=lt ninterval=10 plots=(s,p,h); Analiza nieparametryczna zmiennej t Metoda life-table (lub product-limit ) Wyznaczyć funkcje: Niezawodności (survival, s) Gęstości (p) Intensywności uszkodzeń (hazard, h) 15
PROC LIFETEST proc lifetest run; time t*censor( 1 ); data=test method=lt ninterval=10 plots=(s,p,h); 16