ZASTOSOWANIE TESTU GEHANA DO PORÓWNYWANIA FUNKCJI PRZEŻYCIA FIRM 1

Podobne dokumenty
An a l i z a d e t e r m i n a n t c z a s u p o s z u k i wa n i a p r a c y

PŁEĆ, WIEK I WYKSZTAŁCENIE OSÓB BEZROBOTNYCH JAKO DETERMINANTY CZASU POSZUKIWANIA PRACY

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Testy nieparametryczne

Wykład 3 Hipotezy statystyczne

Jak długo żyją spółki na polskiej giełdzie? Zastosowanie statystycznej analizy przeżycia do modelowania upadłości przedsiębiorstw

Statystyka matematyczna dla leśników

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Analiza długości okresu bezrobocia według przyczyny wyrejestrowania na przykładzie Powiatowego Urzędu Pracy w Szczecinie

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Testowanie hipotez statystycznych.

Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym

STATYSTYKA MATEMATYCZNA

Testy dla dwóch prób w rodzinie rozkładów normalnych

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

Kolokwium ze statystyki matematycznej

Analiza przeżycia. Czym zajmuje się analiza przeżycia? Jest to analiza czasu trwania, zaprojektowana do analizy tzw.

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Analiza przeżycia. Czym zajmuje się analiza przeżycia?

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Wykład 9 Testy rangowe w problemie dwóch prób

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Wydział Matematyki. Testy zgodności. Wykład 03

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Wybrane statystyki nieparametryczne. Selected Nonparametric Statistics

PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR. Wojciech Zieliński

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

POLITECHNIKA WARSZAWSKA

Spis treści 3 SPIS TREŚCI

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Wnioskowanie statystyczne. Statystyka w 5

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Wykład 10 ( ). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

STATYSTYKA MATEMATYCZNA

166 Wstęp do statystyki matematycznej

Elementarne metody statystyczne 9

Weryfikacja hipotez statystycznych

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Zadania ze statystyki cz.8. Zadanie 1.

Statystyka matematyczna i ekonometria

EKONOMETRIA ECONOMETRICS 2(40) 2013

Wykorzystanie testu Levene a i testu Browna-Forsythe a w badaniach jednorodności wariancji

STATYSTYKA MATEMATYCZNA

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Statystyczna analiza danych

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

Testy post-hoc. Wrocław, 6 czerwca 2016

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Statystyka matematyczna. Wykład VI. Zesty zgodności

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

DEMOGRAFIA FIRM ANALIZA ZMIAN W POPULACJI FIRM W POLSCE

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Analiza przeżycia Survival Analysis

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Monte Carlo, bootstrap, jacknife

METODY STATYSTYCZNE W BIOLOGII

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Wykład 12 Testowanie hipotez dla współczynnika korelacji

IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15

Właściwości testu Jarque-Bera gdy w danych występuje obserwacja nietypowa.

Testowanie hipotez statystycznych

Wykład 10 Testy jednorodności rozkładów

Transkrypt:

STUDIA I PRACE WYDZIAŁU AUK EKOOMICZYCH I ZARZĄDZAIA R 2 187 IWOA MARKOWICZ BEATA STOLORZ Uniwersytet Szczeciński ZASTOSOWAIE TESTU GEHAA DO PORÓWYWAIA FUKCJI PRZEŻYCIA FIRM 1 Wstęp Rozwój metod ilościowych i techniki komputerowej stwarza coraz większe możliwości wykorzystania nowoczesnych i zaawansowanych metod i technik w różnych dyscyplinach naukowych. Przykładem są metody analizy historii zdarzeń, wykorzystywane przez demografów, socjologów, ekonomistów, medyków, biologów, kryminologów i epidemiologów. Tak szerokie zastosowanie sprawia, że nie zostało ujednolicone nazewnictwo, dlatego mówi się o analizie przeżycia (lub dożycia), analizie trwania, analizie przejścia, analizie niezawodności (lub bezawaryjności), analizie czasu niepowodzeń itp. Ogólnie mówiąc, jest to zbiór procedur statystycznych, dla których zmienną losową jest czas między określonymi zdarzeniami bądź czas procesu. Zdarzenie powoduje przejście jednostki z jednego stanu w drugi (np. śmierć osoby, awaria urządzenia, upadek firmy). Okres między stanem początkowym a momentem wystąpienia zdarzenia jest nazywany czasem przeżycia. Wyznaczając prawdopodobieństwo, że jednostka przeżyje kolejne wartości czasu t, określamy funkcję przeżycia. Funkcje takie utworzone dla dwóch lub więcej prób można porównywać. Celem artykułu jest przedstawienie możliwości wykorzystania testu Gehana (uogólnienia testu Wilcoxona) do porównywania funkcji przeżycia firm. Przy- 1 Praca naukowa finansowana ze środków na naukę w latach 2006-2008 jako projekt badawczy. Artykuł napisano w ramach projektu numer 11101131/1109.

188 Iwona Markowicz, Beata Stolorz kładem zmiennej losowej jest czas funkcjonowania firm. Przeprowadzone badania uwzględniają obserwacje ucięte, a więc czas funkcjonowania niektórych firm nie jest znany, gdyż nie zostały one zlikwidowane przed zakończeniem obserwacji. 1. ieparametryczny test Gehana Modele nieparametryczne dla zmiennej losowej czasu trwania (czasu przeżycia) są stosowane wtedy, gdy nie jest znana postać analityczna rozkładu. Teoria szacowania wybranych funkcji jest wówczas bardzo złożona i rozbudowana. Historycznie najstarszym modelem nieparametrycznym jest tablica trwania życia 2. Tradycyjna metoda konstrukcji takich tablic dostarcza nieparametrycznej estymacji funkcji dożycia, funkcji gęstości i wskaźnika hazardu dla określonego przedziału czasu. Jednym z ograniczeń tej metody jest konieczność grupowania czasu obserwacji w przedziały o jednakowej długości 3, dlatego do badania czasu trwania zjawiska często stosuje się inne metody. Przykładem jednej z nich jest metoda Product-Limit-Estimation Kaplana-Meiera, stosowana głównie do konstrukcji tablic trwania życia. Jest to metoda nieparametryczna, uwzględniająca występowanie obserwacji uciętych, a więc niekompletnych danych. W tym przypadku nie ma konieczności konstrukcji przedziałów dla zmiennej czasowej, lecz jedynie uszeregowanie epizodów według długości czasów trwania. Każdemu punktowi czasu, w którym nastąpiło co najmniej jedno zdarzenie, jest przyporządkowana wartość ryzyka. W roku 1958 E.L. Kaplan i P. Meier zaproponowali sposób estymacji funkcji przeżycia (survival function) 4 : i d j St ˆ( i ) = 1 dla i = 1,..., k (1) j= 1 n j gdzie: t i punkt czasu, w którym wystąpiło co najmniej jedno zdarzenie, t 1 < t 2 <... < t k, t 0 = 0, d i liczba zdarzeń w czasie t i, 2 [5]. 3 Por. [4], s. 61 65. 4 Por. ibidem, s. 65 69.

189 n i liczba jednostek objętych obserwacją w czasie t i, n i = n i 1 d i 1 z i 1, z i liczba obserwacji uciętych w czasie t i. Analizowane zbiorowości można dzielić na grupy ze względu na badane cechy i oszacować funkcję przeżycia dla każdej z tych grup oraz zbadać istotność różnic między nimi. Czasy przeżycia można porównywać w dwóch lub więcej próbach. Ponieważ ich rozkłady są nieznaczne, należy zastosować test nieparametryczny, który jest oparty na porządku rangowym czasów przeżycia. W przypadku dwóch grup można wykorzystać następujące testy: uogólnienie Gehana testu Wilcoxona 5, test Coxa-Mantela, test F Coxa, test log-rank oraz uogólnienie Peto i Peto testu Wilcoxona 6. Dostępne są również testy do porównywania wielu grup. ie ma, niestety, powszechnie akceptowanych metod wyboru testu w danej sytuacji. Zależy to bowiem od liczebności prób, występowania danych uciętych i znajomości rozkładu zmiennych 7. W większości testów obliczone statystyki dla dużej próby asymptotycznie dążą do rozkładu normalnego. Fakt ten jest wykorzystywany do testowania istotności statystycznej różnic między próbami. Większość testów daje rzetelne wyniki tylko przy dużych próbach, a efektywność testów przy małych próbach jest mniej poznana. Autorki artykułu zastosowały test Gehana dla dwóch prób 8 do weryfikacji hipotezy o równości funkcji przeżycia: H 0 : S 1 (t) = S 2 (t). ajpierw za pomocą procedury Mantela każdemu czasowi przeżycia przyporządkowuje się punkty, a następnie oblicza się wartość statystyki w oparciu o sumy (dla każdej próby) tych punktów. Dane są dwie próby: 1 i 2, o liczebnościach odpowiednio n 1 i n 2, które należy uporządkować łącznie w rosnącej kolejności. Dane można porządkować dwoma sposobami. ajpierw należy ustawić nieucięte obserwacje z obu prób wciąg od najmniejszej do największej, nadając im kolejne wartości naturalne, a w miejscu obserwacji uciętej wstawić wartość najbliższej kolejnej obserwacji nieuciętej. astępnie powtarzające się obserwacje w dwóch próbach trzeba zredukować do nadanej im mniejszej wartości. W ten sposób powstaje ciąg, które- 5 Zob. [6]; [7]. 6 Por. [10], s. 71 91; [2], s. 123 125. 7 Por. [8], s. 425 427. 8 Procedurę testowania zaczerpnięto z [10], s. 75.

190 Iwona Markowicz, Beata Stolorz go wyrazy oznaczono jako R 1i. Teraz należy utworzyć drugi ciąg wartości. Kolejno numerowane są wszystkie obserwacje w malejącej kolejności. astępnie w miejscu każdej obserwacji uciętej wstawia się wartość 1. W ten sposób powstaje ciąg wartości, który oznaczono jako R 2i. iech zbiór A jest zbiorem indeksów i, którymi oznaczono dane dotyczące pierwszej próby. Statystykę G oblicza się ze wzoru: gdzie: v = w G =, v n + n 1 2 nn 1 2 Ui i= 1 ( n + n )( n + n ) 1 2 1 2 1 w= U, i A i, U = R R. i 1i 2i Otrzymaną wartość porównuje się z wartościami krytycznymi standardowego rozkładu normalnego na przyjętym poziomie istotności. Opisaną metodę stosuje się do analizy czasu przeżycia lub bezawaryjności, gdy część danych jest ucięta 9. Można je wykorzystać także w demografii, biologii, naukach społecznych, inżynierii, technice, a szczególnie w medycynie 10, gdzie często traci się kontakt z obserwowanymi pacjentami. 2. Analiza funkcji przeżycia firm w Szczecinie Badania przeprowadzono w trzech grupach firm zarejestrowanych w krajowym rejestrze urzędowym podmiotów gospodarki narodowej REGO w Urzę- 9 Obserwacje ucięte to obserwacje, dla których nieznany jest dokładny czas przeżycia. Powodem może być niewystąpienie zdarzenia przed ukończeniem badań lub utrata kontaktu z badaną jednostką. W literaturze mówi się również o danych cenzurowanych. Por. [3], s. 203 204. 10 Por. [1].

191 dzie Statystycznym w Szczecinie. O przynależności firmy do danej kohorty decydował rok powstania podmiotu gospodarczego. Do analizy przyjęto grupy firm założonych w latach 1990, 1994 i 1997. a długość czasu funkcjonowania firm wpłynęło wiele czynników, między innymi warunki gospodarcze, w jakich podmiot rozpoczynał działalność, które z pewnością były różne dla omawianych grup. Jednym z elementów, który należy wziąć pod uwagę, jest konkurencja na danym rynku. O jej wielkości może świadczyć liczba istniejących podmiotów. a koniec roku (1989) poprzedzającego powstanie firm grupy pierwszej zarejestrowanych było 1205 podmiotów gospodarczych, Wielkość ta dla drugiej grupy wynosiła już ponad 33 grupy trzeciej ponad 43 tys. Wielkości te świadczą o niejednorodności warunków funkcjonowania badanych grup firm. Obserwację trzech grup zakończono w 2000 roku, zatem okresy obserwacji są niejednakowe. Maksymalny czas obserwacji wynosił do 132 miesięcy dla pierwszej grupy (firmy założone w 1990 roku), do 84 miesięcy dla drugiej grupy (firmy założone w 1994 roku) i do 48 miesięcy dla trzeciej grupy (firmy założone w 1997 roku). Firma, która nie została zlikwidowana w wymienionych okresach była uznawana za obserwację uciętą. Charakterystykę ilościową badanych grup przedstawiono w tabeli 1. Tabela 1 Liczebność badanych grup z podziałem na obserwacje nieucięte i ucięte Liczebność Obserwacje nieucięte Obserwacje ucięte Lata grupy liczba odsetek liczba odsetek 1990 1641 37,30 2758 62,70 4399 1994 2007 40,35 2967 59,65 4974 1997 2291 29,15 5568 70,85 7859 Źródło: obliczenia własne. Jak wspomniano, punktem wyjścia w przeprowadzonej analizy było wyznaczenie funkcji przeżycia Kaplana-Meiera. astępnie przy zastosowaniu testu Gehana zweryfikowano hipotezę o jednakowych funkcjach przeżycia firm z analizowanych grup. Test ten przeprowadzono najpierw dla trzech grup, a następnie dla poszczególnych par grup; wyniki przedstawiono w tabeli 2. Wartość statystyki testu dla trzech grup wskazuje na istotność różnic między nimi. Potwierdza to również histogram sum punktów dla grup firm, obliczonych według pro-

192 Iwona Markowicz, Beata Stolorz cedury Mantela (rysunek 1). Wyraźną różnicę można zauważyć między grupą firm z 1990 roku a pozostałymi grupami. Wartości testów dla poszczególnych par jednoznacznie wskazują na istotną różnicę między czasami przeżycia dla firm z lat 1990 i 1994 oraz 1990 i 1997. Porównując grupy firm z lat 1994 i 1997, czasy przeżycia można uznać za różne dopiero na poziomie istotności 0,10946. Zakładając najczęściej przyjmowany poziom α = 0,05, nie ma podstaw do odrzucenia hipotezy o jednakowych funkcjach przeżycia. Grupy (rok powstania firm dla porównywanych grup) Wyniki testu Gehana Wynik testu Gehana Źródło: obliczenia własne z wykorzystaniem programu Statistica. Tabela 2 Prawdopodobieństwo, przy którym różnice są istotne 1990, 1994, 1997 451,0314 0,00000 1990, 1994 17,67692 0,00000 1990, 1997 19,66488 0,00000 1994, 1997 1,600630 0,10946 Rys. 1. Histogram sumy punktów dla każdej grupy firm (założonych w Szczecinie w latach 1994 i 1997), obliczone według procedury Mantela, wykorzystanej do obliczenia statystyki testu Gehana Źródło: opracowanie własne z wykorzystaniem programu Statistica.

193 Porównanie prawdopodobieństw przeżycia dla poszczególnych par spośród trzech badanych grup firm zaprezentowano w tabelach 3 5 i na rysunkach 2 4 ( liczebność). Tabela 3 Tablice przeżycia, przy zastosowaniu estymatora Kaplana-Meiera dla firm powstałych w Szczecinie w latach 1990 i 1994 Dolna granica wchodzących uciętych zlikwidowanych Procent Źródło: obliczenia własne z wykorzystaniem programu Statistica. Skumulowany procent 1990 1994 1990 1994 1990 1994 1990 1994 1990 1994 0,0000 4399 4974 0 0 398 630 90,95249 87,33414 100,0000 100,0000 14,5556 4001 4344 0 0 107 506 97,32567 88,35175 90,9525 87,3341 29,1111 3894 3838 0 0 117 425 96,99538 88,92652 88,5201 77,1612 43,6666 3777 3413 0 0 214 269 94,33412 92,11837 85,8604 68,6168 58,2222 3563 3144 0 275 138 123 96,12686 95,90886 80,9957 63,2087 72,7778 3425 2746 0 2692 225 54 93,43066 96,14286 77,8586 60,6227 87,3334 3200 0 0 0 227 0 92,90625 0,00000 72,7438 58,2844 101,8889 2973 0 0 0 113 0 96,19913 0,00000 67,5835 0,0000 116,4445 2860 0 2758 0 102 0 93,11276 0,00000 65,0148 0,0000 131,0000 0 0 0 0 0 0 0,00000 0,00000 60,5371 0,0000 Tabela 4 Tablice przeżycia, przy zastosowaniu estymatora Kaplana-Meiera dla firm powstałych w Szczecinie w latach 1990 i 1997 Dolna granica wchodzących uciętych zlikwidowanych Procent Źródło: obliczenia własne z wykorzystaniem programu Statistica. Skumulowany procent 1990 1997 1990 1997 1990 1997 1990 1997 1990 1997 0,0000 4399 7859 0 0 398 1406 90,95249 82,10968 100,0000 100,0000 14,5556 4001 6453 0 0 107 590 97,32567 90,85696 90,9525 82,1097 29,1111 3894 5863 0 3515 117 272 96,99538 93,37474 88,5201 74,6024 43,6666 3777 2076 0 2053 214 23 94,33412 97,80848 85,8604 69,6598 58,2222 3563 0 0 0 138 0 96,12686 0,00000 80,9957 68,1332 72,7778 3425 0 0 0 225 0 93,43066 0,00000 77,8586 0,0000 87,3334 3200 0 0 0 227 0 92,90625 0,00000 72,7438 0,0000 101,8889 2973 0 0 0 113 0 96,19913 0,00000 67,5835 0,0000 116,4445 2860 0 2758 0 102 0 93,11276 0,00000 65,0148 0,0000 131,0000 0 0 0 0 0 0 0,00000 0,00000 60,5371 0,0000

194 Iwona Markowicz, Beata Stolorz Tabela 5 Tablice przeżycia, przy zastosowaniu estymatora Kaplana-Meiera dla firm powstałych w Szczecinie w latach 1994 i 1997 Dolna granica wchodzących uciętych zlikwidowanych Procent Źródło: obliczenia własne z wykorzystaniem programu Statistica. Skumulowany procent 1994 1997 1994 1997 1994 1997 1994 1997 1994 1997 0,0000 4974 7859 0 0 405 996 91,85766 87,32664 100,0000 100,0000 9,2259 4569 6863 0 0 368 645 91,94572 90,60178 91,8577 87,3266 18,4519 4201 6218 0 0 335 332 92,02571 94,66066 84,4592 79,1195 27,6778 3866 5886 0 398 256 190 93,37817 96,65905 77,7242 74,8950 36,9037 3610 5298 0 4606 243 121 93,26870 95,95993 72,5774 72,3928 46,1296 3367 571 0 564 187 7 94,44609 97,57785 67,6920 69,4681 55,3555 3180 0 0 0 101 0 96,82390 0,00000 63,9324 67,7855 64,5815 3079 0 534 0 63 0 97,75961 0,00000 61,9019 0,0000 73,8074 2482 0 2433 0 48 0 96,20703 0,00000 60,5150 0,0000 83,0333 1 0 0 0 1 0 0,00000 0,00000 58,2197 0,0000 Rys. 2. Prawdopodobieństwo przeżycia Kaplana-Meiera dla firm założonych w Szczecinie w latach 1990 i 1994 Źródło: opracowanie własne z wykorzystaniem programu Statistica.

195 Rys. 3. Prawdopodobieństwo przeżycia Kaplana-Meiera dla firm założonych w Szczecinie w latach 1990 i 1997 Źródło: opracowanie własne z wykorzystaniem programu Statistica. Rys. 4. Prawdopodobieństwo przeżycia Kaplana-Meiera dla firm założonych w Szczecinie w latach 1994 i 1997 Źródło: opracowanie własne z wykorzystaniem programu Statistica.

196 Iwona Markowicz, Beata Stolorz Podsumowanie Podsumowując, wśród badanych grup wyróżnia się grupa firm zarejestrowanych w Szczecinie w 1990 roku. Spadek skumulowanego prawdopodobieństwa przeżycia tych podmiotów gospodarczych był wolniejszy niż podmiotów powstałych w latach 1994 i 1997. Z pewnością utrzymanie się firmy na szczecińskim rynku było łatwiejsze w pierwszych latach 90. ubiegłego wieku ze względu na małą konkurencję. Przedstawione na rysunku 4 prawdopodobieństwa przeżycia firm założonych w latach 1994 i 1997 wskazywały na podobieństwo zmian w czasie. Brak podstaw do odrzucenia hipotezy o statystycznej równości funkcji przeżycia potwierdził zastosowany test Gehana. Literatura 1. Badania statystyczne w ubezpieczeniach. Red. J. Hozer. Wyd. aukowe Uniwersytetu Szczecińskiego, Szczecin 2002. 2. Cox D.R., Oakes D.: Analysis of survival data. Chapman and Hall, London 1984. 3. Domański C., Pruska K.: ieklasyczne metody statystyczne. PWE, Warszawa 2000. 4. Frątczak E., Gach-Ciepiela U., Babiker H.: Analiza historii zdarzeń. Elementy teorii, wybrane przykłady zastosowań. SGH, Warszawa 2005. 5. Frątczak E., Jóźwiak J., Paszek B.: Zastosowania analizy historii zdarzeń w demografii. SGH, Warszawa 1996. 6. Gehan E.A.: A generalized Wilcoxson test for comparing arbitrary single-censored samples. Biometrica 1965, o 52. 7. Gehan E.A.: A generalized two-sample Wilcoxson test for double-censored data. Biometrica 1965, o 52. 8. Lawless J.F.: Statistical models and methods for lifetime data. John Wiley & Sons, ew York 1982. 9. Markowicz I., Stolorz B.: Wykorzystanie analizy historii zdarzeń do konstrukcji tablic żywotności firm. Wiadomości Statystyczne 2006, nr 4. 10. amboodiri K., Suchindran C.M.: Life table techniques and their applications. Academic Press Inc., ew York 1987.

197 APPLICATIO OF THE GEHA TEST FOR COMPARISO OF FIRMS SURVIVAL FUCTIOS Summary The aim of the paper is to present the possibility of Gehan test (Gehan s generalization of Wilcoxon test) application for the comparison of survival functions. Firm s existence time is the example of random variable. Studies carried out include censored observations, thus time of some firms existence is unknown because they were still operating at the completion of research. Analyses were carried out in three groups of firms registered in the ational Register of Economic Entities REGO in the Statistical Office in Szczecin. The year of the origin of economic entity decided on firm s membership in the specific cohort. Groups of firms established in the years 1990, 1994 and 1997 were analyzed and the observation was completed in year 2000. Translated by Janusz Stolorz