ULEPSZONE SZACOWANIE RYZYKA W PRZEDSIĘWZIĘCIACH INFORMATYCZNYCH Z WYKORZYSTANIEM SIECI BAYESA
|
|
- Bogna Przybysz
- 9 lat temu
- Przeglądów:
Transkrypt
1 STUDIA I PRACE WYDZIAŁU NAUK EKONOMICZNYCH I ZARZĄDZANIA NR 20 Łukasz Radliński ULEPSZONE SZACOWANIE RYZYKA W PRZEDSIĘWZIĘCIACH INFORMATYCZNYCH Z WYKORZYSTANIEM SIECI BAYESA Wprowadzenie Wraz ze wzrostem wymagań tworzenia oprogramowania dobrej jakości przy niskich kosztach, rosną również wymagania w zakresie szacowania ryzyka w przedsięwzięciach informatycznych, rozumianych w tej pracy jako takie przedsięwzięcia (projekty), których celem jest wytworzenie oprogramowania. Pierwszym wymiarem szacowania w obszarze przedsięwzięć informatycznych jest szacowanie kluczowych czynników projektu. Istniejące modele skupiają się najczęściej na szacowaniu nakładów niezbędnych do realizacji projektu lub jakości wytworzonego oprogramowania. Chronologicznie pierwszymi modelami są modele parametryczne do szacowania liczby defektów 1, czasu między awariami 2 i nakładów 3. 1 F. Akiyama, An Example of Software System Debugging, w: Proc. Int. Federation for Information Processing Congress, vol. 71, Ljubljana 1971, s ; M.H. Halstead, Elements of Software Science, Elsevier North-Holland, New York A.L. Goel, K. Okumoto, An Analysis of Recurrent Software Failures in Real-Time Control System, w: Proc. ACM Annual Technology Conference, Washington, D.C. 1978, s ; Z. Jelinski, P. Moranda, Software Reliability Research, w: Statistical Computer Performance Evaluation, ed. W. Freiberger, Academic Press, New York 1972, s B. Boehm, Software Engineering Economics, Prentice Hall 1981; L.H. Putnam, A general empirical solution to the macro software sizing and estimating problem, IEEE Transactions on Software Engineering 1978, vol. 4, no. 4, s
2 148 Łukasz Radliński Jednym z najważniejszych zadań kierowników projektów jest odpowiednie balansowanie kluczowymi czynnikami projektu. Analiza kompromisu (ang. trade-off) pozwala szacować, jaka wartość jednego z tych czynników musi zostać poświęcona w celu osiągnięcia wyższej wartości innego czynnika. Na przykład: o ile większe nakłady są potrzebne w celu wytworzenia oprogramowania o określonej wielkości bez zmiany jakości procesu wytwórczego, ale o wyższym poziomie jakości oprogramowania? Albo: o ile mniejsza funkcjonalność oprogramowania zostanie dostarczona przy stałej jakości procesu, stałej docelowej jakości oprogramowania, lecz przy niższych nakładach? Z tego względu podjęto się napisania rozprawy doktorskiej pt. Improved Software Project Risk Assessment Using Bayesian Nets 4. Praca ta skupiona była na analizie kompromisu między następującymi czynnikami projektu: nakładami, jakością procesu, dostarczoną funkcjonalnością (wielkością oprogramowania), jakością oprogramowania (liczbą defektów, wskaźnikiem defektów). Drugim wymiarem szacowania w obszarze przedsięwzięć informatycznych jest szacowanie ryzyka. Popularne definicje określają ryzyko jako źródło niebezpieczeństwa 5 lub możliwość poniesienia straty lub innej szkody 6. Pierwsza z tych definicji wskazuje na jakościowy wymiar ryzyka, natomiast druga na ilościowy. Podejście ilościowe często ujmuje ryzyko w postaci wartości ryzyka (inaczej: podatność na ryzyko): wartość ryzyka = prawdopodobieństwo zdarzenia * wpływ zdarzenia (równanie 1) Takie ujęcie ryzyka posiada jednak istotne wady: (1) szacowanie prawdopodobieństwa zdarzenia jest często trudne i pozbawione sensu bez analizy czynników wpływających na wystąpienie zdarzenia i działań mających na celu niedopuszczenie do wystąpienia zdarzenia, (2) szacowanie wpływu zdarzenia jest często trudne i pozbawione sensu bez analizy czynników i działań mogących zniwelować negatywne 4 L. Radlinski, Improved Software Project Risk Assessment Using Bayesian Nets, Ph.D. Thesis, Queen Mary, University of London Webster s Online Dictionary, 2008, Merriam-Webster s Online Dictionary, 2008,
3 Ulepszone szacowanie ryzyka w przedsięwzięciach informatycznych z wykorzystaniem sieci bayesa 149 konsekwencje, (3) wartość ryzyka nie posiada użytecznej interpretacji i może być wykorzystana jedynie do uszeregowania ryzyka 7. Sieci Bayesa udostępniają mechanizm, który pokonuje sygnalizowane ograniczenia istniejących podejść w postaci jawnego ujęcia związków przyczynowo-skutkowych w modelu, a w konsekwencji dokładniej odzwierciedlającego rzeczywistość. Praca składa się z jedenastu rozdziałów, spisu literatury oraz pięciu załączników. Rozdział 1 stanowi omówienie celu, hipotez i zawartości rozprawy. Rozdział 2 zawiera przegląd dotychczas zbudowanych modeli i wskazuje ich zalety i wady. W rozdziale 3 zaprezentowane zostały dane empiryczne, wykorzystane do budowy nowych oraz niektórych z istniejących sieci Bayesa. Rozdział 4 stanowi przegląd istniejących sieci Bayesa. W rozdziale 5 omówione zostały szerzej główne ograniczenia istniejących sieci Bayesa oraz rozwiązania niektórych problemów. Kolejne rozdziały poświęcone są realizacji głównych celów rozprawy budowie nowych modeli prognostycznych: model produktywności (rozdział 6 i 7), model wskaźników produktywności i defektów (rozdział 8), model typów defektów (rozdział 9) oraz uczący się model iteracyjnego testowania i naprawiania defektów (rozdział 10). Rozdział 11 zawiera podsumowanie osiągniętych wyników. Rozprawa została napisana pod kierunkiem prof. Normana Fentona (Queen Mary, University of London). Recenzentami rozprawy byli: prof. Mark Harman (King s College London), dr Tracy Hall (Brunel University) oraz, jako dodatkowy recenzent powołany w procesie nostryfikacji dyplomu, dr hab. Alberto Lozano Platonoff (Uniwersytet Szczeciński). 1. Cel i hipotezy pracy Głównym celem pracy było stworzenie modeli prognostycznych, które będą w stanie udzielić informacji na następujące pytania: 1. Jakie zależności występują między funkcjonalnością, nakładami a defektami? 2. Jaki wpływ na funkcjonalność i jakość oprogramowania ma alokacja nakładów? 3. Jak zmiana jakości procesu wpływa na poziom funkcjonalności i jakości dostarczanego oprogramowania? 7 N. Fenton, M. Neil, Measuring your risks, Agena White Paper, 2005,
4 150 Łukasz Radliński 4. Jeśli nie dysponujemy wymaganymi nakładami na realizację projektu, jaką część funkcjonalności musimy poświęcić, żeby dostarczyć oprogramowanie na zadanym poziomie jakości? 5. Jakiej funkcjonalności i jakości powinniśmy oczekiwać, jeśli bieżący projekt jest bardziej skomplikowany od poprzednich? 6. Jak zmiany niekontrolowanych cech projektu wpływają na szacowaną produktywność i jakość oprogramowania? 7. Jak uciążliwe będą defekty dla przyszłych użytkowników oprogramowania? 8. Ile defektów zostanie znalezionych i naprawionych podczas fazy testowania? W pracy zostały zweryfikowane następujące hipotezy naukowe: H1: Możliwe jest zbudowanie sieci Bayesa do szacowania ryzyka w przedsięwzięciach informatycznych, która pokonuje ograniczenia istniejących sieci Bayesa bez poświęcania ich podstawowych założeń. W szczególności taka sieć umożliwia przeprowadzanie analizy kompromisu między kluczowymi zmiennymi w przedsięwzięciu (nakłady, funkcjonalność, jakość produktu) i może być dostosowana do potrzeb konkretnej firmy informatycznej. H2: Możliwe jest zbudowanie sieci Bayesa do szacowania produktywności zespołu programistycznego i wskaźnika defektów, która zawiera czynniki środowiskowe opisujące naturę wytwarzanego oprogramowania, czynniki opisujące proces wytwórczy zidentyfikowane podczas statystycznej analizy danych empirycznych oraz wiedzę ekspercką. H3: Możliwe jest zbudowanie sieci Bayesa do szacowania proporcji różnych typów defektów skategoryzowanych według ich dotkliwości, która zawiera czynniki środowiskowe opisujące naturę wytwarzanego oprogramowania, czynniki opisujące proces wytwórczy zidentyfikowane podczas statystycznej analizy danych empirycznych oraz wiedzę ekspercką. H4: Możliwe jest zbudowanie sieci Bayesa do prognozowania liczby defektów znalezionych i naprawionych w przyszłych iteracjach testowania i naprawiania defektów, która uczy się wartości swoich parametrów na podstawie obserwacji z przeszłych iteracji testowania i naprawiania.
5 Ulepszone szacowanie ryzyka w przedsięwzięciach informatycznych z wykorzystaniem sieci bayesa Prezentacja metod i rozwiązań w badanym obszarze Zbudowanych zostało wiele modeli do szacowania nakładów projektowych oraz jakości oprogramowania. Modele te zostały zbudowane z wykorzystaniem różnych technik statystycznych, sztucznej inteligencji czy uczenia maszynowego, takich jak: regresja wieloraka, dynamika systemowa, sztuczne sieci neuronowe, szacowanie przez analogię, zbiory przybliżone, logika rozmyta, podejścia Bayesowskie, wektory nośne, algorytmy genetyczne i inne. W rozprawie została dokonana szczegółowa analiza porównawcza różnych metod do szacowania nakładów i jakości (oraz pokrewnych zmiennych). Chociaż autorzy informują najczęściej o względnie dużej dokładności prognoz uzyskiwanej tymi modelami, istnieją poważne ograniczenia tych technik: dostępność danych empirycznych o minionych przedsięwzięciach, brak możliwości pełnego ujęcia zależności do analizy kompromisu projektowego, ograniczone ujęcie wiedzy eksperckiej oraz niepewności. Krytycznym czynnikiem wyboru metody jest jak najmniejsza zależność od dostępnych danych przy jednoczesnej możliwości integracji z wiedzą ekspercką. Sieci Bayesa wydają się metodą z największym potencjałem do przeprowadzania różnego typu analiz szacowania ryzyka w przedsięwzięciach informatycznych, w szczególności analizy kompromisu najważniejszych czynników projektu. Do pozostałych zalet sieci Bayesa zaliczyć można: brak stałych osobnych list predyktorów i zmiennych zależnych, wnioskowanie wprzód i wstecz, jawne ujęcie niepewności, możliwość przeprowadzenia obliczeń przy niepełnych danych, możliwość łączenia danych jakościowych i ilościowych, intuicyjność modelu. Sieć Bayesa jest probabilistycznym modelem złożonym z dwóch elementów: 1. Skierowany acykliczny graf zawierający zestaw węzłów sieci odzwierciedlających zmienne losowe (logiczne, nominalne, numeryczne dyskretne lub numeryczne ciągłe) oraz zestaw skierowanych powiązań łączących pary zmiennych. 2. Rozkłady prawdopodobieństw przypisane do węzłów: dla zmiennych niezależnych (bez rodziców ) prawdopodobieństwa bezwarunkowe, dla zmiennych zależnych (posiadających co najmniej jednego rodzica ) prawdopodobieństwa warunkowe. W pracy doktorskiej zastosowano do obliczeń algorytm dekompozycji drzewiastej (ang. junction tree), który jest algorytmem wnioskowania dokładnego.
6 152 Łukasz Radliński Algorytm ten został rozszerzony o dynamiczną dyskretyzację zmiennych numerycznych 8 zaimplementowaną w narzędziu AgenaRisk Charakterystyka problemu w literaturze przedmiotu Prognozowanie nakładów projektowych i jakości oprogramowania jest celem wielu badań podejmowanych od początku lat siedemdziesiątych XX wieku. Najważniejszą wadą dotychczas opracowanych modeli jest brak poprawnego ujęcia zależności między wielkością projektu, nakładami projektowymi i jakością wytworzonego oprogramowania. Ta wada powoduje, że modele te mogą być wykorzystane tylko do mocno ograniczonych typów analiz, w szczególności do prognozowania jednej ściśle określonej zmiennej (na przykład jakości). Takie analizy dostarczają jednak znacznie ograniczonych informacji przydatnych do wspomagania podejmowania decyzji, a same modele wymagają kosztownego gromadzenia szczegółowych danych empirycznych. Analiza kompromisu projektowego obejmuje w literaturze analizę zależności między różnymi zmiennymi, najczęściej między zakresem, czasem i kosztem projektu. W niektórych badaniach dodatkowo uwzględniana jest jakość wytworzonego produktu. W modelach zaproponowanych w tej pracy dokładnie analizowany jest wpływ czynników procesu na nakłady i jakość, natomiast nie jest uwzględniany koszt, który może być stosunkowo łatwo dodany do tych modeli i ich transformację z sieci Bayesa do postaci diagramów decyzyjnych. Jedno z podejść prognozowania defektów oprogramowania w czasie trwającego projektu polega na dopasowaniu krzywej liczby defektów znalezionych w czasie testowania oprogramowania. Wiele z istniejących modeli ujmuje wielkość nakładów na testowanie (chociaż niektóre ich nie zawierają), jednak żaden nie ujmuje czynników jakości procesu. Istniejące modele zakładają, że jakość procesu wytwarzania oprogramowania (w tym testowania) jest niezmienna w czasie trwania projektu. Takie założenie nie zawsze jest prawidłowe, szczególnie w odniesieniu do długotrwałych projektów. W tej pracy zaproponowany został model, który zawiera czynniki jakości procesu, co pozytywnie wpływa na dokładność uzyskanych prognoz oraz jego możliwości analityczne. 8 M. Neil, M. Tailor, D. Marquez, Inference in hybrid Bayesian networks using dynamic discretization, Statistics and Computing 2007, vol. 17, no. 3, s Agena, AgenaRisk. Bayesian Network Software Tool, 2008,
7 Ulepszone szacowanie ryzyka w przedsięwzięciach informatycznych z wykorzystaniem sieci bayesa 153 Analiza literatury oraz doświadczenia własne autora wykazały, że kierownicy projektu potrzebują modelu o większym potencjale analitycznym, który będzie mógł być łatwo skalibrowany i/lub rozbudowany oraz będzie ujmował niepewność i wiedzę ekspercką. Fenton i in. 10 jako pierwsi zaczęli budować realistyczne sieci Bayesa na potrzeby inżynierii oprogramowania. Niniejsza praca stanowi rozwinięcie tego podejścia przez dostarczenie nowych możliwości analitycznych. 4. Propozycje autorskich rozwiązań W dysertacji zaproponowano zbudowanie czterech modeli: modelu produktywności, modelu wskaźników produktywności i defektów, modelu typów defektów oraz uczącego się modelu iteracyjnego testowania i naprawiania defektów. Model produktywności Głównym celem budowy modelu produktywności była możliwość przeprowadzania analizy kompromisu między kluczowymi czynnikami przedsięwzięć informatycznych. Istniejące modele MODIST: na poziomie projektu 11 i do prognozowania defektów 12 częściowo umożliwiały przeprowadzanie takich analiz i odniosły sukces w praktycznych zastosowaniach. Posiadały one jednak pewne ograniczenia, których wyeliminowanie lub ograniczenie stało się główną motywacją do zbudowania modelu produktywności 13. Model ten posiada unikalne cechy, które nie były dostępne we wcześniejszych modelach: 10 N.E. Fenton, M. Neil, A Critique of Software Defect Prediction Models, IEEE Transactions on Software Engineering 1999, vol. 25, no. 5, s ; N.E. Fenton, M. Neil, Software Metrics: Roadmap, w: The Future of Software Engineering. Proc. 22nd Int. Conf. on Software Engineering, ed. A. Finkelstein, ACM Press, 2000, s N.E. Fenton, W. Marsh, M. Neil, P. Cates, S. Forey, M. Tailor, Making Resource Decisions for Software Projects, w: Proc. 26th Int. Conf. on Software Engineering, IEEE Computer Society, Washington, D.C. 2004, s N.E. Fenton, M. Neil, W. Marsh, P. Krause, R. Mishra, Predicting Software Defects in Varying Development Lifecycles using Bayesian Nets, Information and Software Technology 2007, vol. 43, no. 1, s Ł. Radliński, N. Fenton, M. Neil, D. Marquez, Improved Decision-Making for Software Managers Using Bayesian Networks, w: Proc. 11th IASTED Int. Conf. Software Engineering and Applications, Cambridge, MA 2007, s
8 154 Łukasz Radliński 1. Użycie wskaźników produktywności i defektów podanych a priori przez użytkownika na podstawie danych historycznych z minionych projektów. Jeśli podanie tych wskaźników nie jest możliwe, wskaźniki te mogą być oszacowane przez dodatkowy model wskaźników produktywności i defektów omówiony w dalszej części. 2. Przeprowadzenie analizy kompromisu między kluczowymi zmiennymi projektu wyrażonymi na skali numerycznej. Wszystkie kluczowe zmienne: funkcjonalność, jakość oprogramowania i nakłady są wyrażone liczbowo, a nie na skali porządkowej, tak jak nakłady i jakość oprogramowania w niektórych istniejących modelach. 3. Korzystanie z jednostek miar wybranych przez użytkownika. Model umożliwia wyrażenie kluczowych zmiennych numerycznych w różnych jednostkach. Użytkownicy mogą wybrać jedną z predefiniowanych jednostek dla każdej zmiennej numerycznej, a nawet korzystać z jednostek wprowadzonych przez siebie. 4. Wpływ czynników jakościowych może być łatwo dostosowany przez zmianę wag w definicjach poszczególnych zmiennych. Dostarczony kwestionariusz może pomóc w poznaniu opinii użytkowników na temat zależności między zmiennymi modelu. Te opinie mogą być odmienne dla pracowników różnych firm i mogą zależeć od typu tworzonego oprogramowania, zastosowanych procesów wytwórczych i innych czynników. Odpowiednia kalibracja modelu zapewni precyzyjniejsze odzwierciedlenie rzeczywistości. 5. Wprowadzenie docelowych wartości zmiennych numerycznych jako przedziałów wartości, nie tylko jako wartości punktowych. Na przykład model jest w stanie odpowiedzieć na pytanie: jak możemy osiągnąć wskaźnik defektów w przedziale od 0,05 0,08 defektów na punkt funkcyjny w projekcie o określonej funkcjonalności i możliwych innych ograniczeniach? 6. Zmienne numeryczne są dynamicznie dyskretyzowane. Oznacza to, że definiowanie przedziałów dla rozkładu prawdopodobieństwa w zmiennych numerycznych następuje automatycznie w czasie przeliczania modelu. Nie tylko zwalnia to osoby budujące model z konieczności poświęcenia czasu na definiowanie tych przedziałów dla każdej zmiennej numerycznej, ale co ważniejsze zapewnia, że dyskretyzacja jest bardziej dokładna, gdyż bierze pod uwagę wszystkie obserwacje wprowadzone do modelu.
9 Ulepszone szacowanie ryzyka w przedsięwzięciach informatycznych z wykorzystaniem sieci bayesa 155 Model wskaźników produktywności i defektów W praktyce wytwarzania oprogramowania występują sytuacje, kiedy nie jest możliwe oszacowanie wskaźników produktywności i defektów na podstawie danych z minionych projektów. Taka sytuacja ma miejsce, kiedy firmy nie gromadzą danych wymaganych do obliczenia tych wskaźników. Doświadczenie praktyczne autora oraz inne źródła 14 wskazują, że firmy często nie gromadzą danych o wykorzystanych nakładach. Bez danych o nakładach nie jest możliwe wyznaczenie wskaźnika produktywności. Czasami, nawet gdy te wskaźniki można obliczyć na podstawie danych historycznych, są one nieadekwatne do danej sytuacji. Dzieje się tak, gdy obecny projekt istotnie różni się od projektów realizowanych wcześniej pod względem architektury, użytych narzędzi czy też procesu jego wytworzenia. Zatem, konieczne jest rozwiązanie wymogu podania przez użytkownika wskaźników produktywności i defektów na podstawie najbardziej podobnych projektów z przeszłości. Takim uzupełnieniem jest model wskaźników produktywności i defektów (MWPD). Celem tego modelu jest oszacowanie tych wskaźników na podstawie zmiennych opisujących naturę bieżącego projektu, a następnie przekazanie tych szacunków do modelu produktywności. Model ten posiada strukturę naiwnego klasyfikatora Bayesa. Powiązania pomiędzy zmiennymi niezależnymi a zależnymi nie odzwierciedlają związków przyczynowo-skutkowych. Taka struktura umożliwia jednak łatwiejszą budowę modelu, ponieważ zmienne są analizowane parami (jeden predyktor i jedna zmienna zależna). W efekcie predyktory nie są ze sobą powiązane. Do budowy tego modelu został wykorzystany publicznie dostępny zbiór danych ISBSG 15 o minionych przedsięwzięciach informatycznych. Predyktory zostały zidentyfikowane na podstawie wyników analizy statystycznej (współczynnik korelacji rang Spearmana, test Kruskala-Wallisa, współczynniki Fi, V Cramera, kontyngencji, wykresy ramkowe i punktowe, dopasowanie rozkładów, histogramy). Wpływ zmiennych niezależnych na zmienne zależne odzwierciedla powiązania między poszczególnymi parami zmiennych, występujące w analizowanym 14 A. Rainer, T. Hall, Identifying the causes of poor progress in software projects, w: Proc. 10th Int. Symposium on Software Metrics, Sep. 2004, s ISBSG, Estimating, Benchmarking & Research Suite Release 9, International Software Benchmarking Standards Group, 2005,
10 156 Łukasz Radliński zbiorze danych. Jednak te zależności zostały częściowo skorygowane innymi wynikami 16 oraz wiedzą wynikającą z doświadczenia praktycznego. Szczegóły dotyczące procesu budowy modelu i scenariusze ilustrujące sposoby korzystania z modelu zostały przedstawione we wcześniejszej pracy 17. Model typów defektów Większość modeli do prognozowania defektów traktuje wszystkie defekty jednakowo. Jednakże firmy potrzebują kategoryzacji defektów znalezionych w wytworzonych przez siebie produktach w celu zaplanowania kolejności naprawiania defektów. W pracy zastosowano trójstopniową kategoryzację defektów według ich szkodliwości (niewielkie, duże, ekstremalne) ze względu na dostępność danych do analizy w bazie ISBSG. Celem tego etapu badań było zbudowanie modelu do prognozowania proporcji poszczególnych typów defektów występujących w wytworzonym oprogramowaniu. Model typów defektów (MTD) powstał na bazie wyników analizy statystycznej przeprowadzonej według tej samej procedury, co w przypadku omówionego wcześniej MWPD. Model ten jest również naiwnym klasyfikatorem Bayesa. Proporcje defektów to prognozowana zmienna typu nominalnego z trzema wartościami, których prawdopodobieństwo odzwierciedla proporcje defektów niewielkich, dużych i ekstremalnych. Taka struktura umożliwia łatwą kalibrację modelu dzięki zastosowaniu analogii prawdopodobieństwa do proporcji defektów suma wynosi zawsze 1. Taka struktura posiada wadę polegającą na utracie rozkładu prawdopodobieństwa dla poszczególnych proporcji defektów dostępna jest jedynie wartość punktowa. MTD może być wykorzystywany do prognozowania jako niezależny model lub w połączeniu z modelem produktywności. W tym drugim przypadku dzięki połączeniu prognoz dotyczących proporcji defektów z MTD oraz prognozy całkowitej liczby defektów z modelu produktywności możliwe jest otrzymanie wyniku w postaci prognozowanych liczb defektów poszczególnych typów. 16 C. Jones, Software Quality in 2002, A Survey of the State of the Art, Software Productivity Research, Inc., 2002, za: J.A. Sassenburg, Design of a Methodology to Support Software Release Decisions (Do the numbers Really Matter?), Ph.D. Thesis, University of Groningen Ł. Radliński, N. Fenton, D. Marquez, Estimating Productivity and Defects Rates Based on Environmental Factors, w: Information Systems Architecture and Technology: Models of the Organisation s Risk Management, Oficyna Wydawnicza Politechniki Wrocławskiej, Wrocław 2008, s
11 Ulepszone szacowanie ryzyka w przedsięwzięciach informatycznych z wykorzystaniem sieci bayesa 157 Uczący się model iteracyjnego testowania i naprawiania defektów Modele dyskutowane powyżej zakładają stałe i znane zależności między poszczególnymi zmiennymi. Model iteracyjnego testowania i naprawiania defektów (UMITND) jest modelem uczącym się, co oznacza, że model ten uczy się wpływu poszczególnych predyktorów na zmienne zależne z wykorzystaniem zbioru danych z przeszłości. Celem modelu jest prognozowanie liczby defektów znalezionych i naprawionych w procesie iteracyjnego testowania i naprawiania. Ten iteracyjny proces zakłada, że pełna funkcjonalność oprogramowania jest zaimplementowana przed rozpoczęciem fazy testowania. Testowanie i naprawianie defektów jest podzielone na serię iteracji trwających przez różny czas. Model działa w następujący sposób: Użytkownik wprowadza dane opisujące proces minionych iteracji testowania i naprawiania oraz liczby defektów znalezionych i naprawionych w tych iteracjach. Model używa tych danych do oszacowania swoich parametrów: liczby ukrytych defektów oraz mnożników dla każdego czynnika procesu. Wartości tych mnożników odzwierciedlają wagę poszczególnych czynników procesu w kontekście ich wpływu na liczbę defektów znalezionych i naprawionych. Następnie użytkownik wprowadza planowane wartości czynników procesu w przyszłych iteracjach, na przykład odnośnie do planowanego poziomu nakładów przeznaczonych na testowanie i naprawianie. Do prognozowania liczby znalezionych defektów i liczby naprawionych defektów w przyszłych iteracjach model wykorzystuje te czynniki procesu oraz nauczone wcześniej mnożniki i liczbę ukrytych defektów. W tym momencie użytkownik może analizować różne scenariusze różniące się planowanymi nakładami, poziomem jakości procesu i ludzi i innymi czynnikami. 5. Ocena uzyskanych wyników Przeprowadzona została wnikliwa walidacja zbudowanych modeli, jednak nie przy użyciu danych z rzeczywistych projektów z powodu braku dostępu do takich danych. Dostępny publicznie zbiór ISBSG nie zawiera czynników jakości procesu wykorzystanych w modelach. Inny zbiór 18 zawiera takie czynniki, ale brakuje w nim 18 N. Fenton, M. Neil, W. Marsh, P. Hearty, Ł. Radliński, P. Krause, On the effectiveness of early life cycle defect prediction with Bayesian Nets, Empirical Software Engineering 2008, vol. 13, no. 5, s
12 158 Łukasz Radliński danych o alokacji nakładów oraz czynników opisujących projekty. Obszerny przegląd publicznie dostępnych zbiorów danych 19 wykazał, że nie zostały opublikowane pełne dane wymagane do modeli zaproponowanych w pracy doktorskiej. Ponadto, model produktywności przed użyciem wymaga kalibracji do potrzeb konkretnej firmy. Taka kalibracja może być przeprowadzona właściwie jedynie w odniesieniu do pojedynczej firmy, co zapewniłoby poprawne odzwierciedlenie w modelu wiedzy eksperckiej. Zatem, walidacja dokładności prognoz modelu z użyciem rzeczywistych danych wymagałaby użycia danych z tej konkretnej firmy. Z powyższych powodów przeprowadzona została wewnętrzna walidacja modeli pod kątem poprawności ujęcia wiedzy eksperckiej oraz wyników dodatkowych analiz statystycznych, w szczególności kierunku zależności między poszczególnymi zmiennymi. Dokładność prognoz modelu produktywności została zweryfikowana przez porównanie tych prognoz z danymi pozyskanymi w badaniu ankietowym. Analiza różnych scenariuszy w zbudowanych modelach wykazała duży potencjał tych modeli przy szacowaniu ryzyka projektowego. Zbudowane modele, szczególnie MWPD oraz MTD, które są naiwnymi klasyfikatorami Bayesa, mogą być stosunkowo łatwo rozbudowane o nowe zmienne, na przykład miary kodu programu. Jednak dodanie takich miar do modelu powoduje, że będzie on mógł być skutecznie wykorzystany dopiero na takim etapie tworzenia oprogramowania, kiedy wartości tych miar będą dostępne. Działanie UMITND zostało zweryfikowane przy użyciu zbioru danych wygenerowanego w sposób częściowo losowy dla hipotetycznego projektu. Te dane zostały w procesie testowania modelu potraktowane jako dane empiryczne. Weryfikacja tego modelu ma zatem na celu sprawdzenie, jak szybko model jest w stanie nauczyć się liczby ukrytych defektów oraz mnożników czynników procesu. Dodatkowo proces weryfikacji ma pokazać, czy model jest w stanie prognozować w racjonalny sposób w różnych scenariuszach dotyczących wartości planowanych czynników procesu. Wyniki symulacji potwierdzają, że już po pięciu iteracjach wykorzystanych do uczenia modelu model prognozuje sumę liczby defektów znalezionych z błędem względnym na poziomie 0,16 wartości rzeczywistej, a sumę liczby defektów naprawionych z błędem względnym na poziomie 0,30 wartości rzeczywistej. Te wyniki pokazują, że model jest w stanie nauczyć się swoich parametrów przy użyciu 19 Ł. Radliński, Przegląd publicznie dostępnych baz danych przedsięwzięć informatycznych, Zeszyty Naukowe Uniwersytetu Szczecińskiego, Studia Informatica 2009, nr 22, s
13 Ulepszone szacowanie ryzyka w przedsięwzięciach informatycznych z wykorzystaniem sieci bayesa 159 niewielkiej liczby iteracji, a następnie generować prognozy na akceptowalnym poziomie dokładności. Podsumowanie Głównymi efektami badań autora są cztery sieci Bayesa do różnych zastosowań w dziedzinie inżynierii oprogramowania wraz z wynikami towarzyszących im analiz: 1. Integracja modeli do analizy kompromisu między kluczowymi zmiennymi przedsięwzięcia informatycznego w postaci modelu produktywności. 2. Szacowanie wskaźników produktywności i defektów na podstawie czynników środowiskowych. 3. Prognozowanie typów defektów skategoryzowanych pod względem ich uciążliwości. 4. Uczący się model iteracyjnego testowania i naprawiania defektów. Zbudowane modele wraz z towarzyszącymi im analizami potwierdzają zasadność hipotez postawionych we wcześniejszej części. Do pozostałego wkładu autorskiego w odniesieniu do istniejących i nowych modeli zaliczyć można: dyskusję na temat możliwości parametryzacji modeli, dyskusję na temat zastosowania podejścia przyczynowego lub wskaźnikowego w modelowaniu zagregowanych wartości, dyskusję na temat zastosowania dynamicznej dyskretyzacji w zmiennych numerycznych w modelach, dyskusję na temat możliwości uwzględnienia nowych danych w modelach, przegląd najnowszych danych empirycznych wykorzystanych przy budowie modeli. Modele opracowane w ramach rozprawy mogą być zastosowane w praktyce. Do ich budowy zostały wykorzystane zarówno dostępne dane empiryczne, jak i wiedza ekspercka. Struktury tych modeli pozwalają na łatwe ich dostosowanie do indywidualnych potrzeb przez dodawanie i usuwanie zmiennych lub zmianę wpływu danej zmiennej na inne zmienne. Kalibracja modelu może zostać dokonana ręcznie (wyniki ankiety) w celu odzwierciedlenia wiedzy eksperckiej lub niewielkiego zbioru danych, albo automatycznie (na przykład popularnym algorytmem maksymalizacji wartości oczekiwanej) w celu odzwierciedlenia zależności z większego zbioru danych. Możliwość przeprowadzania rozbudowanych symulacji co-jeśli i porównywania różnych scenariuszy, analiz wrażliwości i poszukiwania celu stanowić może istotną pomoc przy podejmowaniu decyzji przez kierowników projektów.
14 160 Łukasz Radliński Literatura Agena, AgenaRisk. Bayesian Network Software Tool, 2008, Akiyama F., An Example of Software System Debugging, w: Proc. Int. Federation for Information Processing Congress, vol. 71, Ljubljana Boehm B., Software Engineering Economics, Prentice Hall Fenton N., Marsh W., Neil M., Cates P., Forey S., Tailor M., Making Resource Decisions for Software Projects, w: Proc. 26 th Int. Conf. on Software Engineering, IEEE Computer Society, Washington, D.C Fenton N., Neil M., Marsh W., Hearty P., Radliński Ł., Krause P., On the effectiveness of early life cycle defect prediction with Bayesian Nets, Empirical Software Engineering 2008, vol. 13, no. 5. Fenton N., Neil M., Measuring your risks, Agena White Paper, 2005, Fenton N.E., Neil M., A Critique of Software Defect Prediction Models, IEEE Transactions on Software Engineering 1999, vol. 25, no. 5. Fenton N.E., Neil M., Marsh W., Krause P., Mishra R., Predicting Software Defects in Varying Development Lifecycles using Bayesian Nets, Information and Software Technology 2007, vol. 43, no. 1. Fenton N.E., Neil M., Software Metrics: Roadmap, w: The Future of Software Engineering. Proc. 22 nd Int. Conf. on Software Engineering, ed. A. Finkelstein, ACM Press, Goel A.L., Okumoto K., An Analysis of Recurrent Software Failures in Real-Time Control System, w: Proc. ACM Annual Technology Conference, Washington, D.C Halstead M.H., Elements of Software Science, Elsevier North-Holland, New York ISBSG, Estimating, Benchmarking & Research Suite Release 9, International Software Benchmarking Standards Group, 2005, Jelinski Z., Moranda P., Software Reliability Research, w: Statistical Computer Performance Evaluation, ed. W. Freiberger, Academic Press, New York Jones C., Software Quality in 2002: A Survey of the State of the Art, Software Productivity Research, Inc., Merriam-Webster s Online Dictionary, 2008, Neil M., Tailor M., Marquez D., Inference in hybrid Bayesian networks using dynamic discretization, Statistics and Computing 2007, vol. 17, no. 3. Putnam L.H., A general empirical solution to the macro software sizing and estimating problem, IEEE Transactions on Software Engineering 1978, vol. 4, no. 4. Radliński Ł., Fenton N., Marquez D., Estimating Productivity and Defects Rates Based on Environmental Factors, w: Information Systems Architecture and Technology: Models of the Organisation s Risk Management, Oficyna Wydawnicza Politechniki Wrocławskiej, Wrocław Radliński Ł., Fenton N., Neil M., Marquez D., Improved Decision-Making for Software Managers Using Bayesian Networks, w: Proc. 11 th IASTED Int. Conf. Software Engineering and Applications, Cambridge, MA 2007.
15 Ulepszone szacowanie ryzyka w przedsięwzięciach informatycznych z wykorzystaniem sieci bayesa 161 Radlinski L., Improved Software Project Risk Assessment Using Bayesian Nets, Ph.D. Thesis, Queen Mary, University of London Radliński Ł., Przegląd publicznie dostępnych baz danych przedsięwzięć informatycznych, Zeszyty Naukowe Uniwersytetu Szczecińskiego, Studia Informatica 2009, nr 22. Rainer A., Hall T., Identifying the causes of poor progress in software projects, w: Proc. 10 th Int. Symposium on Software Metrics, Sep Sassenburg J.A., Design of a Methodology to Support Software Release Decisions (Do the numbers Really Matter?), Ph.D. Thesis, University of Groningen Webster s Online Dictionary, 2008, IMPROVED SOFTWARE PROJECT RISK ASSESSMENT USING BAYESIAN NETS Summary Empirical software engineering models typically focus on predicting development effort or software quality but not both. Using Bayesian Nets (BNs) as causal models, researchers have recently attempted to build models that incorporate relationships between functionality, effort, software quality, and various process variables. The thesis analyses such models and, as part of a new validation study, identifies their strengths and weaknesses. A major weakness is their inability to incorporate prior local productivity and quality data, which limits their applicability in real software projects. The main hypothesis is that it is possible to build BN models that overcome these limitations without compromising their basic philosophy. In particular, the thesis shows we can build BNs that capture known trade-offs and can be tailored to individual company needs. The new model, called the productivity model, is developed by using the results of the new validation of the existing models, together with various other analyses. These include: the results of applying various statistical methods to identify relationships between a range of variables using publicly available data on software projects; analyses of other studies; expert knowledge. The new model is also calibrated using the results of an extensive questionnaire survey of experts in the area. The thesis also makes a number of other novel contributions to improved risk assessment using BNs, including a model which predicts the proportions of different types of defects likely to be left in software after testing and a learning model for predicting the number of defects found and fixed in successive testing iterations. Translated by Łukasz Radliński
16
PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE
UNIWERSYTET WARMIŃSKO-MAZURSKI W OLSZTYNIE PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE http://matman.uwm.edu.pl/psi e-mail: psi@matman.uwm.edu.pl ul. Słoneczna 54 10-561
ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO NR 476 STUDIA INFORMATICA NR 21 PRZEGLĄD SIECI BAYESA DO SZACOWANIA RYZYKA W INŻYNIERII OPROGRAMOWANIA
ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO NR 476 STUDIA INFORMATICA NR 21 2007 ŁUKASZ RADLIŃSKI PRZEGLĄD SIECI BAYESA DO SZACOWANIA RYZYKA W INŻYNIERII OPROGRAMOWANIA Wprowadzenie Tworzenie jest skomplikowane,
Zastosowanie sztucznej inteligencji w testowaniu oprogramowania
Zastosowanie sztucznej inteligencji w testowaniu oprogramowania Problem NP Problem NP (niedeterministycznie wielomianowy, ang. nondeterministic polynomial) to problem decyzyjny, dla którego rozwiązanie
Summary in Polish. Fatimah Mohammed Furaiji. Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling
Summary in Polish Fatimah Mohammed Furaiji Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling Zastosowanie symulacji wieloagentowej w modelowaniu zachowania konsumentów Streszczenie
Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU
Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów
Zastosowanie symulacji Monte Carlo do zarządzania ryzykiem przedsięwzięcia z wykorzystaniem metod sieciowych PERT i CPM
SZKOŁA GŁÓWNA HANDLOWA w Warszawie STUDIUM MAGISTERSKIE Kierunek: Metody ilościowe w ekonomii i systemy informacyjne Karol Walędzik Nr albumu: 26353 Zastosowanie symulacji Monte Carlo do zarządzania ryzykiem
Krytyczne czynniki sukcesu w zarządzaniu projektami
Seweryn SPAŁEK Krytyczne czynniki sukcesu w zarządzaniu projektami MONOGRAFIA Wydawnictwo Politechniki Śląskiej Gliwice 2004 SPIS TREŚCI WPROWADZENIE 5 1. ZARZĄDZANIE PROJEKTAMI W ORGANIZACJI 13 1.1. Zarządzanie
Inżynieria oprogramowania. Część 8: Metoda szacowania ryzyka - PERT
UNIWERSYTET RZESZOWSKI KATEDRA INFORMATYKI Opracował: mgr inż. Przemysław Pardel v1.01 2010 Inżynieria oprogramowania Część 8: Metoda szacowania ryzyka - PERT ZAGADNIENIA DO ZREALIZOWANIA (3H) PERT...
Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11
Modele DSGE Jerzy Mycielski Maj 2008 Jerzy Mycielski () Modele DSGE Maj 2008 1 / 11 Modele DSGE DSGE - Dynamiczne, stochastyczne modele równowagi ogólnej (Dynamic Stochastic General Equilibrium Model)
Optymalizacja Automatycznych Testów Regresywnych
Optymalizacja Automatycznych Testów Regresywnych W Organizacji Transformującej do Agile Adam Marciszewski adam.marciszewski@tieto.com Agenda Kontekst projektu Typowe podejście Wyzwania Cel Założenia Opis
Zarządzanie projektami. Wykład 2 Zarządzanie projektem
Zarządzanie projektami Wykład 2 Zarządzanie projektem Plan wykładu Definicja zarzadzania projektami Typy podejść do zarządzania projektami Cykl życia projektu/cykl zarządzania projektem Grupy procesów
Analiza korespondencji
Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy
Ewaluacja w polityce społecznej
Ewaluacja w polityce społecznej Dane i badania w kontekście ewaluacji Dr hab. Ryszard Szarfenberg Instytut Polityki Społecznej UW rszarf.ips.uw.edu.pl/ewalps/dzienne/ Rok akademicki 2018/2019 Główny problem
Akademia Morska w Szczecinie. Wydział Mechaniczny
Akademia Morska w Szczecinie Wydział Mechaniczny ROZPRAWA DOKTORSKA mgr inż. Marcin Kołodziejski Analiza metody obsługiwania zarządzanego niezawodnością pędników azymutalnych platformy pływającej Promotor:
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
KARTA PRZEDMIOTU. WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI 1. Brak
WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI Zał. nr 4 do ZW KARTA PRZEDMIOTU Nazwa w języku polskim: Metody statystyczne w badaniu wzroku Nazwa w języku angielskim: Statistical methods in eye research Kierunek
REFERAT PRACY DYPLOMOWEJ
REFERAT PRACY DYPLOMOWEJ Temat pracy: Projekt i implementacja środowiska do automatyzacji przeprowadzania testów aplikacji internetowych w oparciu o metodykę Behavior Driven Development. Autor: Stepowany
Zastosowanie rozmytych map kognitywnych do badania scenariuszy rozwoju jednostek naukowo-dydaktycznych
Konferencja Systemy Czasu Rzeczywistego 2012 Kraków, 10-12 września 2012 Zastosowanie rozmytych map kognitywnych do badania scenariuszy rozwoju jednostek naukowo-dydaktycznych Piotr Szwed AGH University
Sterowanie wielkością zamówienia w Excelu - cz. 3
Sterowanie wielkością zamówienia w Excelu - cz. 3 21.06.2005 r. 4. Planowanie eksperymentów symulacyjnych Podczas tego etapu ważne jest określenie typu rozkładu badanej charakterystyki. Dzięki tej informacji
Średni. Mały. Zakres Dół Środek Góra
Szacowanie rozmiaru kodu Jerzy Nawrocki & Adam Wojciechowski Po co szacować wielkość kodu? Opracowanie planów pracy Ocena pracochłonności Konstruowanie wiarygodnych harmonogramów Sizing represents the
Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV
Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną
Błędy procesu tworzenia oprogramowania (Badania firmy Rational Software Corporation)
Błędy procesu tworzenia oprogramowania (Badania firmy Rational Software Corporation) Zarządzanie wymaganiami Ad hoc (najczęściej brak zarządzania nimi) Niejednoznaczna, nieprecyzyjna komunikacja Architektura
Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18
Eksploracja Danych wykład 4 Sebastian Zając WMP.SNŚ UKSW 10 maja 2017 Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja 2017 1 / 18 Klasyfikacja danych Klasyfikacja Najczęściej stosowana (najstarsza)
Elementy inteligencji obliczeniowej
Elementy inteligencji obliczeniowej Paweł Liskowski Institute of Computing Science, Poznań University of Technology 9 October 2018 1 / 19 Perceptron Perceptron (Rosenblatt, 1957) to najprostsza forma sztucznego
... prognozowanie nie jest celem samym w sobie a jedynie narzędziem do celu...
4 Prognozowanie historyczne Prognozowanie - przewidywanie przyszłych zdarzeń w oparciu dane - podstawowy element w podejmowaniu decyzji... prognozowanie nie jest celem samym w sobie a jedynie narzędziem
Wnioskowanie bayesowskie
Wnioskowanie bayesowskie W podejściu klasycznym wnioskowanie statystyczne oparte jest wyłącznie na podstawie pobranej próby losowej. Możemy np. estymować punktowo lub przedziałowo nieznane parametry rozkładów,
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: MODELOWANIE I ANALIZA SYSTEMÓW INFORMATYCZNYCH Modeling and analysis of computer systems Kierunek: Informatyka Forma studiów: Stacjonarne Rodzaj przedmiotu: Poziom kwalifikacji: obowiązkowy
Analiza zawartości dokumentów za pomocą probabilistycznych modeli graficznych
Analiza zawartości dokumentów za pomocą probabilistycznych modeli graficznych Probabilistic Topic Models Jakub M. TOMCZAK Politechnika Wrocławska, Instytut Informatyki 30.03.2011, Wrocław Plan 1. Wstęp
Drzewa decyzyjne i lasy losowe
Drzewa decyzyjne i lasy losowe Im dalej w las tym więcej drzew! ML Gdańsk http://www.mlgdansk.pl/ Marcin Zadroga https://www.linkedin.com/in/mzadroga/ 20 Czerwca 2017 WPROWADZENIE DO MACHINE LEARNING CZYM
System prognozowania rynków energii
System prognozowania rynków energii STERMEDIA Sp. z o. o. Software Development Grupa IT Kontrakt ul. Ostrowskiego13 Wrocław Poland tel.: 0 71 723 43 22 fax: 0 71 733 64 66 http://www.stermedia.eu Piotr
Wprowadzenie do metodologii modelowania systemów informacyjnych. Strategia (1) Strategia (2) Etapy Ŝycia systemu informacyjnego
Etapy Ŝycia systemu informacyjnego Wprowadzenie do metodologii modelowania systemów informacyjnych 1. Strategia 2. Analiza 3. Projektowanie 4. Implementowanie, testowanie i dokumentowanie 5. WdroŜenie
Model referencyjny doboru narzędzi Open Source dla zarządzania wymaganiami
Politechnika Gdańska Wydział Zarządzania i Ekonomii Katedra Zastosowań Informatyki w Zarządzaniu Zakład Zarządzania Technologiami Informatycznymi Model referencyjny Open Source dla dr hab. inż. Cezary
Wstęp do Metod Systemowych i Decyzyjnych Opracowanie: Jakub Tomczak
Wstęp do Metod Systemowych i Decyzyjnych Opracowanie: Jakub Tomczak 1 Wprowadzenie. Zmienne losowe Podczas kursu interesować nas będzie wnioskowanie o rozpatrywanym zjawisku. Poprzez wnioskowanie rozumiemy
Projektowanie systemów informatycznych. Roman Simiński programowanie.siminskionline.pl. Cykl życia systemu informatycznego
systemów informatycznych Roman Simiński roman.siminski@us.edu.pl programowanie.siminskionline.pl Cykl życia systemu informatycznego Trochę wprowadzenia... engineering co to oznacza? Oprogramowanie w sensie
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Monitoring procesów z wykorzystaniem systemu ADONIS
Monitoring procesów z wykorzystaniem systemu ADONIS BOC Information Technologies Consulting Sp. z o.o. e-mail: boc@boc-pl.com Tel.: (+48 22) 628 00 15, 696 69 26 Fax: (+48 22) 621 66 88 BOC Management
Nazwa przedmiotu: MODELOWANIE I ANALIZA SYSTEMÓW INFORMATYCZNYCH. Modeling and analysis of computer systems Forma studiów: Stacjonarne
Nazwa przedmiotu: MODELOWANIE I ANALIZA SYSTEMÓW INFORMATYCZNYCH Kierunek: Informatyka Modeling and analysis of computer systems Forma studiów: Stacjonarne Rodzaj przedmiotu: obowiązkowy w ramach specjalności:
Identyfikacja i pomiar ryzyka pierwszy krok w zarządzaniu ryzykiem.
Identyfikacja i pomiar ryzyka pierwszy krok w zarządzaniu ryzykiem. Andrzej Podszywałow Własność przemysłowa w innowacyjnej gospodarce. Zarządzanie ryzykiem, strategia zarządzania własnością intelektualną
Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA
Opis zakładanych efektów kształcenia na studiach podyplomowych Nazwa studiów: BIOSTATYSTYKA PRAKTYCZNE ASPEKTY STATYSTYKI W BADANIACH MEDYCZNYCH Typ studiów: doskonalące Symbol Efekty kształcenia dla studiów
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Zmienność wiatru w okresie wieloletnim
Warsztaty: Prognozowanie produktywności farm wiatrowych PSEW, Warszawa 5.02.2015 Zmienność wiatru w okresie wieloletnim Dr Marcin Zientara DCAD / Stermedia Sp. z o.o. Zmienność wiatru w różnych skalach
STRESZCZENIE. rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne.
STRESZCZENIE rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne. Zasadniczym czynnikiem stanowiącym motywację dla podjętych w pracy rozważań
Field of study: Computer Science Study level: First-cycle studies Form and type of study: Full-time studies. Auditorium classes.
Faculty of: Faculty of Electrical Engineering, Automatics, Computer Science and Biomedical Engineering Field of study: Computer Science Study level: First-cycle studies Form and type of study: Full-time
XIII International PhD Workshop OWD 2011, October 2011 METODA REEINGINEERINGU ORGANIZACJI Z WYKORZYSTANIEM SYMULATORA PROCESÓW BIZNESOWYCH
XIII International PhD Workshop OWD 2011, 22 25 October 2011 METODA REEINGINEERINGU ORGANIZACJI Z WYKORZYSTANIEM SYMULATORA PROCESÓW BIZNESOWYCH METHOD OF REEINGINEERING ORGANIZATION USING BUSINESS PROCESS
Zarządzanie projektami. Zarządzanie ryzykiem projektu
Zarządzanie projektami Zarządzanie ryzykiem projektu Warunki podejmowania decyzji Pewność Niepewność Ryzyko 2 Jak można zdefiniować ryzyko? Autor S.T. Regan A.H. Willet Definicja Prawdopodobieństwo straty
Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016
Systemy pomiarowo-diagnostyczne Metody uczenia maszynowego wykład I dr inż. Bogumil.Konopka@pwr.edu.pl 2015/2016 1 Wykład I - plan Sprawy organizacyjne Uczenie maszynowe podstawowe pojęcia Proces modelowania
Etapy modelowania ekonometrycznego
Etapy modelowania ekonometrycznego jest podstawowym narzędziem badawczym, jakim posługuje się ekonometria. Stanowi on matematyczno-statystyczną formę zapisu prawidłowości statystycznej w zakresie rozkładu,
Etapy życia oprogramowania
Modele cyklu życia projektu informatycznego Organizacja i Zarządzanie Projektem Informatycznym Jarosław Francik marzec 23 w prezentacji wykorzystano również materiały przygotowane przez Michała Kolano
KIERUNKOWE EFEKTY KSZTAŁCENIA
WYDZIAŁ INFORMATYKI I ZARZĄDZANIA Kierunek studiów: INFORMATYKA Stopień studiów: STUDIA II STOPNIA Obszar Wiedzy/Kształcenia: OBSZAR NAUK TECHNICZNYCH Obszar nauki: DZIEDZINA NAUK TECHNICZNYCH Dyscyplina
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: PROJEKTOWANIE SYSTEMÓW INFORMATYCZNYCH I KARTA PRZEDMIOTU CEL PRZEDMIOTU PRZEWODNIK PO PRZEDMIOCIE C1. Podniesienie poziomu wiedzy studentów z inżynierii oprogramowania w zakresie C.
Zdalny dostęp do Statystycznych Baz Danych a bezpieczeństwo danych jednostkowych.
Zdalny dostęp do Statystycznych Baz Danych a bezpieczeństwo danych jednostkowych. Przegląd zastosowanych rozwiązań urzędów statystycznych na świecie. mgr inż. Jarosław Butanowicz mgr inż. Łukasz Ślęzak
Widzenie komputerowe (computer vision)
Widzenie komputerowe (computer vision) dr inż. Marcin Wilczewski 2018/2019 Organizacja zajęć Tematyka wykładu Cele Python jako narzędzie uczenia maszynowego i widzenia komputerowego. Binaryzacja i segmentacja
Diagramy ERD. Model struktury danych jest najczęściej tworzony z wykorzystaniem diagramów pojęciowych (konceptualnych). Najpopularniejszym
Diagramy ERD. Model struktury danych jest najczęściej tworzony z wykorzystaniem diagramów pojęciowych (konceptualnych). Najpopularniejszym konceptualnym modelem danych jest tzw. model związków encji (ERM
Analiza możliwości szacowania parametrów mieszanin rozkładów prawdopodobieństwa za pomocą sztucznych sieci neuronowych 4
Wojciech Sikora 1 AGH w Krakowie Grzegorz Wiązania 2 AGH w Krakowie Maksymilian Smolnik 3 AGH w Krakowie Analiza możliwości szacowania parametrów mieszanin rozkładów prawdopodobieństwa za pomocą sztucznych
Co to jest jest oprogramowanie? 8. Co to jest inżynieria oprogramowania? 9. Jaka jest różnica pomiędzy inżynierią oprogramowania a informatyką?
ROZDZIAŁ1 Podstawy inżynierii oprogramowania: - Cele 2 - Zawartość 3 - Inżynieria oprogramowania 4 - Koszty oprogramowania 5 - FAQ o inżynierii oprogramowania: Co to jest jest oprogramowanie? 8 Co to jest
Testowanie i walidacja oprogramowania
i walidacja oprogramowania Inżynieria oprogramowania, sem.5 cz. 3 Rok akademicki 2010/2011 Dr inż. Wojciech Koziński Zarządzanie testami Cykl życia testów (proces) Planowanie Wykonanie Ocena Dokumentacja
WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU
WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU Nazwa w języku polskim: STATYSTYKA W MODELACH NIEZAWODNOŚCI I ANALIZIE PRZEŻYCIA Nazwa w języku angielskim: STATISTICS IN RELIABILITY MODELS AND
WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI
WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI Stefan WÓJTOWICZ, Katarzyna BIERNAT ZAKŁAD METROLOGII I BADAŃ NIENISZCZĄCYCH INSTYTUT ELEKTROTECHNIKI ul. Pożaryskiego 8, 04-703 Warszawa tel. (0)
INSTYTUT METEOROLOGII I GOSPODARKI WODNEJ PAŃSTWOWY INSTYTUT BADAWCZY Oddział we Wrocławiu. Görlitz
Görlitz 17.11.2014 Pakiet programów MIKE opracowany na Politechnice Duńskiej, zmodyfikowany przez Duński Instytut Hydrauliki, Zasady działania modeli: MIKE NAM - model konceptualny o parametrach skupionych,
Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną. laboratoria 30 zaliczenie z oceną
Wydział: Psychologia Nazwa kierunku kształcenia: Psychologia Rodzaj przedmiotu: podstawowy Opiekun: dr Andrzej Tarłowski Poziom studiów (I lub II stopnia): Jednolite magisterskie Tryb studiów: Stacjonarne
Ograniczenia projektu. Zakres (co?) Czas (na kiedy?) Budżet (za ile?)
Harmonogram Ograniczenia projektu Zakres (co?) Czas (na kiedy?) Budżet (za ile?) Pojęcia podstawowe Harmonogram: Daty wykonania działań Daty osiągnięcia kamieni milowych Działanie: Element składowy pakietu
ZASTOSOWANIE TECHNOLOGII WIRTUALNEJ RZECZYWISTOŚCI W PROJEKTOWANIU MASZYN
MODELOWANIE INŻYNIERSKIE ISSN 1896-771X 37, s. 141-146, Gliwice 2009 ZASTOSOWANIE TECHNOLOGII WIRTUALNEJ RZECZYWISTOŚCI W PROJEKTOWANIU MASZYN KRZYSZTOF HERBUŚ, JERZY ŚWIDER Instytut Automatyzacji Procesów
TECHNIKI PROGNOZOWANIA NAKŁADÓW PROJEKTOWYCH I JAKOŚCI OPROGRAMOWANIA W PROJEKTACH IT
ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO NR 611 STUDIA INFORMATICA NR 26 2010 ŁUKASZ RADLIŃSKI TECHNIKI PROGNOZOWANIA NAKŁADÓW PROJEKTOWYCH I JAKOŚCI OPROGRAMOWANIA W PROJEKTACH IT Wprowadzenie Prognozowanie
Maciej Oleksy Zenon Matuszyk
Maciej Oleksy Zenon Matuszyk Jest to proces związany z wytwarzaniem oprogramowania. Jest on jednym z procesów kontroli jakości oprogramowania. Weryfikacja oprogramowania - testowanie zgodności systemu
wbudowane October 7, 2015 KSEM WETI PG Komputery przemysłowe i systemy wbudowane Oprogramowanie systemów wbudowanych - wydajność Wydajność
KSEM WETI PG October 7, 2015 Inżynieria wydajności oprogramowania Software performance engineering (SPE) - dyscyplina zajmująca się poprawą dojrzałości procesu budowy i rozwoju dla zwiększenia ich wydajności.
Elementy modelowania matematycznego
Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski
Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego
IBS PAN, Warszawa 9 kwietnia 2008 Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego mgr inż. Marcin Jaruszewicz promotor: dr hab. inż. Jacek Mańdziuk,
Zarządzanie sieciami telekomunikacyjnymi
SNMP Protocol The Simple Network Management Protocol (SNMP) is an application layer protocol that facilitates the exchange of management information between network devices. It is part of the Transmission
2. Empiryczna wersja klasyfikatora bayesowskiego
Algorytmy rozpoznawania obrazów 2. Empiryczna wersja klasyfikatora bayesowskiego dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Brak pełnej informacji probabilistycznej Klasyfikator bayesowski
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: Kierunek: Systemy Decision suport systems Zarządzanie i Inżynieria Produkcji Management and Engineering of Production Rodzaj przedmiotu: obowiązkowy Poziom studiów: studia II stopnia
Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych
dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo
Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner
Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska Elementy nieprzystające Definicja odrzucania Klasyfikacja
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
STATYSTYKA MATEMATYCZNA
Zał. nr 4 do ZW WYDZIAŁ ELEKTRONIKI KARTA PRZEDMIOTU Nazwa w języku polskim STATYSTYKA MATEMATYCZNA Nazwa w języku angielskim Mathematical Statistics Kierunek studiów (jeśli dotyczy): Specjalność (jeśli
Algorytm hybrydowy dla alokacji portfela inwestycyjnego przy ograniczonych zasobach
Adam Stawowy Algorytm hybrydowy dla alokacji portfela inwestycyjnego przy ograniczonych zasobach Summary: We present a meta-heuristic to combine Monte Carlo simulation with genetic algorithm for Capital
Systemy uczące się wykład 1
Systemy uczące się wykład 1 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 5 X 2018 e-mail: przemyslaw.juszczuk@ue.katowice.pl Konsultacje: na stronie katedry + na stronie domowej
WIELOKRYTERIALNE PORZĄDKOWANIE METODĄ PROMETHEE ODPORNE NA ZMIANY WAG KRYTERIÓW
Uniwersytet Ekonomiczny we Wrocławiu WIELOKRYTERIALNE PORZĄDKOWANIE METODĄ PROMETHEE ODPORNE NA ZMIANY WAG KRYTERIÓW Wprowadzenie Wrażliwość wyników analizy wielokryterialnej na zmiany wag kryteriów, przy
METODA PRZEKSZTAŁCANIA PLANÓW REAKCJI NA RYZYKO W SIECI BAYESA
ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO NR 643 STUDIA INFORMATICA NR 27 2011 ŁUKASZ RADLIŃSKI Uniwersytet Szczeciński METODA PRZEKSZTAŁCANIA PLANÓW REAKCJI NA RYZYKO W SIECI BAYESA Wprowadzenie Istnieje
Metody ilościowe w badaniach ekonomicznych
prof. dr hab. Tadeusz Trzaskalik dr hab. Maciej Nowak, prof. UE Wybór portfela projektów z wykorzystaniem wielokryterialnego programowania dynamicznego Metody ilościowe w badaniach ekonomicznych 19-06-2017
Etapy życia oprogramowania. Modele cyklu życia projektu. Etapy życia oprogramowania. Etapy życia oprogramowania
Etapy życia oprogramowania Modele cyklu życia projektu informatycznego Organizacja i Zarządzanie Projektem Informatycznym Jarosław Francik marzec 23 Określenie wymagań Testowanie Pielęgnacja Faza strategiczna
Zmienne zależne i niezależne
Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }
Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2)
Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2) Ewa Wołoszko Praca pisana pod kierunkiem Pani dr hab. Małgorzaty Doman Plan tego wystąpienia Teoria Narzędzia
Modelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka
Modelowanie jako sposób opisu rzeczywistości Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka 2015 Wprowadzenie: Modelowanie i symulacja PROBLEM: Podstawowy problem z opisem otaczającej
KIERUNKOWE EFEKTY KSZTAŁCENIA
KIERUNKOWE EFEKTY KSZTAŁCENIA WYDZIAŁ INFORMATYKI I ZARZĄDZANIA Kierunek studiów: INFORMATYKA Stopień studiów: STUDIA II STOPNIA Obszar Wiedzy/Kształcenia: OBSZAR NAUK TECHNICZNYCH Obszar nauki: DZIEDZINA
Metody komputerowe statystyki Computer Methods in Statistics. Matematyka. Poziom kwalifikacji: II stopnia. Liczba godzin/tydzień: 2W, 3L
Nazwa przedmiotu: Kierunek: Metody komputerowe statystyki Computer Methods in Statistics Matematyka Rodzaj przedmiotu: przedmiot obowiązkowy dla specjalności matematyka przemysłowa Rodzaj zajęć: wykład,
laboratoria 24 zaliczenie z oceną
Wydział: Psychologia Nazwa kierunku kształcenia: Psychologia Rodzaj przedmiotu: podstawowy Opiekun: dr Andrzej Tarłowski Poziom studiów (I lub II stopnia): Jednolite magisterskie Tryb studiów: Niestacjonarne
Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym
Wiesława MALSKA Politechnika Rzeszowska, Polska Anna KOZIOROWSKA Uniwersytet Rzeszowski, Polska Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym Wstęp Wnioskowanie statystyczne
Zarządzanie ryzykiem w projektach informatycznych. Marcin Krysiński marcin@krysinski.eu
Zarządzanie ryzykiem w projektach informatycznych Marcin Krysiński marcin@krysinski.eu O czym będziemy mówić? Zarządzanie ryzykiem Co to jest ryzyko Planowanie zarządzania ryzykiem Identyfikacja czynników
Metodologia badań psychologicznych
Metodologia badań psychologicznych Lucyna Golińska SPOŁECZNA AKADEMIA NAUK Psychologia jako nauka empiryczna Wprowadzenie pojęć Wykład 5 Cele badań naukowych 1. Opis- (funkcja deskryptywna) procedura definiowania
Opis metodyki i procesu produkcji oprogramowania
Opis metodyki i procesu produkcji oprogramowania Rational Unified Process Rational Unified Process (RUP) to iteracyjny proces wytwarzania oprogramowania opracowany przez firmę Rational Software, a obecnie
Zarządzanie projektami. Zarządzanie czasem w projekcie
Zarządzanie projektami Zarządzanie czasem w projekcie Zarządzanie czasem w projekcie PROJECT TIME MANAGEMENT Zarządzanie czasem - elementy 1. Zarządzanie harmonogramem (zasady, procedury i dokumentacja
Karta (sylabus) modułu/przedmiotu Inżynieria Materiałowa Studia II stopnia Specjalność: Inżynieria Powierzchni
Karta (sylabus) modułu/przedmiotu Inżynieria Materiałowa Studia II stopnia Specjalność: Inżynieria Powierzchni Przedmiot: Statystyczne Sterowanie Procesami Rodzaj przedmiotu: Obowiązkowy Kod przedmiotu:
Zastosowania sieci neuronowych
Zastosowania sieci neuronowych aproksymacja LABORKA Piotr Ciskowski zadanie 1. aproksymacja funkcji odległość punktów źródło: Żurada i in. Sztuczne sieci neuronowe, przykład 4.4, str. 137 Naucz sieć taką
Mail: Pokój 214, II piętro
Wykład 2 Mail: agnieszka.nowak@us.edu.pl Pokój 214, II piętro http://zsi.tech.us.edu.pl/~nowak Predykcja zdolność do wykorzystania wiedzy zgromadzonej w systemie do przewidywania wartości dla nowych danych,
Robert M.Korona. Dr Robert M. Korona 1
Robert M.Korona Dr Robert M. Korona 1 Agenda Co to jest KRI? Wartość krytyczna i progowa Opis wyzwania Wyznaczenie wartości KRI za pomocą modelu logistycznego Wyznaczenie KRI za pomocą szeregu czasowego
ROZWÓJ SYSTEMÓW SZTUCZNEJ INTELIGENCJI W PERSPEKTYWIE "PRZEMYSŁ 4.0"
ROZWÓJ SYSTEMÓW SZTUCZNEJ INTELIGENCJI W PERSPEKTYWIE "PRZEMYSŁ 4.0" Dr inż. Andrzej KAMIŃSKI Instytut Informatyki i Gospodarki Cyfrowej Kolegium Analiz Ekonomicznych Szkoła Główna Handlowa w Warszawie
PLANY I PROGRAMY STUDIÓW
WYDZIAŁ INŻYNIERII PRODUKCJI I LOGISTYKI PLANY I PROGRAMY STUDIÓW STUDY PLANS AND PROGRAMS KIERUNEK STUDIÓW FIELD OF STUDY - ZARZĄDZANIE I INŻYNIERIA PRODUKCJI - MANAGEMENT AND PRODUCTION ENGINEERING Studia
Wstęp do zarządzania projektami
Wstęp do zarządzania projektami Definicja projektu Projekt to tymczasowe przedsięwzięcie podejmowane w celu wytworzenia unikalnego wyrobu, dostarczenia unikalnej usługi lub uzyskania unikalnego rezultatu.
Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska
Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska Anna Stankiewicz Izabela Słomska Wstęp- statystyka w politologii Rzadkie stosowanie narzędzi statystycznych Pisma Karla Poppera