Wykład jest przygotowany dla II semestru kierunku Elektronika i Telekomunikacja. Studia II stopnia Dr inż. Małgorzata Langer ZARZĄDZANIE SIECIAMI TELEKOMUNIKACYJNYMI Prezentacja multimedialna współfinansowana przez Unię Europejską w ramach Europejskiego Funduszu Społecznego w projekcie Innowacyjna dydaktyka bez ograniczeń zintegrowany rozwój Politechniki Łódzkiej zarządzanie Uczelnią, nowoczesna oferta edukacyjna i wzmacniania zdolności do zatrudniania osób niepełnosprawnych Zadanie nr 30 Dostosowanie kierunku Elektronika i Telekomunikacja do potrzeb rynku pracy i gospodarki opartej na wiedzy 90-924 Łódź, ul. Żeromskiego 116, tel. 042 631 28 83 www.kapitalludzki.p.lodz.pl
DOKŁADNOŚĆ OSZACOWANIA Oszacowanie niezawodności oprogramowania lub systemu jest trudniejsze i bardziej niejednoznaczne niż oszacowanie niezawodności sprzętu Aby właściwie zarządzać systemem, niezbędne jest nie tylko oszacowanie najważniejszych parametrów, ale również wiedza o tym, z jakim prawdopodobieństwem są one prawdziwe Przy pobieraniu prób, wybieraniu czasu do badań, itd. należy odpowiedzieć na następujące pytania: - jaka ilość danych eksploatacyjnych jest wystarczająca, albo ile prób trzeba pobrać - w jaki sposób dokonuje się próbkowania, jaką metodą szacuje się błędy - co jest główna przyczyną błędów oszacowania 2
Jaka ilość danych eksploatacyjnych jest wystarczająca Najdokładniej byłoby zbadać wszystko cała populację; oczywiście nie jest to możliwe ze względu na: - czas, koszt i cierpliwość potrzebne do zbadania całej populacji - jeżeli czas badania będzie długi, populacja ulegnie zmianom i wszelkie uogólnienia będą już nieważne Metod pobierania prób jest wiele, zawsze celem jest zdobycie reprezentatywnej próby dla całej populacji. Trzeba rozważyć: - zmienność elementów populacji. Im bardziej zmienne są elementy tym więcej próbek musi zawierać próba - metodę próbkowania - stosowane w obliczeniach rozkłady statystyczne (większość zakłada minimalną liczność) - wymagany poziom dokładności uogólnienia; zazwyczaj większa liczność zapewnia większą dokładność 3
Jak sprawdzić, czy próba jest reprezentatywna Można pobrać drugą próbę tej samej wielkości i dokładnie przy pomocy tych samych metod, a następnie porównać statystyki parametrów oszacowanych na podstawie pierwszej i drugiej próby. Jeżeli są kompatybilne, możemy wnioskować o reprezentatywności próby. Jeżeli pobierze się wiele prób, niezależnie od rozkładu statystycznego poszczególnych parametrów, ich średnie wartości dla wszystkich prób będą układały się w rozkład normalny (CLT central limit theorem) Centralne Twierdzenie Graniczne 4
CLT Centralne twierdzenie graniczne dotyczy dowolnej populacji, niezależnie od jej rozkładu gęstości prawdopodobieństwa. Jeżeli zmienne losowe x i są niezależne i pochodzą z rozkładów populacji o wartościach oczekiwanych m i odchyleniu standardowym δ, to zmienna losowa x opisana zależnością: zbliża się do standardowego rozkładu normalnego N(0,1), 5
Ilustracja centralnego twierdzenia granicznego 6
TECHNIKA PLANOWANIA EKSPERYMENTU Doświadczenie bez teorii jest równie nie do pomyślenia, jak teoria bez doświadczenia... P.K.Feyerabend 7
EKSPERYMENT seria doświadczeń Wyróżniamy trzy etapy doświadczenia: - plan doświadczenia - realizacja doświadczenia - opracowanie wyników TEORIA EKSPERYMENTU Metody matematyczne Fisher opublikował swoją pracę The Design of Experiments w 1935r. Przyjmuje się, że były to narodziny teorii eksperymentu 8
Cel eksperymentu: Na drodze doświadczalnej należy uzyskać aproksymującą funkcję obiektu badań, o znanej i świadomie ustalonej niedokładności 9
Należy to uzyskać przy liczbie pomiarów, niezbędnych do realizacji przyjętego planu, OGRANICZONEJ DO DOPUSZCZALNEGO MINIMUM, co w sposób decydujący zmniejsza nakłady i czas badań doświadczalnych Wszystkie wyniki powinny mieć oszacowane błędy - BŁĄD różnica między wartością uzyskaną a rzeczywistą (KTÓREJ NIE ZNAMY) GIGO garbage in garbage out 10
Gdzie powstają błędy? - plan doświadczenia - realizacja doświadczenia - opracowanie wyników NAJMNIEJSZY BŁĄD WYNIKU TO NAJWIĘKSZY BŁĄD DANYCH Obwód koła o promieniu około 50m NIE WYNOSI arbitralnie 314,159265359 m 11
h 1 h 2 h z x 1 x 2 x i Obiekt badań (OB.) z 1 z 2 zw c 1 c 2 c s Wielkości charakteryzujące obiekt badań: x wielkości wejściowe; z wielkości wyjściowe; c wielkości stałe; h wielkości zakłócające 12
Plan doświadczenia wybiera się na podstawie ustalonego obiektu badań OBIEKT BADAŃ układ (lub proces), który podlega badaniom. Jego charakterystyka obejmuje: Liczbę i rodzaj niezależnych wielkości wejściowych {x k : k=1,...,i} Przedziały zmienności wielkości wejściowych x k min < x k < x k max Liczbę i rodzaj zależnych wielkości wyjściowych {z p }, których wartości zależą od {x k } Liczba i rodzaj oraz wartości wielkości stałych {c c }, oddziaływujących na obiekt, ale celowo nie zmienianych w czasie badań 13
Cechy dobrego planu eksperymentu Odporność na nieprawidłową specyfikację obiektu (Czy przed badaniem wiemy wszystko o obiekcie???) Właściwe podanie warunków - problem estymacji i wyboru wielkości wejściowych Rotatabilność dokładność oszacowania jest taka sama w każdym kierunku zmiany wielkości wejściowej Optymalność wybrano najlepszy z możliwych planów ze względu na... Odporność na duże zakłócenia (błędy grube) Plany ortogonalne ułatwiają przetwarzanie wyników Minimalizacja nakładów (koszt, czas) 14
Model matematyczny obiektu badań Określenie jakościowego modelu matematycznego obiektu badań opisanego jako: F z (α 1, α 2,..., α n )=0 Jeżeli zbiór α i będzie niekompletny i niejednoznaczny model obiektu będzie zawsze nieadekwatny Wielkości charakteryzujące ce obiekt badań muszą być wielkościami wzajemnie niezależnymi; żadna nie może być wyznaczona na podstawie innych 15
16
Jeżeli oszacowano rodzaj wielkości wejściowych dla obiektu, ich ilość i przedziały zmienności, można rozpocząć planowanie eksperymentu DLA JAKICH WYBRANYCH WARTOŚCI WIELKOŚCI WEJŚCIOWYCH BADAMY OBIEKT? ILE DOŚWIADCZEŃ BĘDZIE LICZYŁ NASZ EKSPERYMENT? 17
Historycznie pierwszy: pełen eksperyment czynnikowy x 3 5 6 7 8 Plan całkowitego eksperymentu dwupoziomowego dla 3 zmiennych 1 2 3 4 x 2 x 1 18
W przypadku ogólnym można dokonać 2 s różnych doświadczeń (przy badaniu tylko dwóch wartości każdej zmiennej wejściowej). Dla trzech zmiennych plan eksperymentu całkowitego zawiera 2 3 = 8 doświadczeń c t1 t2 t3 1 - - - 2 + - - 3 - + - 4 + + - 5 - - + 6 + - + 7 - + + 8 + + + Na podstawie 8 doświadczeń wyznaczamy 4 współczynniki k 0, k 1, k 2,k 3 modelu matematycznego Dla 30 zmiennych plan eksperymentu całkowitego zawiera 1073741824 doświadczeń (2 30 ). Gdyby 1 doświadczenie wykonywać przez 1s potrzeba ok. 34 lat by wykonać eksperyment. 19
Wniosek: Nie stać nas na realizację całkowitych eksperymentów, nawet dwupoziomowych!! W decyzji, które doświadczenia przeprowadzać pomaga teoria eksperymentu 20
BANK planów doświadczeń Plany dla normowanych wielkości wejściowych (przy planach dwupoziomowych) 21
Plan eksperymentu całkowitego typu 2 s spełnia trzy warunki: Symetria doświadczeń względem środka eksperymentu Ortogonalność (zerowanie się wszystkich iloczynów skalarnych wektorów kolumnowych Równość sum kwadratów we wszystkich kolumnach macierzy N t n= 1 N t n= 1 N t n= 1 ns t ni nj 2 ns = 0, = 0, = N, s= 1,2,..., S i, j = 01,,2,..., Si, j s= 1,2,..., S Te same 3 warunki musi spełniać plan eksperymentu ułamkowego 22
Plany ułamkowe Aby spełnić warunek ortogonalności, macierz eksperymentu całkowitego można dzielić na 2, 4, 8... części czyli tworzyć plany połówkowe, ćwiartkowe, ósemkowe itd., przy czym podział nie jest dowolny Analizy należy prowadzić przy jednoczesnej zmianie wszystkich zmiennych wejściowych (analiza czynnikowa), a nie tradycyjnie zmieniając kolejno poszczególne zmienne wejściowe 23
Przykład eksperymentu Szukamy wagi trzech przedmiotów: t 1, t 2, t 3 Należy uwzględnić tarowanie wagi 24
Mamy zważyć trzy przedmioty Klasyczne podejście: tarujemy wagę (y 1 )i kolejno ważymy trzy przedmioty, jeden po drugim. Ciężary poszczególnych przedmiotów to różnice odpowiednio: t 1 =y 2 -y 1 t 2 =y 3 -y 1 t 3 =y 4 -y 1 Jeżeli każdy pomiar został wykonany z błędem o wariancji σ 2, wszystkie obliczone ciężary mają wariancje dwukrotnie większe: var(t 1 )=var(t 2 )=var(t 3 ) = 2 σ 2 25
Wykonano eksperyment n t1 t2 t3 y 1 - - - y1 2 + - - y2 3 - + - y3 4 - - + y4 n t1 t2 t3 y 1 - - - y1 2 + + - y2 3 + - + y3 4 - + + y4 Proponujemy taki. (Kolejno umieszczamy po 2 przedmioty) 26
Ciężary poszczególnych przedmiotów obliczamy na podstawie wzorów: k 1 = ½(-y 1 + y 2 + y 3 y 4 ) k 2 = ½(-y 1 + y 2 - y 3 + y 4 ) k 3 = ½(-y 1 - y 2 + y 3 + y 4 ) Każde z wyrażeń w nawiasach maj wariancję 4σ 2 ale : Jeżeli zmienne losowe X 1, X 2,...,X N mają wariancje var(x 1 ), var(x 2 ),...,var(x N ), to kombinacja liniowa tych zmiennych ma wariancję określoną następującym wzorem: var(a 1 X 1 +a 2 X 2 +...+a N X N )=a 12 var(x 1 )+a 22 var(x 2 )+...+a N2 var(x N ) var(k 1 ) = var(k 2 ) = var(k 3 ) = σ 2 CZYLI DWUKROTNIE MNIEJSZĄ NIŻ PRZY TRADYCYJNYM PLANIE 27
Planowanie trójpoziomowe (poszczególne zmienne wejściowe powinny przyjmować wartości przynajmniej na trzech poziomach) Stosujemy, gdy spodziewamy się ekstremum wartości wyjściowej. Przyjmując, że znajdujemy się blisko ekstremum, staramy się znaleźć model matematyczny obiektu o postaci: ÿ = b 2 0 + b 1 x 1 + b 2 x 2 + b 11 x 12 + b 12 x 1 x 2 Czyli musimy zaplanować eksperyment i obliczyć 5 współczynników: b 0, b 1, b 2, b 11, b 12 x 1 Model o współczynnikach ÿ =f(x 1,x 2,b 0,...,b 12 ) x 2 b 0, b 1, b 2, b 11, b 12 28
Eksperyment całkowity: dla 2 zmiennych 3 2 = 9 eksperymentów, dla 3 zmiennych 3 3 =27 eksperymentów itd... W planach ułamkowych rozważamy... Przy planowaniu pięciopoziomowym rozważamy... Dla większej liczby wejść powstały plany kompozycyjne (uzupełnienie planowania dwupoziomowego symetrycznymi doświadczeniami gwiezdnymi), ortogonalne, rotatabilne... Jeżeli wejścia mogą przyjmować dowolne wartości z danego przedziału (np. mieszaniny) rozpatrujemy plany simplexowe. 29
Porównanie liczby doświadczeń przy S wejściach Planowanie N S 2 3 4 5 6 Trójpoziomowe 3 S 9 27 81 243 729 Kompozycyjne 2 S +2S+1 9 15 25 43 77 30
Rozwój teorii planowania, przy rozwoju technik obliczeniowych spowodował wprowadzenie pojęcia planów ciągłych i użycie nowego aparatu analizy matematycznej: teorii miary. Na jej podstawie powstały plany optymalne typu D (minimalizacja objętości elipsoidy koncentracji), E (największa oś elipsoidy koncentracji), A (minimalizacja średniej wariancji współczynników b), G (inaczej minimaksowe minimalizacja największej wariancji funkcji regresji)... Szczególnie powstało pojęcie macierzy informacyjnej (macierzy Fishera) 31
32
Czynniki Czynniki sterowalne łatwe w identyfikacji, mierzalne, możemy je kontrolować, Czynniki obserwowalne łatwe w identyfikacji, są mierzalne, jednak nie możemy ich kontrolować, Czynniki zakłócające trudne w identyfikacji oraz niemierzalne i niemożliwe do kontroli; czynniki zakłócające nazywa się czasami czynnikami szumu; dzieli się je ponadto na: - zakłócenia wewnętrzne - zakłócenia zewnętrzne. 33
Dla planu eksperymentu istotne są: Dobór odpowiedniej liczby doświadczeń w celu uzyskania określonego modelu empirycznego, (zaplanowanie takiego eksperymentu, który zawiera minimalną liczbę doświadczeń) Dobór czynników; celem eksperymentu jest określenie poziomu istotności poszczególnych czynników, należy je wybrać według kryterium sterowalności, tzn. czy i na ile będą możliwe zmiany wartości czynnika, aby uzyskać określoną odpowiedź, Kwestia, czy proces optymalizacji będzie wymagał znalezienia tylko wartości optymalnej, minimalnej, maksymalnej bądź nominalnej, czy też dodatkowo będzie wymagana analiza czułości oraz projektowanie tolerancji. 34
Plany eksperymentów losowy Jeden czynnik w czasie Dwa czynniki F 1 i F 2 statystycznie poprawny 35
Możliwe wyniki eksperymentu: czynnik zmienia wartość średnią, 36
Czynnik zmienia wariancję, 37
czynnik zmienia zarówno średnią, jak i wariancję, 38
czynnik, który nie zmienia ani średniej, ani wariancji: 39
Przykładowe plany eksperymentów Najczęściej stosowane: ortogonalny - pełny - ułamkowy, centralny kompozytowy, wg schematu Box Benkena, D-optymalny, Z zastosowaniem metody Monte Carlo, wg kwadratu łacińskiego LH (Latin-Hypercube). 40
Ortogonalny pełny i ułamkowy 41
Centralny kompozytowy 42
wg schematu Box Benkena 43
Z zastosowaniem metody Monte Carlo 44
Wg LF (f) 45
Metody interpretacji wyników eksperymentu Wyniki eksperymentu dotyczą próbek statystycznych oraz stochastycznych, zatem narzędzia do interpretacji tych wyników są także oparte na statystyce. Wnioskowanie statystyczne polega na uogólnieniu wyników uzyskanych na podstawie wylosowanej próby czy próbek n-elementowych, w odniesieniu do całej populacji. Najważniejsze narzędzia wnioskowania statystycznego to estymatory i hipotezy statystyczne. Teoria estymacji obejmuje metody statystyczne pozwalające na oszacowanie nieznanych parametrów charakterystycznych dla całej populacji, jak: wartość średnia, wariancja, charakter rozkładu prawdopodobieństwa na podstawie próbki losowej Celem estymacji parametrycznej przedziałowej jest oszacowanie prawdopodobieństwa, że szukana wartość znajduje się w zadanym przedziale ufności W przypadku estymacji nieparametrycznej, tj. populacji o nieznanym rozkładzie, korzysta się najczęściej z weryfikacji hipotez. 46
Procedura weryfikacji hipotezy Hipoteza zerowa: założenie, że nie ma różnicy między wybranymi parametrami lub rozkładem dla danej populacji i uzyskanej na jej podstawie próby losowej Test χ2 (chi-kwadrat) pozwala na badanie zarówno cech mierzalnych, jak i niemierzalnych populacji. Stosuje się go m.in. do badania zgodności próbki losowej z założonym rozkładem prawdopodobieństwa populacji o wartości średniej m i odchyleniu standardowym δ, Test t stosuje się do oszacowania wartości średniej populacji m oraz jej przedziałów ufności na podstawie parametrów próbki losowej oraz czy średnie z dwóch różnych próbek losowych o wielkości n1 i n2 mogą pochodzić z tej samej lub różnych populacji, 47
Test F pozwala na ocenę na podstawie stosunku dwóch wariancji dla dwóch próbek losowych czy pochodzą z tej samej populacji, czy różnych populacji, lecz o tych samych wariancjach, NIE MOŻNA STWIERDZIĆ, ŻE HIPOTEZA ZEROWA JEST NA PEWNO PRAWDZIWA. SZACUJE SIĘ JEDYNIE PRAWDOPODOBIEŃSTWO PRAWDZIWOŚCI DECYZJA MOŻE BRZMIEĆ: BRAK JEST PODSTAW, ABY ODRZUCIĆ HIPOTEZĘ ZEROWĄ 48
Metody weryfikacji wyników Przykład żonglowania liczbami: Dla danego systemu przewiduje się 5 minut dopuszczalnego czasu postoju w ciągu roku. Pomiary wykazały, że w rzeczywistości czas postoju wyniósł 30 minut. Błąd w zaplanowanej wielkości wyniósł PE = (30-5)/5 x 100% = 500% Dla systemu przewiduje się 30 minut postoju. W rzeczywistości ci wyniósł on 5 minut. Błąd: PE = (30-5)/30 x 100% = 83% WNIOSEK: może lepiej podawać dopuszczalny błąd w wartościach bezwzględnych? 49
Narzędzia stosowane w zarządzaniu sieciami telekomunikacyjnymi Niezależnie od zadań, które są celem poszczególnych problemów zarządzania sieciami telekomunikacyjnymi, można je podzielić na: - narzędzia diagnostyczne - narzędzia monitorujące - narzędzia służące do symulacji i modelowania, oparte o metody komputerowe 50
KONIEC CZĘŚCI PIERWSZEJ Dr inż. Małgorzata Langer ZARZĄDZANIE SIECIAMI TELEKOMUNIKACYJNYMI Prezentacja multimedialna współfinansowana przez Unię Europejską w ramach Europejskiego Funduszu Społecznego w projekcie Innowacyjna dydaktyka bez ograniczeń zintegrowany rozwój Politechniki Łódzkiej zarządzanie Uczelnią, nowoczesna oferta edukacyjna i wzmacniania zdolności do zatrudniania osób niepełnosprawnych Zadanie nr 30 Dostosowanie kierunku Elektronika i Telekomunikacja do potrzeb rynku pracy i gospodarki opartej na wiedzy 90-924 Łódź, ul. Żeromskiego 116, tel. 042 631 28 83 www.kapitalludzki.p.lodz.pl