WIELOKRYTERIALNE WSPOMAGANIE DECYZJI METODA UTA Zastosowania Informatyki w Medycynie semestr zimowy, 2013-2014 Szymon Wilk, Instytut Informatyki, PP Przygotowane na podstawie materiałów prof. R. Słowińskiego, dr. M. Kadzińskiego oraz dr. R. Susmagi
WPROWADZENIE
Definicja problemu decyzyjnego Mamy cel, który chcemy osiągnąć Istnieje wiele możliwych sposobów osiągnięcia tego celu tworzą one zbiór akcji A (zbiór rozwiązań, wariantów, ) Decydent chciałby uzyskać odpowiedź na jedno z pytań dotyczących zbioru A P α : Jak wybrać najlepszą akcję? albo: klasyfikować P β : Jak przyporządkować akcje do zdefiniowanych wcześniej klas? P γ : Jak uporządkować akcje od najlepszej do najgorszej? 3 podstawowe problematyki rozważane w podejmowaniu i wspomaganiu decyzji
Problematyka wyboru (P α ) Podzbiór wybranych najlepszych akcji A A Podzbiór odrzuconych akcji A \ A
Problematyka klasyfikacji (P β ) A... Klasa 1 Klasa 2 Klasa p Klasa 1 Klasa 2... Klasa p Bardziej preferowana
Problematyka porządkowania (Pγ) A * * * * * * * * * * * * Częściowy lub zupełny (pre)porządek (ranking) akcji z A Porządek częściowy dopuszcza akcje nieporównywalne Porządek zupełny wszystkie akcje są porównywalne Preporządek porządek, w którym kilka akcji jest na tym samym miejscu
MODELOWANIE PREFERENCJI
Kryterium Kryterium to funkcja rzeczywista g i zdefiniowana na zbiorze A, która odzwierciedla wartość każdej akcji z pewnego punktu widzenia. Do porównania dwóch dowolnych akcji a, b A z tego punktu widzenia powinno wystarczyć porównanie dwóch wartości liczbowych g i (a) i g i (b). Możliwe skale kryterium porządkowa liczy się porządek wartości, nie można porównywać różnic ocen (np. oceny szkolne) interwałowa brak zera absolutnego, można porównywać różnice (np. skala Celsiusa) ilorazowa istnieje zero absolutne, można porównywać różnice oraz stosunek ocen (np. waga)
Rodzina kryteriów W praktyce akcje charakteryzowane są za pomocą wielu kryteriów wielokryterialne wspomaganie decyzji Rodzina (zbiór) kryteriów G = {g 1,, g n } jest spójna jeśli jest kompletna jeśli dwie akcje a i b mają takie same oceny na wszystkich kryteriach, to a i b są nierozróżnialne monotoniczna jeśli akcja a jest preferowana nad b oraz akcja c jest co najmniej tak samo dobra jak a, to c jest również preferowane nad b nienadmiarowa jeśli usunięcie dowolnego kryterium z G spowodowałoby naruszenie dwóch wcześniejszych właściwości
Modelowanie preferencji Akcja Time Cost a 3 1 akcja niezdominowana akcja zdominowana b 1 2 c 2 3 Akcja c jest najgorsza. Ale która z akcji a i b jest lepsza?
Modelowanie preferencji Informacja o dominacji jest zbyt uboga nie pozwala na podjęcie ostatecznej decyzji Informację tę można wzbogacić informacją preferencyjną pozyskaną od decydenta Wartości na poszczególnych kryteriach Informacja preferencyjna pozwala na budowę modelu preferencji, który agreguje oceny akcji ze zbioru A Model preferencji zastosowany do akcji ze zbioru A pozwala na otrzymanie ostatecznej decyzji w sensie wyboru, klasyfikacji czy porządkowania
Modele preferencji 1. Funkcje, np. addytywna funkcja użyteczności U a = n i=1 u i (g i a ) 2. Systemy relacyjne, np. relacja przewyższania asb a jest co najmniej tak dobre jak b 3. Zbiory reguł if i (a,b) s i & j (a,b) s j &... h (a,b) s h, then asb Model funkcyjny jest najbardziej intuicyjny, chociaż trudny do pozyskania Model regułowy jest najbardziej ogólnym modelem preferencji
Addytywna funkcja użyteczności U a = n i=1 u i (g i a ) Ocena/wartość akcji a na i-tym kryterium Globalna (całkowita) wartość akcji a Cząstkowa funkcja użyteczności na i-tym kryterium Akcja a jest preferowana nad akcję b (apb) U a > U(b) Akcje a i b są nierozróżnialne (aib) U a = U(b)
METODA UTA
Charakterystyka metody UTA Model preferencji: addytywna funkcja użyteczności Rozwiązuje problematykę P γ Pośrednio realizuje problematyki P α i P β Działa w trybie interaktywnym (decydent może modyfikować otrzymany model preferencji) Wymagane dane wejściowe Zbiór akcji A (tabela informacyjna) Zbiór referencyjny A R Ranking na zbiorze A R Aparat matematyczny: programowanie matematyczne
Schemat działania metody Spójna rodzina kryteriów: (1) kompletna, (2) monotoniczna i (3) nienadmiarowa Zbiór akcji A Wybór zbioru akcji referencyjnych A R Uporządkowanie akcji referencyjnych ranking (akcje mogą być e-aquo) Zbiór cząstkowych funkcji użyteczności zgodnych z podanym rankingiem (rozwiązanie problemu regresji porządkowej PM) Zmiana zbioru A R, modyfikacja rankingu, zwiększenie rozdzielczości cząstkowych funkcjach użyteczności Tak Zbiór pusty? Nie Konstrukcja globalnej funkcji użyteczności U Uporządkowanie wszystkich akcji w zbiorze A za pomocą funkcji U
Funkcje użyteczności Cząstkowe funkcje użyteczności muszą być monotoniczne (niemalejące lub nierosnące) Cząstkowe funkcje użyteczności mogą być odcinkami liniowe Liczba odcinków to parametr wejściowy dla metody UTA Im więcej odcinków, tym lepsze dopasowanie funkcji do danych u i (g i (a)) 0.5 0.4 0.3 0.2 0.1 0 10 20 30 40 50 g i (a) u i (g i (a)) 0.5 0.4 0.3 0.2 0.1 0 10 20 30 40 50 g i (a) u i (g i (a)) 0.5 0.4 0.3 0.2 0.1 0 10 20 30 40 50 g i (a)
Funkcje użyteczności Wartości cząstkowej użyteczności dla najgorszej wartości na każdym kryterium musi wynosić 0 Suma wartości cząstkowych dla najlepszych wartości na wszystkich kryteriach musi wynosić 1 u cena 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 35 40 45 50 55 cena (tys. zł) u moc 0.5 0.4 0.3 0.2 0.1 0 60 70 80 90 100 moc (KM) U(ideal) = 1.0 U(nadir) = U(antyideal) = 0.0
Aparat matematyczny Programowanie matematyczne (programowanie liniowe) przy ograniczeniach min F = a A R (σ + a + σ a ) U a σ + a + σ a U b σ + b + σ b 0 U a σ + a + σ a U b σ + b + σ b = 0 u i g i j u i g i j+1 n i=1 u i g i j u i (β i ) = 1 0 apb aib i = 1... n, j = 1 γ i 1 u i α i = 0 i = 1 n 0, σ + a 0, σ + a 0 a A R, i, j Jeśli optymalne F (F * ) jest równe 0, to istnieje co najmniej jedna funkcja użyteczności zgodna z rankingiem zadanym na zbiorze A R (tzn. odtwarzająca ranking referencyjny)
Współczynnik Kendalla Określa zgodność uzyskanej funkcji użyteczności z preferencjami decydenta Wyznaczany przez porównanie dwóch rankingów na zbiorze A R decydenta i wynikającego z funkcji użyteczności Wartości z przedziału [-1, 1] = 1 pełna zgodność rankingów (F * = 0) = -1 pełna niezgodność rankingów (tzn. rankingi są przeciwstawne) W praktyce funkcje użyteczności akceptuje się, gdy 0.75
Wyznaczanie współczynnika Kendalla Dane wejściowe kwadratowe macierze R i R * o rozmiarze m ( m = liczba wariantów referencyjnych) macierz R opisuje porządek referencyjny podany przez decydenta macierz R * opisuje porządek zdefiniowany przez funkcję użyteczności wyznaczoną automatycznie ( programowanie matematyczne) poszczególne elementy macierzy R i R * przyjmują następujące wartości r i,j (= r i,j ) = 0.0 i = j lub a j Pa i 0.5 a i Ia j 1.0 a i Pa j
Wyznaczanie współczynnika Kendalla Odległość Kendalla między macierzami R i R * wyznaczona jako d K (R, R ) = 0.5 m m i=0 j=0 r i,j r i,j Współczynnik Kendalla wyznaczony jako τ = 1 4 d K(R, R ) m(m 1)
Wyznaczanie przykład 1 Ranking referencyjny Ranking automatyczny a 1 a 1 a 2 a 2 d K R, R = 0.0 a 3 a 4 a 3 a 4 τ = 1 4 0 4 3 = 1.0 Macierz R r i,j 1 2 3 4 1 0 1 1 1 2 0 0 1 1 3 0 0 0 1 4 0 0 0 0 Macierz R* r * i,j 1 2 3 4 1 0 1 1 1 2 0 0 1 1 3 0 0 0 1 4 0 0 0 0
Wyznaczanie przykład 2 Ranking referencyjny Ranking automatyczny a 1 a 4 a 2 a 3 d K R, R = 0.5 12 = 6.0 a 3 a 4 a 1 a 2 τ = 1 4 6 4 3 = 1 2 = 1.0 Macierz R r i,j 1 2 3 4 1 0 1 1 1 2 0 0 1 1 3 0 0 0 1 4 0 0 0 0 Macierz R* r * i,j 1 2 3 4 1 0 0 0 0 2 1 0 0 0 3 1 1 0 0 4 1 1 1 0
Wyznaczanie przykład 3 Ranking referencyjny Ranking automatyczny a 1 a 1 a 2 a 3 d K R, R = 0.5 2 = 1.0 a 3 a 4 a 2 a 4 τ = 1 4 1 4 3 = 1 1 3 = 2 3 = 0.67 Macierz R r i,j 1 2 3 4 1 0 1 1 1 2 0 0 1 1 3 0 0 0 1 4 0 0 0 0 Macierz R* r * i,j 1 2 3 4 1 0 1 1 1 2 0 0 0 1 3 0 1 0 1 4 0 0 0 0
PRZYKŁAD TRANSPORTOWY
Opis problemu Ranking dostępnych środków transport publicznego 6 wariantów opisanych za pomocą 3 kryteriów Price Time Comfort RER 3 10 1 METRO1 4 20 2 METRO2 2 20 0 BUS 6 40 0 koszt im mniej, tym lepiej zysk im więcej, tym lepiej TAXI 30 30 3 SNCF 3 20 2
Decydent A Decydent zorientowany kosztowo Zbiór referencyjny A R i ranking zbudowany na tym zbiorze
Decydent B Decydent zorientowany czasowo Zbiór referencyjny A R i ranking zbudowany na tym zbiorze
Decydent B Interakcja z decydentem modyfikacja cząstkowych użyteczności
PRZYKŁAD MEDYCZNY
Opis problemu Konstrukcja funkcji użyteczności pozwalającej na ocenę stanu pacjentów z atakiem astmy ( wstępna diagnoza) 75 wariantów (pacjentów) opisanych za pomocą 7 kryteriów SaO2 Color Distress Suprasternal retractions Scalene retractions Air entry Wheeze Color pink 0 pale 1 Distress none 0 mild 1 mod 2 severe 3 SupraRetractions, ScaleneRetractions absent 0 present 1 AirEntry normal 0 dim_bases 1 dim_wide 2 minimal 3 Wheeze absent 0 epi 1 inspi_epi 2 audible 3 Kryteria wykorzystywane również przez miarę PRAM Dane zbierane w izbie przyjęć szpitala CHEO w Ottawie
PRAM Pediatric Respiratory Assessment Measure Miara stosowana do oceny stanu pacjentów z astmą Asthma symptoms Suprasternal indrawing Score 0 1 2 3 absent present Scalene retractions absent present Wheezing absent epiratory inspiratory and epiratory audible without stetoscope/ absent with no air entry Air entry normal decreased at bases widespread decrease absent/minimal Oygen saturation 95% 92-95% <92% symptomy punkty im większa wartość, tym gorszy stan pacjenta
Zastosowanie UTA Ranking referencyjny odzwierciedlający stan pacjenta oraz zweryfikowaną diagnozę
Zastosowanie UTA Zbędne kryterium
Funkcja użyteczności PRAM i funkcja użyteczności 1.2 1 0.8 0.6 Korelacja rangowa = -0.81 0.4 0.2 Konkurencja dla PRAM? 0 0 2 4 6 8 10 12 PRAM
PODSUMOWANIE
38 Podsumowanie Podstawowe problematyki wspomagania decyzji wybór, klasyfikacja i porządkowanie Informacja o dominacji zbyt uboga Modele preferencji funkcje, relacje, zbiory reguł Metoda UTA interakcyjne budowanie addytywnej funkcji użyteczności