(X) REPREZENTATYWNOŚCI HIPOTEZ I JEJ ZASTOSOWANIE DO AGREGACJI OCEN EKSPERCKICH

Podobne dokumenty
Weryfikacja hipotez statystycznych

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

FORMALIZACJA SUBIEKTYWNEJ NIEPEWNOŚCI

APLIKACJA MATEMATYCZNEJ TEORII EWIDENCJI DO ANALIZY RYZYKA AWARII SIECI WODOCIĄGOWEJ

Komputerowa analiza danych doświadczalnych

WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH

Ćwiczenie 3 Temat: Oznaczenia mierników, sposób podłączania i obliczanie błędów Cel ćwiczenia

Aproksymacja funkcji a regresja symboliczna

Podstawowe funkcje przetwornika C/A

Komputerowa analiza danych doświadczalnych

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Oznacza to, że chcemy znaleźć minimum, a właściwie wartość najmniejszą funkcji

Metody numeryczne Technika obliczeniowa i symulacyjna Sem. 2, EiT, 2014/2015

Agata Boratyńska Statystyka aktuarialna... 1

Elementy Modelowania Matematycznego

Programowanie celowe #1

Rozkład normalny, niepewność standardowa typu A

Wprowadzenie do analizy korelacji i regresji

Klasyfikacja w oparciu o metrykę budowaną poprzez dystrybuanty empiryczne na przestrzeni wzorców uczących

Rozkład Gaussa i test χ2

LABORATORIUM Z FIZYKI

Prezydent wszystkich kombinacji czyli rzecz o filtrowaniu systemów Lotto

Liczby zmiennoprzecinkowe i błędy

REPREZENTACJA LICZBY, BŁĘDY, ALGORYTMY W OBLICZENIACH

Niepewności pomiarów

KARTA INFORMACYJNA PRZEDMIOTU

Modelowanie niezawodności prostych struktur sprzętowych

Metody probabilistyczne klasyfikatory bayesowskie

Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa. Diagnostyka i niezawodność robotów

Wykład 6 Centralne Twierdzenie Graniczne. Rozkłady wielowymiarowe

Analiza wielokryterialna wstęp do zagadnienia

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład Przedmiot statystyki

PRZEWODNIK PO PRZEDMIOCIE

Wnioskowanie bayesowskie

Rachunek prawdopodobieństwa (Elektronika, studia niestacjonarne) Wykład 3

Definicja problemu programowania matematycznego

Matematyka ubezpieczeń majątkowych r.

Fizyka (Biotechnologia)

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Zmierzyłem i co dalej? O opracowaniu pomiarów i analizie niepewności słów kilka

Wybrane rozkłady zmiennych losowych. Statystyka

Przedmiot statystyki. Graficzne przedstawienie danych.

PRAWO OHMA DLA PRĄDU PRZEMIENNEGO

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Sposób wykorzystywania świadectw wzorcowania do ustalania okresów między wzorcowaniami

Komputerowa Analiza Danych Doświadczalnych

Wstęp do Metod Systemowych i Decyzyjnych Opracowanie: Jakub Tomczak

Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa. Diagnostyka i niezawodność robotów

LI OLIMPIADA FIZYCZNA ETAP II Zadanie doświadczalne

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

Ważne rozkłady i twierdzenia

Pomiar rezystancji metodą techniczną

Statystyka i eksploracja danych

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.

SYLABUS. Nazwa jednostki prowadzącej Wydział Matematyczno Przyrodniczy Centrum Mikroelektroniki i Nanotechnologii

Wielokryteriowa optymalizacja liniowa cz.2

Wybrane rozkłady zmiennych losowych. Statystyka

PRZEWODNIK PO PRZEDMIOCIE

Rachunek prawdopodobieństwa- wykład 2

Przekształcenia widmowe Transformata Fouriera. Adam Wojciechowski

Metoda największej wiarygodności

Wykład 9. Terminologia i jej znaczenie. Cenzurowanie wyników pomiarów.

Niepewność pomiaru. Wynik pomiaru X jest znany z możliwa do określenia niepewnością. jest bledem bezwzględnym pomiaru

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

METODY BADAŃ NA ZWIERZĘTACH ze STATYSTYKĄ wykład 3-4. Parametry i wybrane rozkłady zmiennych losowych

DROGI lądowe, powietrzne, wodne 1/2009

REPREZENTACJA LICZBY, BŁĘDY, ALGORYTMY W OBLICZENIACH

Agnieszka Nowak Brzezińska Wykład III

5. WNIOSKOWANIE PSYCHOMETRYCZNE

WYZNACZANIE PRACY WYJŚCIA ELEKTRONÓW Z LAMPY KATODOWEJ

Podstawy opracowania wyników pomiarów z elementami analizy niepewności pomiarowych

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

KOOF Szczecin:

Sympozjum Trwałość Budowli

SMOP - wykład. Rozkład normalny zasady przenoszenia błędów. Ewa Pawelec

Metoda określania pozycji wodnicy statków na podstawie pomiarów odległości statku od głowic laserowych

7. Identyfikacja defektów badanego obiektu

Wykład 5: Statystyki opisowe (część 2)

g) wartość oczekiwaną (przeciętną) i wariancję zmiennej losowej K.

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

POLITECHNIKA WARSZAWSKA

Analiza niepewności pomiarów

Agnieszka Nowak Brzezińska Wykład III

ALGORYTM PROJEKTOWANIA ROZMYTYCH SYSTEMÓW EKSPERCKICH TYPU MAMDANI ZADEH OCENIAJĄCYCH EFEKTYWNOŚĆ WYKONANIA ZADANIA BOJOWEGO

Sterowanie procesem i jego zdolność. Zbigniew Wiśniewski

Pochodna i różniczka funkcji oraz jej zastosowanie do obliczania niepewności pomiarowych

SZTUCZNA INTELIGENCJA

Modelowanie glikemii w procesie insulinoterapii

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

6.4 Podstawowe metody statystyczne

Analiza korelacyjna i regresyjna

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb

Zmienne zależne i niezależne

Automatyka i pomiary wielkości fizykochemicznych. Instrukcja do ćwiczenia III. Pomiar natężenia przepływu za pomocą sondy poboru ciśnienia

Teoria błędów pomiarów geodezyjnych

Co to jest analiza regresji?

Transkrypt:

ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO NR 643 STUDIA INFORMATICA NR 27 20 ANDRZEJ PIEGAT Zachodniopomorski Uniwersytet Technologiczny w Szczecinie FUNKCJA R (X) REPREZENTATYWNOŚCI HIPOTEZ I JEJ ZASTOSOWANIE DO AGREGACJI OCEN EKSPERCKICH Wprowadzenie W systemach technicznych do pomiarów różnych wielkości jednowymiarowych, takich jak napięcie, natężenie prądu, szybkość samochodu etc., stosowane są techniczne urządzenia pomiarowe, takie jak mierniki elektryczne, szybkościomierze, wagi, ciśnieniomierze itd. Pomiar wielkości występujących w systemach ekonomicznych, takich jak wartość firmy, posiadłości, budynku, atrakcyjności oferty złożonej w przetargu itd., jest zadaniem o wiele trudniejszym. Są to bowiem wielkości nie jedno-, lecz wielowymiarowe. Przykładowo, wartość firmy zależy od jej zysków w ostatnim okresie, od wartości terenów, na których firma leży, od jakości i liczności kadry inżynierskiej, zarządzającej i robotniczej, od stanu zadłużenia, od liczności, wieku i nowoczesności maszyn i urządzeń należących do firmy, od aktualnego portfela zamówień produkcyjnych, od atrakcyjności branży, w której firma działa, i innych atrybutów. Jednak nie ma urządzeń technicznych, które byłyby w stanie pomierzyć tak złożone wielkości wielowymiarowe. Mogą tego dokonać jedynie eksperci. Eksperci jednak, podobnie jak i mierniki techniczne, także mniej lub bardziej różnią się w swych pomiarach, czyli ocenach. Stąd istnieje konieczność angażowania do oceny zmiennych wielu ekspertów, a następnie dokonywania agregacji (pod-

46 Andrzej Piegat sumowywania) ich ocen po to, aby uzyskać jedną łączną ocenę wynikową, na której podstawie można by podjąć rozsądna decyzję ekonomiczną. Agregacja ocen eksperckich jest zadaniem bardzo trudnym. Świadczy o tym fakt, że badania w tym zakresie prowadzone są od kilkudziesięciu co najmniej lat, opracowano dużo metod agregacji, a badania nie ustają, co świadczy o ciągłym naukowym niezadowoleniu badaczy. Obecnie trudno jest powiedzieć, która z istniejących metod agregacji jest obiektywnie najlepsza. Przyczyną tego stanu rzeczy jest brak jednolitego stanowiska świata naukowego w kwestii modelowania niepewności (oceny eksperckie są niepewne). Do modelowania niepewności, z którą w życiu codziennym i w działalności firm mamy nieustannie do czynienia, stosuje się różne podejścia. Najbardziej znane jest podejście probabilistyczne, następnie oparte na teorii wiary i niewykluczalności (belief and plausibility) Dempstera-Shafera 2, posybilistyczne oparte na pojęciu możliwości i konieczności (possibility and necessity) Duboisa i Prade 3 i inne. Metoda przedstawiona w niniejszym artykule oparta jest na podejściu probabilistycznym, które jest chyba najbardziej rozbudowaną i przebadaną teorią naukową w zakresie niepewności zdarzeń. Również w ramach teorii prawdopodobieństwa opracowano znaczną liczbę metod agregacji ocen eksperckich. Przegląd tych metod został przedstawiony w książce A. O Hagana i C. Bucka 4. Autorzy tej pracy, renomowani specjaliści z zakresu teorii prawdopodobieństwa, przeanalizowali w ramach dużego grantu rządowego wszystkie najbardziej znane i stosowane metody probabilistyczne, takie jak metody Bayesowskie, liniowa, ważona agregacja ocen (opinion pooling), agregacja behawioralna, agregacja logarytmiczna, metoda Cooka (seeding variables) i inne. Jedną z ważnych miar rzeczywistej wartości metod agregacji jest częstość ich praktycznego stosowania. Badania wykazały, R. Clemen, R. Winkler, Combining probability distributions from experts in risk analysis, Risk Analysis, vol. 9, no. 2, s. 87 203; A. O Hagan, C.A. Buck i in., Uncertain judgementseliciting experts probabilities, John Wiley & Sons LTD, Chichester, England 2006. 2 G. Shafer, A mathematical theory of evidence, Princeton, NJ, Princeton University Press 976. 3 S. Destercke, D. Dubois, E. Chojnacki, Possibilistic information fusion using maximal coherent subsets, IEEE Transactions on Fuzzy Systems 2009, vol. 7, no., s. 79 92; D. Dubois, H. Prade, R. Yager, Merging fuzzy information, w: Fuzzy sets in approximate reasoning and information systems, Kluwer, Boston, MA 999, s. 335 40; S. Sandri, D. Dubois, H. Kalfsbeek, Elicitation assesment and pooling of expert judgments using possibility theory, IEEE Transactions on Fuzzy Systems 995, vol. 3, no. 3, s. 33 335. 4 A. O Hagan, C.A. Buck i in., Uncertain judgements-eliciting experts probabilities...

Funkcja r (x) reprezentatywności hipotez... 47 że metodą najczęściej stosowaną i zweryfikowaną w praktyce jest metoda liniowej agregacji ważonej (linear opinion pooling) 5. gp(x) ekspert E, w = 0.5 0.5 f (x) warto firmy 3 4 5 6 x [mln z] gp(x) ekspert E 2, w 2 = 0.5 0.5 f 2 (x) warto firmy 3 4 5 6 x [mln z] gp(x) 0.5 F(x) ocena zagregowana F(x) = 0.5 f (x) + 0.5 f 2 (x) 0.25 warto firmy 3 4 5 6 x [mln z] Rys.. Przykład użycia najczęściej w praktyce stosowanej metody agregacji liniowej do zagregowania dwóch spójnych opinii eksperckich, gp(x) gęstość prawdopodobieństwa ocenianej zmiennej X 5 Tamże.

48 Andrzej Piegat Załóżmy, że danych jest n eksperckich ocen f i (x) wartości x niepewnej zmiennej X (na przykład wartości firmy), gdzie f i (x) mają formę rozkładów gęstości prawdopodobieństwa. Wówczas zagregowaną ocenę łączną F(x) określa się według wzoru (): n F( x) w f ( x) () gdzie w i oznacza współczynnik zaufania (współczynnik jakości) eksperta. n Zwykle zakłada się, że w. i i Na rysunku przedstawiono przykład zastosowania tej metody do agregacji dwóch różnych ocen wartości firmy, uzyskanych od dwóch ekspertów E i E 2. Oceny te mają formę równomiernych rozkładów gęstości prawdopodobieństwa. Eksperci nieco różnią się w swych opiniach, jednak istnieje między nimi pewien zakres konsensusu (zgodności). Jak pokazano to na rysunku, metoda agregacji liniowej daje bardzo wiarygodny i przekonujący wynik, stąd jej popularność. Wiarygodność ta jest jednak wysoka tylko wówczas, gdy eksperckie opinie f i (x) są spójne. Sytuacja zmienia się natomiast, gdy mamy do czynienia z ocenami niespójnymi (rysunek 2). i i i gp(x) 0.5 ekspert E, w = 0.5 f (x) ekspert E 2, w 2 = 0.5 f 2 (x) 0.25 warto firmy 2 3 4 5 6 7 8 x [mln z] gp(x) ocena zagregowana F(x) = 0.5 f (x) + 0.5 f 2 (x) 0.5 0.25 warto firmy 2 3 4 5 6 7 8 x [mln z] Rys. 2. Przykład agregacji dwóch niespójnych eksperckich ocen wartości firmy najbardziej popularną metodą liniowej agregacji ważonej

Funkcja r (x) reprezentatywności hipotez... 49 Uzyskany wynik agregacji przedstawiony na rysunku 2 trudno zaakceptować. Sugeruje on, że wartość firmy możliwa jest tylko w zakresach x [, 3] oraz x [6, 8]. Wartość firmy leżąca w zakresie pośrednim x [3, 6] jest natomiast nieprawdopodobna. Jest to oczywiście niezgodne ze zdrowym rozsądkiem. Przykład ten pokazuje, że metoda agregacji liniowej nie obejmuje swym zakresem pewnych ważnych przypadków występujących w praktyce. Z tego względu nie jest ona metodą generalną i istnieje potrzeba opracowania metody bardziej ogólnej, która by umożliwiła agregację zarówno spójnych, jak i niespójnych opinii eksperckich. Przykład takiej metody opublikowano w artykule D. Duboisa, H. Prade a i R. Yagera 6. Jest to jednak metoda oparta na posybilistycznej teorii niepewności. W niniejszym artykule przedstawiona natomiast zostanie teoria oparta na rachunku prawdopodobieństwa, będącego najstarszą i najbardziej ugruntowaną teorią badania niepewności. Oceny eksperckie f i (x) mogą w ogólnym przypadku być ocenami punktowymi lub mieć formę rozkładów gęstości prawdopodobieństwa. W rozdziale 2 przedstawiona zostanie ze względu na dopuszczalny wolumen artykułu tylko wersja metody realizująca agregację ocen punktowych, które są zawsze ocenami niespójnymi, poza przypadkiem idealnego pokrywania się tych ocen. Inne wersje proponowanej metody zostaną przedstawione w kolejnych publikacjach autora.. Agregacja punktowych ocen eksperckich metodą optymalnej reprezentacji Ze względu na konieczne ograniczenie objętości artykułu metoda zostanie opisana skrótowo. Składa się ona z czterech kroków A, B, C, D. A. Określenie oddzielnych rozkładów S Ei (x) bezwzględnych błędów reprezentacji x względem poszczególnych eksperckich ocen x Ei. B. Zsumowanie wszystkich oddzielnych rozkładów S Ei (x) błędów bezwzględnych w jeden łączny, ważony rozkład S (x) według wzoru (2). n x) SEi ( x) i S ( (2) 6 D. Dubois, H. Prade, R. Yager, Merging fuzzy information..., s. 335 40.

50 Andrzej Piegat C. Określenie rozkładu r (x) dokładności reprezentowania ocen eksperckich x i przez wszystkie możliwe hipotezy (X = x) dotyczące ocenianej zmiennej wzór (3). r ( x) S ( x) (3) Smax gdzie S max oznacza maksymalny sumaryczny błąd reprezentacji występujący w zbiorze możliwych hipotez x min x. D. Określenie rozkładu gęstości prawdopodobieństwa gpr (x) zagregowanej oceny według wzoru (4). gpr ( x) xmin r ( x) r ( x) dx (4) W następnym punkcie zostanie przedstawiony przykład praktycznego użycia metody. 2. Przykład zastosowania metody optymalnej reprezentacji do agregacji punktowych eksperckich ocen wartości samochodu Pewna osoba zamierza sprzedać swój używany samochód. Z analizy ogłoszeń wynika, że samochody tej marki i wieku osiągają na rynku cenę w zakresie od 0 do 20 tys. zł (0 x 20) zależnie od swego przebiegu, stanu technicznego, stopnia zużycia, wyposażenia, koloru etc. Aby dokładniej poznać aktualną wartość swego samochodu, jego właściciel zlecił ocenę tej wartości trzem ekspertom. Eksperci po dokładnym zapoznaniu się z samochodem i na podstawie swej głębokiej znajomości rynku samochodowego podali punktowe, według nich najbardziej prawdopodobne, wartości samochodu: E : x E = 2 tys. zł, E 2 : x E 2 = 3 tys. zł, E 3 : Oceny te przedstawiono graficznie na rysunku 3. x E3 = 5 tys. zł.

Funkcja r (x) reprezentatywności hipotez... 5 P(x) w = w 2 = w 3 = /3 /3 E E 2 E 3 warto samochodu 0 2 3 5 20 x [tys. z] x min przestrze rozwaa przestrze moliwych hipotez (X = x) Rys. 3. Wizualizacja punktowych ocen wartości samochodu dostarczona przez trzech ekspertów o jednakowym współczynniku zaufania (jakości) w = w 2 = w 3 = /3, P oznacza prawdopodobieństwo oceny, 0 x 20 oznacza zakres możliwych wartości samochodu (przestrzeń rozważań, przestrzeń hipotez) Oceny eksperckie oraz przestrzeń rozważań ceny jest to jedyna wiedza, jaką dysponujemy. Należy też zauważyć, że punktowe oceny ekspertów są przykładem całkowitej niespójności wiedzy. Oceny te nie mają żadnego wspólnego zakresu konsensusu, czyli zgodności. Z tego względu metoda agregacji liniowej nie może być tu zastosowana. W trakcie wyjaśniania metody stosowane będzie pojęcie możliwych hipotez (X = x), gdzie X oznacza nazwę zmiennej ocenianej, a x oznacza liczbową wartość samochodu w tys. zł. Pojęcie wartość samochodu może być też interpretowane jako cena, za jaką właścicielowi faktycznie uda się sprzedać samochód. Zastanówmy się teraz, jaka wartość x samochodu najlepiej reprezentuje wszystkie trzy oceny eksperckie. Przyjmijmy na przykład hipotezę, że wartość samochodu x = 4 tys. zł. Zauważmy, że hipoteza ta nie jest zgodna z żadną z opinii eksperckich (rysunek 4).

52 Andrzej Piegat e i bd hipotezy x wzgldem oceny x Ei eksperta E i P(x) /3 e e 2 e 3 w = w 2 = w 3 = /3 warto samochodu 0 2 3 4 5 20 x [tys. z] x min x E E2 x x x E3 hipoteza (X = x=4) Rys. 4. Ilustracja pojęcia błędu hipotezy (X = x) względem opinii x Ei pojedynczych ekspertów Hipoteza (X = x = 4) ma błąd (niezgodność) z każdą z opinii eksperckich. Zastosowane zostanie tutaj pojęcie błąd w sensie błędu bezwzględnego. Można oczywiście użyć innych matematycznych form błędu. Poniżej podane są wartości błędów hipotezy (X = x = 4) względem poszczególnych ocen eksperckich oraz ich ważona suma S (x). e ( x) 2, S ( x) 3 i e ( x), 2 e ( x), wi ei ( x) 2 3 3 3 3 x 4 4. 3 Ważona suma błędów bezwzględnych S (x) jest dobrą miarą niezgodności hipotezy z posiadanymi ocenami eksperckimi. Zastanówmy się teraz, czy w ogóle istnieje jakakolwiek hipotetyczna wartość x samochodu, która byłaby całkowicie zgodna ze wszystkimi ocenami jednocześnie. Jeden rzut oka na rysunek 4 uzmysławia, że hipoteza taka nie istnieje. W związku z tym jedynym rozsądnym postępowaniem może być znalezienie takiej wartości x samochodu, która najlepiej będzie reprezentować wszystkie oceny eksperckie. W tym celu należy określić rozkłady niezgodności S (x) dla wszystkich możliwych hipotez wartości

Funkcja r (x) reprezentatywności hipotez... 53 x samochodu w ramach możliwego zakresu wartości x min x. Na rysunku 5 przedstawiono rozkład niezgodności S E (x) hipotez x względem jednej tylko oceny eksperckiej x = 2 tys. zł. E S E (x) S ( ) E x x xe x 2 3 3 8 3 2 3 warto samochodu 0 2 20 x [tys. z] x min x E Rys. 5. Rozkład niezgodności S (x) poszczególnych możliwych hipotez (X = x) wartości samochodu z oceną x = 2 tys. zł pierwszego eksperta E Jak łatwo zauważyć na rysunku 5, w przypadku pojedynczej tylko oceny eksperckiej istnieje jedna jedyna hipoteza (x = 2), która jest całkowicie zgodna z opinią eksperta E. Pozostałe hipotezy są mniej lub bardziej niezgodne. Najwyższą niezgodność wykazuje hipoteza x = 20, dla której wartość kryterium niezgodności S E (x) wynosi 8/3. Na rysunku 6 przedstawiono trzy rozkłady S Ei (x) ważonej niezgodności możliwych hipotez x z poszczególnymi ocenami eksperckimi oraz sumaryczny rozkład niezgodności S (x). Jak widać na rysunku 6, żadna możliwa hipotetyczna wartość x samochodu nie ma idealnej zgodności z ocenami wszystkich ekspertów jednocześnie. Najlepsza pod tym względem jest hipoteza x = 3 tys. zł, która ma najmniejszą niezgodność S (x) = 3/3 =. 3 S ( x) wi S ( x) x 2 x 3 x 3 3 3 Ei i 5.

54 Andrzej Piegat S (x) S max = 20/3 S (x) 0/3 /3 5 /3 3 /3 2 4/3 3/3 5/3 /3 8 S E(x) /3 7 S E2(x) /3 5 S E3(x) warto samochodu 0 2 3 5 20 x [tys. z] x min x E x E2 x E3 Rys. 6. Rozkłady niezgodności S E (x) możliwych hipotez (X = x) ceny samochodu z ocenami poszczególnych ekspertów xei oraz łączny rozkład S (x) bezwzględnej niezgodności hipotez z ocenami ekspertów E i W kolejnym kroku metody określony zostanie rozkład r (x) zgodności możliwych hipotez (X = x) z ocenami wszystkich ekspertów, według wzoru (5). r ( x) S ( x) (5) Smax W rozpatrywanym przykładzie S max = 20/3 (rysunek 6). Na rysunku 7 przedstawiono rozkład r (x) zgodności hipotez (X = x) z ocenami x ekspertów. E

Funkcja r (x) reprezentatywności hipotez... 55 r (x) 0.8 0.85 0.75 0.5 0 warto samochodu 0 2 3 5 20 x [tys. z] x min x E x E2 x E3 Rys. 7. Funkcja dokładności reprezentowania ocen eksperckich przez poszczególne możliwe hipotezy (X = x), x min x lub inaczej funkcja zgodności hipotez z ocenami eksperckimi Funkcja r (x) dokładności reprezentacyjnej przedstawiona na rysunku 7 informuje nas, jak dokładnie poszczególne hipotezy (X = x) wartości samochodu reprezentują trzy eksperckie oceny dotyczące tej wartości. Żadna z możliwych wartości x nie reprezentuje tych ocen w stopniu idealnym r (x) =, gdyż jest to niemożliwe. Jednak hipoteza X = x = 3 tys. zł osiąga najwyższą dokładność reprezentacyjną, gdyż jest najbardziej zgodna (r (x) = 0,85) ze wszystkimi trzema ocenami ekspertów. Wartość x = 3 tys. zł jest więc najlepszym reprezentantem posiadanej wiedzy o wartości sprzedawanego samochodu. Wartość ta może być wykorzystana na przykład do określenia wywoławczej ceny w ofercie sprzedaży samochodu. Na podstawie rozkładu dokładności reprezentacyjnej r (x) można uzyskać rozkład gęstości prawdopodobieństwa gpr (x) dokładności hipotezy (X = x) wartości samochodu, stosując wzór (6). gpr ( x) xmin r ( x) r ( x) dx (6)

56 Andrzej Piegat Całka występująca w mianowniku wzoru (6) określa powierzchnię A rozkładu dokładności reprezentacji. W rozpatrywanym przypadku powierzchnia rozkładu z rysunku 7 wynosi A = 5,6. Na podstawie wzoru (6) uzyskuje się rozkład przedstawiony na rysunku 8. gpr (x) 0.43 0.52 0.34 0.089 0 warto samochodu 0 2 3 5 20 x [tys. z] x min x E x E2 x E3 Rys. 8. Rozkład gęstości prawdopodobieństwa wartości x samochodu wynikający z posiadanej wiedzy (trzy oceny eksperckie dotyczące tej wartości) Rozkład z rysunku 8 informuje nas o szansach uzyskania poszczególnych cen za samochód. Najbardziej prawdopodobna jest cena w wysokości około 3 tys. zł. Bardziej prawdopodobne jest uzyskanie ceny w zakresie od 0 do 5 tys. zł niż w zakresie powyżej 5 tys. zł etc. Wnioski Najczęściej stosowane probabilistyczne metody agregacji ocen eksperckich, na które istnieje duże zapotrzebowanie w zakresie nauk ekonomicznych i zarządzania, dają wiarygodne wyniki tylko w przypadku spójnych, niesprzecznych ocen eksperckich. Nie potrafią one jednak wiarygodnie agregować ocen niespójnych, sprzecznych. W artykule przedstawiono metodę opartą na funkcji dokładności reprezentowania ocen eksperckich przez możliwe hipotezy (X = x) dotyczące ocenianej zmiennej. Metoda ta może być stosowana zarówno w przypadku spójnych, jak i niespójnych ocen eksperckich. Dostarcza ona wiarygodne

Funkcja r (x) reprezentatywności hipotez... 57 wyniki, zgodne z ludzką intuicją i zdrowym rozsądkiem, i jest dość łatwa pod względem obliczeniowym. W niniejszej publikacji, ze względu na jej ograniczenie objętościowe, przedstawiono jedynie wersję metody opartą na kryterium sumarycznego błędu bezwzględnego S (x) dla przypadku punktowych ocen eksperckich, które są najostrzejszym przypadkiem niespójności (oceny punktowe są zwykle niespójne). Metoda oparta na błędzie bezwzględnym ma dużą odporność na opinie eksperckie silnie różniące się od większości opinii eksperckich (tak zwanych outliersów). Cechy takiej nie mają natomiast metody agregacji, oparte na błędzie kwadratowym, w których wpływ opinii nietypowych jest niezwykle silny ze względu na stosowanie operacji podnoszenia błędu do kwadratu. Metoda oparta na błędzie bezwzględnym ma charakter medianowy, to znaczy maksimum funkcji zgodności r (x) występuje zawsze albo dla opinii eksperta środkowego (w przypadku nieparzystej liczby ekspertów), albo też leży między opiniami dwóch ekspertów środkowych (w przypadku parzystej liczby ekspertów). W następnych publikacjach autora przedstawione zostaną wersje metody reprezentacyjnej dla niepunktowych ocen eksperckich w formie rozkładów gęstości prawdopodobieństwa) oraz dla innych kryteriów niezgodności. Literatura Clemen R., Winkler R., Combining probability distributions from experts in risk analysis, Risk Analysis, vol. 9, no. 2. Destercke S., Dubois D., Chojnacki E., Possibilistic information fusion using maximal coherent subsets, IEEE Transactions on Fuzzy Systems 2009, vol. 7, no.. Dubois D., Prade H., Yager R., Merging fuzzy information, w: Fuzzy sets in approximate reasoning and information systems, Kluwer, Boston, MA 999. O Hagan A., Buck C.A. i in., Uncertain judgements-eliciting experts probabilities, John Wiley&Sons, LTD, Chichester 2006. Sandri S., Dubois D., Kalfsbeek H., Elicitation assesment and pooling of expert judgments using possibility theory, IEEE Transactions on Fuzzy Systems 995, vol. 3, no. 3. Shafer G., A mathematical theory of evidence, Princeton University Press, Princeton, NJ 976.

58 Andrzej Piegat REPRAESENTATIONSFUNKTION R (X) VON HYPHOTHESEN UND IHRE ANWENDUNG ZUR AGGREGATION VON EXPERTENSCHAETZUNGEN Zusammenfassung Integrierung numerischer Daten mit Expertenschätzungen ermöglicht bessere Lösung ökonomischer (und nicht nur) Problemen. Deswegen ist die Entwicklung der Aggregationsmethoden von Expertenschätzungen sehr wichtig. Es gibt bereits eine Reihe der Aggregationsmethoden die im Rahmen unterschiedlicher Theorien der Unsicherheit erarbeitet wurden. In dem Artikel ist eine probabilistische Methode dargestellt. Die meisten Methoden aggregieren gut kohärente Expertenschätzungen. Die im Artikel vorgeschlagene Methode dient zur Aggregation aller Schätzungstypen: sowohl kohärenter wie auch akohärenter, widersprüchlichen Schatzungen. Die Methode basiert auf dem Konzept der Repräsentationsgenauigkeit von Expertenschätzungen durch alle möglichen Hypothesen (X = x) bettreffens der geschätzten Variable X. Nach dem Wissen des Authors ist die Methode neu. Übersetzt von Andrzej Piegat