ZESZYTY NAUKOWE POLITECHNIKI ŚLĄSKIEJ 994 Seria: GÓRNICTWO z. 9 Nr kol. 34 Stanisła KOWALIK Katedra Organizacji i Ekonomiki Górnicta Politechniki Śląskiej PODEJMOWANIE DECYZJI NA PODSTAWIE TEORII GIER WYKORZYSTUJĄC ZASADY GRY Z NATURĄ Streszczenie. Praca dotyczy podejmoania decyzji sytuacjach konfliktoych. Konflikt ystępuje pomiędzy człoiekiem decydującym o eksploatacji ęgla kopalni a Naturą reprezentoaną przez górotór. W pracy omóiono trzy zasady podejmoania decyzji: - zasada minimalnego ryzyka, - skaźnik pesymizmu-optymizmu, - zasada rónych pradopodobieńst. MAKING DECISIONS ON THE BASIS OF THE GAME THEORY MAKING USE OF THE PRINCIPLES OF THE GAME IN AGRE- EMENT WITH NATURE Summary. The paper deals ith making decisions in conflict situations. The conflict occurs beteen a man deciding about coal mining and Nature represented by rock mass. Three principles of making decisions have been discussed in the paper: - the principle of minimal risk, - the indicator of pessimism-optimism, - the principle of equal probabilities.
78 Stanisła Koalik ПPИHЯТИE PEШEНИЙ_ HA OCHOВAHИИ TEOPИИ ИГP, ИCПOЛЗУЮЩИХ ПPИHЦЫПЫ ИГPЫ C НATУPOЙ Peзюмe. Paбoтa кacaeтcя пpинятия peшeнлияв кoнфликтной oбcтaнoвкe. Кoнфликт выcтупaет мeжду человеком пpинимaющим peшениe oб эксплоатации угля нa шaхтe, и Природой, в лицe которой выступает эдесь горный массив. B paбoтe пpeдcтaвлeны тpи пpинципa пpинятия peшений: - пpинцип минимaльного pиcкa, - пpинцип пeccимиэма-oптимиэма, - пpинцип paвныx вepoятноcтeй.. SFORMUŁOWANIE PROBLEMU Będziemy zajmoali się podejmoaniem decyzji sytuacjach konfliktoych. Konflikt będzie ystępoał pomiędzy człoiekiem decydującym o eksploatacji ęgla kopalni a Naturą reprezentoaną przez górotór. Sytuacje konfliktoe bada teoria gier o sumie zeroej [; 3; 4; 5; 6; 8; 9; 0]. W teorii gier zakłada się że partnerzy uczestniczący grze mają do dyspozycji szereg strategii działania do yboru. W dalszej części naszych rozażań ograniczymy się do gier duosoboych. Można je łaty sposób zilustroać postaci macierzy ypłat. Przyjmujemy, że partner (gracz ) ma do dyspozycji strategii A,..., A m, natomiast partner (gracz ) ma do dyspozycji strategie B,..., B n. Pokazane to jest na poniższej macierzy ypłat W. B B B n W A A A m. m. m......... n n. mn ()
Podejmoanie decyzji na podstaie... 79 Ponieaż nam będzie zależało na minimalizacji strat ziązanych z eksploatacją, to ielkość ij będzie oznaczała ypłatę dla drugiego gracza przypadku, gdy gracz i zdecyduje się na strategię A i, a gracz na strategię B j. Wypłata ij jest rónocześnie stratą dla gracza. Innymi słoy, przy zastosoaniu pary strategii (A i, B j ) gracz płaci graczoi ielkość ij. Graczoi zależy na maksymalizacji zysku, a graczoi na minimalizacji strat. Metody znajdyania strategii optymalnych są opisane pracach [; 3; 4; 5; 6; 8; 9; 0]. Dla przypomnienia omóimy tylko krótko trzy podstaoe pojęcia teorii i gier: zasadę dominacji, punkt siodłoy oraz strategie mieszane. Móimy, ze strategia A k dominuje nad strategią A gracza pierszego, gdy kj lj (j=,..., n). () j Móimy, że strategia B r dominuje nad strategią B s gracza drugiego, gdy ir is, (i=,..., m). (3) i O strategii A l móimy, ze jest zdominoana przez A k, a strategia B s jest zdominoana przez B r. Z zasady dominacji ynika, że z macierzy ypłat W należy usunąć strategie zdominoane. Pomaga to uprościć grę eliminując z rozażań strategie, które nie będą użyane. Móimy, że gra posiada punkt siodłoy, jeżeli istnieje para strategii (A k, B l ) taka, że kl min max ( ij ) max min ( ij ). (4) i j j j W tym przypadku strategie (A k, B l ) spełniające arunek (4) nazyamy optymalnymi dla obydu graczy. Jeżeli gra nie posiada punktu siodłoego oraz jest ielokrotnie potarzana, stosuje się strategie mieszane. Strategia mieszana polega na tym, że gracz stosuje na przemian różne soje strategie z określoną częstotliością. Znajdyanie tych częstotliości opisane jest pracach [; 3; 4; 9; 0]. My nie będziemy się tym zajmoać, ponieaż nie to jest naszym celem. Jeżeli gra nie posiada punktu siodłoego i jest ykonyana tylko jeden raz, to gracz poinien obliczyć cenę gry V określoną zorem V max min ( ij ). (5) j i Wskaźnik "i" ystępujący przy yznaczeniu dolnej ceny V określa strategię maksyminoą A i dla gracza. Gracz poinien obliczyć górną cenę V edług zoru V min max ( ij ). (6) i j
80 Stanisła Koalik Wskaźnik "j" ystępujący cenie V określa strategię minimaksoą B j dla gracza. Przyjmujemy teraz, że graczem będzie Natura reprezentoana przez górotór. Naturę będziemy traktoali jako naszego ryala, który starza sytuacje niebezpieczne dla pracy górnikó. Zjaiskami niebezpiecznymi, z którymi spotykają się górnicy na dole kopalni, mogą być strząsy, tąpnięcia, ycieki ody, ulatnianie się gazu itp. Te zjaiska są skieroane przeciko bezpieczeństu górnikó. Naszym zadaniem będzie podejmoanie decyzji minimalizujących poziom zagrożenia. Ponieaż Natura nie potrafi rozumoać tak jak człoiek, nie potrafi stosoać zasady dominacji czy określać punkt siodłoy, możemy ięc przypuszczać, że nie zasze będzie stosoała soją strategię najgorszą dla górnikó. W ziązku z tym postały pene metody ykorzystujące ten fakt [].. ZASADA MINIMALNEGO RYZYKA Nasze rozażania rozpoczniemy od prostego przykładu ilustrującego istotę zagadnienia. Przykład Niech gracz, tzn. My, ma do dyspozycji die strategie: A - urabianie calizny ęgloej materiałem ybuchoym A - urabianie calizny ęgloej maszyną. Gracz, tj. Natura, ma następujące strategie: B - yrzuty gazó i skał, B - ypły ody, B 3 - ypły kurzaki, B 4 - opad skał z nie zabezpieczonego stropu lub ociosu, B 5 - opad skał z nie zabezpieczonej calizny, B 6 - zagrożenie gazoe dutlenkiem ęgla, B 7 - zagrożenie metanoe, B 8 - tąpania. My przy yborze naszej strategii musimy kieroać się stopniem zagrożenia pracujących górnikó dla każdej naszej strategii odniesieniu do sytuacji niebezpiecznych określonych strategiami Natury. Ten stopień zagrożenia będziemy określali procentach, np. 0% oznacza, że dane zjaisko niekorzystne określonej naszej strategii nie ystąpi, czyli bezpieczeństo górnikó ze zględu na to niekorzystne zjaisko jest całkoite, tj. stuprocentoe. W celu zilustroania tego zagadnienia przyjmujemy konkretne artości liczboe naszej przykładoej grze.
Podejmoanie decyzji na podstaie... 8 Natura B B B 3 B 4 B 5 B 6 B 7 B 8 A 4 5 5 5 9 7 0 5 W My (7) A 9 6 5 6 0 5 5 Jest to macierz ypłat W dla gracza, tzn, dla Natury. Klasyczna teoria gier nakazuje zbadać, czy są strategie dominujące, a następnie znaleźć punkt siodłoy gry (o ile jest). Analizując macierz ypłat W idzimy, że Natura posiada strategie dominującą B 3 nad pozostałymi, ponieaż i 3 ij (8) i Po yeliminoaniu z gry strategii zdominoanych Nam pozostaje jedynie zdecydoać się na strategię A garantującą, że stopień zagrożenia górnikó nie przekroczy 5%. Natomiast strategia A garantuje, że zagrożenie nie przekroczy 6%. Tak ięc strategiami optymalnymi tej grze myśl klasycznej teorii gier są A dla Nas i B 3 dla Natury. Garantuje to poziom zagrożenia górnikó nie iększy od 5%. W naszych rozażaniach braliśmy pod uagę to, że Natura celoo i śiadomie ybierze strategię B 3 lepszą dla siebie, a gorszą dla Nas tym celu, aby ziększyć nasze zagrożenie. Zasada minimalnego ryzyka nie czyni takiego założenia. Przyjmuje się tu, że Natura rónie dobrze może ybrać inną strategię. My natomiast przy yborze strategii będziemy kieroali się minimalnym ryzykiem dla Nas. Analizując jeszcze raz macierz ypłat W ydaje się, że lepiej zdecydoać się nam na strategię A. Ryzykujemy tu ziększenie zagrożenia o % przy zastosoaniu przez Naturę strategii B3 (6% zamiast 5%), ale możemy zmniejszyć zagrożenie przy zastosoaniu innych strategii B j. Zasadę minimalnego ryzyka określił pierszy L. Savage [7]. Polega ona na tym, że dla każdej strategii Bj Natury określamy ielkość ryzyka pierszego gracza przy poszczególnych jego strategiach. Prześledzimy to na macierzy W z przykładu. Zakładając, że Natura zastosuje strategię B, My ryzykujemy utratę % obracając strategię A, natomiast nic nie ryzykujemy obierając strategie A. Przyjmując teraz, że Natura zastosuje strategię B, My nic nie ryzykujemy obierając A, natomiast ryzykujemy utratę 4% przypadku obrania A itd. W ten sposób torzymy macierz ryzyka R. Natura B B B 3 B 4 B 5 B 6 B 7 B 8 A 0 0 0 5 0 0 0 R My (9) A 0 4 0 0 3 5 0
8 Stanisła Koalik Do tej macierzy stosujemy strategie minimaksoą W każdym ierszu znajdujemy element najiększy. Z tych elementó ybieramy najmniejszy Numer iersza tak ybranego elementu skazuje na strategię, którą mamy zastosoać W naszym przypadku mamy min i max j ( ) min( 0, 5) 5. (0) ij Liczba 5 ystępuje drugim ierszu. Tak ięc ybrana strategię myśl zasady minimalnego ryzyka jest strategia A. 3. WSKAŹNIK PESYMIZMU-OPTYMIZMU Zasada skaźnika pesymizmu-optymizmu została opracoana przez L. Huricza []. Wynika z niej, że każdym ierszu macierzy ypłat W należy znaleźć elementy minimalne i maksymalne: min i = min ( ij ), () max i = max ( ij ), () (i =,..., m; j =,..., n). Wielkości min i oraz max i stanoią oceny: optymistyczna i pesymistyczna strategii A i. Dla każdej decyzji A i gracza pierszego, tj. dla Nas określamy ocenę, która jest kombinacją linioą ielkości min i oraz max i, tj. kombinacją oceny optymistycznej i pesymistycznej. -ocenę strategii A i określamy jako -ocena A i = min i + ( - ) max i (3) Wielkość może przybierać artości z przedziału [0,]. Dla =0 odpoiada to pesymistycznej zasadzie minimaksoych strategii, tj. strategii bezpiecznych i traktoaniu gry jako zeroej. Dla = odpoiada to poszukianiu strategii minimalizujących ypłatę przy spółudziale partnera, tj. Natury. Wszystkim pozostałym artościom odpoiadają pene fazy pośrednie. Dobór spółczynnika zależy od nas. Możemy uznać, że przypadki optymistyczne mają iększą szansę ystąpienia niż pesymistyczne lub odrotnie. Po obliczeniu szystkich -ocen ybieramy strategię A i, która uzyskała najniższą ocenę
Podejmoanie decyzji na podstaie... 83 Przykład Mamy do dyspozycji następujące strategie dotyczące sposobu kieroania stropem przy robotach ybierkoych eksploatacyjnych: A - na zaał A - z podsadzką suchą, A 3 - z podsadzką hydrauliczną Natura będzie miała te same strategie, co przykładzie. Macierz W przedstaia się następująco: Natura B B B 3 B 4 B 5 B 6 B 7 B 8 A 5 0 3 30 0 6 3 W My A 8 7 3 6 0 5 5 (4) A 0 9 7 5 0 4 30 3 Należy yznaczyć, którą strategię przeci Naturze ma ybrać gracz (tzn. My), ykorzystując skaźnik pesymizmu-optymizmu. Dla strategii A, A i A 3 obliczamy -oceny: -ocena A = min + ( - ) max = 6 + 3( - ), (5) -ocena A = min + ( - ) max = 5 + 5( - ), (6) -ocena A 3 = min 3 + ( - ) max 3 = 4 + 5( - ), (7) Na podstaie dośiadczenia ustalono, że poinno ynosić 0,6. Uzgledniając tę liczbę otrzymujemy: -ocena A = 6 0,6 + 3 0,4 = 6,4, (8) -ocena A = 5 0,6 + 5 0,4 = 3,0, (9) -ocena A 3 = 4 0,6 + 30 0,4 = 4,4. (0) Najlepszą ocenę uzyskała strategia A. Tak ięc zasada skaźnika pesymizmuoptymizmu, że poinniśmy zastosoać strategię A.
84 Stanisła Koalik 4. ZASADA RÓWNYCH PRAWDOPODOBIEŃSTW Jeżeli grze przeci Naturze nie mamy żadnych danych czy przesłanek, które strategie Natury są bardziej lub mniej pradopodobne, to stosujemy zasadę tz. rónych pradopodobieńst. Uażamy, że jeżeli Natura dysponuje n strategiami B,..., Bn, to każda z tych strategii ma pradopodobieństo ystąpienia /n. Zasada rónych pradopodobieńst zakłada, że Natura stosuje strategię mieszaną ze spółczynnikami dla każdej strategii czystej /n. Dla każdej strategii Ai obliczamy jej artość stosując zór n artość A i = ij, (i=,..., m). () n j Wybieramy strategie, która ma najmniejszą artość. Przykład 3 Mamy do dyspozycji die strategie dotyczące iercenia ęglu lub skale płonnej: A - iercenie iertarką elektryczną, A - iercenie iertarką pneumatyczną Natura będzie miała te same strategie, co przykładzie. Macierz W przedstaia się następująco: Natura B B B 3 B 4 B 5 B 6 B 7 B 8 A 9 0 8 0 5 0 40 0 W My () A 9 0 4 4 5 0 4 4 Należy yznaczyć strategię, którą poinien zastosoać gracz ykorzystując zasadę rónych pradopodobieńst. Dla strategii A i A obliczamy artości: artości A = (9+0+8+0+5+0+40+0)/8 = 9, (3) artości A = (9+0+4+4+5+0+4+4)/8 = 5. (4) Mniejszą artość posiada strategia A i tę ybieramy.
Podejmoanie decyzji na podstaie... 85 5. ZAKOŃCZENIE Jak idać na przykładzie, zaprezentoane metody mogą skazać inną strategię, niż to ynikało z zasady minimaksu. W przykładzie zasada minimalnego ryzyka skazała na strategię A, jako korzystniejszą dla nas. Klasyczna teoria gier skazała na strategie A. Zaprezentoane metody grach przeci Naturze ykorzystują fakt, że Natura nie jest istotą myślącą i nie zasze złośliie staia nas najgorszej sytuacji. W klasycznej teorii gier ykorzystującej pojęcie punktu siodłoego yznaczamy strategie bezpieczna dla nas, która garantuje, że ypłata nie będzie yższa pomimo stosoania doolnych strategii przecinika. W grach przeci Naturze te ypłatę możemy zmniejszyć stosując prezentoane metody. LITERATURA [] Huroicz L.: Optimality Criteria for Decision Making Under Ignorance. Coles Commission Discussion Paper. Statistics No 370, 95. [] Kofler E.: Wstęp do teorii gier. PZWS, Warszaa 963. [3] Luce R.D., Raiffa H.: Gry i decyzje. PWE, Warszaa 964. [4] Oen G.: Teoria gier. PWN, Warszaa 975. [5] Potocki Cz., Przybyła H.: Badania operacyjne górnictie. Skrypt Pol. Śl. nr 906, ser. Górnicto, Gliice 980. [6] Sadoski W.: Teoria podejmoania decyzji. PWE, Warszaa 976. [7] Savage L.J.: The theory of statistical decision. Journal of the Amercan Statistical Associoation No 46. 95. [8] Śierniak A.: Podejmoanie decyzji sytuacjach konfliktoych. Skrypt Pol. Śl. Nr 40, Automatyka, Gliice 988. [9] Tyszka T.: Konflikty i strategie, WNT, Warszaa 978. [0] Williams J.D.: Strateg doskonały. Wproadzenie do teorii gier. PWN, Warszaa 965. Wpłyneło do Redakcji październiku 993 r. Recenzent: Dr hab. Józef DREWNIAK
86 Stanisła Koalik Abstract The paper deals ith making decisions in conflict situations. The conflict occurs beteen a man deciding about coal mining and Nature represented by rock mass. The conflict situations are examined by the theory of zero-sum games [], [3], [4], [5], [6], [8], [9], [0]. It is assumed in the theory of games that the partners taking part in a game have some strategies of action at their disposal. We asssume that the partner (the player ) has strategies A,..., A m, at his disposal, hile the partner (the player ) has strategies B,..., B n at his disposal. The paper presents three basic notions of the theory of games: domination principle, saddle point and mixed strategies. Nature represented by rock mass has been assumed to be the player. We treat Nature as our rival that creates situations dangerous for miners ork. Miners orking underground may face the folloing dangerous phenomena: tremors, bursts, atercourses, gas escape and the like. Our task is to make decisions maximizing the safety level. Since Nature cannot reason like a man and cannot apply domination principle or determine saddle point, e can presume it ill not alays use the strategy hich is the orst for the miners. Certain methods making use of this fact [] have been created, The paper presents theree principlres of taking decisions hich make use of the theory of the game against Nature: - the principle of minimal risk, - the indicator of pessimism-optimism, - the principle of equal probabilities. The principle of minimal risk consista in determining the degree of the risk of the first player in each of his strategies for each strategy B j of Nature. In this ay the matrix of the risk R is formed. The minimax strategy is applied to the matrix. We find the greatest element in every line. Then e choose the least element from the greatest elements. The number of the line of the element chosen in that ay points at the strategy that e are to apply. In order to determine the indicator of pessimism-optimism it is necessary to find minimal and maximal elements in every line of the payoff matrix W. These elements are pessimistic and optimistic estimates for every strategy A i. We determine -estimate for every strategy A i. That estimate is a linear combination of the pessimistic estimate and the optimistic one. We choose the strategy hich has gained the highest -estimate. The principle of equal probabilities assumes that Nature applies its strategies B,..., B n ith the same probability /n. We calculate the value equal to the arithmetic mean from i-line of the matrix W for every strategy Ai. We choose the strategy that has the greatest value.