Stansław KOWALIK e-mal: skowalk@wsb.edu.pl Wyższa Szkoła Bznesu Dąbrowa Górncza RÓWNOWAGA STACKELBERGA W GRACH SEKWENCYJNYCH Streszczene Praca dotyczy nekooperacynych sekwencynych ger dwuosobowych o sume nezerowe. Gracz, który ako perwszy wykonue ruch nazywany est leaderem, a gracz drug nazywany est followerem. W pracy rozważono różne przypadk. Gracze mogą dążyć do maksymalzac lub mnmalzac wygrane. Na podstawe macerzy gry określa sę tzw. punkt równowag Stackelberga, t. parę optymalnych strateg. Rozważono też przypadek, gdy role graczy są odwrotne t. gracz drug B est leaderem, a gracz perwszy A est followerem. 1. Wstęp Rozważana dotyczą ger dwuosobowych o sume nezerowe. Gracze wyberaą koleno swoe stratege. Gracz A, który ako perwszy wykonue ruch nazywany est leaderem, a gracz drug B nazywany est followerem. Przymuemy, że gracz A dysponue strategam 1,, m, a gracz B dysponue strategam 1,, n. Gracz A operue macerzą wypłat {a }, a gracz B macerzą wypłat {b } 1,, m; 1,, n). Graczom może zależeć na maksymalzac lub mnmalzac wypłaty. Zakładamy, że gracz A we czy gracz B chce maksymalzować lub mnmalzować swoą wypłatę. Wtedy możlwe est wyznaczene dla każde strateg nalepsze z punktu wdzena gracza B odpowedz. Rozważymy różne przypadk prowadzena take gry. Celem będze określene pary strateg, ) będące w równowadze Stackelberga nacze pary strateg będące rozwązanem równowag Stackelberga oraz wynku gry t. pary lczb będących wypłatam gry dla graczy. Rozważana będzemy lustrowal na przykładowych macerzach wypłat: A : 1 1 8 8 9 B : 1 1 8 9.
. Gracze A B maksymalzuą swoe wypłaty Gracz A określa dla każde swoe strateg nalepszą z punktu wdzena gracza B odpowedź daącą nawększą wartość wypłaty. Takch strateg może być węce. Dla ustalone strateg oznaczamy przez R) zbór numerów k strateg gracza B takch, że dla każdego 1,, n) est spełnone b k b R) {k : b b } 1) k Stratege Stackelberga o numerze dla leadera A wyznaczamy z równana mn a R ) max mn a R) SA) ) gdze SA) oznacza tzw. koszt Stackelberga. Wskaźnk R ) określa odpowedź strateg, ) followera B na strategę leadera A. Para est rozwązanem równowag Stackelberga. Para wypłat a ) est wynkem te gry t. wynkem równowag w sense Stackelberga. W rozważanym przykładze określamy naperw zbory R) według wzoru 1). R1) {k : b b } {}, R) {k : b b } {,}, R) 1k 1 {k : b b } {1,,}, R) {k : b b } {} k k k. ) Numer strateg optymalne gracza A wyznaczamy na podstawe równana ) max mn a R) max{a 1 maxmn a,mna R1), mn a 1 R) ),mna } max{,mn,),mn,,9),} max,,,) Następne określamy. R ) R1) {}. 1, mn a R) ), mn a R) ) 1 Mamy węc, że rozwązanem równowag Stackelberga w te grze est para strateg, a odpowadaącym wynkem est para wypłat w te grze, ) 1, ) a ) a ),8). 1 1. Gracze A B mnmalzuą swoe wypłaty Gracz A określa dla każde swoe strateg nalepszą z punktu wdzena gracza B odpowedź daącą namneszą wartość wypłaty. Takch strateg może być węce. Dla ustalone strateg oznaczamy przez R) zbór numerów k strateg gracza B takch, że dla każdego 1,, n) est spełnone b k b
R) {k : b b } ) Stratege Stackelberga o numerze dla leadera A wyznaczamy z równana max a R ) gdze SA) oznacza tzw. koszt Stackelberga. Wskaźnk R ) określa odpowedź strateg, ) k mn maxa R) SA) followera B na strategę ) leadera A. Para est rozwązanem równowag Stackelberga. Para wypłat a ) est wynkem te gry t. wynkem równowag w sense Stackelberga. W rozważanym przykładze określamy naperw zbory R) według wzoru ). R1) {k : b b } {}, R) {k : b b } {}, R) 1k 1 {k : b b } {}, R) {k : b b } {} k k k. ) Numer strateg optymalne gracza A wyznaczamy na podstawe równana ) mn maxa R) mn{a 1 mnmax a R 1), max a 1 R) Następne określamy. R ) R) {}, R) R) {}., max a R) } mn{,,,}, max a R ) ),. Mamy węc, że rozwązanem równowag Stackelberga w te grze są pary strateg ), ) a ) a ),,, z wynkem ), ), ) z wynkem a ) a ),).. Gracz A maksymalzue swoą wypłatę a gracz B mnmalzue Gracz A określa dla każde swoe strateg nalepszą z punktu wdzena gracza B odpowedź daącą namneszą wartość wypłaty. Takch strateg może być węce. Dla ustalone strateg oznaczamy przez R) zbór numerów k strateg gracza B takch, że dla każdego 1,, n) est spełnone b k b. Zbory R)wyznaczane są według wzoru ). Stratege Stackelberga o numerze dla leadera A wyznaczamy z równana ). Wskaźnk wyznaczamy ak poprzedno. W rozważanym przykładze zbory R) są określone wzoram ). Numer strateg optymalne gracza A wyznaczamy na podstawe równana )
max mn a R) max{a 1 maxmn a R1), mn a 1 R) Następne określamy. R ) R1) {}, R) R) {}., mn a R) } max,,,), mn a R) ) 1,. Mamy węc, że rozwązanem równowag Stackelberga w te grze są pary strateg, ), ) a ) a ),, 1, ), z wynkem ) 1 1 a ) a ) z wynkem ),).. Gracz A mnmalzue swoą wypłatę a gracz B maksymalzue Gracz A określa dla każde swoe strateg nalepszą z punktu wdzena gracza B odpowedź daącą nawększą wartość wypłaty. Takch strateg może być węce. Dla ustalone strateg oznaczamy przez R) zbór numerów k strateg gracza B takch, że dla każdego 1,, n) est spełnone b k b. Zbory R)wyznaczane są według wzoru 1). Stratege Stackelberga o numerze dla leadera A wyznaczamy z równana ). Wskaźnk wyznaczamy ak poprzedno. W rozważanym przykładze zbory R) są określone wzoram ). Numer strateg optymalne gracza A wyznaczamy na podstawe równana ) mn max a R) mn{a 1 mnmax a,maxa R1) mn{,,9,},max a ),maxa 1 R). Następne określamy. R ) R) {}. 1,maxa R ) ),max a R) ) } mn{, max,), max,,9),} Mamy węc, że rozwązanem równowag Stackelberga w te grze est para strateg, ), ) a ) a ),9)., a odpowadaącym wynkem est para wypłat w te grze. Gracze A B maksymalzuą swoe wypłaty. Gracz B est leaderem, a A followerem W takm przypadku można zastosować wzory rozważana zawarte w punkce. Należy ednak uprzedno zamenć macerze wypłat graczy A B oraz e transponować. Nazwy graczy też należy zamenć. Można też póść nną drogą zostawaąc nazwy oraz macerze
bez zman a zmodyfkować wzory. W takm przypadku dale gracz A będze dysponował macerzą {a }, a gracz B macerzą {b }. Tak też zrobmy. Wzory 1), ), ) będą teraz mały postać R) a }. ) Stratege Stackelberga o numerze dla leadera B wyznaczamy z równana mn b R ) k max mn b R ) SB) gdze SB) oznacza tzw. koszt Stackelberga. Wskaźnk R ) określa odpowedź followera A na strategę strateg, ) 8) leadera B. Para est rozwązanem równowag Stackelberga. Para wypłat a ) est wynkem te gry t. wynkem równowag w sense Stackelberga. W rozważanym przykładze określamy naperw zbory R) według wzoru ). 1) a } {1,}, ) a } {,}, R k1 1 R) k a R) k a R k R) k a } {}, } {1, }, } {}. 9) Numer strateg optymalne gracza B wyznaczamy na podstawe równana 8) max mn b R ) max{mnb maxmn b, mn b 11 1 R1) ),mnb 1 R) ), mn b R ),mnb, mn b } max{mn,), mn,),, mn,),} max{,,,,} Następne określamy. R ) R) {}. R) 1 ), mn b R) ). Mamy węc, że rozwązanem równowag Stackelberga w te grze est para strateg, ), ) a ) a ) 9,. z wynkem ). Gracze A B mnmalzuą swoe wypłaty. Gracz B est leaderem, a A followerem Wzory ), ), ) przedstawaą sę teraz następuąco R) a }. 1) Stratege Stackelberga o numerze dla leadera B wyznaczamy z równana max b R ) k mn max b R ) SB) 11)
gdze SB) oznacza tzw. koszt Stackelberga. Wskaźnk R ) określa odpowedź followera A na strategę strateg, ) leadera B. Para est rozwązanem równowag Stackelberga. Para wypłat a ) est wynkem te gry t. wynkem równowag w sense Stackelberga. W rozważanym przykładze określamy naperw zbory R) według wzoru 1). 1) a } {}, ) a } {}, R k1 1 R) k a R) k a R k R) k a } {,}, } {}, } {1,}. 1) Numer strateg optymalne gracza B wyznaczamy na podstawe równana 11) mn max b R ) mn{b 1 mnmax b, max b R1),maxb 1 R) ),max b,maxb )} mn{,, max,),, max,9)} mn{,,,,9} Następne określamy. R ) R1) {}. R) 1, max b R),max b R) ) 1. Mamy węc, że rozwązanem równowag Stackelberga w te grze est para strateg, ), ) a ) a ),. 1 z wynkem ) 1 1 8. Gracz A maksymalzue swoą wypłatę a gracz B mnmalzue. Gracz B est leaderem, a A followerem Gracz B określa dla każde swoe strateg nalepszą z punktu wdzena gracza A odpowedź daącą nawększą wartość wypłaty. Takch strateg może być węce. Dla ustalone strateg oznaczamy przez R) zbór numerów k strateg gracza A takch, że dla każdego 1,, m) est spełnone a k a. Zbory R)wyznaczane są według wzoru ). Stratege Stackelberga o numerze dla leadera B wyznaczamy z równana 11). Wskaźnk wyznaczamy ak poprzedno. W rozważanym przykładze zbory R) są określone wzoram 9). Numer strateg optymalne gracza B wyznaczamy na podstawe równana 11) mn max b R ) mn{maxb mnmax b, max b 11 1 R1) ),maxb 1 R) ),max b R),maxb, max b } mn{max,), max,),, max,),} mn{,,,,} Następne określamy. R ) R) {}. R) 1,max b R) ) ). 8
Mamy węc, że rozwązanem równowag Stackelberga w te grze est para strateg, ), ) a ) a ),. z wynkem ) 9. Gracz A mnmalzue swoą wypłatę a gracz B maksymalzue. Gracz B est leaderem, a A followerem Gracz B określa dla każde swoe strateg nalepszą z punktu wdzena gracza A odpowedź daącą namneszą wartość wypłaty. Takch strateg może być węce. Dla ustalone strateg oznaczamy przez R) zbór numerów k strateg gracza A takch, że dla każdego 1,, m) est spełnone a k a. Zbory R)wyznaczane są według wzoru 1). Stratege Stackelberga o numerze dla leadera B wyznaczamy z równana 8). Wskaźnk wyznaczamy ak poprzedno. W rozważanym przykładze zbory R) są określone wzoram 1). Numer strateg optymalne gracza B wyznaczamy na podstawe równana 8) max mn b R ) max{b 1 maxmn b, mn b,mnb R1) 1 R) ), mn b,mnb )} max{,, mn,),, mn,9)} max{,,,,} Następne określamy. R ) R) {}, R ) R) {} R ) R) {1,}, 1. R ) 1, mn b R), mn b R) ),,. ne może być z uwag na mnb 1, b )mn, 9)b 1 1. Mamy węc, że rozwązanem równowag Stackelberga w te grze są pary strateg, ), ) a ) a ),,, ),, ) 1, z wynkem ) a ) a a ) a11) ) z wynkem ),), ) z wynkem,). 1. Gracz A est leaderem maksymalzue swoą wypłatę. Gracz A ne zna kryterum optymalzac gracza B Może zastneć sytuaca, że gracz A, który perwszy podemue swoą decyzę ne we, czy gracz B chce maksymalzować czy mnmalzować swą wygraną w te grze. Gracz A mus ednak podąć akąś optymalną dla sebe strategę. Rozważa węc obydwe możlwośc gracza B. Określa stratege będące w równowadze Stackelberga w przypadku maksymalzac wygrane przez gracza B oraz w przypadku mnmalzac. Dla swoe strateg, która poawła sę w punkce równowag Stackelberga, w przypadku maksymalzac wy- 9
grane przez gracza B, określa dodatkowo strategę, która est nalepsza dla gracza B, gdyby gracz B zechcał mnmalzować swoe wgrane. Także dla swoe strateg, która poawła sę w punkce równowag Stackelberga, w przypadku mnmalzac wygrane przez gracza B, określa dodatkowo strategę, która est nalepsza dla gracza B, gdyby gracz B zechcał maksymalzować swoe wgrane. Te stratege na ogół daą różne wynk gry. Gracz A zna swoe wygrane w przypadku maksymalzac oraz mnmalzac wygrane przez gracza B. Poneważ ne we, ake kryterum optymalzac przyme gracz B, stosue zasady wyboru swoe strateg stosowane w grach z naturą. Zlustruemy to na wyże przedstawonych macerzach gry. W punkce otrzymalśmy, że rozwązanem est para strateg 1, ) z wynkem, 8). W punkce otrzymalśmy, że rozwązanem są stratege 1, ) z wynkem, ), ) z wynkem, ). Berzemy węc pod uwagę tylko stratege 1. Dla 1, gdy gracz B maksymalzue wygraną mamy 1, ) z wynkem, 8), a gdy gracz B mnmalzue wygraną mamy 1, ) z wynkem, ). Dla, gdy gracz B maksymalzue wygraną mamy, ) z wynkem, 9), a gdy gracz B mnmalzue wygraną mamy, ) z wynkem, ). Te wynk są zestawone w tabel 1. Tabela 1. Możlwe wynk w przypadku maksymalzac mnmalzac wygrane gracza B A max B max A max B mn stratege wypłaty stratege wypłaty 1 1, ), 8) 1, ), ), ), 9), ), ) W tabel symbolam A max B max zaznaczono sytuacę, gdy gracze A B dążą do maksymalzac wypłat, a symbolem B mn sytuacę, gdy gracz B dąży do mnmalzac swoe wypłaty. Gracza A nteresuą edyne ego wygrane, węc tabelę 1 przekształcamy do mnesze Tabela. Wygrane gracza A stratege A B max B mn 1 W tym przypadku stratega 1 domnue nad strategą gracz A pownen ą zastosować w przypadku neznaomośc kryterum optymalzacynego gracza B. 11. Gracz A est leaderem mnmalzue swoą wypłatę. Gracz A ne zna kryterum optymalzac gracza B Tak ak poprzedno w punkce 1, gracz A rozważa obydwe możlwośc gracza B. Określa stratege będące w równowadze Stackelberga w przypadku maksymalzac wygrane przez gracza B oraz w przypadku mnmalzac. Dla swoe strateg, która poawła sę w punkce równowag Stackelberga, w przypadku maksymalzac wygrane przez gra-
cza B, określa dodatkowo strategę, która est nalepsza dla gracza B, gdyby gracz B zechcał mnmalzować swoe wgrane. Także dla swoe strateg, która poawła sę w punkce równowag Stackelberga, w przypadku mnmalzac wygrane przez gracza B, określa dodatkowo strategę, która est nalepsza dla gracza B, gdyby gracz B zechcał maksymalzować swoe wgrane. Zlustruemy to na naszym przykładze. W punkce otrzymalśmy, że rozwązanem est para strateg, ) z wynkem, 9). W punkce otrzymalśmy, że rozwązanem są stratege, ) z wynkem, ), ) z wynkem, ). Berzemy węc pod uwagę stratege,. Dla, gdy gracz B maksymalzue wygraną mamy, ) z wynkem, ) oraz, ) z wynkem, ). Parę strateg, ) ne dopuszczamy do dalszych rozważań, a uwzględnamy tylko parę, ) dlatego, że wygrana dla gracza A ne est pewna. W rozważanach berze sę pod uwagę maxa, a )max, ) patrz punkt ). Gdy gracz B mnmalzue wygraną mamy, ) z wynkem, ). Dla, gdy gracz B maksymalzue wygraną mamy, 1 ) z wynkem, ),, ) z wynkem, ) oraz, ) z wynkem 9, ). Pary strateg, 1 ),, ) ne dopuszczamy do dalszych rozważań, a uwzględnamy tylko parę, ) dlatego, że wygrana lub dla gracza A ne est pewna. W rozważanach berze sę pod uwagę maxa 1, a, a )max,, 9)9 patrz punkt ). Gdy gracz B mnmalzue wygraną mamy, ) z wynkem, ). Dla, gdy gracz B maksymalzue wygraną mamy, ) z wynkem, 9). Gdy gracz B mnmalzue wygraną mamy, ) z wynkem, ). Te wynk są zestawone w tabel. Tabela. Możlwe wynk w przypadku maksymalzac mnmalzac wygrane gracza B A mn B max A mn B mn stratege wypłaty stratege wypłaty, ), ), ), ), ) 9, ), ), ), ), 9), ), ) Gracza A nteresuą edyne ego wygrane, węc tabelę przekształcamy do mnesze Tabela. Wygrane gracza A stratege A B max B mn 9 W tym przypadku stratega domnue nad strategą, poneważ gracz A dąży do mnmalzac swoe wygrane. Gracz A mus zdecydować sę na strategę lub. Wykorzystue metody stosowane w grach z naturą. Na podstawe zasady równych prawdopodobeństw oblczamy wartośc strateg ako średne arytmetyczne wygranych wartość + ) /, wartość + ) /. 1
mn wartość ),. To kryterum ne dało rozstrzygnęca, która stratega est lepsza. Stosuemy dodatkowe kryterum Walda przy mnmalzac wygrane). Oblczamy mneszą wartość z maksymalnych mn{max, ), max,)} mn,). To kryterum wskazało na strategę ako lepszą. 1. Wnosk W przypadku występowana klku punktów równowag w sense Stackelberga, leader ma taką samą wygraną dla różnych punktów równowag. Natomast follower ma różne wygrane. Gdyby celem leadera było osągnęce swoe wygrane, to może wybrać dowolną swoą strategę, która występue w punktach równowag. Jeżel natomast leader est nastawony antagonstyczne w stosunku do followera, to wybera taką swoą strategę spośród występuących w punktach równowag, która dae mneszą lub wększą) wygraną followera. 1. Lteratura [1] LASKOWSKI S.: Sekwencyna dwuosobowa gra konkurencyna o sume nezerowe. Telekomunkaca technk nformacyne -/. EQUILIBRIUM OF STACKELBRG IN SEQUENCIAL GAMES Abstract Work concerns non-cooperatwe sequencal two-person games about nonzero-sum. The player who as frst executes movement be called leader, and follower player second be called. Dfferent cases n work were consdered. The players can am to maxmzaton or the mnmzaton of payment. On bass of matrx of game defnes the pont of equlbrum Stackelberg,.e. of steam optmum strateges. It t case was consdered was also, when players' parts are opposte.e. player second B leader s and player frst And follower s.