STRATEGIE SEMI-KOOPERATYWNE W GRACH RÓŻNICZKOWYCH MODELUJĄCYCH PROBLEMY DUOPOLU

Podobne dokumenty
Reprezentacje grup symetrii. g s

F - wypadkowa sił działających na cząstkę.

max Wydział Elektroniki studia I st. Elektronika III r. EZI Technika optymalizacji Dr inż. Ewa Szlachcic

= σ σ. 5. CML Capital Market Line, Rynkowa Linia Kapitału

BADANIA OPERACYJNE. Podejmowanie decyzji w warunkach niepewności. dr Adam Sojda

Blok 7: Zasada zachowania energii mechanicznej. Zderzenia

Projekt 6 6. ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH CAŁKOWANIE NUMERYCZNE

Ćw. 5. Wyznaczanie współczynnika sprężystości przy pomocy wahadła sprężynowego

Metody Numeryczne 2017/2018

Definicje ogólne

XXX OLIMPIADA FIZYCZNA ETAP I Zadania teoretyczne

I..ROZWIĄZANIE DŹWIGARA DANEGO OD DANEGO OBCIĄŻENIA

Nieliniowe zadanie optymalizacji bez ograniczeń numeryczne metody iteracyjne optymalizacji

BADANIE SILNIKA INDUKCYJNEGO STEROWANEGO Z FALOWNIKA NAPIĘCIA

Eksploracja danych. Grupowanie danych

STATYSTYKA. Zmienna losowa skokowa i jej rozkład

4. Zjawisko przepływu ciepła

Zaawansowane metody numeryczne Komputerowa analiza zagadnień różniczkowych 1. Układy równań liniowych

OPTYMALIZACJA STRUKTURY PROCESÓW RYNKOWYCH

Diagonalizacja macierzy kwadratowej

POLITYKA DYWIDENDY. Podstawowy dylemat: ile zysku przeznaczyć na dywidendy, a ile zatrzymać w firmie i przeznaczyć na potrzeby jej dalszego rozwoju?

Dr Krzysztof Piontek. Metody taksonomiczne Klasyfikacja i porządkowanie

WYKORZYSTANIE DOMINACJI ZE WZGLĘDU NA RYZYKO DO PORZĄDKOWANIA WARIANTÓW W ZAGADNIENIACH DWUKRYTERIALNYCH PRZY NIEPORÓWNYWALNOŚCI KRYTERIÓW

5. Pochodna funkcji. lim. x c x c. (x c) = lim. g(c + h) g(c) = lim

Dla dzielnej X (dividend) i dzielnika D 0 (divisor) liczby Q oraz R takie, Ŝe

Fizyka 1- Mechanika. Wykład 6 10.XI Zygmunt Szefliński Środowiskowe Laboratorium Ciężkich Jonów

Zadanie 1. Podaj model matematyczny układu jak na rysunku: a) w postaci transmitancji, b) w postaci równań stanu (równań różniczkowych).

11/22/2014. Jeśli stała c jest równa zero to takie gry nazywamy grami o sumie zerowej.

WSPOMAGANIE PROJEKTOWANIA STRUKTURY CZASOWEJ PROCESÓW RYNKU ENERGII ELEKTRYCZNEJ

MATEMATYKA POZIOM ROZSZERZONY Kryteria oceniania odpowiedzi. Arkusz A II. Strona 1 z 5

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4

SPRĘŻYNA DO RUCHU HARMONICZNEGO V 6 74

EKONOMIA MENEDŻERSKA. Wykład 3 Funkcje produkcji 1 FUNKCJE PRODUKCJI. ANALIZA KOSZTÓW I KORZYŚCI SKALI. MINIMALIZACJA KOSZTÓW PRODUKCJI.

Natalia Nehrebecka. Zajęcia 4

Ą Ą

ć Ę ć ć ć ć ą

Zaawansowane metody numeryczne

ć Ę Ę ć Ę ć Ę Ę Ę

ż

Ą Ą Ł

Ż Ć Ź Ź Ż Ą Ą ć Ź Ź Ć Ę

Ę Ą Ż ć Ę Ż Ł ź

Ę Ą Ł Ę Ł ć

f 4,3 m l 20 m 4 f l x x 2 y x l 2 4 4,3 20 x x ,86 x 0,043 x 2 y x 4 f l 2 x l 2 4 4, x dy dx tg y x ,86 0,086 x

Proces narodzin i śmierci

Prawdopodobieństwo i statystyka r.

Wykład 4. Skręcanie nieskrępowane prętów o przekroju cienkościennym otwartym i zamkniętym. Pręt o przekroju cienkościennym otwartym

Zestaw zadań 4: Przestrzenie wektorowe i podprzestrzenie. Liniowa niezależność. Sumy i sumy proste podprzestrzeni.

RUCH DRGAJĄCY. Ruch harmoniczny. dt A zatem równanie różniczkowe ruchu oscylatora ma postać:

Parametry zmiennej losowej

ż ć ż ń Ń Ż ń ń ć ż ż ć Ż

3. Kinematyka podstawowe pojęcia i wielkości

Idea metody LINIE PIERWIASTKOWE EVANSA. Idea metody. Przykład. 1 s1,2 k

Badanie energetyczne płaskiego kolektora słonecznego

DRGANIA MECHANICZNE. materiały uzupełniające do ćwiczeń. Wydział Samochodów i Maszyn Roboczych studia inżynierskie

Kier. MTR Programowanie w MATLABie Laboratorium Ćw. 12

EFEKTYWNA STOPA PROCENTOWA O RÓWNOWAŻNA STPOPA PROCENTOWA

Pattern Classification

5. MES w mechanice ośrodka ciągłego

Wstęp do metod numerycznych Faktoryzacja SVD Metody iteracyjne. P. F. Góra

BADANIE STATYSTYCZNEJ CZYSTOŚCI POMIARÓW

p Z(G). (G : Z({x i })),

Rozwiązywanie zadań optymalizacji w środowisku programu MATLAB

ź ń ń

INSTYTUT ENERGOELEKTRYKI POLITECHNIKI WROCŁAWSKIEJ Raport serii SPRAWOZDANIA Nr LABORATORIUM TEORII STEROWANIA INSTRUKCJA LABORATORYJNA

Analiza Matematyczna Ćwiczenia. J. de Lucas

PRÓBA ANALIZY AUKCJI Z RÓśNYMI ROZKŁADAMI WYCEN WSTĘP

ż ż Ż Ł Ż Ś ć ż ć ż Ś

Udoskonalona metoda obliczania mocy traconej w tranzystorach wzmacniacza klasy AB

WYZNACZANIE CHARAKTERYSTYK DYNAMICZNYCH RAM Z TŁUMIKAMI MAXWELLA

WOJEWÓDZTWA PRZODUJĄCE W REALIZACJI REGIONALNYCH PROGRAMÓW OPERACYJNYCH W POLSCE W DRUGIEJ POŁOWIE 2008 ROKU

PROJEKTOWANIE SYSTEMU REGULACJI ZE WZGLĘDU NA ŻĄDANE WIDMO CZĘSTOŚCI

Optymalizacja funkcji

ć Ę ć Ę ź Ę

Metody probabilistyczne Rozwiązania zadań


Równania rekurencyjne na dziedzinach

Markowa. ZałoŜenia schematu Gaussa-

Ę Ż ż Ł ź ż ż ż ż

7. PLANY OPTYMALNE PODSTAWOWE ZAŁOŻENIA I KRYTERIA OPTYMALNOŚCI

Fizyka 1- Mechanika. Wykład 7 16.XI Zygmunt Szefliński Środowiskowe Laboratorium Ciężkich Jonów

KINEMATYKA MANIPULATORÓW

ź Ć Ż

ć ć ć

Ż ź Ł

Małe drgania wokół położenia równowagi.

N ( µ, σ ). Wyznacz estymatory parametrów µ i. Y które są niezależnymi zmiennymi losowymi.

MIKROEKONOMIA Prof. nadzw. dr hab. Jacek Prokop

Ą Ę Ł Ą Ż

ź Ź Ź ć ć ć ź ć ć ć ć ć Ź

Ę ź Ą

ż ą Ę ą ą Ż ą ż ż ą Ż Ż ż ą ą ż ć Ż Ź ż ż ą ą Ł ć Ó ż Ó Ć

Ą ŚĆ Ś Ś Ę ć

Ł Ą Ł Ł ć

Ł

Ł

DOSTOSOWANIE METOD BADANIA ROZBIEŻNOŚCI DESENI PRÓBEK DO PERCEPCJI CZŁOWIEKA

Ą Ą Ł Ą

1.7 Zagadnienia szczegółowe związane z równaniem ruchu Moment bezwładności i moment zamachowy

Ę

Transkrypt:

Studa Eonoczne. Zezyty auowe Unwerytetu Eonocznego w Katowcach ISS 083-86 r 4 05 Inforatya Eonoetra 3 Joanna Zwerzchowa Unwerytet Mołaja Koerna w Torunu Wydzał Mateaty Inforaty Katedra elnowej Analzy Mateatycznej Toolog joanna.zwerzchowa@at.u.l STRATEGIE SEMI-KOOPERATYWE W GRACH RÓŻICZKOWYCH MODELUJĄCYCH PROBLEMY DUOPOLU Strezczene: Dynaczne odele duoolu ą obete zantereowana oób zajujących ę teorą ger od welu lat. Tyowy odejśce do rozwązana ta zadanego robleu jet ozuwane równowag aha wśród trateg w ętl zanętej. Soób ten oera ę na oocnczy wyorzytanu funcj wartośc tóre ełnają uład równań różnczowych czątowych erwzego rzędu. etety uzyany w ten oób uład w ogólnośc ne jet dobrze otawony roblee co oznacza że nezaadne jet ozuwane nuerycznego rozwązana zagadnena. owy odejśce ą tratege e-ooeratywne ozwalające na badane urytej ooeracj ędzy gracza. W ty wyadu uład równań różnczowych oujących funcje wyłaty jet herbolczny co jet nezbędne by jego rozwązane tnało było wyznaczone jednoznaczne. Teora ta oże być efetywne wyorzytana w rzyadu odelu Lanchetera co zotane oazane w nnejzy artyule. Słowa luczowe: gry różnczowe odelujące duool odel Lanchetera tratege e-ooeratywne herbolczne równana różnczowe czątowe. Wrowadzene Badacze zajujący ę gra różnczowy rzed rzytąene do analzy uzą zdecydować o dwóch rawach. Perwza to oreślene rodzaju ntereującego ch rozwązana. Standardowo w grach neooeracyjnych rozważa ę równowagę aha jao rozwązane otyalne. atęne należy oreślć zbór nforacyjny do tórego ają dotę gracze rzed odjęce decyzj.

Stratege e-ooeratywne w grach różnczowych... 75 ajrotzą otacą zboru nforacyjnego jet odcne obrazujący cza w ja a być rozgrywana gra. Oznacza to że trategą gracza jet funcja dzałająca na zadany rzedzale w zbór douzczalnych wyborów gracza. Stratege tae nazyway tratega w ętl otwartej. Podejśce oarte na trategach w ętl otwartej jet bardzo dobrze oane w lteraturze [n. Baar Older 999; Docner n. 000]a co ważnejze równowaga aha w ętl otwartej jet efetywne wylczalna w rzyadach erycznych. e jet to jedna rozwązane racjonalne w ażdej ytuacj. Łatwo zauważyć że odejowane decyzj oerając ę tylo na chwl w jaej znajduje ę gra ne jet realtyczny założene. W welu ytuacjach najważnejzy czynne decydujący o wyborze zachowana jet tan w ja znajduje ę uład. ajrotzy rzyłade jet roble otyalzacyjny gdze jeden gracz ooba terująca eruje ojazde w ta oób aby dojechać do wyznaczonego celu. Kerowca ngdy ne decyduje o erunu jazdy czy rędośc aochodu oługując ę tylo zegare. Sterujący u oberwować drogęczyl śledzć tan w tóry znajduje ę ojazd. Stratege zależneod czau tanu uładu nazyway tratega w ętl zanętej. Przedote onżzego artyułu jet rzedtawene otatnch wynów dla robleu znalezena otyalnego rozwązana gry różnczowej o dynace zadanej równane: & f ϕ u u ψ Standardowa defncja rozwązana gry neooeracyjnej równowaga aha ne jet dobry wyjśce ze względu na roble brau tablnośc uładu oującego funcję wyłat w ty rzyadu. W artyule zotaną nareślone robley jae wytęują rzy rozważanu równowag ahaw ętl zanętej oraz zotaną wonane etody oradzena obez ty roblea. W ecj drugej zotane rzedtawone nowe odejśce [Brean Shen 004] czyl tratege e-ooeratywne uwzględnające urytą ooerację ędzy gracza. W ogólnośc rozwązane robleu rzy tych trategach ne jet równowaga aha. Podtawową zaletą tego odejśca jet fat ż ułady tóre ą generowane rzez tego tyu tratege ają włanośc ozwalające na ozuwane rozwązań w oób nueryczny. etety w obecnej chwl ne a gotowych algorytów. Do oreślena trateg e-ooeratywnych wyorzytuje ę ojęce Pareto-otyalnośc. W wyborze jednego z ożlwych otów Pareto uryta jet ooeracja graczy. Powtaje roble w ja oób gracze ownn doonywać jednoznacznego wyboru aby wyelecjonowany unt ełnał oczewana

76 Joanna Zwerzchowa zarówno graczy ayalzacja zyów ja badaczy warune ownen eć włanośc ozwalające na znalezene zuanego untu w oób analtyczny. Oazuje ę że wyorzytując rozwązane aha dla robleów rzetargowych ożna oreślć unt Pareto otyalny dający wybór racjonalny analtyczne wylczalny w rozważanych rzyadach. Wybór ten uwzględna równeż ewentualną rzewagę jednego gracza nad drug. Otatna część artyułu rzedtawa zatoowane wcześnej wrowadzonej teor do gry różnczowej tórej dynaa zadana jet rzez odel Lanchetera. Perwotne łużył on do ou dzałań wojennych jedna od drugej ołowy lat 50. XX w. funcjonuje jao odel duoolu. a rzetrzen lat odel ten wyorzytywano zarówno w rozważanach teoretycznych [Breton n. 996; Jarrar n. 004] ja do badań erycznych analzujących ryn tae ja: Coca-Cola v Pe-Cola Marlboro v Wnton aeroy czy Anheuer-Buch v Mller wo [Chntagunta Vlca 99; Ercon 99; Fruchter Kalh 997; Wang Wu 00; Breton n. 006]. W artyule zotane rzedtawona rocedura wyznaczana trateg e-ooeratywnych dla duoolu Lanchetera.. Gry różnczowe tratege w ętl zanętej Gry różnczowe ładają ę z równana różnczowego oującego tan uładu oraz z funcjonałów obrazujących wyłaty graczy na onec rozgryw. Stratege wybrane rzez uczetnów gry wływają na ewolucję tanu uładu w czae oraz na wyłaty graczy. Przedote dalzych rozważań jet gra różnczowa w tórej onuruje ze obą dwóch rzecwnów. Ewolucja tanu uładu w czae jet zadana natęujący równane różnczowy: & F u u gdze R wraz z warune oczątowy: n u u R τ y R Gracz erwzy drug uzą odjąć decyzję o wyborze trateg odowedno u u w ta oób by ayalzować wój funcjonał zyu: t J t T τ y u u g T h t u t dt gdze 3 τ

Stratege e-ooeratywne w grach różnczowych... 77 Funcja zyu ońcowego -tego gracza: głada a funcja oztów ośrednch -tego gracza: g : R R jet neujena n h : R R R jet funcją gładą taą że funcja h jet ścśle wyuła dla dowolnego R. Powyżze obety ą zaane rzy użycu terowań w ętl otwartej u t u t zależą tylo od zennej czau. Jeśl gracze toują terowana w ętl zanętej t to wtawając je do równana ożna znaleźć zwązaną u z ty tratega trajetorę t. Oznaczając u t u t t oreśla ę terowana w ętl otwartej wyznaczonerzez wybrane terowana w ętl zanętej. Powyżzy za a en w rzyadu obu rodzajów terowań. Podtawowy narzędze łużący do otyalzacj wyłat w grach neooeracyjnych jet ojęce równowag aha. Defncja. ech U będze zbore terowań w ętl zanętej -tego gracza tzn. U { u :[ τ T ] R R } dla. Równowagą ahaw n ętl zanętej dla robleu 3 nazyway arę trateg u u U U ełnającą natęujące warun:. Dla dowolnego u U zachodz: J τ y u u J τ y u u.. Dla dowolnego u U zachodz: J τ y u u J τ y u u. Gracz używający trategę równowag aha a zagwarantowane że jego rzecwn ne zya toując dowolną nną trategę w ętl zanętej. Standardową rocedurą wyznaczana równowag aha w ętl zanętej jet znalezene ogranczonych gładch funcj V τ y ełnających uład równań Haltona Jacobego Bellana: V V t t wraz z warune ońcowy: gdze Haltonany H H H V V V V V T g V T g 0 0 4 5 3 : R R oreślone ą za oocą natęującego algorytu. Z roblee 3 towarzyza ę funcjonały natychatowego zyu: Y u u F u u h u dla

78 Joanna Zwerzchowa Przy utalonych R rozważa ę grę tatyczną dla dwóch graczy Y oraz u u gry tatycznej o wyłatach zadanych funcja odowedno Y. Równowaga aha { Y Y } wyznacza Haltonanyw uładze 4 w natęujący oób: H Y u u Zwąze rozwązana V robleu 4 5 z równowagą aha w ętl V zanętej robleu 3 wyazuje natęujące twerdzene. Twerdzene. Przy owyżzych oznaczenach jeśl u u H H ą funcja gład oraz tneje V V V jedyne rozwązane layczne zagadnena 4 5to tratege w ętl zanętej zdefnowane natęująco: u * t u V t V t ą równowagą aha w ętl zanętej robleu 3 a funcje wyłaty wyznaczone rzez te terowana: J τ y J τ y u u ełnają równość: J τ y V τ y dla ażdego τ [ 0 T ] y R. Dowód owyżzego twerdzena ożna znaleźć w racy Baara Oldera [999]. Procedura znalezena równowag aha w ętl zanętej jet oreślona w onretny oób jedna aby znaleźć te tratege otrzebne ą gradenty funcj wyłaty właśne rzy tych zuanych trategach. Obety wytęujące w roblee ą ze obą uwłane w totny tonu. Warto zauważyć że rzy rozważanu terowań w ętl zanętej ozuwane rozwązana robleu 3 [zadanego zagadnene oczątowy] zotaje zaenone na roble rozwązana uładu 4 5 wytęującego w otac zagadnena ońcowego. Manaent Twerdzena. ryje ę w face ż bardzo rzado zdarza ę by otyalne terowana funcje wyłaty odowadające były funcja gład. To rawa że twerdzene o że bardzo wartoścowe teoretyczne a ałe zatoowane w ratyce. Dodatowo ja oazal Brean Shen [004] w ogólnośc zagadnena tyu 4 5 generowane rzez równowagę aha ne ą dobrze otawony roblea. Zagadnene jet dobrze otawony

Stratege e-ooeratywne w grach różnczowych... 79 roblee gdy oada jednoznaczne rozwązane tóre jet zależne w oób cągły od warunów oczątowych. Uwaga Breana Shen otawła od znae zaytana zaadność ozuwana rozwązana nuerycznego ta zadanego robleu gdyż jet on nezwyle czuły na wzele nawet najdrobnejze zany warunów oczątowych.. Stratege e-ooeratywne Równowaga aha w ogólnośc generuje ułady netablne dlatego owtało ytane ja radzć obe z roblee znalezena otyalnego rozwązana gry 3. Jedną z ożlwośc jet ozotane rzy równowadze aha jao rozwązanu rozważane tylo robleów lnowo-wadratowych dla tórych tneje oletna teora [Baar Older 999; Engwerda 005]. Podejśce to ograncza jedna różnorodność rozważanych dyna odel Lanchetera ne jet roblee tyu lnowo-wadratowego. Inny wyjśce jet wyorzytane aroyacj analzowanej gry tochatyczny gra różnczowy [Shen 009] dla tórych równana Haltona Jacobego ają jednoznaczne rozwązane [Fredan 97; Manucc 004]. ależy jedna aętać że ne ay gwarancj ż będze tnała funcja granczna będąca rozwązane wyjścowej gry różnczowej. ajbardzej obecujące odejśce zaroonowal Brean Shen [004]. Zaat równowag aha wyorzytują on ojęce Pareto-otyalnośc do oreślena nowego rozwązana gry. Ja ę oazało uzyane rzez nch wyn dla dyna & f u u udało ę uogólnć na rodznę dyna do tórej należy odel Lanchetera [Zwerzchowa 05]... Główny wyn ech tan uładu będze oany równane: & f ϕ u ψ u 6 n n gdze: R u u R natoat f : R R ϕψ : R R ą funcja gład. Dodatowo rozważay tan oczątowy oraz funcjonały zyu 3 wraz z założena o funcjach zyu ońcowego oraz o funcjach oztów ośrednch.

80 Joanna Zwerzchowa Podejśce Breana Shen [004] oarte jet na rozwązanach Paretootyalnych ger zadanych rzez funcjonały natychatowego zyu tóre w rzyadu 6 rzyjują otać: Y u u f ϕ u ψ u h u Defncja. ech gra będze zadana rzez funcje wyłaty Y u u Y u. Multtrategę u P u P nazyway Pareto-otyalną jeśl ne u u tneje ulttratega u taa że Y u u > Y u P u P oraz Y u u > Y u P u P Jedną z etod znajdowana untów Pareto-otyalnych jet ayalzacja funcjonału Y Y Y dla dowolnego utalonego > 0 w toce jet to warune dotateczny Pareto-otyalnośc. Procedura wygląda natęująco. Analogczne do rzyadu równowag aha utala ę R rozważa ę grę tatyczną zadaną rzez funcjonały natychatowego zyu. Za oocą warunu dotatecznego ozuuje ę terowań Pareto-otyalnych: P P u u arg a{ Y u u Y u u : u u} 7 W ten oób dla utalonych R ożna otrzyać całą rodznę trateg Pareto-otyalnych ndeowanych lterą > 0. ależy aętać że rzy ta odejścu rodz ę ytane w ja oób wyberać odowedne > 0 dla R ta aby wybór był enowny. Proble ten zotał oany w ecj.. Załóży że gracze doonal wyboru tałej > 0 dla ażdego ożlwego 3 uładu R. Oznacza to że dyonują funcją : R 0 wyznaczającą w oób jednoznaczny wybory Pareto-otyalne dla rozważanej gry tatycznej. Możlwe jet zdefnowane trateg P u u dla 8 Brean Shen [004] nazwal 8 tratega e-ooeratywny gdyż douzczają one ewnego rodzaju ooerację ędzy gracza odzwercedla to wybór funcj. Haltonany ą defnowane jao wartość funcjonałów zyu rzy trateg e-ooeratywnej: H Y u u

Stratege e-ooeratywne w grach różnczowych... 8 Jeśl oreśly funcje wartośc jao V τ y J τ y u u 9 ą one głade wówcza ełnają uład równań Haltona Jacobego: V V t t H H V V V V wraz z warune ońcowy: V T g V T g 0 0 0 Twerdzene. ech będze dana gra o dynace 6 wraz z warune oczątowy funcjonała zyu 3. Jeśl gradenty funcj wartośc V zdefnowanej w 9 należą do ewnego otwartego zboru V Ω R gracze toują tratege e-ooeratywne zdefnowane w 8 oraz funcja jet głada wówcza uład 0 jet łabo herbolczny na obzarze Ω. Co węcej w rzyadu jednowyarowej rzetrzen tanu uład 0 jet herbolczny oza ończoną loścą rzywych na łazczyźne. Dowód zaezczony jet w racy [Zwerzchowa 05]. Powyżze twerdzene jet totny uogólnene twerdzena Breana Shen [004] gdyż ozwala na twerdzene herbolcznośc uładu oującego funcje wartośc dla zerzej lay robleów. Twerdzene. a zaadnczą wartość dla badań erycznych gdyżz herbolcznoścą uładu 0 ścśle zwązane jet zagadnene tnena jednoznacznośc rozwązana oraz jego cągłej zależnośc od warunów oczątowych co jet równoznaczne z ty że uład 0 jet dobrze otawony roblee [Brean Shen 004]. Przedtawona teora zotane zlutrowana rzy oocy odelu Lanchetera ecja 3. dlatego zagadnene herbolcznośc zotane oówone dla ytuacj gry z jednowyarową rzetrzeną tanu. Załóży że tneje layczne rozwązane V V V uładu 0 tóry w jednowyarowej ytuacj rzyjuje otać: V V t t H H V V V V 0 0

8 Joanna Zwerzchowa Różnczując owyżzy uład oznaczając W V otrzyuje ę qualnowy uład równań otac: W A W W b W gdze acerz A W wetor b W ą t zadane natęujący wzora: H W A W oraz j j H W b W Defncja 3. Uład jet łabo herbolczny gdy acerz A W a dwe rzeczywte wartośc włane λ W λ W. Uład jet herbolczny wtedy tylo wtedy gdy wetory włane acerzy A W tworzą bazę w rze- trzen R. Teora [Brean Shen 004; Serre 000] wyazujeże herbolczność jet warune oneczny na to aby uład tyu 0 był dobrze otawony roblee. Co węcej ą to jedyne warun truturalne tóre a ełnać wonany uład aby oadał on jednoznaczne rozwązane. Rezta warunów wyaganych do uzyana jednoznacznośc rozwązana dotyczy regularnośc funcj ładających ę na roble. W śwetle owyżzych fatów Twerdzene. daje odtawę do ozuwana nuerycznego rozwązana uładu 0... Jednoznaczny wybór tona ooeracj Stratege e-ooeratywne ą oarte na wyborze terowana Paretootyalnego w grze tatycznej oanej funcjonała natychatowego zyu. Oznacza to że dla dowolnych R należy doonać wyboru terowana Pareto-otyalnego tóry będze racjonalne uzaadnony analtyczne wylczalny. Zate luczowe dla oreślena trateg e-ooeratywnych: P u u jet wazane odowednej funcj 3 : R 0. Gra tatyczna Y Y } oada równowagę aha { u u oznaczoną rzez dlatego ożey odnoć ę do wyłat rzy tych trategach: Y Y u u dla

Stratege e-ooeratywne w grach różnczowych... 83 Zależność wyłat Pareto-otyalnych od funcj wyrażay w natęujący oób: Y Y u u dla Perwzy warune ja a ełnać wybór terowana Paretootyalnego jet jego rzewaga nad równowagą aha. Żądayby wyłaty rzy terowanu Pareto-otyalny były ne nejze nż rzy równowadze aha: Y Y dla ażdego 3 W nny wyadu jedneu z graczy ne ołaca ę odrzucać równowag aha. Warune 3 oże ogranczać rozważany zbór rozwązań Pareto- -otyalnych ne daje jedna jednoznacznośc tego wyboru. ech S ~ oznacza zbór tałych > 0 ełnających warune 3. Brean Shen [004] zaroonowal by jednoznaczność uzyaćza oocą warunu rawedlwego. Każdy z graczy zyuje tyle aow tounu do wyłaty rzy równowadze aha. Funcja a zate ełnać równość: Y Y Y Y 4 W rzyadu odelu Lanchetera ne tylo [Zwerzchowa 05] warune 4 wyuza nueryczne znajdowane funcj co neotrzebne zwęza błąd rozwązana nuerycznego. Drugą ożlwoścą jet wyorzytane rozwązana aha robleu rzetargowego [Zwerzchowa 05]. Defncja 4. Powey że ara Pareto-otyalna Y ~ ~ Y Y S Y S jet rozwązane rzetargowy aha [950] gdy S S ~ Y ~ ~ ełna natęujący Y warune: ~ ~ Y Y Y Y Y Y Y Y dla ażdego S ~ 5 Warune 4 oże być rzeforułowany w języu funcj w onżzy oób: arga{ Y Y Y Y : S ~ } 6

84 Joanna Zwerzchowa Jeśl obraz funcj Y Y jet zbore wyuły 3 wówcza warune 6 oreśla funcję : R 0 w oób orawny. Mo że warune 4 jet nazywany warune rawedlwy to w rzyadach neyetrycznych użyce warunu 6 jet bardzej uzaadnone. Załóży że obraz odwzorowana Y u u Y u u Y u ne jet u yetryczny względe rotej y y cont rzechodzącej rzez wyłaty rzy równowadze aha. Wówcza tylo warune 6 uwzględna rzewagę jednego gracza nad drug wazuje otu Pareto tóre rocentowo daje ta a zy obu graczo. Sytuację neyetryczną wybory generowane rzez warun 4 6 lutruje onżzy ryune. Ry.. Porównane warunów jednoznacznego wyboru rozwązana Pareto-otyalnego Źródło: Badana włane. 3. Przyład Model Lanchetera Perwotne odel Lanchetera owtał na otrzeby oana zanw odzale ł odcza dzałań wojennych. W latach 50. zezłego weuo raz erwzy zotał użyty do badana robleu duoolu htorę wyorzytana odelu jego warantów ożna znaleźć w ublacj [Huang Leng Lang 0]. W odelu załada ę że dwe fry onurują o udzał w rynu za oocą utalena

Stratege e-ooeratywne w grach różnczowych... 85 welośc włanych naładów na relaę. Dodatowo relaa ażdej fry wycelowana jet tylo w lentów onurencj. ech t t oznacza udzał w rynu erwzej fry w chwl t 0 natoat t t udzał w rynu drugej fry w chwl t 0. Stan uładu oany jet równane różnczowy: & t t u t t u t gdze > 0 odzwercedla uteczność relay -tego graczana zwolennów onurencyjnej fry a u t to tratega naład na relaę gracza -tego w chwl t 0. Wraz z dynaą towarzyzony jet tandardowy warune oczątowy: τ y. Przyładowy funcjonałe zyu ełnający założenatwerdzena. otyany w lteraturze odnozącej ę do badań erycznych [Wang Wu 00] jet: T J τ y u u β T α t u t dt dla τ Aby uzyać uład 0 dla owyżzego robleu należy znaleźć tratege e-ooeratywne 8. Do jednoznacznego wyboru terowań Pareto-otyalnych ołuży warune 6. Funcjonały natychatowego zyu w ty rzyadu rzyjują otać: Y u u u u α u dla Do znalezena równowag aha gry tatycznej Y Y } { wytarczy wyorzytać warune oneczny tnena etreu loalnego. W ty celu różnczuje ę funcję Y o zennej u natoat funcję Y o u. Przyrównując do zera otrzyane ochodne dotaje ę równowagę aha: u u Wyłaty aha dla funcjonałów natychatowego zyu to: Y u u α Y

Joanna Zwerzchowa 86 analogczne Y α Do uzyana terowań Pareto-otyalnych ołuży warune 7. Funcjonałe oddawany ayalzacj jet:. u u u u u u Y α α Korzytając z warunu onecznego tnena au funcj dwóch zennych uzyuje ę wzór na terowana Pareto-otyalne: u P u P rzy tórych wyłaty to: u u Y Y P P P. α Y P α Korzytając z warunu 6 otrzyuje ę natęujący wzór na funcję: 3 a tratege e-ooeratywne rzyjują otać: 3 u

Stratege e-ooeratywne w grach różnczowych... 87 u 3 Uzyana funcja jet głada zate na ocy Twerdzena. uład 0 generowany rzez owyżzy roble jet herbolczny uład oujący funcje wyłaty rzy trategach e-ooeratywnychdla odelu Lanchetera ożna znaleźć w artyule [Zwerzchowa 05]. Borąc od uwagę zero wachlarz ublacj na teat badań erycznych wyorzytujących odel Lanchetara naturalny roe doełnający wedzę na teat tego odelu jet wyznaczene trateg e-ooeratywnych oraz uładu 0. Ja wcześnej zauważono tratege e-ooeratywne u wytęują w otac zawerającej gradenty funcj wyłat. a chwlę obecną bra gotowych rograów rozwązujących robley z ta uwłany ze obą ładowy. Jedna teora etod nuerycznych dla uładów qua-lnowych daje odtawy by ądzć że w najblżzej rzyzłośc uład 0 zotane rozwązany dla odel otac 6. W racy [Zwerzchowa 05] ożna znaleźć nny rzyład duoolu ochodzący z racy Breana Shen [004] tóry równeż oada dynaę tyu 6. Dla nego taże wylczony jet jednoznaczny wybór trateg e- -ooeratywnej oraz uład 0. Poduowane Stratege w ętl zanętej dla ger różnczowych w dalzy cągu natręczają welu robleów rodzą oro ytań. Mo że zczególne rzyad równowaga aha dla robleów lnowo-wadratowych ą rozwązywalne w tej lae trateg ne oznacza to że udaje ę uzyać dotateczne obecujące rezultaty dla ażdego tyu dyna. Z uwag na to że równowaga aha w ogólnośc rowadz do netablnych uładów równań różnczowych czątowych badacze tanęl rzed roblee albo zany oobu znajdowana równowag ahan. orzez aroyację tochatyczny gra różnczowyco ne zawze ończy ę owodzene albo rozważana nnego tyu rozwązana. Brean Shen [004] wrowadzl nową etodę. Borą on od uwagę terowana Pareto-otyalne dla funcjonałów natychatowego zyu a ne ja dotychcza równowag aha. W onewencj oazuje ęże odel oują-

88 Joanna Zwerzchowa cy roble duoolu oada wyagane włanośc [Zwerzchowa 05] by óc rozważać rozwązana nueryczne.co węcej nowe odejśce dotarcza dodatowych nforacj. Wyznaczając tratege e-ooeratywne uzyuje ę narzędze do badanaczy gracze toują urytą ooerację zowy cenowe odzwercedlonąw wybranej rzez nch wólne funcj. atęny etae badań będze wyznaczene trateg e-ooeratywnych w rzyadu danych erycznych. Porównane uzyanych w ten oób wynów ze znany wyna dla równowag aha n. [Wang Wu 00] ozwol zbadać czy na tetowanych rynach ay do czynena z grą neooeracyjną czy oże jednaze zową cenową. Lteratura Baar T. Older G.J. 999 Dynac oncooeratve Gae Theory. edycja SIAM owy Jor. Brean A. Shen W. 004 Se-cooeratve Stratege for Dfferental Gae Internatonal Journal of Gae Theory Vol. 3. 56-593. Breton M. Jarrar R. Zaccour G. 006 A ote on Feedbac Sequental Equlbra n a Lancheter Model wth Ercal Alcaton Manageent Scence Vol. 5. 804-8. Breton M. Yezza A. Zaccour G. 996 Feedbac Sacelberg Equlbra n a Dynac Gae of Advertng Coetton: A uercal Analy S. Jorgenen G. Zaccour ed. Srnger-Verlag Berln. Chntagunta P.K. Vlca.J. 99 An Ercal Invetgaton of Advertng Stratege n a Dynac Duooly Manageent Scence Vol. 38. 30-44. Docner E.J. Jorgenen S. Long.V. Sorger G. 000 Dfferental Gae n Econoc and Manageent Scence Cabrdge Unverty Pre Cabrdge. Engwerda J. 005 Lnear-quadratc Dynac Otzaton and Dfferental Gae John Wley ew Yor. Ercon G. 99 Ercal Analy of Cloed-loo Duooly Advertng Stratege Manageent Scence Vol. 38. 73-749. Fredann A. 97 Stochatc Dfferental Gae Journal of Dfferental Equaton Vol.. 79-08. Fruchter G.E. Kalh S. 997 Cloed-loo Advertng Stratege n a Duooly Manageent Scence Vol. 43. 54-63. Huang J. Leng M. Lang L. 0 Recent Develoent n Dynac Advertng Reearch Euroean Journal of Oeratonal Reearch Vol. 0. 59-609. Jarrar R. Martn-Herran G. Zaccour G. 004 Marov Perfect Equlbru Advertng Stratege of Lancheter Duooly Model. A Techncal ote Manageent Scence.

Stratege e-ooeratywne w grach różnczowych... 89 Manucc P. 004 onzero Su Stochatc Dfferenta Gae wth Dcontnuou Feedbac SIAM Journal on Control and Otzaton Vol. 43. -33. ah J. 950 The Barganng Proble Econoetrca Vol. 8. 55-6. Serre D. 000 Syte of Conervaton Law I II Cabrdge Unverty Pre Cabrdge. Shen W. 009 on-cooeratve and Se-cooeratve Dfferenta Gae 85-06 [w:] P. Bernhard V. Gatgory O. Pourtaller ed. Advance n Dynac Gae and ther uercal Develoent era: Annal of ISDG Vol. 0 Srnger Brhauer. Wang Q. Wu Z. 00 A Duooltc Model of Dynac Coettve Advertng Euroean Journal of Oeratonal Reearch Vol. 8. 3-6. Zwerzchowa J. 05 Hyerbolcty of Syte Decrbng Value Functon n Dfferental Gae whch Model Duooly Proble Decon Mang n Manufacturng and Servce Vol. 9. SEMI-COOPERATIVE STRATEGIES I DIFFERETIAL GAMES WHICH MODEL DUOPOLY PROBLEMS Suary: In the reent aer there condered a cla of non-cooeratve dfferental fnte horzon gae for two layer. Frtly ah equlbru n feedbac for are reented. In general the yte of Halton-Jacob equaton generated by th tratege are ll-oed. Secondly the aer concerned wth e-cooeratve tratege. In th cae the yte of Halton-Jacob equaton hyerbolc for duooly roble. A e-cooeratve tratege are not unque there reented the alcaton of ah oluton for barganng roble to receve unque tratege. Th aroach roer alo for non-yetrc tuaton. The theory llutrated by Lancheter odel. Keyword: duooly roble Lancheter duooly odel e-cooeratve tratege hyerbolc artal dfferenta equaton.