(37.2) THBU – Manželský spor

1. duben 2013 | 08.00 |

Jak lze zviditelnit Nashovu rovnováhu u her dvou hráčů s nekonstantním součtem. Reakční křivky.

Úvodní poznámka

Od 25. ledna tohoto roku uveřejňuji každý den jeden díl seriálu Teorie her jako bojové umění. Všechny díly seriálu uveřejněné do 24.3.2013 lze stáhnout na

http://www.vsfs.cz/?id=1685-pracovni-materialy

Řešení úlohy 3(37.2)

V předcházejícím dílu jsme si ukázali, že ani v tak jednoduché hře, jakou je hra typu Manželský spor, není tak jednoduché najít odpověď na otázku, jak se zachovat. Zkusme použít Nashovu rovnováhu. Nashova rovnováha je dvojice strategií dvou hráčů, pro kterou platí, že pokud se jeden z hráčů od své strategie jednostranně (tj. pouze on sám) odchýlí, nemůže si polepšit (ale může si pohoršit).

Připomeňme si matici výplat hry typu Manželský spor:

ONA

Fotbal

Divadlo

ON

Fotbal

3; 2

1; 1

Divadlo

0; 0

2; 3

Červeně jsou vyznačeny dvě Nashovy rovnováhy v čistých strategiích. Pokud by kterýkoli z hráčů změnil svou strategii nepolepšil by si. Měl by místo výplaty 3 výplatu rovnou 0, resp. místo 2 výplatu 1, to znamená, že by si pohoršil.

Nalezením těchto dvou rovnováh ovšem ještě neodpovídáme na otázku: Co dělat? (Tedy – kam jít?)

Podívejme se tedy, zda v daném systému není ještě nějaká další Nashova rovnováha. Víme totiž, že existují rovněž rovnováhy ve smíšených strategiích. Jak je najít?

Ukážeme postup založený na reakční křivce prvního hráče R1(q) a druhého hráče R2(p). Reakční křivka prvního hráče ukazuje, jak první hráč hledá nejlepší odpověď na jakoukoli smíšenou strategii druhého hráče. Podobně reakční křivka druhého hráče ukazuje, jak druhý hráč hledá nejlepší odpověď na jakoukoli smíšenou strategii prvního hráče. Umožní nám to pochopit další půvaby teorie her. Pokud najdeme průsečík reakčních křivek, získáme tím rovnovážný bod. Reakční křivky nemůžeme bohužel požít ve většině případů, kdy mají hráči více než dvě strategie.

Pro názornost si ukážeme ještě jednu matici, tentokráte nikoli výplatní. Pokud jeden z hráčů hraje svou strategii s určitou pravděpodobností a druhou s pravděpodobností doplňující první (tj. jejich součet musí být roven 1), pak následující tabulka ukazuje, s jakou pravděpodobností nastávají jednotlivé události: 

      

Tabulka pravděpodobností možných událostí v určité hře:

Hráč 2

Strategie 1

Strategie 2

Hráč 1

Strategie 1

pq

p(1-q)

Strategie 2

(1-p)

(1-p) (1-p)

Využití reakčních křivek si nejdříve ukážeme na velmi jednoduchém příkladu, který jsme rozebírali dříve (hádání, zda je mince v pravé či levé ruce).

Připomeňme si příslušnou matici výplat:

Franta

Pravá

Levá

Karel

Pravá

-1;1

1;-1

Levá

1;-1

-1;1

Výplata Karla bude: -pq + (1 - p)q + p(1 - q) - (1 - p)(1 - q)

Výplata Franty bude: pq - 1(1 - p)q - p(1 - q) + (1 - p)(1 - q)

(V obou případech násobíme velikost výplaty, pokud nastane příslušná událost, pravděpodobností, se kterou událost nastane.)

Jednoduchou úpravou dostaneme:

-pq + (1 - p)q + p(1 - q) - (1 - p)(1 - q) = p(4q - 2) - 2q + 1

pq - 1(1 - p)q - p(1 - q) + (1 - p)(1 - q) = q(-4p +2) +p -1

Pozorně se podívejme do červeně vyznačených závorek:

- V prvním případě je číslo v závorce záporné při q menším než 1/2 a kladné při q větším než 1/2.

- V prvním případě je číslo v závorce záporné při q menším než 1/2 a kladné při q větším než 1/2.

- Ve druhém případě je číslo v závorce záporné při p menším než 1/2 a kladné při q větším než 1/2.

Pokud si uvědomíme, že p volí první hráč (Karel), tak pokud chce maximalizovat hodnotu své výplaty, tj. p(4q - 2) - 2q + 1, tak při q menším než 1/2 musí volit p minimální, tj. rovné 0, a při q větším než 1/2 musí volit p maximální tj. rovné 1.

Obdobně platí, že druhý hráč (Franta) volí q a pokud chce maximalizovat hodnotu své výplaty, tj. p(4q - 2) - 2q + 1, tak při p menším než 1/2 musí volit p minimální, tj. rovné 0, a při q větším než 1/2 musí volit 1 maximální tj. rovné 1.

Nyní vyjádříme příslušnou situaci graficky. K tomu využijeme následující graf, kterým lze vyjádřit všechny možné kombinace pravděpodobností výběru jednotlivých strategií jedním i druhým hráčem.


Graf: Všechny možné kombinace pravděpodobností výběru jednotlivých strategií jedním i druhým hráčem:


Zde například bod určený průsečíkem modré a červené tečkované linie označuje situaci, kdy první hráč hraje svou první strategii s pravděpodobností p (a druhou s pravděpodobností 1 - p), zatímco druhý hráč hraje svou první strategii s pravděpodobností q (a druhou s pravděpodobností 1 - q)

Nyní do tohoto grafu zakreslíme reakční křivku prvního a druhého hráče v souladu s výše řečeným.

Graf: Reakční křivky prvního hráče R1(p) a druhého hráče R2(q):

Tam, kde se obě křivky protínají, je Nashova rovnováha ve smíšených strategiích. Pokud by hráč zvolil jiný bod, jeho výplata poklesne. To odpovídá tomu, co jsme si řekli již dříve. Pokud by se některý z hráčů od této rovnováhy odchýlil a druhý ne, tak si hráč nemůže polepšit.

Úloha k zamyšlení 1(37.2)

Pokuste se namalovat v příslušném grafu reakční křivky hráčů ON a ONA ve hře typu Manželský spor.

(Pokračování)

Zpět na hlavní stranu blogu

Hodnocení

1 · 2 · 3 · 4 · 5
známka: 0.00 (0x)
známkování jako ve škole: 1 = nejlepší, 5 = nejhorší

Komentáře