Teorie her jako bojové umění (6)

30. leden 2013 | 08.00 |

Teorie her jako bojové umění (6) 

Poznámka na úvod tohoto dílu seriálu

Zjistíme, že i velmi jednoduchá úloha (hádání, zda se mince nachází v pravé či levé ruce) má netriviální řešení, pokud poněkud změníme výplatní matici. Nalezení řešení se bude možná někomu zdát příliš složité na to, aby pokračoval v seznamování se se základy teorie her. Toho V tom případě prosím o trochu trpělivosti. Až převedeme úlohu do podoby, ve které si budeme moci názorně představit, o co jde, bude vše hned mnohem jednodušší.

Mj. je to poučné i z hlediska mimořádně významné role, kterou naše představivost (schopnost něco si představit) má. Pokud se rozhodujeme on-line, rozpoznáváme a vyhodnocujeme situace (tedy například když využíváme teorii her jako bojové umění), pak se opíráme především o naši představivost. Důležitým úkolem teorie z tohoto hlediska je přispět ke kultivování a rozvíjení představivosti.

A ještě něco na úvod. To, že řešení úlohy z minulého dílu, kterým se nyní budeme zabývat, je poměrně složité, je dáno i tím, že v zárodečné příp. i více rozvinuté podobě obsahuje velké množství problémů, se kterými se v teorii her setkáme. Ale tak tomu u dobré teorie využívající matematický aparát bývá. Nejdůležitější je co nejvíce do hloubky pochopit základy. Pak už na nich lze stavět.

Odpověď na úlohu 1(5) - úvodní část

Podívejme se ještě jednou pozorně na matici výplat příslušné hry:

65pt;border:solid windowtext 1.0pt; border-left:none;padding:0cm 5.4pt 0cm 5.4pt;height:15.45pt" colspan="2">

Hráč 2

Strategie 1

Strategie 2

Hráč 1

Strategie 1

-1;1

1;-1

Strategie 2

4;-4

-1;1

 Lze ji číst i takto. Když Hráč 1 použije Strategii 2 a vyhraje, je jeho výplata 4x větší, než pokud použije Strategii 1. Kterou strategii zvolit? (Či ve smyslu našeho příkladu: Kam tedy dát minci?) Zdálo by se tedy, že nejlepší je volit Strategii 2.

Ovšem i Hráč 2 umí uvažovat. Proto si lehce spočítá to, k čemu došel Hráč 1, použije svou Strategii 2. a vyhraje.

Jakkoli se to tedy zdá být Hráči 1 výhodné, nemůže použít pokaždé Strategii 2. Z předcházejícího tušíme, že hra má řešení ve smíšených strategiích. Lehce si lze domyslet, že to v tomto případě není použití Strategie 1 a Strategie 2 se stejnou pravděpodobností. S Jakou pravděpodobností však tyto strategie použít? A s jakou pravděpodobností by měl Hráč 2 použít své strategie?

Odpověď na tuto otázku není triviální. Pokud neznáte základy teorie her a pokusili jste se na ni sami dát odpověď, nemuselo se vám to podařit. A to přesto, že oproti původnímu zadání výplatní matice došlo jen k malé změně.

K tomu, abychom našli řešení, provedeme úvahu, která má několik kroků. Možná se bude zdát trochu složitější, ale nezoufejte. Poté, co ji dokončíme, ukážeme si řešení s využitím grafických prostředků a vše se nám bude jevit mnohem srozumitelnější a intuitivně zřejmější. Nejdříve ovšem provedeme příslušnou úvahu:

1. Pokud bude Hráč 1 hrát Strategii 1 s pravděpodobností p (tedy tou, jejíž hodnotu hledáme), pak Strategii 2 bude hrát s pravděpodobností 1 - p (to je triviální - součet všech pravděpodobností se musí rovnat jedné).

2. Obdobně pro Hráče 2 platí, že pokud bude hrát svou Strategii 1 s pravděpodobností q (tedy tou, jejíž hodnotu též hledáme), pak Strategii 2 bude hrát s pravděpodobností 1 - q (pro p i q platí, že se jedná o čísla větší nebo rovná nule a menší nebo rovna jedné).

3. Podle výplatní matice mohou nastat celkem čtyři možnosti, přičemž pokud známe hodnoty p a q, víme s jakou pravděpodobností každá z možností nastane. Pokud například bude Hráč 1 hrát Strategii 1 s pravděpodobností p a Hráč 2 Strategii 2 s pravděpodobností 1 - q, pak pravděpodobnost, že nastane situace odpovídající příslušné buňce ve výplatní matici (první řádka, druhý sloupec) je součin obou pravděpodobností, tj. p(1 - q).

4. Odsud je zřejmé, že výplata každého z hráčů bude rovna součtu jeho výplat v jednotlivých případech, které mohou nastat, vynásobených pravděpodobností, se kterou mohou nastat. Tj.:

Výplata Hráče 1 bude: -1pq + 4(1 - p)q + 1p(1 - q) - 1(1 - p)(1 - q)

Výplata Hráče 2 bude: 1pq - 4(1 - p)q - 1p(1 - q) + 1(1 - p)(1 - q)

5. Platí:

Optimální strategie Hráče 1 bude taková, při které bude hodnota matematické formule

-1pq + 4(1 - p)q + 1p(1 - q) - 1(1 - p)(1 - q)

(tj. jeho výplaty) maximální, když může určit hodnotu p (je to jeho rozhodnutí, s jakou pravděpodobností bude své strategie hrát), ovšem nezávisle na tom, jakou hodnotu nabyde q (pravděpodobnost, se kterou bude Hráč 2 hrát svou Strategii 1).

(Obdobné platí pro Hráče 2.)

6. Nyní stačí příslušné maximální hodnoty nalézt. K tomu existuje několik matematických postupů. Vzhledem k tomu, že jsou i v tak jednoduchém případě poněkud komplikované, použijeme nejdříve grafické řešení, které nám pro další úvahy poskytne potřebnou oporu.

(Pokračování)

Zpět na hlavní stranu blogu

Hodnocení

1 · 2 · 3 · 4 · 5
známka: 1 (1x)
známkování jako ve škole: 1 = nejlepší, 5 = nejhorší

Komentáře