Teorie her jako bojové umění (6)
Poznámka na úvod tohoto dílu seriálu
Zjistíme, že i velmi jednoduchá úloha (hádání, zda se mince nachází v pravé či levé ruce) má netriviální řešení, pokud poněkud změníme výplatní matici. Nalezení řešení se bude možná někomu zdát příliš složité na to, aby pokračoval v seznamování se se základy teorie her. Toho V tom případě prosím o trochu trpělivosti. Až převedeme úlohu do podoby, ve které si budeme moci názorně představit, o co jde, bude vše hned mnohem jednodušší.
Mj. je to poučné i z hlediska mimořádně významné role, kterou naše představivost (schopnost něco si představit) má. Pokud se rozhodujeme on-line, rozpoznáváme a vyhodnocujeme situace (tedy například když využíváme teorii her jako bojové umění), pak se opíráme především o naši představivost. Důležitým úkolem teorie z tohoto hlediska je přispět ke kultivování a rozvíjení představivosti.
A ještě něco na úvod. To, že řešení úlohy z minulého dílu, kterým se nyní budeme zabývat, je poměrně složité, je dáno i tím, že v zárodečné příp. i více rozvinuté podobě obsahuje velké množství problémů, se kterými se v teorii her setkáme. Ale tak tomu u dobré teorie využívající matematický aparát bývá. Nejdůležitější je co nejvíce do hloubky pochopit základy. Pak už na nich lze stavět.
Odpověď na úlohu 1(5) - úvodní část
Podívejme se ještě jednou pozorně na matici výplat příslušné hry:
|
65pt;border:solid windowtext 1.0pt; border-left:none;padding:0cm 5.4pt 0cm 5.4pt;height:15.45pt" colspan="2"> Hráč 2 |
||
Strategie 1 |
Strategie 2 |
||
Hráč 1 |
Strategie 1 |
-1;1 |
1;-1 |
Strategie 2 |
4;-4 |
-1;1 |
Lze ji číst i takto. Když Hráč 1 použije Strategii 2 a vyhraje, je jeho výplata 4x větší, než pokud použije Strategii 1. Kterou strategii zvolit? (Či ve smyslu našeho příkladu: Kam tedy dát minci?) Zdálo by se tedy, že nejlepší je volit Strategii 2.
Ovšem i Hráč 2 umí uvažovat. Proto si lehce spočítá to, k čemu došel Hráč 1, použije svou Strategii 2. a vyhraje.
Jakkoli se to tedy zdá být Hráči 1 výhodné, nemůže použít pokaždé Strategii 2. Z předcházejícího tušíme, že hra má řešení ve smíšených strategiích. Lehce si lze domyslet, že to v tomto případě není použití Strategie 1 a Strategie 2 se stejnou pravděpodobností. S Jakou pravděpodobností však tyto strategie použít? A s jakou pravděpodobností by měl Hráč 2 použít své strategie?
Odpověď na tuto otázku není triviální. Pokud neznáte základy teorie her a pokusili jste se na ni sami dát odpověď, nemuselo se vám to podařit. A to přesto, že oproti původnímu zadání výplatní matice došlo jen k malé změně.
K tomu, abychom našli řešení, provedeme úvahu, která má několik kroků. Možná se bude zdát trochu složitější, ale nezoufejte. Poté, co ji dokončíme, ukážeme si řešení s využitím grafických prostředků a vše se nám bude jevit mnohem srozumitelnější a intuitivně zřejmější. Nejdříve ovšem provedeme příslušnou úvahu:
1. Pokud bude Hráč 1 hrát Strategii 1 s pravděpodobností p (tedy tou, jejíž hodnotu hledáme), pak Strategii 2 bude hrát s pravděpodobností 1 - p (to je triviální - součet všech pravděpodobností se musí rovnat jedné).
2. Obdobně pro Hráče 2 platí, že pokud bude hrát svou Strategii 1 s pravděpodobností q (tedy tou, jejíž hodnotu též hledáme), pak Strategii 2 bude hrát s pravděpodobností 1 - q (pro p i q platí, že se jedná o čísla větší nebo rovná nule a menší nebo rovna jedné).
3. Podle výplatní matice mohou nastat celkem čtyři možnosti, přičemž pokud známe hodnoty p a q, víme s jakou pravděpodobností každá z možností nastane. Pokud například bude Hráč 1 hrát Strategii 1 s pravděpodobností p a Hráč 2 Strategii 2 s pravděpodobností 1 - q, pak pravděpodobnost, že nastane situace odpovídající příslušné buňce ve výplatní matici (první řádka, druhý sloupec) je součin obou pravděpodobností, tj. p(1 - q).
4. Odsud je zřejmé, že výplata každého z hráčů bude rovna součtu jeho výplat v jednotlivých případech, které mohou nastat, vynásobených pravděpodobností, se kterou mohou nastat. Tj.:
Výplata Hráče 1 bude: -1pq + 4(1 - p)q + 1p(1 - q) - 1(1 - p)(1 - q)
Výplata Hráče 2 bude: 1pq - 4(1 - p)q - 1p(1 - q) + 1(1 - p)(1 - q)
5. Platí:
Optimální strategie Hráče 1 bude taková, při které bude hodnota matematické formule
-1pq + 4(1 - p)q + 1p(1 - q) - 1(1 - p)(1 - q)
(tj. jeho výplaty) maximální, když může určit hodnotu p (je to jeho rozhodnutí, s jakou pravděpodobností bude své strategie hrát), ovšem nezávisle na tom, jakou hodnotu nabyde q (pravděpodobnost, se kterou bude Hráč 2 hrát svou Strategii 1).
(Obdobné platí pro Hráče 2.)
6. Nyní stačí příslušné maximální hodnoty nalézt. K tomu existuje několik matematických postupů. Vzhledem k tomu, že jsou i v tak jednoduchém případě poněkud komplikované, použijeme nejdříve grafické řešení, které nám pro další úvahy poskytne potřebnou oporu.
(Pokračování)