Teorie her jako bojové umění (7)
Úvodní poznámka
Již jsme si řekli, že při seznamování se s teorií her i při jejím využívání má velmi významnou roli naše představivost. Proto si nyní ukážeme grafické řešení úlohy 1(5) zadané maticí výplat:
|
Hráč 2 |
||
Strategie 1 |
Strategie 2 |
||
Hráč 1 |
Strategie 1 |
-1;1 |
1;-1 |
Strategie 2 |
4;-4 |
-1;1 |
Grafické řešení úlohy 1(5)
V případě, kdy alespoň jeden z hráčů má pouze dvě strategii, můžeme řešení hry dvou hráčů s nulovým součtem vyjádřit prostřednictvím následujícího obrázku:
Kde:
- Černá horizontální linie znamená rozložení pravděpodobnosti od 0 do 1
- První vertikální linie odpovídá situaci, kdy Hráč 2 zvolí svou Strategii 1
- Druhá vertikální linie odpovídá situaci, kdy Hráč 2 zvolí svou Strategii 2
- Modrá linie jdoucí od hodnoty -1 (na první vertikální linii) do hodnoty 1 (na druhé vertikální linii) odpovídá situaci, kdy Hráč 1 zvolí za svou Strategii 1 (buď získá -1, nebo 1) a Hráč 2 využije své smíšení strategie(každému bodu na této linii odpovídá jedna ze smíšených strategií).
- Modrá linie jdoucí od hodnoty 4 (na první vertikální linii) do hodnoty -1 (na druhé vertikální linii) odpovídá situaci, kdy Hráč 1 zvolí za svou Strategii 2 (buď získá 4, nebo -1) a Hráč 2 využije své smíšení strategie (každému bodu na této linii odpovídá jedna ze smíšených strategií).
Rozhodující roli hraje průsečík obou linií:
- Jeho horizontální souřadnice odpovídá optimální smíšené strategii Hráče 1., tj. tomu, s jakou pravděpodobností p má hrát svou Strategii 1 a s jakou pravděpodobností 1 - p má hrát svou Strategii 2. (V daném případě se jedná o p = 5/7 a 1- p = 2/7, k tomu se později ještě vrátíme.)
- Jeho vertikální souřadnice odpovídá tomu, co nazýváme hodnota hry, tj. tomu, jakou průměrnou výplatu může hráč očekávat, pokud se hra bude mnohkrát opakovat. Vidíme, že hodnota hry v našem případě není rovna nule, ale je kladná. To lze chápat i takto - pokud by se hra (se stejnou výplatní maticí) opakovala mnohokrát, Hráč 1 by v průměru získával tuto hodnotu a Hráč 2 by tuto hodnotu ztrácel. (V daném případě je hodnota hry 21/49, tj. o něco méně než 1/2; k otázce proč se později ještě vrátíme.)
Proč tomu tak je? Hodnoty na linii odpovídající situaci, kdy Hráč 1 zvolí svou Strategii 1 a Hráč 2 volí své smíšené strategie, které rostou od -1 do 1. Hodnoty na linii odpovídající situaci, kdy Hráč 1 zvolí svou Strategii 2 a Hráč 2 volí své smíšené strategie, které klesají od 4 do -1. Použití smíšené strategie odpovídající bodu průsečíku těchto linií zaručuje Hráči 1, že jako svou průměrnou výplatu nebude mít méně, než je hodnota hry. Je to totiž maximum z jeho minimálních výplat, ať již Hráč 2 použije jakoukoli svou smíšenou strategii. Pokud by se Hráč 1 od této své smíšené strategie odchýlil, má Hráč 2 k dispozici smíšené strategie, které mu zajišťují větší výhru. Vzhledem k tomu, že se jedná o hru s nulovým součtem výplat hráčů (to, co jeden vyhraje je přesně tak velké jako to, co druhý prohraje), jedná se o optimální strategii Hráče 1.
Tento bod určuje i optimální smíšenou strategii Hráče 2, a to právě proto, že se jedná o hru s nulovým součtem. Podrobně si to ukážeme v dalším díle našeho seriálu.
(Pokračování)
RE: Teorie her jako bojové umění (7) | václav pohoriljak | 31. 01. 2013 - 19:16 |