Тема 3.4. Геометрическая интерпретация игры 2×2.

Оглавление | Назад | Далее| Глоссарий понятий

Решение игры 2×2 допускает наглядную геометрическую интерпретацию. Пусть игра задана платежной матрицей Р = (aij), i, j = 1, 2. По оси абсцисс (рис. 3.1) отложим единичный отрезок A1 A2 точка A1(х=0) изображает стратегию A1, а все промежуточные точки этого отрезка — смешанные стратегии SA первого игрока, причем расстояние от SA до правого конца отрезка — это вероятность p1 стратегии A1, расстояние до левого конца — вероятность p2 стратегии A2. На перпендикулярных осях II и IIII откладываем выигрыши при стратегиях A1 и A2 соответственно. Если 2-й игрок примет стратегию B1, то она дает выигрыши a11 и a21 на осях II и IIII, соответствующие стратегиям A1 и A2. Обозначим эти точки на осях I—I и II—II буквой B1. Средний выигрыш v1, соответствующий смешанной стратегии SA, определяется по формуле математического ожидания v1 = a11 p1 + a21 p2   и равен ординате точки M1, которая лежит на отрезке B1 B1 и имеет абсциссу SA (рис. 3.1).

Рис. 3.1
Рис. 3.2

Аналогично строим отрезок B2B2, соответствующий применению вторым игроком стратегии B2 (Рис. 3.2). При этом средний выигрыш v2 = a12 p1 + a22 p2 — ордината точки M2.
В соответствии с принципом минимакса оптимальная стратегия S*A такова, что минимальный выигрыш игрока А (при наихудшем поведении игрока В) обращается в максимум. Ординаты точек, лежащих на ломаной (рис. 3.3 в примере 3.4.1), показывают минимальный выигрыш игрока А при использовании им любой смешанной стратегии (на участке B1 N — против стратегии B1 , на участке NB2 — против стратегии B2). Оптимальную стратегию S*A = ( p* p*2 ) определяет точка N, в которой минимальный выигрыш достигает максимума; ее ордината равна цене игры v. На рис. 3.3 (пример 3.4.1) обозначены также верхняя и нижняя цены игры α и β. Применим геометрический метод для решения следующего примера.

Пример 3.4.1.

Рис. 3.6
Рис. 3.7

Из решения примера 3.4.1 следует, что геометрически можно определять оптимальную стратегию как игрока А, так и игрока В, в обоих случаях используется принцип минимакса, но во втором случае строится не нижняя, а верхняя граница выигрыша и на ней определяется не максимум, а минимум.

Если платежная матрица содержит отрицательные числа, то для графического решения задачи лучше перейти к новой матрице с неотрицательными элементами; для этого к элементам исходной матрицы достаточно добавить соответствующее положительное число. Решение игры при этом не изменится, а цена игры увеличится на это число. В примере 3.4.1 платежная матрица не имела седловой точки (α ≠β ).

При наличии седловой точки графическое решение дают варианты, изображенные на рис. 3.6 и 3.7. На рис. 3.6 наибольшей ординатой на ломаной B1 NB2 обладает точка B2, поэтому оптимальной является чистая стратегия A2 для игрока А (B2 — для игрока В), т.е. оптимальное решение: S*A = (0;1), S*B = (0;1). Игра имеет седловую точку a22 = v.

Чистая стратегия B2 (рис. 3.7) не выгодна для игрока В, поскольку при любой стратегии игрока А она дает последнему больший выигрыш, чем чистая стратегия B1. На основании принципа минимакса выделим прямую B1B1 и на ней точку B1 с наибольшей ординатой на оси I—I. Чистая стратегия A2 является оптимальной для игрока А, а чистая стратегия B1 — для игрока В. Оптимальное решение: S*A = (0;1), S*B = (1;0), цена игры v = a21 = α = β , т.е. имеется седловая точка.

Графический метод можно применять при решении игры 2 × n и m × 2.

Оглавление | Назад | Далее| Глоссарий понятий

Hosted by uCoz