2.1 Вычисление оптимальных стратегий на примере решения задач

 

Используя теорему о минимаксе, можно утверждать, что каждая антагонистическая игра имеет оптимальные стратегии.

Теорема: пусть А – матричная игра и строки  данной матрицы являются доминирующими. Тогда игрок 1 имеет такую оптимальную стратегию х, что ; кроме того, любая оптимальная стратегия для игры, получающаяся в результате удаления доминирующих строк, будет также оптимальной для первоначальной игры.

Пример 1. Игра доминирования

Рассмотрим игру с матрицей . Здесь второй столбец доминирует 4 и игрок 2 соответственно не будет использовать 4 стратегию. Поэтому можно рассмотреть матрицу следующего вида . В этой матрице третья строка доминирует первую. При удалении получается матрица . А в этой матрице третий столбец доминируется вторым. Следовательно, исходная матрица сводится к следующей матрице .

Пример 2. Игра на уклонение.

Предполагается, что игроки выбирают целые числа i и j между 1 и n, а игрок 1 выигрывает величину , т.е. расстояние между i и j. Пусть первый игрок придерживается стратегии , тогда  для всех  (( - значение игры).

·          Пусть  нечётно, тогда игрок 2 имеет чистую стратегию  для всех

·          Предположим, что  чётно, тогда игрок 2 имеет такую стратегию  где , , , , ,  для всех . Теперь используя теорему можно убедиться, что значение игры . Игрок 1 имеет оптимальную стратегию , а оптимальная стратегия игрока 2 равна , если  и  если  

Приведём теорему, по которой решалась эта игра. Теорема: для того, чтобы ситуация была равновесной в игре , а число  - значение игры , необходимо и достаточно выполнение следующего неравенства. Для всех и : ).

Ситуация называется ситуацией равновесия в чистых стратегиях, если для любых выполнено двойное неравенство (*). Если каждый из игроков стремится достичь ситуации равновесия, то принцип, которому они следуют, называют принципом равновесия. Для игры, заданной матрицей  равенство  (т.е. верхнее значение игры равно нижнему значению) записывается в виде , а неравенство (*) – в виде , где  чистые максиминная и минимаксная стратегии соответственно игроков I и I I.

Пример 3. Игра «Дуэль».

Два дуэлянта (игроки А и В) начинают сходиться в момент времени t=0. Встреча произойдёт в момент времени t=1. У каждого есть возможность выстрелить в любой момент времени. Если одному из них удастся выстрелить раньше соперника, то он становится победителем. Если же оба выстрелят одновременно, то дуэль закончится вничью. Если игрок А произведёт выстрел в момент времени x () то его выстрел будет успешным с вероятностью р(x). Подобным образом будет вероятным выстрел игрока В в момент времени y () c вероятностью q(y). При условии игрок А выиграет с вероятностью р(x), а проиграет с вероятностью (1- р(x)) q(y). Тем самым его средний выигрыш при  будет равен . С другой стороны, если x> y, то его средний выигрыш будет равен . При x= y средний выигрыш . Таким образом, функция H(x,y) игрока А имеет вид

и антагонистическая игра задана. В частности, если игроки стреляют без промаха,

,


Информация о работе «Матричные антагонистические игры с нулевой суммой в чистых стратегиях»
Раздел: Математика
Количество знаков с пробелами: 98743
Количество таблиц: 23
Количество изображений: 11

Похожие работы

Скачать
24554
3
7

... смешанными стратегиями игроков 1 и 2 называются такие наборы хо, уо соответственно, которые удовлетворяют равенству  Е (А, х, y) = Е (А, х, y) = Е (А, хо, уо). Величина Е (А, хо ,уо) называется при этом ценой игры и обозначается через u. Имеется и другое определение оптимальных смешанных стратегий: хо, уо называются оптимальными смешанными стратегиями соответственно игроков 1 и 2, если они ...

Скачать
16545
0
2

... входить в его оптимальную стратегию с положительной вероятностью, если для них выполняется равенство М(х, yo) = V. Такие чистые стратегии х называются существенными. Теорема 5. Пусть дана бесконечная антагонистическая игра с непрерывной и дифференцируемой по y на единичном квадрате при любом х функцией выигрышей М(х, y), с оптимальной чистой стратегией yo игрока 2 и ценой игры V, тогда : 1) ...

Скачать
10034
0
8

... игроков не только на максимизацию своего выигрыша, сколько на минимизацию выигрыша противника. С другой стороны, естественно также рассматривать подходящим поведение игроков в конечных бескоалиционных играх, направленное на максимизацию своего выигрыша с учётом максимального противодействия игрока, т.е. подходящей стратегией игрока 1 считать оптимальную смешанную стратегию игрока 1 в матричной ...

Скачать
30511
5
2

... общую цель. Однако разные члены коллектива могут быть по-разному информированы об обстановке проведения игры. Выигрыш или проигрыш сторон оценивается численно, другие случаи в теории игр не рассматриваются, хотя не всякий выигрыш в действительности можно оценить количественно. Игрок - одна из сторон в игровой ситуации. Стратегия игрока - его правила действия в каждой из возможных ситуаций игры. ...

0 комментариев


Наверх