Биматричная игра это игра

25. Биматричная игра может быть определена: а) двумя матрицами только с

25. Биматричная игра может быть определена:
а) двумя матрицами только с положительными элементами.
б) двумя произвольными матрицами (*ответ*)
в) одной матрицей.
26. В матричной игре элемент aij представляет собой:
а) выигрыш 1-го игрока при использовании им i-й стратегии, а 2-м — j-й стратегии (*ответ*)
б) оптимальную стратегию 1-го игрока при использовании противником i-й или j-й стратегии.
в) проигрыш 1-го игрока при использовании им j-й стратегии, а 2-м — i-й стратегии.
27.Элемент матрицы ац соответствует седловой точке. Возможны следующие ситуации:
а) этот элемент строго меньше всех в строке (*ответ*)
б) этот элемент второй по порядку в строке.
в) в строке есть элементы и больше, и меньше, чем этот элемент.
28. В биматричной игре размерности 3*3 ситуаций равновесия бывает:
а) не более 3.
б) не менее 6.
в) не более 9 (*ответ*)
29. В методе Брауна-Робинсон каждый игрок при выборе стратегии на следующем шаге руководствуется:
а) стратегиями противника на предыдущих шагах (*ответ*)
б) своими стратегиями на предыдущих шагах.
в) чем-то еще.
30. По критерию математического ожидания каждый игрок исходит из того, что:
а) случится наихудшая для него ситуация.
б) все ситуации равновозможны.
в) все или некоторые ситуации возможны с некоторыми заданными вероятностями (*ответ*)
31. Антагонистическая игра может быть задана:
а) множеством стратегий игроков и ценой игры.
б) множеством стратегий обоих игроков и функцией выигрыша второго игрока (*ответ*)
в) чем-то еще.
32. Матричная игра — это частный случай антагонистической игры, при котором обязательно выполняется одно из требований:
а) один из игроков выигрывает.
б) игроки имеют разное число стратегий.
в) можно перечислить стратегии каждого игрока (*ответ*)
33. Пусть матричная игра задана матрицей, в которой все элементы отрицательны. Цена игры положительна:
а) да.
б) нет.
в) нет однозначного ответа (*ответ*)
34.

Цена игры меньше верхней цены игры, если оба показателя существуют.
а) да.
б) не всегда.
в) никогда (*ответ*)
35. Оптимальная смешанная стратегия для матричной игры не содержит нулей:
а) да.
б) нет.
в) вопрос некорректен.
г) не всегда.
36. Цена игры — это:
а) число.
б) вектор.
в) матрица.
37. Каких стратегий в матричной игре больше: а) оптимальных.
б) не являющихся оптимальными.
в) нет однозначного ответа (*ответ*)
38.Если в матрице все столбцы одинаковы и имеют вид (450 1), то какая стратегия оптимальна для 1-го игрока:
а) первая чистая.
б) вторая чистая (*ответ*)
в) какая-либо смешанная.
Ответов: 1 | Категория вопроса: Экономические дисциплины

Как вы понимаете слова государя о намерении править «только согласно закону»?

Разрыв нежелательной установившейся связи между условным раздражителем и реакцией и замена

Соотнесите понятия и определения — региональная социальная политика

При скре­щи­ва­нии ди­ге­те­ро­зи­гот­но­го рас­те­ния ку­ку­ру­зы с глад­ки­ми окра­шен­ны­ми се­ме­на­ми и рас­те­ния

В чем преимущества организма как среды жизни?

Представителем Просвещения не является: (*ответ*) Б. Паскаль Д. Дидро Вольтер Ж.

_ услуги (обслуживания) – это объективная особенность услуги (обслуживания), которая проявляется

Магазин открывается в 10 часов утра, а закрывается в 10 часов

Как образуется пар? При каком условии пар превращается в жидкую воду?

Найдите длину каждого животного по рисунку 27. На сколько метров кит

Согласно взглядам идеологов национальной политики _ представляла собой «плавильный котел», в

Пользуясь материалами учебника, выделите основные этапы в жизни и творчестве Некрасова.

Государственная социальная помощь в натуральной форме включает в себя набор социальных

Укажите, что из перечисленного характеризует гоминид: а) волосяной покров тела;

В национально-терминологических системах АЛЯ в различных арабских странах _ расхождения

Концепции витализма и идеи антиредукционизма совпадают по своему содержанию: (*ответ*) нет

Предыдущие рассмотрения касались игр двух лиц, в которых интересы игроков были прямо противоположны, а также позиционных игр, сводимых к матричным. Однако ситуации, в которых интересы игроков хотя и не совпадают, но уже не обязательно являются противоположными, встречаются значительно чаще.

Рассмотрим, например, конфликтную ситуацию, в которой каждый из двух участников имеет следующие возможности для выбора своей линии поведения:

игрок А – может выбрать любую из стратегий А1,…,Аm,

игрок В – любую из стратегий В1,…,Вn.

При этом их совместный выбор оценивается вполне определённо: если игрок А выбрал i-ю стратегию Аi, а игрок В – k-ю стратегию Вk, то в итоге выигрыш игрока А будет равен некоторому числу aik, а выигрыш игрока В некоторому, вообще говоря, другому числу bik.

Последовательно перебирая все стратегии игрока А и все стратегии игрока В, мы сможем заполнить их выигрышами две таблицы

Первая из таблиц описывает выигрыш игрока А, а вторая – выигрыш игрока В. Обычно эти таблицы записывают в виде матрицы

А = , В =

Здесь А – платёжная матрица игрока А,

В – платёжная матрица игрока В.

Таким образом, в случае, когда интересы игроков различны (но не обязательно противоположны) получаются две платёжные матрицы: одна – матрица выплат игроку А, другая – матрица выплат игроку В. Поэтому совершенно естественно звучит название, которое обычно присваивается подобной игре – биматричная.

Пример1: «Студент – Преподаватель».

Студент (игрок А) готовится к зачету, который принимает Преподаватель (игрок В). Можно считать, что у студента две стратегии – подготовится к сдаче зачёта (+) и не подготовится (-). У Преподавателя также две стратегии – поставить зачёт и не поставить .

Тогда

Количественно это можно выразить, например, так

Вследствие того, что в биматричных играх интересы игроков не совпадают, необходимо построить такое решение, которое бы в том или ином, но в одинаковом смысле удовлетворяло обоих игроков.

Рассмотрим случай когда у игроков имеется ровно две стратегии, т.е. m=n=2.

В 2´2 биматричной игре платёжные матрицы игроков имеют следующий вид

А = В =

Вероятности р1=р, р2=1-р, q1=q, q2=1-q, а средние выигрыши вычисляются по формулам

Ha(p,q) = a11p q + a12 p(1- q) + a21(1-p)q + a22(1-p)(1-q),

Hb(p, q) = b11pq + b12 p(1-q) + b21(1-p)q + b22(1-p)(1-q), где 0 £ p £ 1, 0 £ q £ 1,

Пара чисел (p*, q*), o ≤ p * ≤ 1, o ≤ q* ≤ 1, p и q, подчиненных условиям o ≤ p * ≤ 1, o≤q*≤1, одновременно выполнены следующие неравенства HA (p, q* ) ≤ HA (p*, q*). (Ü)

T:всякая биматричная игра имеет хотя бы одну равновесную ситуацию (точку равновесия) в смешанных стратегиях.

Задание смешанной стратегии игрока состоит в указании тех вероятностей, с которыми выбираются его первоначальные стратегии.

Если некоторая пара чисел (p*,q*) претендуют на то, чтобы определить ситуацию равновесия, то необходимо проверить справедливость неравенств (Ü). Для этого воспользуемся теоремой:

T:Выполнение неравенств (Ü) равносильно выполнению неравенств

HA (o, q* ) ≤ HA (p*,q*), HB (p*, o ) ≤ HB (p*, q*), (ÜÜ)

HA (1, q* ) ≤ HA (p*, q*), HB (p*, 1 ) ≤ HB (p*, q*).

Запишем средние выигрыши игроков А и В в более удобной форме. Имеем

HA (p, q) = (a11 — a12 — a21 + a22 ) pq + (a11 — a22)p + (a21 — a22 )q + a22

HB (p, q) = (b11 — b12 — b21 + b22 ) pq + (b11 — b22)p + (b21 — b22 )q + b22

Обратимся к первой формуле. Пологая p = 1, а потом p = 0, получаем, что

HA (1, q) = (a11 — a12 — a21 + a22 ) q + a12 + (a21 — a22 )q,

HA (0, q) = (a21 — a22 )q + a22

Рассмотрим разности

HA (p, q) — HA (1, q) = (a11 — a12 — a21 + a22 )pq + (a12 — a22)p –

– (a11 — a12 — a21 + a22)q + a22 – a12,

HA (р, q) — HA (0, q) = (a11 — a12 — a21 + a22)p q + (a12 — a22)p

Пологая C= a11 — a12 — a21 + a22, α = a22- a12, получим

HA (p, q) — HA (1, q) = Cpq – αp – Cr + α = (p – 1)(Cq — α)

HA (p, q) — HA (0, q) = Cpq – αp = p(Cq — α)

В случае, если пара (p, r) определяет точку равновесия, эти разности неотрицательны, поэтому

(p – 1)(Cq — α) ≥ 0, p(Cq — α) ≥ 0

Из формул для функции HB (p, r) при r = 1, r = 0 соответственно имеем

HB (p, 1) = (b11 — b12 — b21 + b22 )p + b12 + (b21 — b22 )p + b21,

HB (p, 0) = (b21 — b22 )p + b22

Разности HB (p, q) — HB (p, 1) и HB (p, q) — HB (p, — 0)

С учётом обозначений Д = b11-b12-b21+b22, b = b22-b21

Приводятся к виду Hb(p, q) = Hb(p, 1) = (q-1)( Дp-b),

Hb(p, r) = Hb(p, 0) = q(Дp-b).

И (q-1)(Дp-b) ³ 0, q( Дp-b) ³ 0

Итак, чтобы в биматричной игре

А = В = пара (p, q)

определяемая равновесную ситуацию, необходимо и достаточно одновременное выполнение следующих неравенств

Пример1: «Студент – Преподаватель» (продолжение).

А = , В =

Проводя необходимые вычисления

С = 2+1-1+0 = 2, α = 0+1=1,

Д = 1+3+2-1 = 5, b=-1+2 = 1,

и рассуждения (p-1) (2q-1) ³ 0, (q-1)(5p-1) ³ 0,

p(2q-1) ³ 0, q(5p-1) ³ 0,

получаем, что 1) p=1, q ³ , 2) q=1, p ³ ,

p=0, q ≤ , q=0, p ≤ ,

0<p<1, q = , 0<q<1, p = .

Число точек пересечения у зигзагов (равновесных ситуаций) равно трём. Две из них отвечают чистым стратегиям игроков,

p=1, q=1: Ha(1,1)=2, Hb(1,1)=1,

p=0, q=0: Ha(0,0)=0, Hb(0,0)=1,

Одна – смешанная, p= , q= : Ha( ; ) = , Hb( ; ) =

Наилучшим является выбор каждым из игроков первой чистой стратегии – хорошо подготовится к зачёту и поставить зачет.

Вопросы для самоконтроля по главе

1. Какая матрица называется платежной?

2. Что называют нижней (верхней) ценой игры?

3. Какой элемент матрицы игры называют Седловой точкой или точкой равновесия?

4. Сформулируйте понятие позиционной игры?

5. Что называют информационным множеством?

6. Какой процесс называют нормализацией позиционной игры?

7. Какие игры называют биматричными?

8. Выполнение каких неравенств определяет равновесную ситуацию для биматричных игр?

9. Всегда ли биматричная игра имеет равновесную ситуацию?

Если имеет, то сколько?

Биматричные игры

В играх с ненулевой суммой в выигрыше или проигрыше могут оказаться все участники игры. Биматричная игра – это конечная игра двух игроков с ненулевой суммой. В этом случае для каждой игровой ситуации AiBj каждый из игроков имеет свой выигрыш aij для первого игрока и bij– для второго игрока. К биматричной игре сводится, например, поведение производителей на рынках несовершенной конкуренции. С помощью онлайн-калькулятора можно найти решение биматричной игры, а также ситуации оптимальные по Парето и ситуации устойчивые по Нэшу.

Рассмотрим конфликтную ситуацию, в которой каждый из двух участников имеет следующие возможности для выбора своей линии поведения:

  • игрок А – может выбрать любую из стратегий А1,…,Аm,
  • игрок В – любую из стратегий В1,…,Вn.

При этом их совместный выбор оценивается вполне определённо: если игрок А выбрал i-ю стратегию Аi, а игрок В – -ю стратегию Вk, то в итоге выигрыш игрока будет равен некоторому числу aik, а выигрыш игрока некоторому, вообще говоря, другому числу bik.
Последовательно перебирая все стратегии игрока и все стратегии игрока , мы сможем заполнить их выигрышами две таблицы.

Первая из таблиц описывает выигрыш игрока , а вторая – выигрыш игрока . Обычно эти таблицы записывают в виде матрицы.
Здесь – платёжная матрица игрока , – платёжная матрица игрока .

Таким образом, в случае, когда интересы игроков различны (но не обязательно противоположны) получаются две платёжные матрицы: одна – матрица выплат игроку А, другая – матрица выплат игроку В. Поэтому совершенно естественно звучит название, которое обычно присваивается подобной игре – биматричная.

Равновесие Нэша – равновесие, когда каждый участник игры выбирает стратегию, которая является для него оптимальной при условии, что остальные участники игры придерживаются определенной стратегии.
Равновесие Нэша не всегда является наиболее оптимальным для участников. В этом случае говорят, что равновесие не является Парето-оптимальным.
Чистая стратегия – определенная реакция игрока на возможные варианты поведения других игроков.
Смешанная стратегия – вероятностная (не определенная точно) реакция игрока на поведение других игроков.

Пример №1. Борьба за рынки сбыта.
Фирма намерена сбыть партию товара на одном из двух рынков, контролируемых более крупной фирмой . С этой целью она проводит подготовительную работу, связанную с определенными затратами. Если фирма разгадает, на каком из рынков фирма будет продавать свой товар, она примет контрмеры и воспрепятствует «захвату» рынка (этот вариант означает поражение фирмы ); если нет, то фирма одерживает победу. Предположим, что для фирмы проникновение на первый рынок более выгодно, чем проникновение на второй, но и борьба на первом рынке требует от нее больших средств. Например, победа фирмы на первом рынке приносит ей вдвое большую прибыль, чем победа на втором, но зато поражение на первом рынке полностью ее разоряет.
Составим математическую модель этого конфликта, считая фирму игроком 1 и фирму игроком 2. Стратегии игрока 1: А1 – проникновение на рынок 1, А2 – проникновение на рынок 2; стратегии игрока 2: В1 – контрмеры на рынке 1, В2 – контрмеры на рынке 2. Пусть для фирмы ее победа на 1-м рынке оценивается в 2 единицы, а победа на 2-м рынке – в 1 единицу; поражение фирмы на 1-м рынке оценивается в -10, а на 2-м в -1. Для фирмы ее победа составляет соответственно 5 и 1 единицу, а поражение -2 и -1. Получаем в итоге биматричную игру с матрицами выигрышей
.
По теореме эта игра может иметь либо чистые, либо вполне смешанные ситуации равновесия. Ситуаций равновесия в чистых стратегиях здесь нет. Убедимся теперь, что данная игра имеет вполне смешанную ситуацию равновесия. Находим , .
Итак, рассматриваемая игра имеет единственную ситуацию равновесия (x0;y0), где , . Она может быть реализована при многократном повторении игры (то есть при многократном воспроизведении описанной ситуации) следующим образом: фирма а должна использовать чистые стратегии 1 и 2 с частотами 2/9 и 7/9, а фирма b – чистые стратегии 1 и 2 с частотами 3/14 и 11/14. Любая из фирм, отклонившись от указанной смешанной стратегии, уменьшает свой ожидаемый выигрыш.

Пример №2. Найти ситуации оптимальные по Парето и ситуации устойчивые по Нэшу для биматричной игры.

Пример №3. Имеются 2 фирмы: первая может произвести одно из двух изделий А1 и А2, вторая – одно из двух изделий B1, B2. Если первая фирма произведет продукцию Ai (i = 1, 2), а вторая — Bj (j = 1, 2), то прибыль этих фирм (зависящая от того, являются ли эти изделия взаимодополняющими или конкурирующими), определяется таблицей №1:

Решение матричной игры

Назначение сервиса.

С помощью сервиса в онлайн режиме можно:

  • определить цену матричной игры (нижнюю и верхнюю границы), проверить наличие седловой точки, найти решение смешанной стратегии, найти минимаксную стратегию игроков;
  • записать математическую модель пары двойственных задач линейного программирования, решить матричную игру методами: минимакс, симплекс-метод, графический (геометрический) метод, методом Брауна.

Игра – это математическая модель реальной конфликтной ситуации. Конфликтная ситуация двух игроков называется парной игрой. Парную игру с нулевой суммой удобно исследовать, если она описана в виде матрицы. Такая игра называется матричной; матрица, составленная из чисел aij, называется платежной.

Математической моделью антагонистической игры является матричная игра с матрицей , в которой ходы (стратегии) игрока расположены по строкам, а ходы (стратегии) игрока расположены по столбцам. В самой матрице записаны выигрыши игрока при соответствующих ходах игроков и (отрицательный выигрыш – это проигрыш).

Алгоритм решения матричной игры

В таблице представлены варианты решения игры, заданной платежной матрицей А.

Наличие седловой точки Отсутствие седловой точки
Тип стратегии Чистая стратегия Смешанная стратегия
Метод решения Решение найдено 1. Через систему уравнений.
2. Графический метод.
3. Использование симплекс-метода.

Описание алгоритма:

  1. На основании анализа платёжной матрицы следует определить, существуют ли в ней доминируемые стратегии, и исключить их.
  2. Найти верхнюю и нижнюю цены игры и определить, имеет ли данная игра седловую точку (нижняя цена игры должна быть равна верхней цене игры).
  3. Если седловая точка существует, то оптимальными стратегиями игроков, являющимися решением игры, будут их чистые стратегии, соответствующие седловой точке. Цена игры равна верхней и нижней цены игры, которые равны между собой.
  4. Если игра не имеет седловой точки, то решение игры следует искать в смешанных стратегиях. Для определения оптимальных смешанных стратегий в играх m × n следует использовать симплекс-метод, предварительно переформулировав игровую задачу в задачу линейного программирования.

Представим алгоритм решения матричной игры графически.


Рисунок — Схема решения матричной игры.

Биматричные игры. Равновесие Нэша. Оптимальность Парето.

Биматричная игра – это конечная игра двух игроков с ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно для соответствующего игрока (в каждой матрице строка соответствует стратегии игрока 1, столбец – стратегии игрока 2, на пересечении строки и столбца в первой матрице находится выигрыш игрока 1, во второй матрице – выигрыш игрока 2.)

Для биматричных игр также разработана теория оптимального поведения игроков, однако решать такие игры сложнее, чем обычные матричные.

Непрерывной считается игра, в которой функция выигрышей каждого игрока является непрерывной в зависимости от стратегий. В теории математики доказано, что игры этого класса имеют решения, однако пока не разработано практически приемлемых методов их нахождения.

Рассмотрим, например, конфликтную ситуацию, в которой каждый из двух участников имеет следующие возможности для выбора своей ли­нии поведения –

игрок А может выбрать любую из стратегий A1,…,Am,

игрок В может выбрать любую из стратегий B1,…,Bn.

При этом всякий раз их совместный выбор оценивается вполне оп­ределенно: если игрок A выбрал i-ю стратегию А1, а игрок В — k-ю стра­тегию Bk, то выигрыш игрока А равен некоторому числу aik, а выигрыш игрока В некоторому, вообще говоря, другому числу bik.

Иными словами, всякий раз каждый из игроков получает свой приз.

Последовательно перебирая все стратегии игрока А и все стратегии игрока B мы сможем заполнить их выигрышами две таблицы

Первая из таблиц описывает выигрыши игрока А, вторая — выигрыши игрока B. Обычно эти таблицы записывают в виде матриц

,

Здесь А — платежная матрица игрока А, а В — платежная матрица игрока В.

При выборе игроком А i-й стратегии, а игроком В — k-й стратегии их выигрыши находятся в матрицах выплат на пересечении i-x строк и k-х столбцов: в матрице А это элемент aik , а в матрице В — элемент bik.

Таким образом, в случае, когда интересы игроков различны (но не обязательно противоположны), получаются две платежные матрицы: одна — матрица выплат игроку А, другая — матрица выплат игроку В. Поэтому совершенно естественно звучит название, которое обычно присваивается подобной игре, — биматричная.

Замечание, Рассматриваемые ранее матричные игры можно рассмат­ривать, разумеется, и как биматричные, где матрица выплат игроку В противоположна матрице выплат игроку А:

или

.

Однако в общем случае биматричная игра — это игра с ненулевой суммой.

Равновесие по Нэшу.

В теории игр равновесием Нэша (названным в честь Джона Форбса Нэша, который предложил его) называется тип решений игры двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив своё решение в одностороннем порядке, когда другие участники не меняют решения. Такая совокупность стратегий выбранных участниками и их выигрыши называются равновесием Нэша.

Из определения видно, что в ситуациях равновесия и только в них ни один игрок не заинтересован в отклонении от своей стратегии. В частности, если ситуация равновесия оказывается предметом договора между игрока­ми, то ни один из игроков не будет заинтересован в нарушении своих обя­зательств. Наоборот, если в договоре зафиксирована неравновесная ситуа­ция., то по определению найдется хотя бы один игрок, который будет заинтересован в отклонении от нее и тем самым — в нарушении этого до­говора.

Равновесной стратегией игрока в бескоалиционной игре называется такая его стратегия, которая входит хотя бы в одну из си­туаций равновесия игры.

В случае антагонистической игры равновесные стратегии игроков совпа­дают с их оптимальными стратегиями.

Для биматричных игр, напро­тив, понятие оптимальной стратегии игрока нередко вообще не имеет смысла: в таких играх оптимальными оказываются не стратегии отдельных игроков, а их сочетания, (т.е. ситуации) и притом для множества всех игро­ков сразу.

Поэтому в биматричных играх как оптимальные следует квалифицировать не действия того или иного игрока, а совокупность дейст­вий всех игроков, исход игры, ситуацию в ней. Именно в таком смысле следует понимать оптимальность приемлемых ситуаций в биматричной игре и ситуаций равновесия в ней.

Значительная часть теории биматричных игр состоит в исследовании свойств их ситуаций равновесия и равновесных стратегий игроков, а также в разработка способов их нахождения.

Процесс нахождения ситуаций равновесия в биматричной игре часто называется решением игры.

Джорджем Нэшем было доказано существование ситуации равновесия в смешанных стратегиях для любой биматричной игры.

Оптимальность по Парето.

Как и в случае антагонистических игр, целью теории биматричных игр является выработка принципов оптимальности, а так же установление соответствий между свойствами игр и свойствами их решений.

Чаще всего под оптимальностью подразумевают различные варианты формализованных описаний содержательных представлений о выгодности, устойчивости и справедливости.

В биматричных играх могут появляться ситуации, приемлемые, (т.е. выгодные и потому устойчивые) для каждого из игроков, могут априори оказываться в том или ином смысле невыгодными (и потому не устойчивыми)для игроков.

Один вариант устойчивости ситуации, отражающий черты ее выгодности, состоит в ее оптималь­ности по Парето.

Иными словами, в оптимальной по Парето ситуации игроки не могут совместными усилиями увеличить выигрыш кого-либо из них, не уменьшив при этом выигрыш кого-либо другого.

Формальное различие ситуации равновесия от ситуации, оптимальной по Парето: в первой ни один игрок, действуя в оди­ночку, не может увеличить своего собственного выигрыша; во второй — все игроки, действуя совместно, не могут (даже нестрого) увеличить выигрыш каждого.

Вопросы об оптимальных по Парето ситуациях решаются в принципе
проще, чем аналогичные вопросы о ситуациях равновесия.

Пример: имеются два продавца, продающие определенный товар на рынке. Оба из них знают, что чем выше цена, тем меньше общий объем продаж. Для простоты предположим, что каждый из них может продать либо 400 единиц некоторого товара, либо 100 единиц. Известно, что при продаже 800 единиц на рынке складывается цена равная 100 фунтам, при 500 единицах — 200 фунтов, а при объеме продаж 200 единиц — 500 фунтов. Матрицы выигрышей продавцов показаны в нижеследующих таблицах.

Выигрыш 1 продавца.

Стратегии 2 продавца
400 ед. 100 ед.
Стратегии 1 продавца 400 ед. 40000 фунтов 80000 фунтов
100 ед. 20000 фунтов 50000 фунтов

Выигрыш 2 продавца.

Стратегии 1 продавца
400 ед. 100 ед.
Стратегии 2 продавца 400 ед. 40000 фунтов 20000 фунтов
100 ед. 80000 фунтов 50000 фунтов

Если бы игроки имели возможность и желание согласовывать свои действия, то они решили бы продать по 100 единиц и получить прибыль по 50 ООО каждый.

Предположим теперь, что по каким-либо причинам они принимают решения независимо друг от друга.

Каковы оптимальные стратегии для игроков в этом случае?

Пара стратегий (400,100) не является ситуацией равновесия, так как в этом случае второму игроку вьгодно изменить свою стратегию на 400 и тем самым увеличить свой выигрыш с 20000 до 40000.

Если рассмотреть пару стратегий (100,100), то она также не является ситуацией равновесия, поскольку каждому отдельному игроку выгодно поменять свою стратегию на 100 и получить вместо 50000 выигрыш в 80000.

Если же мы рассмотрим пару стратегий (400,400), то, как легко заметить, отклонение каждого отдельного игрока является для него невыгодным. Такую ситуацию мы называем ситуацией некооперативного равновесия.

Таким образом, основным определяющим свойством ситуации некооперативного равновесия является невыгодность для каждого отдельного игрока отклоняться от своей стратегии, входящей в ситуацию равновесия. В этом случае речь не идет о каких-либо договоренностях между игроками и поэтому такое равновесие называется некооперативным (равновесием по Нэшу).

Напротив, когда возможность достигать определенные договоренности между игроками существует, игроки стараются найти такую пару стратегий, для которой не существует другой пары, одновременно улучшающей выигрыши обоих игроков. Такая пара стратегий называется ситуацией кооперативного (оптимальность по Парето) равновесия. Таковой является пара стратегий (100,100).

60. Игра двух лиц, в которой одним из игроков является «природа»

Выбор наилучших решений в условиях неполной информации — одно из основных занятий людей. К примеру, собираясь в туристический поход, мы укладываем вещи в рюкзак с учетом неизвестной (непредсказуемой) погоды и преследуем цель получения максимума удовольствий, не превращаясь в рекордсмена по переноске тяжестей.

Одним из наиболее распространенных видов управленческой деятельности также является принятие решений в условиях неполной или неточной информации, что сопряжено с неизбежным риском (и немалыми убытками) в случае принятия ошибочного решения.

При принятии решений в условиях неполной информации следует различать ситуацию риска и ситуацию неопределённости. Собственно разница между риском и неопределённостью касается того, знает ли принимающий решение что-либо о вероятности наступления определённых событий. Риск присутствует тогда, когда вероятности, связанные с различными последствиями принятия решения, могут оцениваться на основе данных предшествующего периода (имеется статистическая информация о подобных ранее принимаемых решениях / о подобных изучаемой ситуациях/ т.п.). Неопределённость существует тогда, когда эти вероятности приходится определять субъективно, т.к. нет данных предшествующего периода (нет соответствующей статистики). Задача выбора решения в условиях неопределённости сводится к следующему.

Пусть задан некоторый векторS=(S1,S2,..,Sn), описывающий nсостояний внешней среды, и векторX=(X1,X2,..,Xm), описывающий mдопустимых решений. Требуется найти такой вектор X*=(0,0,..,0,Xi,0,..,0), который бы обеспечивал оптимум некоторой функции полезностиW(X,S)по некоторому критериюK.

Значение оптимума функции W(X,S) раскрывается, исходя из постановки конкретной задачи (к примеру, если обсуждается получение прибыли, то значение функции стремятся максимизировать, если себестоимость – минимизировать).

Информацию об указанной функции полезности (по сути исходные данные задачи такого типа) представляют матрицей размерностиm × n c элементами Wij = F(Xi,Sj), где F- решающее правило (определяемое из постановки конкретной задачи).

Следует отметить, что формирование решающего правила во многом предопределяет конечный результат расчетов (в случае его неточности даже правильный выбор критерия оптимальности и соответствующие расчеты не дают основания считать принятое решение наилучшим).

При достаточно четкой экономической постановке задачи практически не возникает проблем с формированием матрицы {Wij}.

Критерий принятия решения в ситуации риска.

Предположим, что в нашем распоряжении имеются статистические данные, позволяющие оценить вероятность того или иного состояния внешней среды, и этот опыт может быть использован для оценки будущего. При известных вероятностях Pj для возникновения состояния Sj можно найти математическое ожидание W(X,S,P) и определить вектор X*, обеспечивающий

БИМАТРИЧНЫЕ ИГРЫ примеры решения

Примеры этого раздела описывают некоторые типические конфликтные ситуации, приводящие к биматричным играм. Сначала мы обсудим вопросы, связанные с формализацией рассматриваемых конфликтов (построение платежных матриц), а позднее связанные с рекомендациями по их разрешению. БИМАТРИЧНЫЕ ИГРЫ примеры решения Пример 20. «Борьба за рынки*. Небольшая фирма (игрок А) намерена сбыть партию товара на одном из двух рынков, контролируемых другой, более крупной фирмой (игрок В). Для этого фирма А готова предпринять на одном из рынков соответствующие приготовления (например, развернуть рекламную компанию). Господствующая на рынках фирма В может попытаться воспрепятствовать этому, приняв на одном из рынков предупредительные меры (разумеется, в ремках закона). Не встречая противодействия на рынке, фирма А захватывает его; при наличии препятствий — терпит поражение, Будем считать для определенности, что проникновение фирмы А на первый рынок более выгодно для нее, нежели проникновение на второй. Естественно также считать, что и борьба за первый рынок потребует вложения бблышх средств. Например, победа фирмы А на первом рынке принесет ей вдвое больший выигрыш, чем победа на втором, но зато и поражение при попытке освоиться на первом рынке полностью ее разорит, а фирму В избавит от конкурента. Что же касается второго рынка, то при поражении фирмы А ее потери будут не столь разорительны, но и победа принесет немного. Таким образом, у фирмы А две стратегии: А\ — выбор первого рынка, Л 2 — выбор второго рынка. Такие же стратегии и у фирмы В: В\ — выбор первого рынка, Bi — выбор второго рынка. Для того, чтобы составить платежные матрицы игроков, нужны расчетные количественные показатели, которые мы приведем здесь в условных единицах: Взглянем на выписанные матрицы выплат.

Из сказанного выше ясно, что если оба игрока выберут один и тот же рынок, то победа останется за более сильной фирмой В. То. что в ситуации В\) выигрыш игрока В равен 5, а в ситуации (j4j, В}) — 1, подчеркивает, что первый рынок более выгоден (удобно расположен, хорошо посещаем и т.п.), чем второй. Выифыш (-10) игрока А в ситуации (Л), (а точнее, проигрыш) в сопоставлении с его выигрышем (-1) в ситуации (Л2, В2) выглядит, разумеется, вполне сокрушительно. Что же касается ситуации, когда фирмы уделяют основное внимание разным рынкам (Л|, В}) и (Ai, В\), то здесь фирму А ждет настоящий выигрыш, ббльший на более выгодном рынке. Потери, которые при этом несет фирма В, оказываются прямо противоположными. игроку А, другая — матрица выплат игроку В. Поэтому совершенно естественно звучит название, которое обычно присваивается подобной игре — биматричиая. Замечание. Рассматриваемые ранее матричные игры, разумеется, можно рассматривать и как бима-тричные, где матрица выплат игроку В противоположна матрице выплат игроку А: Примеры биматричных игр Тем не менее, в общем случае биматричная игра — это игра с ненулевой суммой. Нам кажется вполне естественным время от времени сопоставлять наши рассмотрения с рассуждениями, проведенными ранее для матричных игр (особенно при попытках разрешения схожих проблем). Подобные сопоставления часто оказываются одновременно и удобными и полезными. Конечно, класс биматричных игр значительно шире класса матричных (разнообразие новых моделируемых конфликтных ситуаций весьма заметно), а, значит, неизбежно увеличиваются и трудности, встающие на пути их успешного разрешения. Впрочем, мы надеемся, что часть из этих трудностей мы сумеем преодолеть уже в настоящем издании. Примеры этого раздела описывают некоторые типические конфликтные ситуации, приводящие к биматричным играм. Сначала мы обсудим вопросы, связанные с формализацией рассматриваемых конфликтов (построение платежных матриц), а позднее связанные с рекомендациями по их разрешению. Пример 20. «Борьба за рынки*. Небольшая фирма (игрок А) намерена сбыть партию товара на одном из двух рынков, контролируемых другой, более крупной фирмой (игрок В). Для этого фирма А готова предпринять на одном из рынков соответствующие приготовления (например, развернуть рекламную компанию). Господствующая на рынках фирма В может попытаться воспрепятствовать этому, приняв на одном из рынков предупредительные меры (разумеется, в ремках закона). Не встречая противодействия на рынке, фирма А захватывает его; при наличии препятствий — терпит поражение, Будем считать для определенности, что проникновение фирмы А на первый рынок более выгодно для нее, нежели проникновение на второй. Естественно также считать, что и борьба за первый рынок потребует вложения бблышх средств. Например, победа фирмы А на первом рынке принесет ей вдвое больший выигрыш, чем победа на втором, но зато и поражение при попытке освоиться на первом рынке полностью ее разорит, а фирму В избавит от конкурента. Что же касается второго рынка, то при поражении фирмы А ее потери будут не столь разорительны, но и победа принесет немного. Таким образом, у фирмы А две стратегии: Примеры биматричных игр А\ — выбор первого рынка, Л 2 — выбор второго рынка. Такие же стратегии и у фирмы В: В\ — выбор первого рынка, Bi — выбор второго рынка. Для того, чтобы составить платежные матрицы игроков, нужны расчетные количественные показатели, которые мы приведем здесь в условных единицах: Взглянем на выписанные матрицы выплат. Из сказанного выше ясно, что если оба игрока выберут один и тот же рынок, то победа останется за более сильной фирмой В. То. что в ситуации В\) выигрыш игрока В равен 5, а в ситуации (j4j, В}) — 1, подчеркивает, что первый рынок более выгоден (удобно расположен, хорошо посещаем и т.п.), чем второй. Выифыш (-10) игрока А в ситуации (Л), (а точнее, проигрыш) в сопоставлении с его выигрышем (-1) в ситуации (Л2, В2) выглядит, разумеется, вполне сокрушительно. Что же касается ситуации, когда фирмы уделяют основное внимание разным рынкам (Л|, В}) и (Ai, В\), то здесь фирму А ждет настоящий выигрыш, ббльший на более выгодном рынке. Потери, которые при этом несет фирма В, оказываются прямо противоположными. Замечание. Ясно, что точно рассчитать выгоду и ущерб сторон в этом конфликте заранее довольно трудно. А вот в следующей конфликтной ситуации размеры выигрышей игроков известны со всей определенностью. Пример 21. «Дилемма узников». Игроками являются два узника, находящихся в предварительном заключении по подозрению в совершении преступления. При отсутствии прямых улик возможность их осуждения в большой степени зависит от того, заговорят они или будут молчать. Если оба будут молчать, то наказанием будет лишь срок предварительного заключения (потери каждого из узников составят (-1)). Если сознаются, то получат срок, учитывающий признание как смягчающее обстоятельство (потери каждого из узников составят в этом случае (-6)). Если же заговорит только один из узников, а другой будет молчать, то в этом случае заговоривший будет выпущен на свободу (его потери равны 0), а сохраняющий молчание получит максимально возможное наказание (его потери будут равны (-9)). Эта конфликтная ситуация приводит к биматричной игре, в которой каждый из игроков имеет по две стратегии — молчать (М) или говорить (Г). Выигрыши игроков А и В соответственно описываются так: Пример 22. «Семейный спор». Два партнера договариваются о совместном проведении одного из двух действий, (1) и (2), каждое из которых требует их совместного участия. В случае осуществления первого из этих двух действий выигрыш первого партнера (игрок А) будет вдвое выше выигрыша второго партнера (игрок В). Напротив, в случае осуществления второго из этих двух действий выигрыш игрока А будет вдвое меньше выигрыша игрока В. Если же партнеры выполнят различные действия, то выигрыш каждого из них будет равен нулю. Эта конфликтная ситуация приводит к биматричной игре, в которой каждый из игроков имеет по две стратегии. Выигрыши игроков А и В соответственно описываются таблицами следующего вида: По»С**иИГ Довольно понятно, что различные конфликтные ситуации могут иметь одну и ту же формализацию. В частности, рассмотренная биматричная играчасгао интерпретируется, как одновременный выбор супругами совместного развлечения: посещение оперного спектакля или хоккейного матча. При этом в посещении оперного театра жена заинтересована в большей степени, чем муж, а при посещении стадиона наблюдается обратная картина. В случае же непреодоления разногласий, возникших при выборе, день оказывается вообще испорченным. Отсюда и название, вынесенное в заголовок. БИМАТРИЧНЫЕ ИГРЫ примеры решения Пример 23. «Студент — Преподаватель». Рассмотрим следующую ситуацию. Студент (игрок А) готовится к зачету, который принимает Преподаватель (игрок В). Можно считать, что у Студента две стратегии — подготовиться к сдаче зачета (+) и не подготовиться (-). У Преподавателя также две стратегии — поставить зачет |+) и не поставить зачета . В основу значений функций выигрыша игроков положим следующие соображения: (+) все нормально был неправ (-) дал себя обмануть опять придет

Добавить комментарий

Закрыть меню