Решение симплекс методом в excel. Линейное программирование в Excel. Некоторые настройки Поиска решения
Выигрыш-критерий Байеса является основным критерием оптимальности стратегий, который используется при принятии решений в условиях риска (см. §2.1).
Рассмотрим игру с природой, задаваемой платежной матрицей А (см. (2.1.2)). Пусть q = - вектор вероятностей состояний природы, удовлетворяющих условиям (2.1.1), которые удобно расположить в добавленной строке матрицы (2.1.2):
Референд Томас Байес
(1702 - 17.04.1761)
Выигрыш-критерием Байеса оптимальности чистых стратегий с вектором ч вероятностей состояний природы (В 1 ’ (q) -критерием 2 ) называется критерий, по которому:
- показателем (В’’ (q) -показателем) эффективности чистой стратегии
A-(i = 1,2.....т) называется величина
- ценой (В 1 ’(q)-ценой) игры в чистых стратегиях (множества S c ), называется наибольший из показателей эффективности Bj’{q), /" = 1,2..., т, чистых стратегий:
- оптимальной (В 1 ’ (q) -оптимальной) во множестве S c чистых стратегий называется стратегия A k е S 1 с максимальным показателем эффективности
Оптимальную стратегию также называют байесовской стратегией. Так как показатель эффективности Bj’(q) стратегии А к есть взвешенная средняя выигрышей при этой стратегии, то оптимальная стратегия является по этому критерию оптимальной не в каждом отдельном случае, а во взвешенно среднем.
Равенство (2.5.2) можно записать в векторной форме:
где « г » - значок транспонирования.
Как видно из (2.5.3) и (2.5.4) во множестве чистых стратегий показатель эффективности оптимальной стратегии совпадает с ценой игры.
Интерпретируя чистую стратегию А- как дискретную случайную величину со значениями a n ,a i2 ,...,a irl , которые она принимает с вероятностями соответственно q u q 2 ,...,q n , получаем, что B"‘(q) - показатель эффективности стратегии А- сеть ее математическое ожидание. Именно поэтому выигрыш-критерий Байеса называют также «критерием математического ожидания».
Из (2.5.2) и (2.5.3) следуют оценки: где а™" = min а, я"“ = шах а п, а а " ттт = max min а, и max max л, -соот-
ISjSn 1 1 Klfimisy&i ’ 1 j 1
встственно максимин и максияшкс игры в чистых стратегиях. Подчеркнем, что левые и правые части неравенств (2.5.5) и (2.5.6) нс зависят от вектора q.
Чистая стратегия, наименьший выигрыш при которой совпадает с максими- ном, называется максиминной стратегией. Если игрок А придерживается макси- минной стратегии А к, то при любом состоянии природы Я имеет место неравенство а к1 >а"” т =а" юхтт, у = 1,2,..., и, означающее, что максимин экономически
представляет собой гарантированный наименьший выигрыш игрока А при любых вероятностях состояний природы, если только игрок А придерживается максиминной стратегии.
Множество чистых стратегий, оптимальных во множестве S c чистых стратегий по B p (q) -критерию, обозначим через (? с) 0(а "’»_ общее решение игры с природой в чистых стратегиях можно интерпретировать как двухэлементное множество {(S c) 0 , ?"(()}.
Под частным решением игры с природой в чистых стратегиях можно понимать двухэлементное множество, одним из элементов которого является непустая неполная совокупность чистых стратегий, оптимальных во множестве чистых стратегий, а другим - цена игры в чистых стратегиях.
Перейдем в область смешанных стратегий 5.
По В 1 ’(q) -критерию оптимальности смешанных стратегий:
- показателем (В 1 ’ (q) -показателем) эффективности смешанной стратегии Р = (р 1 ,р 2 ,...,р т) назовем взвешенно среднее значение выигрышей (2.2.3) с весами q l ,q 2 ,...,q ll:
- ценой (B p (q) -ценой) игры в смешанных стратегиях назовем наибольший из показателей эффективности (2.5.7):
- оптимальной (В’’(q) -оптимальной) во множестве S смешанных стратегий назовем стратегию Р° =(р", с наибольшим показателем эффективности:
Легко видеть, что если, в частности, смешанная стратегия Р является чистой, например, А к, к е {1,2,...,от}, то её показатель эффективности B p (P;q) как смешанной стратегии, выражаемый формулой (2.5.7), превращается в ее показатель эффективности B p (A t ;q) = Bj’(q) как чистой стратегии, вычисляемый по формуле (2.5.2).
Нетрудно убедиться в том, что показатель эффективности B p (Pq) можно представить в матричной форме:
где А - матрица игры.
В связи с бесконечностью множества 5 смешанных стратегий встает вопрос о существовании оптимальной стратегии в этом множестве. Положительный ответ дает следующая теорема.
Теорема 2.5.1. В любой игре с природой с любым вектором вероятностей ее состояний существует стратегия, оптимальная во множестве смешанных стратегий по выигрыш-критерию Байеса.
Доказательство. Из (2.2.3) и (2.5.7) заключаем, что показатель эффективности В 1 ’ (P,q) как функция смешанной стратегии Р линейна и, следовательно, непрерывна на множестве 5, которое, будучи симплексом, ограничено и замкнуто в от-мерном евклидовом пространстве R"". Следовательно, по теореме Вейерштрасса (, с. 298) функция B p (P;q) достигает на симплексе 5 своей верхней грани, т.е. найдется стратегия Р° = (/>,",р") е 5, удовлетворяющая равенству (2.5.9) ?
Множество S""(су)-оптимальных стратегий во множестве S смешанных стратегий обозначим через s 0(B (ч)) .
В следующей теореме устанавливается связь между показателями эффективности чистых и смешанных стратегий.
Теорема 2.5.2. Показатель эффективности B"Pq) смешанной стратегии Р = (Pi’PiP m) 1,0 В р (q)-критерию представляет собой взвешенное среднее показателей эффективности Bj’(q) чистых стратегий Д, / = 1,2,...,от, по тому же критерию с весами р (, / = 1,2,...,от:
Доказательство. Применяя последовательно равенства (2.5.7), (2.2.3) и (2.5.2), получим:
Пусть Р = (/; | ,р 2 ,...,р т) - произвольная смешанная стратегия. Умножая все части двойного неравенства (2.5.5) на р , и суммируя полученные неравенства по номеру /" от 1 до от, получим на основании (2.5.11) диапазон изменения показателя эффективности B p (Pq) при любых векторах вероятностей состояний природы:
Следующая теорема устанавливает связь между ценами игры в чистых и смешанных стратегиях.
Теорема 2.5.3. По выигрыш-критерию Байеса цены игры в чистых и в смешанных стратегиях равны.
Доказательство. Пусть P = (p l ,p 2 ,...,p m) е S. Используя (2.5.11), (2.5.3) и нормировочное условие вероятностей /?, i = 1,2,...,от, получим:
Так как это неравенство справедливо для любой смешанной стратегии Р, то оно справедливо, в том числе и для стратегии Р°, оптимальной во множестве смешанных стратегий 5: В р Р°q Но левая часть последнего неравенства,
по определению (2.5.9) оптимальной смешанной стратегии, равна цене игры в смешанных стратегиях. Таким образом,
С другой стороны, поскольку с5, то max Bf (q) max В 1 ’ (P:q) или, что то же
Неравенства (2.5.13) и (2.5.14) доказывают требуемое равенство B p c (q) = B p (q) ,
В силу этой теоремы можно нс говорить поотдельности о ценах в чистых и в смешанных стратегиях, а их общее значение назвать просто ценой игры по выигрыш-критерию Байеса
и обозначить через B p }