Теория игр и принятие решений


Чтобы посмотреть презентацию с картинками, оформлением и слайдами, скачайте ее файл и откройте в PowerPoint на своем компьютере.
Текстовое содержимое слайдов презентации:

Тема «Теория игр и принятие решений» 1. Предмет и задачи теории игр.2. Матричные игры. Равновесная ситуация.3. Смешанные стратегии матричных игр.4. Игры с природой.Учебные вопросы: Построением математических моделей конфликтных ситуаций и разработкой методов решения возникающих в этих ситуациях задач занимается теория игр.Методы и рекомендации теории игр применимы к многократно повторяющимся конфликтным ситуациям. Если конфликтная ситуация реализуется ограниченное число раз, то рекомендации теории игр теряют смысл.Игра – это упрощенная математическая модель конфликтной ситуации.Игра ведется по определенным правилам. Суть игр состоит в том, что каждый участник принимает такое решение, которое, как он полагает, обеспечит ему наилучший исход. Исходом игры называется значение некоторой функции, называемой функцией выигрыша (платежной функцией), которая может задаваться в матричном или аналитическом виде.1. Предмет и задачи теории игр.
1. Предмет и задачи теории игр.Стратегия – это совокупность правил, однозначно определяющих последовательность действий игрока в каждой конкретной ситуации, складывающейся в процессе игр.Оптимальной называется стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш. Количество стратегий у каждого игрока может быть конечным или бесконечным. В зависимости от этого игры подразделяются на конечные и бесконечные.Игра состоит из отдельных партий.Партия – это каждый вариант реализации игры.В партии игроки совершают ходы.Ход – это выбор и реализация игроком одного из допустимых вариантов поведения.
2. Матричные игры:Пусть в игре участвуют два игрока. Игрок А имеет m стратегий, а игрок В – n стратегий.Обозначим стратегии игрока А как А1,А2,…,Аm , а стратегии игрока В – как В1 ,В2 …,Вn .Если игрок А выбрал стратегию Ai , а игрок B – стратегию Bk , то выигрыш игрока A составит аik , а игрока B – bik , причем аik = - bik (1) 2. Матричные игры:Поэтому при анализе такой игры достаточно рассмотреть выигрыш только одного игрока, например выигрыш аik игрока А. Зная выигрыш аik по формуле (1) легко определить выигрыш bik .Матричные игры называются парными играми с нулевой суммой, в которых выигрыш одного игрока равен проигрышу другого.Если известны все значения аik для каждой пары стратегий {Ai Bk }, i =1, 2, …, m, k = 1, 2, …, n, то их удобно записать в виде прямоугольной таблицы, строки которой соответствуют стратегиям игрока A , а столбцы – стратегиям игрока В (табл. 1). 2. Матричные игры:{5C22544A-7EE6-4342-B048-85BDC9FD1C3A} B1B2…BnA1A2…A mа11а21…аm1a12а22…аm2…………а1nа2n…аmn: Чаще эти выигрыши записывают в виде платежной матрицы (матрицы игр) размера , поэтому такие игры называются матричными играми :A =Таблица 1.Чаще эти выигрыши 2. Матричные игры:Равновесная ситуацияПусть матричная игра m×n задана платежной матрицейA = (2)Строки этой матрицы соответствуют стратегиям игрока , а столбцы – стратегиям игрока . В теории игр предполагается, что оба игрока действуют разумно, т.е. стремятся к получению максимального выигрыша, считая, что соперник действует наилучшим для себя образом. 2. Матричные игры:Определим оптимальные стратегии каждого из игроков. Начнем с анализа стратегий игрока А . На стратегию Аi игрока A игрок B ответит такой стратегией Bk, при которой выигрыш игрока A будет минимальным. Аналогично игрок B будет отвечать на все m стратегий игрока A . Другими словами, найдем в каждой строке матрицы минимальный элемент (минимальные выигрыши игрока A)и запишем их в правом столбце табл. 2. 2. Матричные игры:Действуя разумно, игрок остановится на той стратегии , для которой окажется максимальным. Поэтому среди чисел выбираем максимальное число(3) 2. Матричные игры:Принцип построения стратегии игрока А, основанный на максимизации минимальных выигрышей, называется принципом максимина (maxmin).Проведем анализ стратегий игрока В. Для этого найдем в каждом столбце матрицы максимальный элемент (максимальные выигрыши игрока А ):И запишем их в нижней строке табл. 2. Действуя разумно, игрок B остановится на той стратегии , для которой выбираем минимальное число (4)Число β называется верхней ценой игры. 2. Матричные игры:Принцип построения стратегии игрока B, основанный на минимизации максимальных выигрышей, называется принципом минимакса (minmax).Нижняя цена игра α и верхняя цена игра β связаны неравенствомα ≤ β. (5)Если или (6)то ситуация оказывается равновесной, и ни один игрок не заинтересован в том, чтобы ее нарушить. В том случае, когда верхняя цена игры равна нижней, их называют просто ценой игры.Если α=β, то такую игру называют также игрой с седловой точкой, а пара оптимальных стратегий – седловой точкой матрицы. Цена игры обозначается буквой v. Тогда . 3. Смешанные стратегии матричных игрЕсли платежная матрица не имеет седловой точки, т.е. , то поиск решения игры приводит к применению сложной стратегии, состоящей в случайном применении двух и более стратегий с определенными частотами. Такая сложная стратегия называется смешанной.В табл. 4 приведен пример, когда нижняя цена игры не совпадает с верхней ценой игры . 3. Смешанные стратегии матричных игр{5C22544A-7EE6-4342-B048-85BDC9FD1C3A} В1В2В3Минимальные выигрыши игрока А4-20112-33-3-3-2-3Максимальные выигрыши игрока В423 Таблица 4.Здесь , а . 3. Смешанные стратегии матричных игрОбратимся к общему случаю матричной игры, представленной в табл. 2. Обозначим через вероятности, с которыми игрок А использует в ходе игры свои чистые стратегии Для этих вероятностей выполняются условия: (8)Вектор , проекция которого удовлетворяет условиям (8), полностью определяет характер игры игрока А и называется его смешанной стратегией. Механизм случайного выбора чистых стратегий, которым пользуется игрок А, обеспечивает ему бесконечное множество смешанных стратегий. 3. Смешанные стратегии матричных игрАналогично, вектор , проекция которого удовлетворяет условиям (9), (9)полностью определяет характер игры игрока В и называется смешанной стратегией игрока В. Игрок В, как и игрок А, располагает бесконечным множеством смешанных стратегий. 3. Смешанные стратегии матричных игрПусть игроки А и В применяют и смешанные стратегии и соответственно, т.е. игрок А использует стратегию с вероятностью , а игрок В – стратегию с вероятностью . Поскольку события и независимы, то вероятность появления комбинации равна произведению вероятностей и , т.е. . При использовании смешанных стратегий игра приобретает случайный характер, случайными становятся и величины выигрышей игроков. 3. Смешанные стратегии матричных игрПоэтому выигрыш игрока А (проигрыш игрока В) определяют его математическим ожиданием, рассчитываемым по формуле (10) Функция (10) называется платежной функцией игры с матрицей, заданной в табл. 5.Нижней ценой игры называется число , рассчитываемое по формуле: (11)Верхней ценой игры называется число , рассчитываемое по формуле: (12) 3. Смешанные стратегии матричных игр{5C22544A-7EE6-4342-B048-85BDC9FD1C3A} ……Вероятности использования чистых стратегий игроком А ……Вероятности использования чистых стратегий игроком В Таблица 5. 3. Смешанные стратегии матричных игрВеличину определенную соотношением (13), называют ценой игры. 3. Смешанные стратегии матричных игрТеорема 1

3. Смешанные стратегии матричных игрПусть , - оптимальные смешанные стратегии и - цена игры.Оптимальная смешанная стратегия игрока А складывается только из тех чистых стратегий (т.е. только те вероятности , могут отличаться от нуля), для которыхАналогично, только те вероятности могут отличаться от нуля, для которых Теорема 2

3. Смешанные стратегии матричных игрГрафические решения матричных игрГрафический метод применим к тем играм, в которых хотя бы один игрок имеет две стратегии. Рассмотрим игру 2×п, представленную в табл. 6. Эта игра не имеет седловой точки. Согласно теореме имеем (15) 3. Смешанные стратегии матричных игрМаксимум функции (16) найдем, построив ее график. Для этого поступаем следующим обра­зом. Построим графики прямыхдля каждого к = 1, 2,..., п в системе координат pOw (рис.1). В соответствии с требованием (16) на каждой из построенных прямых определяются и отмечаются наименьшие значения. На рис. 2 эти значения выделены полужирной ломаной линией. Эта ломаная огибает снизу все семейство построенных прямых и называется нижней огибающей семейства. 3. Смешанные стратегии матричных игр В1В2B3В4B5В6Вероятности использования чистых стратегий игроком АA16431-10pA2-2-110541-pВероятности использования чистых страте­гий игроком Вq1q2q3q4q5q6  3. Смешанные стратегии матричных игр 3. Смешанные стратегии матричных игр

Приложенные файлы

  • pptx 7168814
    Размер файла: 706 kB Загрузок: 0

Добавить комментарий