Decis

Принятие решений
"Дело не в том, что они не видят решения проблемы, дело в том, что они не видят самой проблемы" G.K. Chesterton (1874 - 1936) The Point of a Pin in The Scandal of Father Brown.

Постановка задачи принятия решений в условиях неопределенности

Мы принимаем решение в повседневной жизни каждый день множество раз. При этом наши решения могут быть правильными и неправильными в некотором смысле, оптимальными и неоптимальными. Решения, принимаемые нами, обычно ориентированны на ситуацию, которая произойдет или будет иметь место в ближайщем или далеком будущем, но само решение основывается на опыте, знаниях и интуиции, основанными на событиях прошлого. Поэтому основная сложность принятия того или иного решения заключается в том, что информация о будущем обычно ограниченна и неопределенна. Если неответственные решения обычно принимаются интуитивно, то для принятия ответственных решений, связянных со значимыми последствиями, требующих учета большого числа факторов, необходим формальный математический аппарат, позволяющий сравнивать различные возможные и альтернативные действия или решения не качественно, а количественно. Для этого, прежде всего, необходимо определить основные элементы ситуации принятия решений и классифицировать задачи принятия решений с точки зрения информации, имеющейся в распоряжении так, чтобы отнести интересующую нас ситуацию принятия решений к той или иной типовой задаче.
Основные элементы задачи принятия решений
Принятие решений имеет смысл, если сушествуют различные варианты альтернативных действий, число которых не меньше 2 и выбор одного из которых может привести к определенным последствиям. Пусть имеется совокупность 13 EMBED Equation.DSMT4 1415 альтернативных действий (мероприятий, операций)
13 EMBED Equation.DSMT4 1415
которые может совершить человек для достижения поставленной цели, причем одну и только одну операцию 13 EMBED Equation.DSMT4 1415 выбирает человек, принимающий решение. Примерами альтернативных действий могут быть {открыть счет в банке, купить акции предприятия, держать деньги дома}, {производить 1 изделие, 2 изделия и т.д.}, {использовать 1 единицу оборудования, 2 и т.д.}.
На выбор того или иного решения (действия) оказывают влияние объективные условия, например, на открытие счета в банке или покупку акций предприятия влияет экономическая ситуация, которая будет иметь место на определенном периоде времени, на количество производимых изделий влияет величина (относительная или абсолютная) спроса на эти изделия. Объективные условия представляются в задаче принятия решений в виде множества состояний природы
13 EMBED Equation.DSMT4 1415
одно из которых 13 EMBED Equation.DSMT4 1415, 13 EMBED Equation.DSMT4 1415, будет иметь место в действительности. Приведем примеры состояний природы:
1. экономический спад в заданный период времени (13 EMBED Equation.DSMT4 1415), подъем (13 EMBED Equation.DSMT4 1415) и стабильное состояние (13 EMBED Equation.DSMT4 1415);
2. низкий спрос на продукцию предприятия (13 EMBED Equation.DSMT4 1415), средний спрос (13 EMBED Equation.DSMT4 1415), высокий спрос (13 EMBED Equation.DSMT4 1415);
3. выполнение (13 EMBED Equation.DSMT4 1415) и невыполнение (13 EMBED Equation.DSMT4 1415) обязательств поставщика комплектующих.
Таких примеров можно привести множество в зависимости от конкретной задачи. Главной особенностью множества состояний природы является то, что это множество должно быть полным, т.е. оно должно включать все возможные ситуации. Другой особенностью множества состояний природы является то, что мы определенно не знаем, какое состояние будет иметь место в будущем.
Состояния природы могут быть также комбинированными. Например, если одновременно рассматривать второй и третий примеры состояний природы, то получим следующее множество из 6 состояний:
1. низкий спрос и выполнение обязательств,
2. низкий спрос и невыполнение обязательств,
3. средний спрос и выполнение обязательств,
4. средний спрос и невыполнение обязательств,
5. высокий спрос и выполнение обязательств,
6. высокий спрос и невыполнение обязательств.
Следует отметить, что множество состояний природы может быть бесконечным и непрерывным. Например, если наше решение достаточно жестко зависит от объема продаж в ближайшем будущем, который выражен в денежных условных единицах, то множество состояний в данном случае - множество неотрицательных вещественных чисел.
Другим фактором, влияющим на принятие решений, т.е. на выбор одного из действий, является последствие принимаемого решения, выраженное в некоторой числовой форме и зависящее от состояния природы. Другими словами, последствие есть функция, определенная на множестве альтернатив и на множестве состояний природы, т.е. для каждого действия 13 EMBED Equation.DSMT4 1415 и для каждого состояния природы 13 EMBED Equation.DSMT4 1415 определим последствия в виде полезности (выгоды, дохода) в некоторых единицах 13 EMBED Equation.DSMT4 1415. Величины 13 EMBED Equation.DSMT4 1415, играющие роль платежей в теории игр, обычно задаются из эвристических, субъективных соображений. При этом возникают специфические трудности при их числовой оценке, обусловленные такими факторами, как болезни, удовольствия, престиж, репутация и т.д. Величины полезностей можно задавать относительно, поэтому их также называют показателями предпочтительности. В экономических задачах зачастую вместо доходов задаются потери, обозначаемые 13 EMBED Equation.DSMT4 1415. При этом потери и полезности связаны между собой соотношением 13 EMBED Equation.DSMT4 1415, т.е. значения потерь могут быть сведены формально к доходам, поставив знак отрицания. Другими словами, значения потерь можно рассматривать как отрицательные значения дохода.
Если множество состояний природы является непрерывным, то полезности задаются обычно в виде некоторой типовой функции 13 EMBED Equation.DSMT4 1415, где, в частности, 13 EMBED Equation.DSMT4 1415. Например, если состояния природы определяются объемом продаж 13 EMBED Equation.DSMT4 1415, выраженых в денежных единицах, и полезности линейно зависят от этого объема продаж, то 13 EMBED Equation.DSMT4 1415, где параметры 13 EMBED Equation.DSMT4 1415 и 13 EMBED Equation.DSMT4 1415 зависят от выбора определенной альтернативы.
В дальнейшем для краткости будем записывать 13 EMBED Equation.DSMT4 1415 вместо 13 EMBED Equation.DSMT4 1415.
Задача лица, принимающего решение, состоит в том, чтобы принять какое-либо решение или выполнить какое-либо действие из совокуаности 13 EMBED Equation.DSMT4 1415. Каждое из этих действий есть чистая стратегия. Однако при многократном принятии решений совсем не обязательно ограничиваться использованием только одной чистой стратегии. Можно использовать смесь чистых стратегий в соответствии с некоторым вероятностным законом распределения 13 EMBED Equation.DSMT4 1415, 13 EMBED Equation.DSMT4 1415, определенным на множестве действий 13 EMBED Equation.DSMT4 1415. В этом случае будем говорить о смешанной стратегии. При смешанной стратегии чистые стратегии используются с вероятностями 13 EMBED Equation.DSMT4 1415. Можно заметить, что смешанные стратегии образуют бесконечное множество альтернатив, каждый элемент которого определяется некоторым распределением 13 EMBED Equation.DSMT4 1415. Соответственно, полезность каждой альтернативы при заданном состоянии природы 13 EMBED Equation.DSMT4 1415 зависит от 13 EMBED Equation.DSMT4 1415 и определяется как 13 EMBED Equation.DSMT4 1415.
Приведем пример постановки задачи принятия решений. Предположим, что необходимо выбрать одно из трех (13 EMBED Equation.DSMT4 1415) действий: купить облигации (13 EMBED Equation.DSMT4 1415), купить акции предприятия (13 EMBED Equation.DSMT4 1415) или положить деньги в банк на депозит (13 EMBED Equation.DSMT4 1415). Каждое из действий зависит от четырех (13 EMBED Equation.DSMT4 1415) возможных состояний природы, которые являются состояниями экономики в течение одного года: быстрый подъем экономики (13 EMBED Equation.DSMT4 1415), средний подъем экономики (13 EMBED Equation.DSMT4 1415), неизменное состояние экономики (13 EMBED Equation.DSMT4 1415), спад экономики (13 EMBED Equation.DSMT4 1415). Функция полезности, характеризующая ставку дохода в процентах от вложенной суммы, представлена в таблице:


быстрый
средний
неизменное
спад


подъем
подъем
состояние


облигации
12
8
6
3

акции
15
7
3
-2

депозит
7
7
7
7


Решение задачи выбора оптимального действия полностью определяется двумя факторами: 1) типом и объемом информации о состояниях природы и 2) критерием оптимальности альтернативы. Собственно говоря, критерий оптимальности также зависит от имеющейся информации о состояниях природы. Поясним более детально, что подразумевается под понятием информации о состояниях природы. Этоа дополнительная информация отражает степень уверенности в том, какое состояние природы будет в действительности иметь место или степень уверенности, что одно состояние более вероятно по сравнению с другим. Данная информация существенно влияет на решение. Так, например, если мы знаем, что с уверенностью 100% будет иметь место быстрый подъем экономики, то очевидно, что покупка акций предприятия даст наибольший доход. Этот случай является наиболее простым и приводит к принятию решений в условиях определенности. Другим крайним случаем является полное отсутствие информации о состояниях природы, т.е. мы имеем дело с задачей принятия решений в услових неопределенности. Конечно, это достаточно редкий случай, так как обычно исходя из предыдущего опыта или наблюдений, а также текущих тенденций, можно с некоторой вероятностью говорить о будущих состояниях. Однако, знание вероятностей состояний не значит, что выбрав оптимальное решение на основе этой информации, мы получим максимальный выигрыш, так как высокая вероятность состояния не означает, что будет реализовано именно это состояние. Другими словами, принимая решение в данной ситуации, мы все равно рискуем, поэтому задача принятия решений при такой исходной информации ведет к решению в условиях риска. В то же время, даже если мы знаем, некоторые вероятности состояний, это совсем не значит, что можно построить единственное распределение вероятностей для состояний природы, и есть смысл рассматривать множества распределений. Информация о состояниях природы вообще не обязательно может быть представлена в виде каких-либо вероятностей. Например, это могут быть сравнительные оценки состояний. В этом случае мы имеем дело с задачей принятия решений в услових неполноты информации. В принципе принятие решений в услових неполноты информации является частным случаем принятия решений в услових риска. Однако мы разделяем этот класс задач, так как его решение и критерии существенно отличаются от решения задачи при известных вероятностях состояний.
Каждая задача принятия решений имеет свой критерий оптимальности, т.е. некоторое правило, по которому численно определяется условие предпочтения одного действия по отношению к другому. Критерий оптимальности определяет упорядочивание всех альтернатив (множества 13 EMBED Equation.DSMT4 1415) по предпочтительности. При этом, как уже было сказано, критерий оптимальности полностью зависит от информации о состояниях природы.
В дальнейшем мы рассмотрим вопросы определения оптимального действия или наилучшей стратегии только на основе имеющейся априорной информации о состоянии природы без уточнения знаний о действительном состоянии природы путем проведения эксперимента.
Принятие решений в условиях определенности
Это наиболее простой класс задач принятия решений, когда состояние природы, которое будет определенно иметь место, известно заранее, т.е. до выполнения действия. Лицо, принимающее решение в данном случае, может всегда с определенностью предсказать последствия от выбора каждого действия. Это фактически означает, что число состояний сводится к одному, т.е. 13 EMBED Equation.DSMT4 1415. Поэтому логично потребовать от рационального лица, принимающего решение, выбрать то действие, которое дает наибольшее значение функции полезности. В задаче с вложением денег, если мы определенно знаем, что будет иметь место быстрый подъем экономики, то из трех альтернатив с полезностями 12, 15 и 7, мы вибираем ту, которая соответствует полезности 15, т.е. покупка акций предприятия.
Принятие решений в условиях неопределенности
В условиях неопределенности лицо, принимающего решение, (ЛПР) не может сказать что-либо о возможных состояниях природы, т.е. абсолютно не известно кокое из состояний будет иметь место. Для решения данной задачи наиболее распространенными критериями принятия решений являются:
1. Критерий равновозможных состояний (критерий Лапласа).
2. Критерий максимина Вальда.
3. Критерий пессимизма-оптимизма Гурвица.
4. Критерий минимакса сожалений Сэвиджа.
Следует отметить, что приведенные критерии являются далеко не единственными для принятия решений в условиях неопределенности. Однако остальные критерии являются в основном комбинацией рассматриваемых.
Критерий равновозможных состояний
Критерий равновозможных состояний основан на предположении Лапласа, согласно которому, если вероятности состояний абсолютно неизвестны, то они предполагаются равными. Это также соответствует принципу максимума энтропии. Тогда действие 13 EMBED Equation.DSMT4 1415 является оптимальным, если
13 EMBED Equation.DSMT4 1415
т.е. выбирается то действие, сумма полезностей которого по всем состояниям природы максимальна.
В задаче с вложением денег мы имеем для каждого действия:
13 EMBED Equation.DSMT4 1415
Первое действие дает максимальное значение суммарной полезности. Следовательно, 13 EMBED Equation.DSMT4 1415 - оптимальное действие.
Критерий максимина Вальда
Согласно критерию максимина для каждой строки (для каждого действия) матрицы полезностей определяется минимальное значение полезности. Далее из всех действий выбирается такое, которое соответствует максимальному из полученных минимальных значений, т.е. действие 13 EMBED Equation.DSMT4 1415 является оптимальным, если
13 EMBED Equation.DSMT4 1415
Обозначим 13 EMBED Equation.DSMT4 1415. Тогда возвращаясь к задаче с вложением денег, мы получаем:
13 EMBED Equation.DSMT4 1415
Отсюда 13 EMBED Equation.DSMT4 1415, что соответствует третьему действию. Следовательно, оптимальное действие - положить деньги в банк на депозит.
Следует отметить, что критерий максимина является перестраховочным, поскольку природа не может быть сознательным противником. Логическая основа критерия заключается в том, что из всех возможных состояний природы выбирается наихудшее для каждой акции с точки зрения полезности. Принимающий решение не может столкнуться с худшим результатом, чем тот, на который он ориентируется. Критерий максимина использует только крайний пессимист, не желающий идти ни на какой риск, поэтому этот критерий часто называют критерием крайнего пессимизма.
Критерий пессимизма-оптимизма Гурвица
Критерий Гурвица является более оптимистическим и использует смесь оптимистического и пессимистического подходов. Пусть
13 EMBED Equation.DSMT4 1415
Тогда действие 13 EMBED Equation.DSMT4 1415 является оптимальным, если
13 EMBED Equation.DSMT4 1415
Здесь 13 EMBED Equation.DSMT4 1415 - коэффициент пессимизма. Заметим, что если 13 EMBED Equation.DSMT4 1415, то критерий Гурвица сводится к критерию максимина. Если 13 EMBED Equation.DSMT4 1415, то критерий Гурвица сводится к так называемому критерию максимакса. Выбор коэффициента 13 EMBED Equation.DSMT4 1415 полностью определяется ЛПР.
Если в задаче с вложением денег использовать критерий Гурвица с 13 EMBED Equation.DSMT4 1415, то
13 EMBED Equation.DSMT4 1415
Значения 13 EMBED Equation.DSMT4 1415 уже были получены при рассмотрении критерия максимина. Тогда
13 EMBED Equation.DSMT4 1415 13 EMBED Equation.DSMT4 1415 13 EMBED Equation.DSMT4 1415
Отсюда оптимальное действие - покупка облигаций (13 EMBED Equation.DSMT4 1415), так как это действие соответствует максимальному значению 13 EMBED Equation.DSMT4 1415.
Критерий Гурвица является достаточно гибким за счет изменения коэффициента 13 EMBED Equation.DSMT4 1415.
Критерий минимакса сожалений Сэвиджа
Сожаление в теории принятия решений - это потери в результате упущенных возможностей. Пусть природа находится в состоянии 13 EMBED Equation.DSMT4 1415. Мера сожаления для 13 EMBED Equation.DSMT4 1415 -ого действия и 13 EMBED Equation.DSMT4 1415 -ого состояния природы определяется как разность
13 EMBED Equation.DSMT4 1415
Другими словами, мера сожаления определяется как разность между максимальным элементом в столбце матрицы полезностей и означает максимальный дополнительный выигрыш, который достигается, если для 13 EMBED Equation.DSMT4 1415 -ого состояния природы вместо 13 EMBED Equation.DSMT4 1415 -ого действия выбрать другое, оптимальное для этого состояния, действие. Заметим, что 13 EMBED Equation.DSMT4 1415. Действие 13 EMBED Equation.DSMT4 1415 является оптимальным, если
13 EMBED Equation.DSMT4 1415
Фактически для принятия решений используется критерий минимакса (минимум из максимальных значений), но не с матрицей полезностей, а с матрицей сожалений.
Используем данный критерий в задаче с вложением денег. Матрица сожалений показана в табл.

быстрый
средний
неизменное
спад


подъем
подъем
состояние


облигации
3
0
1
4

акции
0
1
4
9

депозит
8
1
0
0

Обозначив 13 EMBED Equation.DSMT4 1415, можно записать
13 EMBED Equation.DSMT4 1415 13 EMBED Equation.DSMT4 1415 13 EMBED Equation.DSMT4 1415
Отсюда 13 EMBED Equation.DSMT4 1415, что соответствует первому действию. Следовательно, оптимальное действие - покупка облигаций (13 EMBED Equation.DSMT4 1415).
Принятие решений в условиях риска
Ситуация принятия решений в условиях риска возникает в случаях, когда известны априорные вероятности состояний природы, т.е. имеется информация о распределении
13 EMBED Equation.DSMT4 1415
Данное распределение может быть получено на основе статистического анализа состояний природы или их субъективного описания. Например, исходя из статистических данных об экономической ситуации и основных тенденциях ее изменения, можно сделать прогноз относительно состояния экономики на определенный период. Так, рассматривая три состояния: низкий спрос на продукцию предприятия, средний спрос, высокий спрос, можно предположить учитывая различные факторы спроса, что шансы иметь низкий спрос примерно 10%, шансы иметь средний спрос около 60% и шансы иметь высокий спрос равны 100-10-60=30%.
Вероятности комбинированных состояний вычисляются как произведения соответствующих исходных состояний, если выполняется условие независимости комбинированных факторов. Если рассмотреть пример со спросом и выполнением обязательств предприятием-поставщиком, то предполагая, что поставщик выполнит обязательства с вероятностью 0.85 и не выполнит с вероятностью 1-0.85=0.15, то вероятности состояний:
1. низкий спрос и выполнение обязательств 0.1x0.85=0.085;
2. низкий спрос и невыполнение обязательств 0.1x0.15=0.015;
3. средний спрос и выполнение обязательств 0.6x0.85=0.51;
4. средний спрос и невыполнение обязательств 0.6x0.15=0.09;
5. высокий спрос и выполнение обязательств 0.3x0.85=0.255;
6. высокий спрос и невыполнение обязательств 0.3x0.15=0.045.
При этом сумма всех полученных вероятностей равна 1.
В случае бесконечного множества состояний, например, 13 EMBED Equation.DSMT4 1415, априорное распределение состояний заменяется плотностью 13 EMBED Equation.DSMT4 1415, определенной на множестве значений 13 EMBED Equation.DSMT4 1415 и удовлетворяющей условию
13 EMBED Equation.DSMT4 1415
Следует отметить, что данный прогноз обычно неточен, и трудно получить априорное распределение вероятностей с большой степенью доверия, тем более, что чаще всего вероятности состояний являются субъективными. Однако на первом этапе принятия решений обычно ограничиваются существующими оценками.
Существует ряд критериев принятия решений при наличии вероятностей состояний природы. К наиболее известным относятся:
1. Критерий максимума ожидаемых полезностей.
2. Критерий наиболее вероятного состояния природы.
3. Критерий минимума ожидаемых сожалений.
Критерий максимума ожидаемых полезностей
Это наиболее распространенный критерий, согласно которому оптимальное действие имеет максимальную ожидаемую полезность. Обозначим вектор полезностей, соответствующих 13 EMBED Equation.DSMT4 1415 -ому действию, 13 EMBED Equation.DSMT4 1415. Ожидаемая полезность для 13 EMBED Equation.DSMT4 1415 -ого действия есть математическое ожидание полезностей, соответствующих этому действию, т.е.
13 EMBED Equation.DSMT4 1415
Следует отметить, что если множество состояний природы бесконечно и имеет плотность 13 EMBED Equation.DSMT4 1415, то ожидаемая полезность для 13 EMBED Equation.DSMT4 1415 -ого действия определяется как
13 EMBED Equation.DSMT4 1415
Критерий оптимальности можно записать следующим образом. Действие 13 EMBED Equation.DSMT4 1415 является оптимальным, если для любого 13 EMBED Equation.DSMT4 1415 выполняется неравенство 13 EMBED Equation.DSMT4 1415 или 13 EMBED Equation.DSMT4 1415.
Рассмотрим снова пример с вложением денег, предполагая, что с вероятностью 0.4 будет быстрый рост экономики, с вероятностью 0.2 будет средний рост, с вероятностью 0.3 будет неизменное состояние и с вероятностью 0.1 будет спад, т.е. 13 EMBED Equation.DSMT4 1415, 13 EMBED Equation.DSMT4 1415, 13 EMBED Equation.DSMT4 1415, 13 EMBED Equation.DSMT4 1415. Тогда ожидаемые полезности альтернатив вычисляются как
13 EMBED Equation.DSMT4 1415
13 EMBED Equation.DSMT4 1415
13 EMBED Equation.DSMT4 1415
Максимальное значение ожидаемой полезности - 13 EMBED Equation.DSMT4 1415. Следовательно, оптимальное действие - покупка облигаций (13 EMBED Equation.DSMT4 1415).
Так как критерий максимума ожидаемых полезностей является одним из самых важных и распространенных, то рассмотрим использование этого критерия при определении смешанной стратегии или рандомизированного действия, т.е. наша задача определить оптимальное распределение вероятностей 13 EMBED Equation.DSMT4 1415, определенное на множестве действий 13 EMBED Equation.DSMT4 1415, такое, что ожидаемая полезность
13 EMBED Equation.DSMT4 1415
была бы максимальной. Другими словами, стратегия 13 EMBED Equation.DSMT4 1415 является оптимальной, если для всех 13 EMBED Equation.DSMT4 1415 выполняется неравенство 13 EMBED Equation.DSMT4 1415. Таким образом, для нахождения оптимальной стратегии 13 EMBED Equation.DSMT4 1415 необходимо решить следующую задачу линейного программирования:
13 EMBED Equation.DSMT4 1415
при ограничениях
13 EMBED Equation.DSMT4 1415
Достаточно просто показать, что оптимальное решение задачи - чистая стратегия, т.е. 13 EMBED Equation.DSMT4 1415. Действительно, множество распределений 13 EMBED Equation.DSMT4 1415 образует 13 EMBED Equation.DSMT4 1415 -мерный симплекс вероятностей, а оптимальное решение задачи линейного программирования определяется крайними точками множества значений переменных. Поэтому оптимальным распределением 13 EMBED Equation.DSMT4 1415 является одно из следующих (крайние точки): 13 EMBED Equation.DSMT4 1415
Таким образом, задача поиска оптимальной смешанной стратегии сводится к уже рассмотренной задаче максимизации ожидаемой полезности, т.е. к поиску оптимальной чистой стратегии. В то же время, если расширить задачу принятия решений наложив на распределение 13 EMBED Equation.DSMT4 1415 дополнительные ограничения, например, 13 EMBED Equation.DSMT4 1415 для некоторых 13 EMBED Equation.DSMT4 1415 и 13 EMBED Equation.DSMT4 1415, то, в общем, смешанная стратегия может отличаться от чистой.
Предположим, что в примере с вложением денег мы используем смешанную стратегию, но с условием, что вложения в акции будут осуществляться чаще, чем в облигации. Тогда появляется дополнительное ограничение на распределение 13 EMBED Equation.DSMT4 1415 в виде неравенства 13 EMBED Equation.DSMT4 1415. В результате имеем следующую задачу оптимизации:
13 EMBED Equation.DSMT4 1415
при ограничениях 13 EMBED Equation.DSMT4 1415 и 13 EMBED Equation.DSMT4 1415.
Оптимальное решение - 13 EMBED Equation.DSMT4 1415, 13 EMBED Equation.DSMT4 1415, 13 EMBED Equation.DSMT4 1415. При этом следует отметить, что 13 EMBED Equation.DSMT4 1415, что меньше, чем 13 EMBED Equation.DSMT4 1415.
Критерий наиболее вероятного состояния природы
Согласно критерию наиболее вероятного состояния, выбирается наиболее вероятное состояние природы и далее задача решается в условиях полной определенности в предположении, что обязательно будет иметь место состояние с максимальной вероятностью. Оптимальным считается действие, соответствующее максимальному значению полезности для состояния с максимальной вероятностью. В примере с вложением денег максимальную вероятность 13 EMBED Equation.DSMT4 1415 имеет состояние быстрого роста экономики. Для этого состояния покупка акций имеет наибольшую полезность (15). Следовательно, оптимальное действие - покупка акций (13 EMBED Equation.DSMT4 1415).
Следует отметить, что критерий наиболее вероятного состояния природы используется достаточно редко.
Критерий минимума ожидаемых сожалений
Критерий минимума ожидаемых сожалений является обобшением критерия минимакса сожалений Сэвиджа, используемого для решения задачи принятия решений в условиях неопределенности. Согласно данному критерию, вычисляется матрица сожалений и затем для каждого действия вычисляется ожидаемое сожаление. Оптимальное действие соответствует минимальному значению ожидаемого сожаления. Обозначим вектор сожалений, соответствующих 13 EMBED Equation.DSMT4 1415 -ому действию, 13 EMBED Equation.DSMT4 1415. Ожидаемое сожаление для 13 EMBED Equation.DSMT4 1415 -ого действия есть математическое ожидание сожалений, соответствующих этому действию, т.е.
13 EMBED Equation.DSMT4 1415
Критерий оптимальности можно записать следующим образом. Действие 13 EMBED Equation.DSMT4 1415 является оптимальным, если для любого 13 EMBED Equation.DSMT4 1415 выполняется неравенство 13 EMBED Equation.DSMT4 1415 или 13 EMBED Equation.DSMT4 1415.
Используем данный критерий в задаче с вложением денег. Ожидаемые сожаления (см. матрицу сожалений в описании критерия минимакса сожалений Сэвиджа) имеют вид:
13 EMBED Equation.DSMT4 1415
13 EMBED Equation.DSMT4 1415
13 EMBED Equation.DSMT4 1415
Минимальное значение ожидаемого сожаления - 13 EMBED Equation.DSMT4 1415. Следовательно, оптимальное действие - покупка облигаций (13 EMBED Equation.DSMT4 1415).
Определение функции полезности
Вернемся к критерию максимума ожидаемых полезностей, так как он имеет наибольшее распространение при решении задач принятия решений. Матрица (таблица) полезности содержит полезности (доходы), выраженные в терминах денег. Однако ожидаемые денежные значения не всегда являются наилучшим критерием в задачах принятия решений. Значение денег изменяется в различных ситуациях и для различных лиц, принимающих решение. В общем, значение денег не является линейной функцией от количества денег. В каждой ситуации аналитик должен определять полезности денег для лица, принимающего решение и выбирать альтернативный курс акций, который соответствует наибольшей ожидаемой полезности в большей степени, чем наибольшему ожидаемому денежному значению.
Люди осуществляют страховые выплаты для того, чтобы избежать возможности финансовых потерь в результате нежелательных событий. Однако полезности различных событий не могут быть пропорциональны их денежным последствиям. Если потери относительно большие, человек предпочитает осуществить соответствующую выплату. Если субъект считает, что потери незначительные, то маловероятно, что он будет осуществлять соответствующую выплату.
Субъекты различаются в их отношении к риску, и эти различия влияют на их выбор. Поэтому они должны принимать одинаковые решения относительно воспринимаемого риска в аналогичных ситуациях. Это не означает, что субъекты оценивают одинаковое количество риска в аналогичных ситуациях. Более того, из-за финансовой стабильности некоторого субъекта, два субъекта в одной и той же ситуации могут реагировать различно, но их поведение должно быть рационально.
Ожидаемое денежное вознаграждение, соответствующее различным решениям, может быть неприемлемым по следующим двум важным причинам:
1. Денежная единица, например, рубль, не всегда точно выражает персональное значение последствия. Это то, что движет некоторых людей играть в лотерею за 1 руб.
2. Ожидаемые денежные значения могут не совсем адекватно отражать нежелание рисковать. Например, предположим, что имеется выбор между получением 10 руб. за ничего не делание или за участие в игре. Результат игры зависит от подбрасывания симметричной монеты. Если выпадает орел, то игрок получает 1000 руб. Однако, если выпадает решка, игрок теряет 950 руб. Первая альтернатива имеет ожидаемое вознаграждение 10 руб., вторая - 0.5x1000 + 0.5x(- 950) = 25 руб. Очевидно, что второй выбор был бы более предпочтительным, если бы критерием был бы ожидаемое денежное вознаграждение. В то же время, субъект может предпочесть гарантированные 10 руб., чтобы избежать риска потери 950 руб.
Рассмотрим известный Санкт-Петербургский парадокс Бернулли. Парадокс состоит в следующем: симметричную монету, вероятности выпадания орла и решки которой равны 1/2, бросают до тех пор, пока не появится орел. Игрок получает 13 EMBED Equation.DSMT4 1415 долларов, если первое выпадение орла произойдет на 13 EMBED Equation.DSMT4 1415 -ом испытании. Вероятность этого события равна вероятности последовательного выпадения решек в первых n-1 испытаниях и появления орла на 13 EMBED Equation.DSMT4 1415 -ом испытании, которая равна 13 EMBED Equation.DSMT4 1415. Таким образом, игрок может получить 2 доллара с вероятностью 1/2, 4 доллара с вероятностью 1/4, 8 доллара с вероятностью 1/8 и т.д. Следовательно среднее (ожидаемое) значение выигрыша равно
13 EMBED Equation.DSMT4 1415
и эта сумма бесконечна. Отсюда следует, что за участие в игре можно заплатить какую угодно сумму. Однако никто не будет в этом случае руководствоваться средним денежныим выигрышем. Бернулли предложил считать не действительную денежную стоимость исходов, а внутреннюю стоимость их денежных значений. Разумно предположить, что для многих субъектов внутрення стоимость денег увеличивается с ростом суммы денег, но в уменьшающейся степени. Такой функцией, например, является логарифм. Так, если полезность 13 EMBED Equation.DSMT4 1415 долларов равна 13 EMBED Equation.DSMT4 1415, то среднее значение полезности равно 13 EMBED Equation.DSMT4 1415, что является конечным числом.
Почему некоторые люди покупают страховку, а некоторые нет? Процесс принятия решений включает среди прочих психологические и экономические факторы. Концепция полезности - это попытка измерить полезность денег для лица, принимающего решение. Она позволяет объяснить, почему, например, некоторые люди покупают билет лотереи за 1 руб., чтобы выиграть 1 миллион рублей. Для таких людей 1000000x1 руб. меньше, чем 1000000 руб. Для этих людей шанс выиграть 1000000 руб. значит больше, чем 1 руб., чтобы играть. Поэтому для того, чтобы принять осознанное решение, учитывающее отношение лица, принимающего решение, к риску, нужно перевести денежную матрицу доходов в матрицу полезностей. Главный вопрос: как измерить функцию полезности для конкретного лица, принимающего решение?
Рассмотрим пример задачи принятия решений относительно инвестиций.
Прежде всего, что означает полезность 12?
a) Назначим 100 единиц полезности и ноль единиц полезности наибольшим и наименьшим доходам, выраженным в рублях, соответственно в таблице доходов. Для рассматриваемого числового примера, мы назначим 100 единиц значению 15, и 0 - значению 2.
b) Попросим ЛПР выбрать между следующими сценариями:
1) Получить 12 руб. за ничего не делание (называемые определенный эквивалент, разница между определенным эквивалентом лица, принимающего решение, и ожидаемого денежного значения называется плата за риск.).
ИЛИ
2) Играть следующую игру: выиграть 15 руб. с вероятностью 13 EMBED Equation.DSMT4 1415 ИЛИ выиграть 2 руб. с вероятностью 13 EMBED Equation.DSMT4 1415, где 13 EMBED Equation.DSMT4 1415 - некоторое число от 0 до 1.
Изменяя значение 13 EMBED Equation.DSMT4 1415 и повторяя аналогичный вопрос, найдется значение 13 EMBED Equation.DSMT4 1415, при котором ЛПР не может выбрать из двух сценариев один из-за их "одинаковости" с его точки зрения. Скажем 13 EMBED Equation.DSMT4 1415.
c) Теперь полезность за 12 руб. равна 0.58x100 + (1-0.58)x0 = 58.
d) Повторяя эту процедуру для всех элементов таблицы доходов, получим матрицу полезностей.
С точки зрения отношения лица, принимающего решение, можно выделить три типа поведения:
1. Если вознаграждение за риск положительное, то ЛПР готов идти на риск и называется ищущим риска. Очевидно, что некоторые люди в большей степени готовы идти на риск, чем другие: чем больше вознаграждение за риск, тем больше готовность идти на него.
2. Если вознаграждение за риск отрицательное, то ЛПР готов избежать риска и называется нерасположенным рисковать.
3. Если вознаграждение за риск нулевое, то ЛПР называется, нейтральным к риску.
Типичные графики зависимости полезности от вознаграждения или дохода для рассмотренных видов отношений к риску показаны на рисунке.

Основные аксиомы теории полезностей
Формально можно говорить о том, что полезность 13 EMBED Equation.DSMT4 1415 есть функция дохода 13 EMBED Equation.DSMT4 1415, т.е. 13 EMBED Equation.DSMT4 1415. Если решение 13 EMBED Equation.DSMT4 1415 ведет к одному из альтернативных уровней дохода 13 EMBED Equation.DSMT4 1415, 13 EMBED Equation.DSMT4 1415 и 13 EMBED Equation.DSMT4 1415, то результатом решения будет один из альтернативных уровней полезностей 13 EMBED Equation.DSMT4 1415, 13 EMBED Equation.DSMT4 1415 и 13 EMBED Equation.DSMT4 1415. Если известны вероятности 13 EMBED Equation.DSMT4 1415, 13 EMBED Equation.DSMT4 1415 и 13 EMBED Equation.DSMT4 1415 каждого из трех исходов, то ожидаемая полезность решения 13 EMBED Equation.DSMT4 1415 равна
13 EMBED Equation.DSMT4 1415
Функция 13 EMBED Equation.DSMT4 1415 также называется функцией полезности фон Неймана-Моргенштерна.
Каждое решение, принятое в условиях неопределенности или риска, можно рассматривать как выбор лотереи 13 EMBED Equation.DSMT4 1415 по всем альтернативным уровням дохода 13 EMBED Equation.DSMT4 1415, где каждому уровню 13 EMBED Equation.DSMT4 1415 дохода приписана вероятность 13 EMBED Equation.DSMT4 1415. Вероятность 13 EMBED Equation.DSMT4 1415 есть вероятность получения дохода 13 EMBED Equation.DSMT4 1415, когда решение сделано. Поэтому можно обозначитm лотерею 13 EMBED Equation.DSMT4 1415 множеством пар 13 EMBED Equation.DSMT4 1415. Таким образом, принятие решений представляется как выбор одной из альтернативных лотерей. Если субъект должен выбрать одну из двух лотерей 13 EMBED Equation.DSMT4 1415 и 13 EMBED Equation.DSMT4 1415, то устанавливаются предпочтения субъекта: 13 EMBED Equation.DSMT4 1415 предпочтительнее 13 EMBED Equation.DSMT4 1415, 13 EMBED Equation.DSMT4 1415 предпочтительнее 13 EMBED Equation.DSMT4 1415, 13 EMBED Equation.DSMT4 1415 и 13 EMBED Equation.DSMT4 1415 неразличимы.
Предположим, что имеются две лотерей с одним и тем же множеством альтернатив
13 EMBED Equation.DSMT4 1415
Тогда каждая вероятность 13 EMBED Equation.DSMT4 1415 приводит к новой лотереи
13 EMBED Equation.DSMT4 1415
Если лотереи 13 EMBED Equation.DSMT4 1415 и 13 EMBED Equation.DSMT4 1415 не имеют одних и тех же альтернатив, то мы можем всегда взять объединение 13 EMBED Equation.DSMT4 1415 всех возможных альтернатив и рассматривать 13 EMBED Equation.DSMT4 1415 и 13 EMBED Equation.DSMT4 1415, имеющие альтернативы из 13 EMBED Equation.DSMT4 1415. При этом вероятности альтернатив из 13 EMBED Equation.DSMT4 1415, не принадлежащих 13 EMBED Equation.DSMT4 1415 равны нулю и наоборот. Любая лотерея вида 13 EMBED Equation.DSMT4 1415 называется составной.
Предположим теперь, что субъект предпочитает лотерею 13 EMBED Equation.DSMT4 1415 лотереи 13 EMBED Equation.DSMT4 1415. Естественно ожидать, что если "смешать" третью лотерею 13 EMBED Equation.DSMT4 1415 с 13 EMBED Equation.DSMT4 1415 и 13 EMBED Equation.DSMT4 1415, то предпочтение 13 EMBED Equation.DSMT4 1415 к 13 EMBED Equation.DSMT4 1415 останется неизменным. Это рассуждение определяет следующую аксиому:
Аксиома независимости. Выбор субъекта лотереи удовлетворяет аксиоме независимости, согласно которой всякий раз, когда лотерея 13 EMBED Equation.DSMT4 1415 предпочтительнее лотереи 13 EMBED Equation.DSMT4 1415, то для любого 13 EMBED Equation.DSMT4 1415 составная лотерея 13 EMBED Equation.DSMT4 1415 предпочтительнее составной лотереи 13 EMBED Equation.DSMT4 1415 для всех лотерей 13 EMBED Equation.DSMT4 1415.
Аксиома непрерывности. Выбор субъекта лотереи удовлетворяет аксиоме непрерывности, согласно которой всякий раз, когда последовательность 13 EMBED Equation.DSMT4 1415 вероятностей сходится к 13 EMBED Equation.DSMT4 1415, т.е. 13 EMBED Equation.DSMT4 1415 и лотерея 13 EMBED Equation.DSMT4 1415 предпочтительнее лотереи 13 EMBED Equation.DSMT4 1415 для всех 13 EMBED Equation.DSMT4 1415, то 13 EMBED Equation.DSMT4 1415 предпочтительнее лотереи 13 EMBED Equation.DSMT4 1415.
Теорема ожидаемой полезности. Пусть 13 EMBED Equation.DSMT4 1415 - множество всех лотерей. Если функция полезности субъекта 13 EMBED Equation.DSMT4 1415, определенная на множестве лотерей удовлетворяет аксиомам независимости и непрерывности, то существует функция полезности фон Неймана-Моргенштерна 13 EMBED Equation.DSMT4 1415, зависящая от дохода 13 EMBED Equation.DSMT4 1415, такая, что
13 EMBED Equation.DSMT4 1415 для всех лотерей 13 EMBED Equation.DSMT4 1415.
Формально выбор типа поведения может быть представлен следующим образом. Рассмотрим лотерею с двумя призами 13 EMBED Equation.DSMT4 1415 и 13 EMBED Equation.DSMT4 1415. Также предположим, что функция полезности 13 EMBED Equation.DSMT4 1415 является строго возрастающей. Ожидаемая полезность этой лотереи - 13 EMBED Equation.DSMT4 1415, а ожидаемое денежное вознаграждение - 13 EMBED Equation.DSMT4 1415. Выигрыш в этом случае равен
13 EMBED Equation.DSMT4 1415
Отрицательное значение 13 EMBED Equation.DSMT4 1415 говорит о том, что
13 EMBED Equation.DSMT4 1415
Следовательно,
13 EMBED Equation.DSMT4 1415
Это означает, что функция полезности 13 EMBED Equation.DSMT4 1415 является выпуклой, что в свою очередь означает, что ЛПР является ищущим риска. Аналогично можно получить вогнутость функции полезности для нерасположенного рисковать субъекта. В этом случае 13 EMBED Equation.DSMT4 1415 является положительным.
Пример (Определение величины страховки). Предположим, что субъект (ЛПР) имеет дом стоимостью 13 EMBED Equation.DSMT4 1415 руб. Существует вероятность 13 EMBED Equation.DSMT4 1415, что дом может быть разрушен наводнением или сгореть в пожаре. Предположим также, что ЛПР может купить такую страховку, что 1 руб. ее стоимости покрывается 13 EMBED Equation.DSMT4 1415 рублями. Здесь 13 EMBED Equation.DSMT4 1415 - страховая премия. За сколько купит субъект страховку? Очевидно, что субъект купит страховку, которая совместима с его ощущением риска, т.е. соответствующую его индивидуальной функции полезности 13 EMBED Equation.DSMT4 1415. Используя теорему ожидаемой полезности, можно утверждать, что величина страховки 13 EMBED Equation.DSMT4 1415, которую бы заплатил субъект должна максимизировать ожидаемую полезность
13 EMBED Equation.DSMT4 1415
Это выражение получено из следующих соображений. Если дом разрушен (вероятность 13 EMBED Equation.DSMT4 1415), то его хозяин получит страховку 13 EMBED Equation.DSMT4 1415 минус число 13 EMBED Equation.DSMT4 1415 (страховые выплаты). С другой стороны, с вероятностью 13 EMBED Equation.DSMT4 1415 дом не будет разрушен. В этом случае его стоимость будет равна 13 EMBED Equation.DSMT4 1415. Если считать, что функция 13 EMBED Equation.DSMT4 1415 определена только для положительных доходов, то 13 EMBED Equation.DSMT4 1415. Это гарантирует, что значения ожидаемой полезности 13 EMBED Equation.DSMT4 1415 находятся в интервале 13 EMBED Equation.DSMT4 1415. Пусть 13 EMBED Equation.DSMT4 1415, 13 EMBED Equation.DSMT4 1415, 13 EMBED Equation.DSMT4 1415. Тогда максимум 13 EMBED Equation.DSMT4 1415 зависит от типа субъекта.
Случай 1. Субъект не расположен рисковать и его функция полезности - 13 EMBED Equation.DSMT4 1415. В этом случае
13 EMBED Equation.DSMT4 1415
Дифференцируя 13 EMBED Equation.DSMT4 1415 по 13 EMBED Equation.DSMT4 1415, получим
13 EMBED Equation.DSMT4 1415
Принимая 13 EMBED Equation.DSMT4 1415, получаем 13 EMBED Equation.DSMT4 1415.
Случай 2. Субъект является ищущим риска и его функция полезности - 13 EMBED Equation.DSMT4 1415. В этом случае
13 EMBED Equation.DSMT4 1415
Ожидаемая полезность максимальна при 13 EMBED Equation.DSMT4 1415. Это означает, что данный субъект вообще не будет покупать страховку.
Случай 3. Субъект является нейтральным к риску и 13 EMBED Equation.DSMT4 1415. Тогда 13 EMBED Equation.DSMT4 1415 Ожидаемая полезность максимальна при 13 EMBED Equation.DSMT4 1415.
Пример (Выбор оптимального распределения инвестиций, портфельная оптимизация). Предположим, что ЛПР имеет 10000 руб. для инвестиций в акции и облигации. Пусть акции имеют переменный доход, равномерно распределенный со средним значением 10% и среднеквадратическим отклонением 2%. Облигации приносят четкий доход 5%. ЛПР не расположен рисковать и его функция полезности - 13 EMBED Equation.DSMT4 1415. Учитывая функцию полезности, ЛПР выбирает распределение инвестиций, которе максимизирует функцию полезности. Пусть 13 EMBED Equation.DSMT4 1415 - доля инвестиций в акции (13 EMBED Equation.DSMT4 1415). Ожидаемая полезность инвестора имеет вид
13 EMBED Equation.DSMT4 1415
где 13 EMBED Equation.DSMT4 1415 - интервал возможного дохода от акций и 13 EMBED Equation.DSMT4 1415 - доход от акций.
Так как распределение дохода от акций равномерное, то 13 EMBED Equation.DSMT4 1415 и 13 EMBED Equation.DSMT4 1415. Отсюда 13 EMBED Equation.DSMT4 1415 и 13 EMBED Equation.DSMT4 1415. Следовательно
13 EMBED Equation.DSMT4 1415
Оптимальное значение 13 EMBED Equation.DSMT4 1415 равно 0.511, т.е. 51.1% денег следует вложить в акции и 48.9% - в облигации.
13PAGE 15


13PAGE 14215




Root EntryEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativemEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeІEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation Native

Приложенные файлы

  • doc 359753
    Размер файла: 744 kB Загрузок: 0

Добавить комментарий