14 мая 2004
643

Стреляев: О выборе метода выбора

Человек наделен способностью планировать свои действия и предвидеть с той или иной степенью достоверности результат этих действий. Каждой работе предшествует интеллектуально-волевой процесс формирования последовательности шагов, ведущих к достижению намеченной цели. Этот процесс называют процессом принятия решений.
К множеству задач принятия решений может быть отнесена любая задача, требующая интеллектуального усилия. Возможно, все определяется лишь ее формулировкой. Так, известная школьная задача о заполнении водой бассейна может рассматриваться как задача принятия решения, если в ее формулировке заложить соответствующий вопрос.
Содержательно всякая задача принятия решений является оптимизационной, т.е. состоит в выборе среди некоторого множества допустимых (т.е. допускаемых обстоятельствами) решений тех из них, которые можно в том или ином смысле квалифицировать как наилучшие. При этом допустимость каждого решения понимается в смысле возможности его фактического осуществления, а оптимальность - в смысле его целесообразности.
Обычно под принятие решения понимают выбор одного из некоторого конечного или бесконечного множества вариантов. Однако однозначно отожествлять принятие решения с выбором есть смысл лишь в общетеоретическом аспекте, при решении же конкретных практических задач такой подход не вполне справедлив. Выбор - в буквальном понимании этого слова возможен лишь на конечном множестве альтернатив, т.е. когда из бесконечного множества легко выделяется некоторое его конечное подмножество на основании опыта, интуиции, самых разнообразных знаний лица, принимающего решение. Задача принятия решения - более широкое понятие, чем задача выбора. Основное отличие задач выбора от задач принятия решения на бесчисленном множестве альтернатив в методическом плане заключается в том, что в задаче выбора осуществляется сравнение результатов с целью выявления оптимального по избранному критерию, а в задаче принятия решения на бесчисленном множестве альтернатив сравнение невозможно, требуются иные, вычислительные методы.
В общем виде содержанием задачи принятия решения является построение формальной модели некоторой проблемной ситуации и выбора на множестве допустимых решений элемента, удовлетворяющего тем или иным критериям оптимальности и называемого оптимальным решением задачи.
В любой задаче принятия решения принимаются, как минимум, два решения: одно из них определено содержанием задачи и является целью решения, второе принимается в процессе решения, зависит от уровня развития теории принятия решений, определяет ход, метод решения и является средством. Если задача решается известными методами, то метод определяется в процессе решения задачи выбора, если же способ решения неизвестен, т.е. задача не относится ни к одному из изученных классов, то выбор метода выбора осуществляется на бесчисленном множестве альтернатив.

Информированность лица принимающего решение в задачах выбора
Качество решения задачи выбора зависит от степени априорной информированности ЛПР о проблемной ситуации и выбранного подхода к решению задачи. В то же время тот или иной подход требует некоторого минимума информированности, при котором он может быть применен.
В общем случае можно говорить о существовании следующих видов задач выбора:
1. ЛПР априорно знает состояние внешней среды, либо имеет возможность определить его по своему усмотрению. Тогда результат зависит только от выбора ЛПР. Этот случай называют детерминированным, задача выбора решается в условиях определенности.
2. Задача выбора в условиях риска появляется тогда, когда ЛПР для каждого состояния внешней среды знает вероятность его появления.
3. При отсутствии какой-либо информации о появлении состояний внешней среды говорят о задаче выбора в условиях неопределенности.
4. И, наконец, для полноты картины, есть смысл говорить о принятии решения в условиях неизвестности. Это происходит, когда отсутствует информация о степени полезности того или иного исхода, когда невозможно заранее представить множества характеристик внешней среды, способных реализоваться и т.д.
Приведенные виды задач выбора различаются степенью информированности ЛПР в той прикладной области, где применяется математическая теория решений, т.е. в той области, которая выходит за рамки математики. Степенью значимости для ЛПР того или иного исхода и развитием прикладной области знания и возможностью получения в ней новых знаний определяется, решать ли задачу на данном уровне информированности, или прежде получить дополнительную априорную информацию по задаче, чтобы от условий неопределенности перейти к условиям риска, от условий риска - к условиям определенности.
Чем выше априорная информированность по задаче, тем больше шансов получить наилучшее решение. Однако практическая деятельность часто требует решений, когда получение дополнительной информации требует больших временных или каких-нибудь иных затрат, либо вообще на данном этапе развития знания невозможно. Таких ситуаций множество, поэтому разработка математических методов принятия решений при любом уровне информированности актуальна.
Интеллектуально волевой акт принятия решения при решении задачи в условиях неопределенности волевой составляющей процесса предоставляет больше "прав", чем если бы решалась задача в условиях определенности. За недостаток информации приходится платить риском. Однако степень риска может быть во многих случаях снижена, если кроме традиционно необходимого априорного знания использовать информацию, которая практически всегда имеется в распоряжении ЛПР или в принципе может иметься.
В задачах принятия решений в условиях неопределенности мы часто, не зная заранее тот набор внешних факторов, который осуществиться, тем не менее можем оценить их "степень дружественности" к нам. В общем случае можно выделить три группы ситуаций, в которых:
- внешние факторы определяются "противником", т.е. они "склонны" стать такими, при которых исход для ЛПР будет наихудшим;
- внешние факторы формируются по каким-то неизвестным нам законам, отражают состояние нейтральной "среды", они не зависят от степени полезности результата для ЛПР;
- внешние факторы определяются "союзником".
При этом в случаях, где "фигурирует" "противник" или "союзник", ЛПР следует полагать, что они разумны. Каждая из этих ситуаций может быть разделена на два класса, принадлежность к которым определяется информированностью противника или союзника о выборе ЛПР. Если выбор, сделанный ЛПР, известен, то внешние факторы формируются по законам принятия решения в условиях определенности. Если же выбор ЛПР неизвестен, то применяются правила принятия решения в условиях неопределенности, при этом союзник стремится максимизировать, а противник - минимизировать полезность для ЛПР. В математическом смысле минимизация принципиально не отличается от максимизации, речь идет лишь о разных концах одного и того же отрезка, однако, зная, с кем приходится иметь дело, с противником или с союзником, ЛПР во многих случаях выберет разные стратегии своего поведения.
Следует отметить, что возможны и смешанные ситуации в смысле "дружественности" стороны, определяющей внешние факторы. Можно легко найти из практики примеры, когда полезность, полученная ЛПР, противную сторону не интересует, она стремится лишь максимизировать свою полезность, т.е. по отношению к выигрышу ЛПР она поступает как среда.
Кроме того, ЛПР может обладать информацией не только о степени дружественности и информированности противной стороны, но и о реализуемом ею подходе к выработке своего решения.

Игра с нулевой суммой. Принцип гарантированного результата
Математически ситуация. Когда набор внешних факторов определяется противником или союзником представляется игрой. Игра с противником представляет конфликт. В общем случае каждый исход конфликта может по разному оцениваться ЛПР и противником. Наихудший для ЛПР исход не обязательно является наилучшим для противника. Если же выигрыш ЛПР равен проигрышу противника (и наоборот), то ситуация представляется игрой с нулевой суммой.
Удобной во многих случаях формой представления задачи выбора является матрица решений (платежная матрица, матрица игры):

F1 F2 ... Fn
Е1 Е11 Е12 ... Е1n
Е2 Е21 Е22 ... Е2n
... ... ... ... ...
Еm Еm1 Еm2 ... Еmn

Где Е = {Е1, Е2, ... , Еm} - множество альтернатив (выборов, стратегий);
F = {F1. F2, ... , Fn} - множество наборов внешних факторов;
е11, е12, ... , еmn - множество оценок полезности результатов.

Теоретически любая задача выбора может быть представлена матрицей решений. Однако на практике при решении задач большой размерности построение матрицы решений является процессом чрезвычайно сложным, а иногда и неосуществимым.
Назовем сторону, осуществляющую выбор своей стратегии на множестве {Е1, Е2, ... , Еm} стороной А, сторону, проводящей выбор на множестве {F1. F2, ... , Fn} - стороной В.
Исходя из того, что сторона В стороне А должна представляться несомненно разумной, следует полагать, что в играх с нулевой суммой сторона В будет стремиться создать наихудшие для А условия. Тогда стороне А, при желании получить максимальную из возможных в наихудших условиях полезность, гарантированную полезность, следует выбрать ту стратегию, минимальный выигрыш при которой будет больше минимального при выборе любой другой стратегии. Такой крайне осторожный, пессимистический подход получил название принципа гарантированного результата (принцип минимакса).
Значение выигрыша в этом случае представляется следующим образом:
а = mах min еij
Величина а называется нижней ценой игры.
Если сторона В принимает решение в условиях неопределенности, то, действуя наиболее осторожным образом, она отдаст предпочтение той своей стратегии, которая гарантирует ей минимальный проигрыш при самом неблагоприятном стечении обстоятельств, т.е.
b = min mах еij
Величина b называется верхней ценой игры.
При равенстве верхней и нижней цен игры можно говорить об устойчивости минимаксных стратегий, а игру отнести к играм с седловой точкой.
Далеко не все игры при пессимистическом выборе сторон приводят к устойчивой ситуации. Неустойчивость проявляется тогда, когда знание одной из сторон о выборе противника побуждает ее сменить свою стратегию.

Классы задач. Определение усредненных характеристик ситуаций
Представляется интересной следующая задача.
Пусть имеется некоторый субъект, которому очень большое количество раз приходится принимать решения в ситуациях, представляемых игрой с нулевой суммой, где у каждого из игроков имеется по две стратегии и при этом он всегда пользуется максиминным подходом. Возникает ряд вопросов. Как часто выбранные им стратегии будут приводить к наименьшему выигрышу? Как часто исход будет оказываться наилучшим? Какова доля задач, о которых можно говорить, что они устойчивы по Нэшу? Какова доля задач, где результат окажется выше ожидаемого?
Ответы на эти вопросы можно было бы получить без особого труда, если бы возможных задач было конечное количество и были бы известны вероятности предъявления для решения той или иной задачи. Однако различных задач бесчисленное множество, даже в самой простейшей, представляемой матрицей 2 х 2 любая из четырех возможных ситуаций теоретически может быть представлена любым числом бесконечного числового ряда. Следовательно, для получения ответов на поставленные вопросы требуется разбиение всего бесконечного множества задач на конечное количество классов, при этом правомочным являлось бы допущение, что частоты предъявляемых задач различных классов равны.
Игра 2 х 2 с нулевой суммой представляется матрицей вида:
F1 F2
Е1 е11 е12
Е2 е21 е22

Множество возможных исходов игры - {е11, е12, е21, е22}.
Каждое конкретное заполнение матрицы может быть представлено системой равенств и неравенств. Так как в матрице четыре элемента. То всего этих равенств и неравенств шесть, т.е. четыре элемента образуют шесть пар. Однако часть из них несет избыточную информацию. Например, пусть исходы игры представляются следующей системой:
е11 > е12
е11 < е21
е11 = е22
е12 < е21
е12 < е22
е21 > е22

Очевидно, что та же ситуация может быть представлена и иначе:
е11 > е12
е11 < е21
е11 = е22
Неравенства е12 < е21, е12 < е22 и е21 > е22 избыточны.
С точки зрения такого подхода следующие игры одинаковы и обе они представляются приведенными неравенствами:
F1 F2
Е1 5 3
Е2 8 5

F1 F2
Е1 100 87
Е2 340 100
Наборы конкретных значений выигрышей не зависят от воли игроков, их выбором определяется величина исхода их из некоторого заданного множества. При этом будем считать, что в идеале сторона А желает максимального исхода, а ее противник - сторона В - минимального. В приведенных примерах исходы 8 и 340, 5 и 100, 3 и 87 равнозначны, при этом 8 и 340 являются наилучшими для А, 3 и 87 - для В.
Представление системой равенств и неравенств игр позволяет получить конечный список их возможных видев. Элементарными вычислениями из комбинаторики получаем, что полный список содержит 75 видов.
Однако следует признать, что очередность следования строк и столбцов матрицы платежей формируется случайным образом. Смена нумерации стратегий сторон не приводит к принципиально иной задаче. Поэтому использовать для проводимого анализа разбиение на 75 классов можно лишь в том случае. Если соотнести с различными классами различные частоты их предъявлений.
Для того. Чтобы полагать частоты равными, следует исключить ряд задач как дублирующие. Например, задача, представляемая кортежем 1234 аналогична задаче 3412 (смена нумерации стратегий стороны А), 2143 (смена нумерации стратегий стороны В и 4321 (смена нумераций стратегий и стороны А, и стороны В). Таким образом, количество классов задач, представляемых матрицей 2 х 2, сокращается до 20-ти.
Для обозначения классов требуется выработать символы ситуаций. Могут быть использованы любые буквы, любые значки, но представляется целесообразным использовать (с некоторыми оговорками) цифры. Это позволит определять средний исход по множеству задач как среднее арифметическое, что удобно при машинном решении задач большой размерности, при обобщении полученных результатов для матрицы N х N.
Обозначим символом 1 наихудший в любой конкретной задаче исход для стороны А, символом 2 ближайший к наихудшему по степени предпочтения, символом 2,5 - средний исход, 3 и 4 - ближайший к наилучшему и наилучший исходы. Очевидно, что этого набора символов достаточно для представления любой задачи размерности 2 х 2.
В таблице 1 показаны ситуации, которым надлежит реализоваться при использовании стороной А максиминного, а стороной В минимаксного подходов. Классы задач представлены в ней в первом столбце кортежами из 4-х элементов, с использованием вышеописанных цифровых обозначений, упорядоченными следующим образом: {е11, е12, е21, е22}.

Таблица 1
Кортеж исходов Условия неопределенности
для А и В Неопределенность для А, определенность для В Определенность для А, неопределенность для В
1 1 1 4
1 4 1 4
4 4 1 1
1 4 4 1
4 4 4 1 1
1
4
1 V 4
4 1
1
4
1
4 1
1
4
4
4
1 2,5 4 4
1 4 2,5 4
1 4 4 2,5
1 4 2,5 2,5
1 2,5 4 2,5
1 2,5 2,5 4
1 1 4 2,5
1 4 1 2,5
1 4 2,5 1 4
2,5
2,5 V 4
2,5
2,5
2,5
2,5
1
2,5 V 1 4
2,5
2,5
2,5
2,5
2,5
2,5
1
1 4
2,5
4
2,5
2,5
2,5
2,5
1
2,5
1 2 3 4
1 2 4 3
1 3 2 4
1 3 4 2
1 4 3 2
1 4 2 3 3
3
2
2
3
2 3
3
2
2
2
2 3
3
2
3
3
2
Средний исход 2,5 2,3 2,7

В третьем столбце таблицы приведены исходы для случая информированности стороны В о выбранной стороной А стратегии. Четвертый столбец представляет исходы при действии стороны В по минимаксной стратегии, а стороны А - в условиях определенности.
Здравый смысл подсказывает и данные в таблице 1 убеждают, что при решении достаточно большого количества задач усредненный суммарный результат будет соответствовать той ситуации, которая понимается как средняя. При этом лишь в 15% задач знание избранной противником стратегии позволит улучшить свой результат. В 5% случаев каждую принимающую решение сторону ждет "приятный сюрприз", т.е. исход оказывается лучше ожидаемого (а от неприятных сюрпризов стороны защищены сущностью реализованного подхода).
Можно добавить, что совершенно необязательно знать численные значения полезностей. К тому же это не всегда возможно. В соответствии в принципом несовместимости, чем сложнее система, тем меньше она допускает возможности точного количественного описания (а для принятия решений в простых системах не обязательна разработка специальных методов, очень часто достаточно элементарного здравого смысла). Формальное представление не обязательно должно быть численным, хотя всякое численное - формально. Если в приведенных выше неравенствах знак "=" понимать как равнозначно или безразлично, знак "<" - как "хуже", а знак ">" как "лучше", предпочтительнее, то выбор стратегии может осуществляться не в меньшей степени формально, чем при знании чисел.

Стреляев С.П.
1995 г.http://nvolgatrade.ru/
Рейтинг всех персональных страниц

Избранные публикации

Как стать нашим автором?
Прислать нам свою биографию или статью

Присылайте нам любой материал и, если он не содержит сведений запрещенных к публикации
в СМИ законом и соответствует политике нашего портала, он будет опубликован