В самой игре наказания (и награды, где это уместно) представлены утилита номера. Положительные числа представляют хорошие результаты, отрицательные числа представляют плохие результаты, и один результат лучше другого, если число, связанное с ним, больше. (Однако будьте осторожны с тем, как это работает для отрицательных чисел, поскольку, например, -5 больше -20!)
В приведенной выше таблице первое число в каждом поле относится к результату для игрока 1, а второе число представляет результат для игрока 2. Эти цифры представляют собой лишь один из множества наборов чисел, которые согласуются с установкой дилеммы заключенных.
Как только игра определена, следующим шагом в анализе игры является оценка стратегий игроков и попытка понять, как игроки могут себя вести. Экономисты делают несколько предположений, анализируя игры: во-первых, они предполагают, что оба игрока знают выплаты как для себя, так и для другого игрока, и, во-вторых, они предполагают, что оба игрока ищут в рационально максимизировать собственную отдачу от игры.
Один простой начальный подход заключается в поиске того, что называется доминирующие стратегии- стратегии, которые являются лучшими независимо от того, какую стратегию выберет другой игрок. В приведенном выше примере выбор признания является доминирующей стратегией для обоих игроков:
Учитывая, что признание является лучшим для обоих игроков, неудивительно, что результат, в котором оба игрока признаются, является равновесным результатом игры. Тем не менее, важно быть более точным с нашим определением.
Концепция Равновесие по Нэшу был записан математиком и теоретиком игры Джоном Нэшем. Проще говоря, равновесие по Нэшу - это набор стратегий наилучшего реагирования. Для игры с двумя игроками равновесие по Нэшу - это результат, когда стратегия игрока 2 - лучший ответ на стратегию игрока 1, а стратегия игрока 1 - лучший ответ на стратегию игрока 2.
Нахождение равновесия Нэша с помощью этого принципа можно проиллюстрировать в таблице результатов. В этом примере лучшие ответы игрока 2 на игрока 1 обведены зеленым. Если игрок 1 признается, лучший ответ игрока 2 - признаться, так как -6 лучше, чем -10. Если игрок 1 не признается, лучший ответ игрока 2 - признаться, так как 0 лучше, чем -1. (Обратите внимание, что эти рассуждения очень похожи на рассуждения, используемые для определения доминирующих стратегий.)
Лучшие ответы Игрока 1 обведены синим цветом. Если игрок 2 признается, лучший ответ игрока 1 - признаться, так как -6 лучше, чем -10. Если игрок 2 не признается, лучший ответ игрока 1 - признаться, так как 0 лучше, чем -1.
Равновесие по Нэшу - это результат, в котором есть зеленый и синий круг, поскольку он представляет собой набор лучших стратегий реагирования для обоих игроков. В общем, возможно иметь несколько равновесий по Нэшу или не иметь их вообще (по крайней мере, в чистых стратегиях, как описано здесь).
Возможно, вы заметили, что равновесие по Нэшу в этом примере кажется неоптимальным (в частности, это не является оптимальным по Парето), поскольку оба игрока могут получить -1 а не -6. Это естественный результат взаимодействия, присутствующего в игре - в теории, не признаться было бы оптимальная стратегия для группы в целом, но индивидуальные стимулы не позволяют этому результату быть достигнуты. Например, если игрок 1 думал, что игрок 2 будет молчать, у него будет стимул выдать его, а не молчать, и наоборот.
По этой причине равновесие по Нэшу также можно рассматривать как результат, когда ни один из игроков не имеет стимула в одностороннем порядке (т.е. сам по себе) отклоняться от стратегии, которая привела к этому результату. В приведенном выше примере, когда игроки решают признаться, ни один из них не может добиться большего успеха, если передумает сам.