Дилемма заключенного в теории и жизни

Что общего между ценовыми войнами операторов сотовой связи, коллективным пользованием природными ресурсами, пробками на дорогах и поведением избирателей? Во всех перечисленных ситуациях игроки встают перед сложным выбором: поступить эгоистично, как завещал классик экономической теории Адам Смит, или действовать сообща? Принцип невидимой руки рынка, когда каждый сам за себя, уже подвергается сомнению, ведь другим может быть от этого плохо. Поэтому сегодня специалисты по теории игр думают о том, как сделать лучше обществу, а не каждому отдельному гражданину.

Дилемма
Дилемма: а) Полемический довод с двумя выставленными противоположными положениями, исключающими возможность третьего б) Положение, при котором выбор одной из двух противоположностей одинаково затруднителен

Невидимая рука

Невидимая рука — это метафора шотландского экономиста XVIII века Адама Смита, обозначающая принцип, при котором благотворный общественный порядок возникает как непреднамеренное следствие поступков индивидов. «Таким образом, отдельная личность, стремясь к собственной выгоде, независимо от ее воли и сознания, направляется к достижению экономической выгоды и пользы для всего общества», — А. Смит.

Портрет Адама Смита, автор — Джон Кей
Портрет Адама Смита, автор — Джон Кей
«Никогда столько не лгут, как во время войны, после охоты и до выборов» (Отто фон Бисмарк)

Начнем с небольшой истории дилеммы заключенного, которую рассказал один из первопроходцев Теории игр Гарри Кун на симпозиуме в рамках получения Нобелевской премии 1994 года. Приезжает как-то математик Альберт Такер в Стэнфорд, в отпуск. Что нужно ученому на отдыхе? Конечно, рабочий кабинет! Такового на кафедре математики не оказалось, и Такера любезно приютила кафедра психологии. Противоположности имеют свойство притягиваться, поэтому нетрудно объяснить, почему канадским математиком стали интересоваться его соседи психологи. Они предложили ему провести студенческий семинар по теории игр, для которого Альберт Такер и придумал знаменитую дилемму заключенного. Психологам ведь нужно было доходчиво продемонстрировать математические выкладки, так и родился истинно фундаментальный пример! С тех пор ни один учебник или книга по теории игр не обходятся без дилеммы заключенного, по ней написан не один десяток серьезных и авторитетных работ, проведено множество социальных экспериментов и исследований. Хотя есть и альтернативная история о том, что математическая структура игры была описана годом раньше двумя математиками Мерилом Фледом и Мелвином Дрешером, но все же широкую известность и применение получила именно идея Такера, поэтому мы уделили этой версии наибольшее внимание. Настало время познакомиться с этим классическим примером, поэтому закройте глаза, сделайте глубокий вдох и приготовьтесь оказаться на месте... преступника.

Дилемма заключенного (англ. Prisoner's dilemma, реже употребляется название «дилемма бандита») — фундаментальная проблема в теории игр, согласно которой рациональные игроки не всегда будут сотрудничать друг с другом, даже если это в их интересах.

Дилемма заключенного
Дилемма заключенного — фундаментальная проблема в теории игр, согласно которой рациональные игроки не всегда будут сотрудничать друг с другом, даже если это в их интересах. Предполагается, «заключенный» максимизирует свой собственный выигрыш, не заботясь о выгоде других

Представьте, что вы с напарником ограбили банк. Вы вроде бы все предусмотрели и спланировали — и тут незадача, вас ловит полиция и отвозит на допрос! Видно, что стекло в банке разбито, но где деньги — непонятно. Прямых улик, подтверждающих вашу виновность, нет, детективам остается только «раскалывать» вас поодиночке. Они разводят вас по разным камерам и предлагают сделку. И вот тут все и начинается. Если вы пойдете на сделку со следствием и сдадите улики на напарника, полиция отпустит вас; если вы промолчите, но ваш напарник сдаст вас — вы получите 10 лет лишения свободы; если вы оба промолчите — проведете по одному году в тюрьме за разбитое окно; а если сдадите друг друга — каждого из вас осудят на 5 лет, с учетом «скидки» за сотрудничество со следствием.

Матрица выигрышей

Лауреат Нобелевской премии 2005 года американский экономист Томас Шеллинг, помимо разработки важных концепций теории игр, таких как фокальные точки, достоверность, обязательство и многое другое, еще придумал и способ отображения выигрышей (платежей) игроков в одной матрице, которой мы воспользуемся на следующей странице.

Приведем эту игру, как говорят математики, к нормальной форме (см. таблицу). А именно: обозначим двух игроков, все их возможные стратегии и соответствующие им платежи (это цифровое выражение того, что вы получите в результате). У преступников есть только две стратегии: молчать или предать, у этих стратегий разные платежи, в зависимости от того, что выберет соперник. Если игрок A (назовем его Ваня) выбирает «Молчать», а игрок 2 (пусть будет Коля) выбирает «Предать», то платеж Вани составит -10 (-10 лет свободной жизни), а платеж Коли 0 лет, и наоборот. Если Ваня и Коля оба молчат, получают по -1 году, а если оба предают — то получают по -5 лет. В таблице далее платежи Вани отмечены черным цветом на белом фоне, а платежи Коли — белым на черном.

Напомним, что вы изолированы друг от друга и не можете быть уверены в выборе вашего напарника. Вдумайтесь в эту дилемму, изучите платежи. Что бы вы сделали на месте Вани или Коли?

Молчать или предать?

Итак, у Вани и Коли есть по 2 стратегии, и перед ними стоит серьезный выбор: идти со следствием на сделку («Предать») или не говорить полиции ничего («Молчать»). В такой ситуации они думают только о наилучшем исходе для себя. Всмотритесь в таблицу: если Ваня выберет «Молчать», а Коля «Предать» — то Ваня с 50% вероятностью проведет 10 лет своей жизни за решеткой, пока Коля будет свободно гулять на свободе, а в лучшем случае сядет в тюрьму всего на 1 год. Но если Ваня выберет «Предать», то с вероятностью 50% его сразу отпустят на свободу, или с такой же вероятностью посадят на 5 лет вместе с Колей (это намного лучше 10 лет). Колю разбирать не будем, как бы для него обидно ни звучало, но он здесь абсолютно симметричен Ване. Представим ход мыслей Вани: «Если Коля выберет "Молчать", то для меня лучше "Предать", так как я сразу выйду на свободу. Если Коля выберет "Предать", то и мне лучше "Предать", потому что я сяду в тюрьму хотя бы на 5 лет, а не на 10, если буду "Молчать". Получается, что бы ни выбрал Коля — для меня лучше "Предать" в любом случае». Сейчас мы с вами увидели, что у Вани есть одна стратегия «Предать», которая является лучше стратегии «Молчать», что бы ни выбрал Коля. Такая стратегия имеет свое название — доминирующая. И тут мы подошли ко второму важному правилу теории игр.

Еще одно важное правило: если у вас есть доминирующая стратегия, примените ее.

«Иногда лучший способ погубить человека — это предоставить ему самому выбрать судьбу» (Михаил Афанасьевич Булгаков, «Мастер и Маргарита»)

Вы видите, что Коле и Ване однозначно следует выбрать свои доминирующие стратегии «Предать», тогда исход игры можно представить результатом, что каждый из подельников получит по 5 лет. Но вернитесь к предыдущей таблице еще раз: является ли это оптимальным решением для обоих? Может быть, есть вариант, в котором Ваня и Коля получают меньшие сроки? Да, надеемся, вы тоже смотрите на ячейку «Молчать — Молчать». Верно, есть у ребят наиболее оптимальный ход — промолчать обоим и сесть в тюрьму всего на 1 год. Но чтобы выбрать эту стратегию, Коле и Ване нужно обязательно договориться об этом, иначе риски слишком велики. Тут мы подбираемся к многослойности дилеммы заключенного еще ближе, а именно: сотрудничество игроков всегда приводит к лучшему результату, нежели выбор доминирующих стратегий. «Молчать» сообща лучше, чем «Предать» поодиночке. Однако у стратегии сотрудничества есть и оборотная сторона: стремление избежать предательства. Об этом мы поговорим в конце главы, а пока рассмотрим примеры дилеммы заключенного из реальной жизни.




Поделиться ссылкой