Последовательные игры

Все мы много раз слышали, что нужно просчитывать ходы наперед. Но как это осуществить на практике, в соответствии с теорией игр? В этой главе вы узнаете о методе обратной индукции, потренируете свой мозг игрой в «Палочки» и научитесь рисовать дерево игры.

Последовательные и параллельные ходы. Когда умрут шахматы?

Разберемся с типами игр. Это важно, потому что для поиска оптимальных стратегий необходимо отнести конфликтную ситуацию к определенному классу. Что позволит нам использовать верную концепцию решения, которая будет соответствовать нашему конфликту. Специалисты классифицируют игры по многим критериям: по количеству игроков, стратегий, характеру взаимоотношения сторон, характеру выигрыша и другим. Радует, что популяризаторы теории игр сходятся во мнении, что новичкам такой серьезный подход к классификации игр может быть излишен. Поэтому мы начнем с двух типов игр: игры с последовательными ходами и игры с параллельными ходами. Такого деления будет вполне достаточно для поиска оптимальных действий в реальной жизни.

Чтобы отличать один тип от другого, вам нужно определить характер стратегического взаимодействия игроков: принимают ли они решения параллельно, или по очереди.

Ходы в шахматах
В шахматах можно проанализировать все допустимые ходы и просчитать все исходы игры. Кстати, компьютеры этому уже научились!

Рассмотрим игры с параллельными ходами. В таких играх все игроки принимают решения одновременно и в этот момент не знают, что выбирают их соперники. Примерами таких игр могут быть битвы политических партий, пробки на дорогах, аукционы или ценовые войны производителей. Об этом типе взаимодействия мы поговорим в главе 5, а сейчас подробнее остановимся на играх с последовательными ходами.

«В том-то и состоят шахматы. Сегодня ты даешь сопернику урок, а завтра он тебе» (Роберт Джеймс Фишер)

В таких играх игроки ходят по очереди и знают все предыдущие ходы соперников. Этот тип можно охарактеризовать такой последовательностью: сначала ты, потом я, потом ты, потом я и т. д.

Иван Николич и Горан Арсович
Самую долгую шахматную партию сыграли Иван Николич и Горан Арсович в Белграде в 1989 году. Она длилась 20 часов 15 минут! За игру было сделано 269 ходов, и она закончилась вничью. Теоретически партия может длиться еще дольше, но после введения правила 50 ходов это число удалось ограничить

Пожалуй, идеальным примером для описания последовательной игры являются шахматы. Игроки делают свои ходы поочередно, за ними можно открыто наблюдать, цели и предпочтения игроков прозрачны и понятны — разве не прелесть? И кстати, теоретически доказано, что в шахматах возможно проанализировать все возможные ходы и просчитать все исходы игры. Конечно, теория и практика за руку ходят далеко не всегда, а в этом случае так вообще порознь. Пытливые ученые посчитали, что суперкомпьютеру, который был бы мощнее наших с вами домашних машин в 1000 раз, понадобилось бы несколько лет на то, чтобы окончательно «решить» шахматы. Даже несмотря на стремительную скорость происходящих в мире изменений, ждать такого развития вычислительной техники остается еще долго. Но когда этот день наступит, то его можно абсолютно точно назвать и днем смерти шахмат.

Пока эта перспектива далека от дней сегодняшних. Хорошие гроссмейстеры еще одерживают верх над компьютерами и способны предсказать конец игры, когда на доске остается небольшое количество фигур. Как они это делают? Они применяют два подхода: анализ ходов методом обратных рассуждений и субъективную оценку шахматной позиции. Второй подход шахматисты часто называют «знанием», интуицией или искусством. В общем-то, это опыт, который можно накопить путем наблюдения за многими играми и игроками. А вот анализ ходов методом обратного рассуждения представляет собой буквально правило № 1в теории игр! Его-то мы сейчас и обсудим.

Розы или ромашки?

Все игры с последовательными ходами имеют общий принцип, который два американских профессора экономики Авинаш Диксит и Барри Нейлбафф настаивают обозначить правилом № 1 любого стратегического поведения. Этот принцип заявляет о том, что каждый игрок должен анализировать будущие ответные действия соперников и этот прогноз использовать для поиска своего оптимального хода в настоящем.

Алан Тьюринг
В 1951 году ученый Алан Тьюринг написал первую в мире компьютерную программу для игры в шахматы. Так как в то время не было машины, способной обработать эту программу, для тестовой игры Тьюрингу пришлось самому выполнять алгоритмические вычисления, делая один ход в несколько минут
Не каждая девушка предпочтет ромашки букету роз
Наши поступки не всегда рациональны, и не каждая девушка предпочтет ромашки букету роз

Вам следует проанализировать, к чему могут привести ваши решения, и на основании этого выбрать наилучший ход.

ПРАВИЛО № 1 — смотреть вперед и рассуждать в обратном порядке.

Разберем этот принцип на житейском примере. Представим, что Сергей собирается на свидание с Инной и думает, какие цветы ему купить для своей возлюбленной: розы или ромашки? Розы стоят в два раза дороже ромашек, а до зарплаты еще неделя, так что экономия пойдет бюджету Сергея явно на пользу. Но Инна больше обрадуется розам, а букет ромашек еще может и не принять. В этой игре Инна будет делать ход после того, как Сергей сделал свой выбор, а значит, здесь мы видим последовательное взаимодействие.

Начинаем с постройки модели. Приводим игру к развернутой форме, которая носит название древовидная.

На рисунке вы видите два возможных действия Сергея: дарить розы или дарить ромашки. Следующий ход делает Инна. В каждом из двух случаев она решает, принимать ли ей цветы от Сергея или нет. Справа в таблице указаны платежи игроков (так называется выгода в числовом выражении, которую получат игроки). Платежи мы назначили в соответствии с предпочтениями игроков. Так, в случае Сергея потратить меньше денег на ромашки и получить расположение Инны будет иметь максимальную выгоду, 10 единиц. Если же она отклонит ромашки, то ущерб Сергея оценим как -5, потому что есть вещи и похуже. Например, если Сергей купит дорогие розы, которые Инна не захочет принять, то ему будет вдвойне обиднее, а значит, его платеж составит -10. Если же Инна примет розы, то профит Сергея будет 5. Что касается Инны, то ее оптимальной стратегией будет всегда принимать букет, потому что это лучше, чем не иметь букета вовсе. Инна у нас выступает в роли рационального игрока! Однако у Инны есть свои предпочтения: розы ей нравятся больше ромашек, а значит, и платеж Инны в случае букета с розами составит 10 единиц, если она его примет. Но как мы увидели выше, у Инны в общем-то есть только один оптимальный вариант: всегда брать букет.

Включаем наше правило «Смотреть вперед и рассуждать в обратном порядке» и начинаем рассматривать игру с конца, то есть с последнего уровня. В нашем случае мы начнем анализировать поведение Инны в точках, отмеченных синей и зеленой стрелкой. Из двух вариантов в каждой ветке Инне лучше принять букет — ее платеж будет выше в обоих случаях и составит 5 в случае ромашек и 10 в случае роз. Понимая это, Сергей перемещается на предыдущий уровень и принимает решение, какой же ему выбрать ход: розы или ромашки. Букет ромашек принесет Сергею наибольший платеж в игре, значит, это и будет его оптимальной стратегией. Улыбки ради мы взяли такую ситуацию в качестве примера, чтобы наглядно посмотреть на древовидную схему игры, и попробовали рассуждать методом обратной индукции. Однако на деле не стоит забывать о том, что наши поступки часто не являются рациональными, а значит, надеяться, что любая девушка будет всегда принимать букет ромашек, тоже не стоит.

Поиграем в спички?

Обратную индукцию хорошо разбирать игрой в спички, или палочки. Такой тип стратегической игры использовали в реалити-шоу «Surviver» типа «Последний герой» на зарубежных каналах, причем довольно успешно — ни одна из команд не находила сразу правильного решения. Немудрено, потому как обычно требуется три или четыре раунда, чтобы научиться играть правильно — это на своих занятиях с первокурсниками университетов Лиги плюща установили американские профессора экономики.

Спички
И где только ни используется игра в палочки!

В «палочки» также играют участники Форта Боярд. На русскоязычном сайте этой игры, кстати, есть симулятор этой игры, в который можно сразиться как с компьютером, так и со своим другом.

Итак, представим, что за главный приз реалити-шоу на необитаемом острове сражаются два племени: Хищники и Травоядные. Перед ними положили 24 палочки, каждая команда может за один ход забрать от 1 до 4 палочек. Выигрывает тот, кто оставляет противника без палочек. Вы в команде Хищников, ваш ход первый.

Начинаем думать с конца! Как вы считаете, сколько палочек нужно оставить вашему сопернику, чтобы вы гарантированно выиграли? Ему нужно оставить столько палочек, чтобы, несмотря на то, возьмет он 1 или 4 палочки, за вами был последний ход, и вы забрали все оставшиеся.

Теперь отложите, пожалуйста, книгу в сторону и посчитайте все ходы (это удобно сделать на бумаге), чтобы ответить на главный вопрос: сколько палочек вам нужно взять сначала и как играть дальше?

Надеемся, что вы не подглядывали и вам теперь будет интересно узнать правильное решение. Чтобы выиграть у Травоядных, вам нужно оставить их с 5 палочками. Это гарантирует вам победу, потому что вы в любом случае заберете все палочки после хода соперника. Но как достичь такой ситуации? Для вашего удобства мы записали правильные ходы в таблицу (см. таблицу).

Задание: представьте, что палочек в начале игры 25. Есть ли шанс выиграть у Хищников, если они снова делают первый ход?

«Главное в шахматах это не то, на сколько ходов вперед ты думаешь, а то, как ты анализируешь текущую ситуацию» (Гарри Каспаров)

Так, мы с вами провели небольшую, но продуктивную разминку мозга для перехода к разбору взаимодействий с параллельными ходами. Метод обратной индукции позволит вам правильнее разрешать конфликтные ситуации в реальной жизни, для которых не всегда требуется даже рисовать дерево стратегий. Это вы можете делать и в своей голове. Следует напомнить, что важным моментом тут является и верный расчет платежей, так что советуем уделять этому должное внимание.




Поделиться ссылкой