AlphaZero изучает новые варианты шахмат

AlphaZero изучает новые варианты шахмат

PeterDoggers
PeterDoggers
|
10 | Шахматные турниры

Компания DeepMind опубликовала новое исследование, на этот раз - совместно с 14-м чемпионом мира по шахматам Владимиром Крамником. Самообучающаяся шахматная программа AlphaZero использовалась для изучения вариантов шахмат с новыми правилами.

Исследование под названием Assessing Game Balance with AlphaZero: Exploring Alternative Rule Sets in Chess (Оценка игрового баланса с помощью AlphaZero: изучение альтернативных правил шахмат) написано представителями Deepmind Ненадом Томашевым, Ульрихом Паке и Демисом Хассабисом в сотрудничестве с Владимиром Крамником. Российский гроссмейстер  работал с DeepMind целый год со времени публикации его статьи о шахматах без рокировки.

В новой работе (см. в PDF) шахматы без рокировки рассматриваются наряду с восемью другими  вариантами шахмат. AlphaZero помогла всего за несколько часов накопить опыт, равнозначный десятилетиям игры людей, и позволила представить, каковы были бы партии сильных шахматистов-людей, специализирующихся на этих вариантах.

Создание новых игр - в целом, сложный процесс. Придумать новый играбельный вариант шахмат тоже трудно. Исследователи пишут: "Создание увлекательных и сбалансированных правил игры - нетривиальная задача в связи со сложностью оценки воздействия отдельных изменений на динамику и привлекательность игры".

Генеральный директор Chess.com по шахматам, ММ Дэнни Ренш детально изучил работу благодаря доступу к ней и партиям, полученным задолго до публикации, и подготовил краткий обзор (планируются и другие видео!) узловых моментов исследования, а также собственный рейтинг "10 вариантов шахмат", изучавшихся с помощью AlphaZero:

Используя систему обучения с подкреплением AlphaZero, ученые хотели показать потенциал AlphaZero в качестве "инструмента творческого поиска и разработки новых вариантов шахмат".

Девять вариантов, тестировавшихся AlphaZero

Вариант Основное изменение правил Дополнительное изменение правил
Без рокировки Рокировка не разрешена. -
Без рокировки (10) Рокировка не разрешена в течении первых 10 ходов (20 полуходов). -
Медленные пешки Пешки могут ходить только на одно поле. -
Пат=победа Сторона, запатовавшая противника, выигрывает. -
Торпеды Пешки могут делать ход на 1 или 2 поля вперед с любой горизонтали. Взятие на проходе также может происходить на любой горизонтали. -
Полуторпеды Пешки могут ходить на 1 или 2 поля вперед со второй или третьей горизонтали. -
Отступающие пешки Пешки могут ходить назад на одно поле, но белые пешки не могут занимать первую горизонталь, а черные - восьмую. Для правила 50 ходов учитываются только взятия.
Обходящие пешки Пешки могут ходить также на одно поле в сторону. Взятия по-прежнему выполняются вверх по диагонали. Ходы пешек в сторону  не учитываются для правила 50 ходов.
Самовзятие Можно брать свои собственные фигуры. -

Chess.com variants No Castling Torpedo Pawns Sideways
Вы скоро сможете сыграть в некоторые варианты на Chess.com!

AlphaZero обучалась с нуля каждому варианту и играла много партий сама с собой: 10,000 партий с контролем секунда на ход и еще 1,000 с контролем минута на ход. На основании этих партий в работе дается количественная и качественная оценка вариантам шахмат.

Количественная оценка

Для каждого варианта авторы определили ожидаемый процент ничьих и преимущество выступки, выраженное как ожидаемый процент побед белых. Как и ожидалось, результаты отличались в зависимости от времени на партию: во всех вариантах в игре по минуте на ход было больше ничьих, чем в игре по секунде на ход.

"Это значит, что в этих вариантах шахмат, как и в классических шахматах, начальная позиция теоретически ничейна, но в некоторые из вариантов просто труднее играть, поскольку нужно учитывать больше возможностей, и возникают более содержательные позиции", - пишут исследователи.

Вариант Тренировка По 1 сек. По 1 мин.
Классика 54.10% 51.80% 50.80%
Без рокировки 55.70% 53.30% 51.30%
Без рокировки (10) 52.50% 51.00% 50.40%
Медленные пешки 53.50% 51.60% 50.30%
Пат=победа 54.90% 53.00% 51.10%
Торпеды 57.00% 56.80% 54.00%
Полуторпеды 54.70% 53.60% 50.90%
Отступающие пешки 53.00% 51.10% 50.10%
Обходящие пешки 54.80% 52.80% 50.50%
Самовзятие 54.20% 52.60% 50.80%

В работе также показано, как один и тот же дебют может получать разную оценку в зависимости от варианта шахмат. AlphaZero сыграла по 1000 партий каждым вариантом шахмат (кроме медленных пешек), с начальных позиций голландской защиты, защиты Чигорина, защиты Алехина и королевского гамбита.

В вариантах с дополнительными возможностями по сравнению с классическими шахматами (например, самовзятием) авторы изучали, насколько часто AlphaZero их использует. Оказалось, что в каждом варианте шахмат неклассические ходы встречались в большом проценте партий, часто много раз за партию. "Это значит, что новые возможности действительно полезны и влияют на игру", - пишут исследователи.

Также интересной частью работы является усредненная оценка силы фигур в каждом из вариантов, полученная на выборках по 10,000 партий AlphaZero:

Вариант p N B R Q
Классика 1 3.05 3.33 5.63 9.5
Без рокировки 1 2.97 3.13 5.02 9.49
Без рокировки (10) 1 3.14 3.40 5.37 9.85
Медленные пешки 1 2.95 3.14 5.36 9.62
Пат=победа 1 2.95 3.13 4.76 8.96
Самовзятие 1 3.10 3.22 5.34 9.42
Отступающие пешки 1 2.65 2.85 4.67 9.39
Полуторпеды 1 2.72 2.95 4.69 8.3
Торпеды 1 2.25 2.46 3.58 7.12
Обходящие пешки 1 1.8 1.98 2.99 5.92

Качественная оценка

Помимо количественного анализа исследователи искали ответы на более субъективные вопросы, оценивая красоту позиций, комбинаций и ходов, возникающих в различных вариантах шахмат. За эту часть работы отвечал Владимир Крамник.

Чтобы оценить, в какие варианты было бы интереснее всего играть людям, 14-й чемпион мира охарактеризовал типичные для них структуры, мотивы и даже стиль игры AlphaZero.

Vladimir Kramnik
Владимир Крамник. Фотография Питера Доггерса/Chess.com.

Как и год назад в своей статье, Крамник называет шахматы без рокировки вариантом шахмат с огромным потенциалом, "короли обоих противников оказываются в большей опасности, что увеличивает возможности атаки и контратаки, а равенство, если оно достигается, чаще является динамическим, а не возникшим в результате 'сушки'. Многообразие подходов к обеспечению безопасности короля и значение правильного выбора времени делают игру в дебюте более сложной".

По мнению Крамника, вариант с запретом на рокировку до 10-го хода неотличим от классических шахмат; AlphaZero все равно делает рокировку в большинстве партий. То же касается и шахмат, где пат ведет к победе, поскольку меняется оценка лишь некоторых окончаний.

Самый сложный вариант по мнению Крамника - обходящие пешки, где возникают позиции "выглядящие 'чужеродно' для классических шахмат. Пешечная структура становится очень подвижной, невозможно создавать постоянные пешечные слабости".

Примеры

Мы приводим по одной из партий, игранных каждым из девяти вариантов, цитируя   комментарии Крамника. Последние пять партий даются в виде видео, потому что альтернативные ходы пока невозможно сделать в средстве просмотра диаграмм (но мы работаем над его усовершенствованием).

Шахматы без рокировки

"Одно из главных преимуществ шахмат без рокировки - уменьшение значения дебютной подготовки в профессиональных шахматах. Шахматистам придется мыслить творчески с самого начала партии", - пишет Крамник. "Это неизбежно приведет к увеличению количества результативных партий в турнирах, пока не возникнет новая теория. Нововведение может увеличить интерес любителей шахмат к турнирам профессионалов".

Без рокировки (10)

"Главная цель частичного ограничения рокировки - уход от дебютной теории", - пишет Крамник. "Оно ориентировано на профессиональных шахматистов как интересная  возможность. Рисунок игры почти не меняется.  AlphaZero стремится разыгрывать более спокойные варианты, где рокировка и в классических шахматах происходит после первых 10 ходов".

Медленные пешки

"Базовые правила и позиции остаются теми же, что и в классических шахматах, но дебютная теория полностью меняется", - пишет Крамник. "Интуиция показывает, что белым труднее использовать преимущество выступки, чем в классических шахматах, получив длительный дебютный перевес и доведя его до победы. В большинстве партий AlphaZero после дебюта возникали довольно типичные позиции миттельшпиля".

Пат=победа

Два коня теперь побеждают одинокого короля. 

Крамник: "По партиям AlphaZero кажется, что в большинстве позиций миттельшпиля хватает ресурсов для защиты, позволяющих избегать окончаний, ставших проигранными после изменения правил. "Сильный шахматист может понять, как стремиться к выигранным позициям, используя новое правило, или их избегать".

Торпеды

В торпедах пешки становятся очень сильны, пишет Крамник. "Особенно серьезным преимуществом являются проходные пешки, а ценность пешек еще сильнее возрастает в окончании. Увеличиваются все атакующие возможности, что благоприятно для стороны, владеющей инициативой, а значит, захват инициативы становится определяющим. Пешки двигаются очень быстро, поэтому в игре становится меньше стратегии и больше тактики. Игра становится более комбинационной и счетной в сравнении с классическими шахматами".

Полуторпеды

"В полуторпедах больше результативных партий, чем в классических шахматах, но меньше, чем в торпедах", - пишет Крамник. "Это интересный вариант для ценителей особенностей миттельшпиля торпед, не готовых отказаться от существующей теории окончаний".

Отступающие пешки

В шахматах с отступающими пешками возникают более подвижные и гибкие пешечные структуры, интересные для ценителей стратегического маневрирования", - пишет Крамник. "Отступление пешек дает дополнительные возможности в защите, поэтому белым чуть труднее добиться победы. Вариант понравится шахматистам, предпочитающим защищаться и любителям атаки, стремящимся к новым вызовам".

Обходящие пешки

"Это самый странный и “чужеродный” из всех изучавшихся нами вариантов шахмат", - пишет Крамник. "Даже изучив партии AlphaZero, я не вполне понимаю закономерности этой игры – мне не вполне ясно, к чему должен стремиться каждый из противников. Позиции выглядят совершенно иначе, многие ходы кажутся странными и ошибочными с точки зрения классических шахмат (...) Это совершенно особый вариант шахмат. Зачастую трудно разобраться в позиции, но игра будет интересна для шахматистов, готовых к экспериментам и меньше привязанных к классическим шахматам!

Самовзятие

"Мне очень нравится этот вариант. Осмелюсь даже сказать, что это - улучшенная версия классических шахмат", - пишет Крамник. (...) "Воздействие инновации на дебют относительно невелико, но самовзятия вносят дополнительную красоту в замыслы в середине и окончании партий. (...) Я горячо рекомендую этот вариант любителям шахмат, ценящим, прежде всего, красоту игры".

В 97-страничную работу вошло намного больше партий и интересных и поучительных пояснений Крамника. Ее можно загрузить в формате PDF.

Больше от пользователя PeterDoggers
Ян Непомнящий - победитель XVIII этапа Гран-При по скоростным шахматам

Ян Непомнящий - победитель XVIII этапа Гран-При по скоростным шахматам

Орлы Армении - победители ПРО Лиги 2020

Орлы Армении - победители ПРО Лиги 2020