AlphaZero explora las diferentes variantes de ajedrez
DeepMind ha publicado un nuevo y revolucionario artículo, cuyo coautor ha sido el 14º Campeón del Mundo Vladimir Kramnik, en el que explica la utilización del programa de ajedrez autodidacta AlphaZero para explorar e investigar acerca de las diferentes variantes del juego del ajedrez, cada una con sus propias reglas específicas.
El artículo se titula Evaluando el equilibrio del juego con AlphaZero: explorando reglas alternativas en el ajedrez y ha sido elaborado por ingenieros e investigadores de DeepMind como Nenad Tomasev, Ulrich Paquet y Demis Hassabis, conjuntamente con Kramnik. El Gran Maestro ruso ha estado colaborando con DeepMind desde hace aproximadamente un año, cuando publicamos su primer trabajo sobre el Ajedrez sin enroque.
El Maestro Luisón analizaba entonces uno de los enfrentamientos entre AlphaZero y Alphazero en esa modalidad, que suponía un gran paso adelante en el terreno de la Inteligencia Artificial, en el siguiente vídeo:
Una de las variantes ensayadas en este nuevo experimento ha sido el ajedrez en donde no se puede enrocar en las 10 primeras jugadas. ¡Prácticamente es ajedrez normal! En el siguiente vídeo podemos disfrutar de una espectacular partida con esa variante.
En este nuevo documento, (disponible aquí en PDF en inglés), el ajedrez sin enroque es solo una de las nueve variantes de ajedrez que han sido analizadas. En cuestión de horas, AlphaZero ha permitido simular décadas de enfrentamientos entre humanos, con la intención de arrojar algo de luz al aspecto que tendrían partidas entre fuertes jugadores en las diferentes variantes en el futuro.
El diseño del juego, en general, es bastante complejo. Crear una nueva variante de ajedrez que funcione tampoco es sencillo. Los investigadores se expresan en los siguientes términos: "Diseñar un conjunto de reglas atractivas y coherentes no es algo trivial, debido a la dificultad que supone evaluar las consecuencias de las modificaciones específicas en la dinámica del juego y en su aceptación entre el gran público."
Mediante el uso del programa de ajedrez autodidacta AlphaZero, los investigadores buscaban poner de manifiesto su enorme potencial "como herramienta para la exploración creativa y el diseño de nuevas modalidades de ajedrez."
Estas son las nueve variantes exploradas por AlphaZero
Variante | Cambio de regla principal | Cambio de regla secundario |
Ajedrez sin enroque | No está permitido enrocar durante toda la partida |
- |
Ajedrez sin enroque (10) | No está permitido enrocar durante las primeras 10 jugadas (20 turnos) 1 turno = media jugada |
- |
Peón lento | Los peones solo pueden avanzar una casilla |
- |
Ahogado=victoria | Ahogar al oponente supone la victoria en lugar de tablas |
- |
Torpedo | Los peones pueden avanzar 1 o 2 casillas en todas sus jugadas. La captura al paso puede producirse por lo tanto en cualquier momento. |
- |
Semi-torpedo | Los peones pueden avanzar dos casillas si se encuentran en la 2ª o 3ª filas |
- |
Peón hacia atrás o cangrejo |
Los peones pueden retroceder una casilla, pero solo para regresar a la 2ª/7ª fila para blancas/negras |
Los movimientos de peón no cuentan para la regla de las 50 jugadas |
Peón hacia un lado | Los peones pueden desplazarse también lateralmente una casilla. Las capturas permanecen igual, en diagonal |
Los movimientos laterales de peón no cuentan para la regla de las 50 jugadas |
Auto-captura | Está permitido capturar las piezas propias |
- |
Para cada una de las variantes explicadas anteriormente, AlphaZero se entrenó de manera autodidacta, partiendo desde cero y jugando una gran cantidad de partidas contra sí mismo: 10.000 partidas realizando una jugada por segundo y otras 1.000 con un minuto para cada movimiento. Gracias a la muestra obtenida, pudo realizarse una valoración tanto cuantitativa como cualitativa de los resultados, los cuales se exponen en el mencionado artículo.
Valoración cuantitativa
Para cada modalidad se procedió a evaluar el porcentaje estimado de tablas, así como la ventaja de realizar la primera jugada, expresado en el resultado esperado de victorias para las blancas. Como cabía esperar, este varió en función del ritmo de juego. Además, quedó de manifiesto que se producían más tablas en partidas de un minuto por jugada en comparación a las de un segundo para cada movimiento.
"Esto parece indicar que la posición inicial podría ser de tablas teóricas en estas modalidades de juego, al igual que sucede en ajedrez clásico. Además, algunas de esas variantes son más complejas que otras, con patrones más elaborados y que exigen por consiguiente una gran capacidad de cálculo," afirman los investigadores.
Variante | Entrenamiento | 1 seg | 1 min |
Clásico | 54.10% | 51.80% | 50.80% |
Ajedrez sin enroque | 55.70% | 53.30% | 51.30% |
ajedrez sin enroque (10) | 52.50% | 51.00% | 50.40% |
Peón una casilla | 53.50% | 51.60% | 50.30% |
Ahogado=victoria | 54.90% | 53.00% | 51.10% |
Torpedo | 57.00% | 56.80% | 54.00% |
Semi-torpedo | 54.70% | 53.60% | 50.90% |
Peón hacia atrás o cangrejo | 53.00% | 51.10% | 50.10% |
Peón hacia un lado | 54.80% | 52.80% | 50.50% |
Auto-captura | 54.20% | 52.60% | 50.80% |
El artículo ilustra de igual forma cómo una misma apertura puede producir resultados completamente distintos en función de la modalidad de ajedrez que se practique. Esta conclusión fue alcanzada tras obligar a AlphaZero a jugar la Defensa Holandesa, la Defensa Chigorin, la Defensa Alekhine y el Gambito de Rey en 1.000 partidas en todas y cada una de las variantes, excepto en Peón lento.
Para aquellas modalidades que contemplan movimientos alternativos a los de ajedrez clásico (pero que no los reemplazan sino que se suman a ellos), como por ejemplo la de Auto-captura, procedió a analizarse con qué frecuencia estas jugadas inusuales eran realizadas por AlphaZero. Resultó que en muchas de esas variantes esos movimientos especiales fueron empleados en una gran cantidad de partidas, en ocasiones incluso varias veces en un solo duelo. "Esto refleja que esos nuevos movimientos alternativos son realmente útiles y ayudan a enriquecer aún más el juego," señalan los investigadores.
Otro fragmento interesante del artículo consiste en la referencia al valor de las piezas en cada una de las modalidades de juego. Para hacer esa estimación, se tomaron un total de 10.000 partidas disputadas a ritmo rápido por AlphaZero:
Variante | p | C | A | T | D |
Clásico | 1 | 3.05 | 3.33 | 5.63 | 9.5 |
Ajedrez sin enroque | 1 | 2.97 | 3.13 | 5.02 | 9.49 |
Ajedrez sin enroque (10) | 1 | 3.14 | 3.40 | 5.37 | 9.85 |
Peón lento | 1 | 2.95 | 3.14 | 5.36 | 9.62 |
Ahogado=victoria | 1 | 2.95 | 3.13 | 4.76 | 8.96 |
Auto-captura | 1 | 3.10 | 3.22 | 5.34 | 9.42 |
Peón hacia atrás o cangrejo | 1 | 2.65 | 2.85 | 4.67 | 9.39 |
Semi-torpedo | 1 | 2.72 | 2.95 | 4.69 | 8.3 |
Torpedo | 1 | 2.25 | 2.46 | 3.58 | 7.12 |
Peón hacia un lado | 1 | 1.8 | 1.98 | 2.99 | 5.92 |
Valoración cualitativa
Además del análisis cuantitativo ofrecido anteriormente, los autores del proyecto quisieron dar respuesta a algunas cuestiones de carácter más subjetivo, tales como el valor estético de los diferentes tipos de posiciones, jugadas y patrones que surgen en cada una de esas variantes. Es aquí donde Kramnik entra en acción.
Para tratar de evaluar qué modalidad de juego puede resultar más interesante de practicar para los humanos, el excampeón mundial ha estudiado los patrones y motivos típicos e incluso el estilo de juego de AlphaZero.
Tal y como señalaba en su artículo del pasado año, Kramnik considera que el Ajedrez sin enroque podría convertirse en una alternativa realmente interesante a la modalidad clásica, "dado que la seguridad del rey pasa a ser con frecuencia un problema para ambos jugadores, lo que permite una serie de ataques y contraataques y en caso de que se alcance la igualdad, esta tiende a ser de naturaleza dinámica en lugar de 'seca.' La variedad de posibilidades de evacuar al rey y el momento de llevarlo a cabo añaden complejidad a la fase de la apertura."
Kramnik considera que el hecho de no permitir el enroque antes de la jugada 10 no difiere en gran medida del ajedrez clásico, ya que AlphaZero tiende a enrocarse igualmente en la mayoría de sus partidas. Lo mismo opina de la modalidad Ahogado=victoria, en la que lo que realmente cambia únicamente es la valoración de algunos finales.
La variante más complicada según Kramnik es sin duda la de Peón hacia un lado, ya que con frecuencia "el tipo de patrones que se presentan son 'extraños' para un jugador de ajedrez clásico. Las estructuras de peones se vuelven muy cambiantes y resulta imposible crear debilidades permanentes."
Ejemplos
A continuación ofrecemos una partida de cada una de las nueve variantes mencionadas anteriormente a modo de ejemplo, con los comentarios de Kramnik incluidos en el artículo. Las últimas cinco se presentan en forma de vídeo, ¡ya que nuestro visor de partidas no recoge aún las reglas alternativas de algunas de las modalidades! (estamos trabajando en ello.)
Ajedrez sin enroque
"Una de las principales ventajas del Ajedrez sin enroque es que elimina, al menos por unos años, la abrumadora importancia de la preparación teórica existente en el ajedrez profesional en la actualidad, y obliga a los jugadores a pensar de forma creativa desde los primeros compases de la partida," escribe Kramnik. "Esto podría hacer que aumentase significativamente el número de partidas decisivas en torneos hasta que se desarrollase la nueva teoría y que hiciese falta una buena dosis de creatividad para anotarse el triunfo. Estos factores podrían provocar además que los torneos de élite fuesen seguidos con mayor entusiasmo por parte de los aficionados al ajedrez."
Ajedrez sin enroque (10)
"El objetivo principal de la restricción parcial del enroque, como una ligera desviación de las reglas del ajedrez clásico, sería evitar la teoría de aperturas," explica Kramnik. "Como tal, podría ser una opción a considerar en el ajedrez de alto nivel. El juego en sí mismo no cambia en gran medida y llama la atención la estrategia de Alphazero en esta modalidad, consistente en emplear líneas más tranquilas para poder enrocar después de la jugada 10."
Peón lento
"Las reglas y patrones básicos son prácticamente los mismos que en ajedrez clásico, pero la teoría de aperturas cambia y se vuelve completamente diferente," señala Kramnik. "La lógica diría que debería resultar más difícil a las blancas conseguir una ventaja duradera en la apertura y transformarla en victoria, pero dado que la teoría de aperturas debería desarrollarse de nuevo, esto no afectaría al juego entre humanos, al menos al comienzo. Es de destacar que en la mayoría de partidas de AlphaZero surgen posiciones típicas de medio juego una vez finalizada la fase de la apertura."
Ahogado=victoria
Dos caballos contra un rey solitario pasa a suponer ahora la victoria.
"Tras estudiar las partidas de AlphaZero, puede afirmarse que existen suficientes recursos defensivos en la mayoría de posiciones de medio juego para evitar alcanzar finales inferiores que, bajo estos nuevos parámetros, podrían conducir al desastre," explica Kramnik. "Un jugador fuerte debe ser capaz en principio de alcanzar este tipo de posiciones para anotarse el triunfo o a evitarlas para escapar a la derrota."
Torpedo
Los peones se vuelven muy poderosos en la modalidad Torpedo," afirma Kramnik. "En concreto, los peones pasados se convierten en armas letales y el valor de los peones cambia en función de las circunstancias, tanto mayor cuanto más cerca esté el final. Por otro lado, las opciones de ataque aumentan, lo que favorece en gran medida al bando que posee la iniciativa, de manera que hacerse con ella resulta crucial. Los peones son muy rápidos, así que dejan de ser un elemento estratégico para pasar a ser un elemento táctico. La partida adquiere un carácter táctico y el cálculo resulta esencial, en comparación con el ajedrez clásico."
Semi-torpedo
"La variante Semi-torpedo parece dar lugar a una mayor cantidad de resultados decisivos que en ajedrez clásico, aunque no tan elevada como en la modalidad Torpedo," indica Kramnik. "Se trata de una alternativa interesante, a ser tenida en cuenta por todos aquellos partidarios del tipo de posiciones de medio juego que se producen en ajedrez Torpedo, pero que rechazan estudiar la teoría de finales que existe en la actualidad."
Peón hacia atrás o cangrejo
La versión de ajedrez Peón hacia atrás o cangrejo da lugar a estructuras de peones más fluidas y flexibles que podrían ser de interés para aquellos que prefieren un juego de maniobras estratégicas," explica Kramnik. "Dado que esta variante ofrece recursos defensivos adicionales, conseguir la victoria con blancas resulta algo más complicado, por lo que podría ser especialmente atractiva para jugadores de corte defensivo o para aquellos que les gusta atacar pero que quieran experimentar nuevos desafíos."
Peón hacia un lado
"Esta es sin duda la modalidad más asombrosa y compleja de todas las que consideramos en este artículo," escribe Kramnik. "Incluso después de haber analizado las partidas disputadas por AlphaZero, los principios de juego de Peón hacia un lado siguen siendo un misterio para mí – no está del todo claro cuál debería ser el objetivo de ambos bandos. Los patrones son muy diferentes y esto provoca que muchas de las jugadas sean visualmente extrañas, puesto que serían consideradas errores en ajedrez clásico. (...) Esta variante es completamente distinta y en ocasiones difícil de entender, pero podría resultar interesante para aquellos jugadores que estén abiertos a experimentar cosas nuevas ¡y que no tengan especiales ataduras con el juego original!
Auto-captura
"Tengo especial predilección por esta variante, tanto que me atrevería a afirmar que se trata de una versión mejorada del ajedrez clásico," señala Kramnik. (...) "Independientemente del poco impacto que supone en cuanto a aperturas, las auto-capturas añaden valor estético al medio juego y suponen opciones adicionales y recursos ganadores alternativos en los finales. (...) Para concluir, me gustaría recomendar esta modalidad a los aficionados que valoren la belleza del ajedrez por encima de todo lo demás."
El artículo, de 97 páginas de extensión, incluye muchas más partidas y comentarios de Kramnik que resultan instructivos y divertidos a partes iguales. Puedes descargarlo aquí en PDF (en inglés).