Alphazero: revolución ia en ajedrez

En 2017, el entorno del ajedrez quedó conmocionado cuando Stockfish (el motor de ajedrez más fuerte del entorno) fue derrotado en un partido unilateral. No fue derrotado por un humano, sino por un programa de computadora desconocido que parecía ser de otro entorno: AlphaZero.

Índice
  1. ¿Qué es AlphaZero?
  2. Los Logros de AlphaZero
  3. AlphaZero y las Variantes de Ajedrez
    1. Jugando con las nuevas variantes de ajedrez
  4. Juegos de AlphaZero

¿Qué es AlphaZero?

AlphaZero fue desarrollado por la empresa de inteligencia artificial e investigación DeepMind, que fue adquirida por Google. Es un programa de computadora que alcanzó un nivel de juego virtualmente inimaginable utilizando solo el aprendizaje por refuerzo y el juego contra sí mismo para entrenar sus redes neuronales. En otras palabras, solo se le dieron las reglas del juego y luego jugó contra sí mismo millones de veces (44 millones de partidas en las primeras nueve horas, según DeepMind).

AlphaZero utiliza sus redes neuronales para realizar evaluaciones extremadamente avanzadas de las posiciones, lo que elimina la necesidad de analizar más de 70 millones de posiciones por segundo (como lo hace Stockfish). Según DeepMind, AlphaZero alcanzó los puntos de referencia necesarios para derrotar a Stockfish en apenas cuatro horas.

AlphaZero se ejecuta en hardware personalizado que algunos han denominado supercomputadora de google, aunque DeepMind ha aclarado que AlphaZero se ejecutó en cuatro unidades de procesamiento tensorial (TPU) en sus partidos.

En diciembre de 2017, DeepMind publicó un artículo de investigación que anunciaba que AlphaZero había derrotado fácilmente a Stockfish en un partido de 100 juegos. AlphaZero continuaría derrotando a Stockfish en un segundo partido de 1,000 juegos; los resultados se publicaron en un artículo a finales de 201

Los enfrentamientos entre AlphaZero y Stockfish cambiaron el entorno del ajedrez.

Desafortunadamente, AlphaZero no está disponible para el público en ninguna forma. Los resultados de los partidos contra Stockfish y los increíbles juegos de AlphaZero han llevado a la creación de varios proyectos de ajedrez de código abierto basados en redes neuronales. Leela Chess Zero, Leelenstein, Alliestein y otros intentan emular el aprendizaje y el estilo de juego de AlphaZero. Incluso Stockfish, el rey del análisis de fuerza bruta, ha agregado redes neuronales.

En 2020, DeepMind y AlphaZero continuaron contribuyendo al entorno del ajedrez en forma de diferentes variantes de ajedrez. ¡Cuando DeepMind y el equipo de AlphaZero hablan, el entorno del ajedrez escucha!

Los Logros de AlphaZero

Como se mencionó, AlphaZero derrotó al motor de ajedrez más fuerte del entorno, Stockfish, en un partido unilateral de 100 juegos en diciembre de 2017 (con un puntaje de 28 victorias, 72 empates y cero derrotas). El público pudo ver 10 juegos de ejemplo de este match, y la reacción del entorno del ajedrez fue casi de incredulidad. El Gran Maestro Peter Heine Nielsen comparó ver los juegos de AlphaZero con presenciar una especie superior aterrizando en la Tierra y mostrándonos cómo jugar al ajedrez:

Es un logro notable... se acerca al enfoque 'tipo b', similar al humano, para el ajedrez de máquina soñado por claude shannon y alan turing en lugar de la fuerza bruta.

Otros grandes maestros compartieron el sentimiento de Nielsen, incluido el legendario Gran Maestro Garry Kasparov, quien le dijo a Chess.com: es un logro notable... se acerca al enfoque 'tipo b', similar al humano, para el ajedrez de máquina soñado por claude shannon y alan turing en lugar de la fuerza bruta.

alpha zero inteligencia artificial - Qué es la calificación AlphaZero

Otros cuestionaron los resultados debido a la disparidad de hardware utilizado en el primer partido. Algunos también encontraron injusto que Stockfish no pudiera usar su libro de aperturas y su tabla de finales de juego.

El Gran Maestro Hikaru Nakamura declaró: no pongo mucha credibilidad en los resultados simplemente porque tengo entendido que alphazero está utilizando la supercomputadora de google, y stockfish no se ejecuta en ese hardware; stockfish se estaba ejecutando básicamente en lo que sería mi computadora portátil.

AlphaZero y las Variantes de Ajedrez

En 2019 y 2020, el Gran Maestro Vladimir Kramnik tuvo la oportunidad de pasar tiempo con AlphaZero y el equipo de DeepMind para explorar variantes de ajedrez y coescribió un artículo con DeepMind sobre la exploración de nuevas variantes de ajedrez, incluyendo peones laterales, sin enroque, ajedrez torpedo (donde los peones siempre pueden avanzar una o más casillas).

En septiembre de 2020, Chess.com organizó una mesa redonda con Kramnik y miembros del equipo de DeepMind donde discutieron variantes y otros temas. Puedes ver el video completo aquí:

Jugando con las nuevas variantes de ajedrez

Se han agregado muchas de estas variantes de ajedrez (y más) a Chess.com. Este artículo describe las nuevas variantes de ajedrez y cómo jugarlas. Si quieres probar alguna de estas variantes por ti mismo, simplemente ve a Chess.com/variants o coloca el cursor sobre el botón jugar en la barra de menú y selecciona variantes :

  • Variantes de Ajedrez
  • Ajedrez 960
  • Gran Ajedrez
  • Ajedrez para 3 jugadores
  • Ajedrez para 4 jugadores
  • Ajedrez por Equipos

Jugar las nuevas variantes de ajedrez en Chess.com es fácil. Después de seleccionar variantes, se te dirige a la página de Variantes de Ajedrez. Todo lo que tienes que hacer es seleccionar una variante y presionar jugar.

Juegos de AlphaZero

En este primer ejemplo de juego, vemos parte de la magia con la que AlphaZero sorprendió al entorno en el primer partido. AlphaZero sacrifica un peón en la apertura e inmediatamente pasa al ataque. Después de 1..Rhxh6, Stockfish tiene una pieza de ventaja, pero el rey no está seguro y todo el flanco de la dama está subdesarrollado:

AlphaZero mantiene la presión, pero su compensación por la pieza es en su mayoría poco clara para nosotros los mortales. Solo a posteriori podemos decir que un par de piezas negras (especialmente la torre a8 y el caballo de la dama) nunca serán realmente parte del juego. Después de 3Dxe6, la posición se ha cristalizado y AlphaZero gana de manera convincente:

Este segundo ejemplo de juego es del segundo partido entre AlphaZero y Stockfish. AlphaZero muestra una clínica posicional y tortura a Stockfish con el par de alfiles en el final después de 4AxfAquí tienes el juego completo:

En el siguiente video, el Gran Maestro Robert Hess analiza este fantástico juego en detalle:

Ahora conoces qué es AlphaZero, qué ha logrado y más. Si estás interesado en ver qué puedes aprender del juego de AlphaZero, echa un vistazo a esta excelente serie de lecciones en video del MI Danny Rensch de Chess.com.

Si quieres conocer otras notas parecidas a Alphazero: revolución ia en ajedrez puedes visitar la categoría Inteligencia artificial.

Subir