El juego de mesa Go ha sido considerado uno de los desafíos más difíciles para la inteligencia artificial debido a su complejidad y a la dificultad de programarlo. Sin embargo, el programa de computadora AlphaGo logró una victoria histórica sobre el jugador profesional Lee Sedol, lo que marcó un hito en la historia de la inteligencia artificial y la ingeniería informática. Aunque AlphaGo ha demostrado una capacidad extraordinaria, aún se sabe poco acerca de cómo piensa. Sus reglas son aprendidas, no diseñadas, implementando técnicas de aprendizaje automático y varias redes neuronales para mejorar su desempeño en el juego de Go. Además, AlphaGo tiene aplicaciones prometedoras en otros campos, como la salud.

El Juego de Go
El Go, conocido como weiqi en China e igo en Japón, es un juego de mesa abstracto para dos jugadores que data de hace 3000 años. Se juega en un tablero de 19x19 casillas y comienza vacío. En cada turno, un jugador coloca una piedra negra o blanca en el tablero. El objetivo general del juego es utilizar las piedras para rodear más territorio que el oponente. Aunque la regla es muy simple, el Go presenta un desafío en cuanto a profundidad y sutileza. Por esta razón, ha sido considerado uno de los mayores desafíos para la inteligencia artificial durante mucho tiempo.
En juegos de computadora comunes, la inteligencia artificial suele utilizar un árbol de juego para determinar el mejor próximo movimiento en función de las posibles jugadas del oponente. Un árbol de juego es un grafo dirigido que representa los estados del juego como nodos y las jugadas posibles como aristas. La raíz del árbol representa el estado al comienzo del juego, y el siguiente nivel representa los posibles estados después de las jugadas sucesivas. Sin embargo, para juegos complejos como el Go, encontrar el mejor próximo movimiento se vuelve imposible rápidamente, ya que el árbol de juego del Go tendría 10^761 nodos, una cantidad abrumadora para almacenar en una computadora (el universo tiene solo 10^80 átomos, como referencia). Esto explica por qué el Go ha sido considerado uno de los mayores desafíos para la inteligencia artificial durante tanto tiempo.

El Algoritmo de AlphaGo
Entonces, ¿cómo logró AlphaGo resolver la complejidad del Go y superar las restricciones impuestas por el nivel de juego de los diseñadores? Todos los métodos anteriores para la inteligencia artificial en el Go se basaban en algún tipo de búsqueda en el árbol de juego, combinada con reglas creadas por ingenieros de inteligencia artificial. AlphaGo, sin embargo, utiliza extensivamente el aprendizaje automático para evitar el uso de reglas diseñadas y mejorar la eficiencia. El aprendizaje automático es un tipo de inteligencia artificial que permite a las computadoras aprender sin ser programadas explícitamente. Se centra en el desarrollo de programas informáticos que pueden aprender y cambiar cuando se les expone a nuevos datos. Los sistemas de aprendizaje automático buscan patrones a través de los datos y ajustan las acciones del programa en consecuencia. AlphaGo también utiliza el aprendizaje profundo y redes neuronales para enseñarse a sí mismo a jugar. Al igual que iPhotos puede ayudarte a clasificar tus fotos en diferentes álbumes según los personajes que aparecen en ellas, AlphaGo se basa en haber visto millones de posiciones y movimientos de partidas de Go jugadas por humanos.
La inteligencia de AlphaGo se basa en dos componentes diferentes: un procedimiento de búsqueda en el árbol de juego y redes neuronales que simplifican dicho procedimiento. El procedimiento de búsqueda en el árbol de juego se puede considerar como un enfoque de fuerza bruta, mientras que las redes convolucionales aportan una intuición al juego. Las redes neuronales son conceptualmente similares a la función de evaluación en otras inteligencias artificiales, con la diferencia de que las de AlphaGo se aprenden, no se diseñan, resolviendo así el problema de que el nivel de juego de los diseñadores influya en el nivel de inteligencia de la IA.
Redes Neuronales
En general, AlphaGo entrena dos tipos principales de redes neuronales: una red de políticas y una red de valores. Ambos tipos de redes toman el estado actual del juego como entrada y califican cada posible próximo movimiento mediante diferentes fórmulas, proporcionando la probabilidad de ganar. Por un lado, la red de valores estima el valor del estado actual del juego, es decir, la probabilidad de que el jugador negro gane el juego en última instancia. La salida de la red de valores es la probabilidad de ganar. Por otro lado, las redes de políticas proporcionan orientación sobre qué acción elegir en función del estado actual del juego. La salida es un valor de probabilidad para cada posible movimiento legal (la salida de la red es tan grande como el tablero). Las acciones con valores de probabilidad más altos corresponden a acciones que tienen una mayor probabilidad de llevar a la victoria. Uno de los aspectos más importantes de AlphaGo es su capacidad de aprendizaje. El aprendizaje profundo permite que AlphaGo mejore continuamente su inteligencia al jugar una gran cantidad de partidas contra sí mismo. Esto entrena a la red de políticas para ayudar a AlphaGo a predecir los próximos movimientos, lo que a su vez entrena a la red de valores para evaluar esas posiciones. AlphaGo analiza posibles movimientos y permutaciones, evaluando diferentes eventualidades antes de seleccionar la que considere más probable de tener éxito.
En general, las dos redes neuronales combinadas permiten que AlphaGo evite hacer trabajo innecesario: la red de políticas se centra en el presente y decide el próximo paso para ahorrar tiempo en la búsqueda de todo el árbol de juego, mientras que la red de valores se centra en el futuro, analizando toda la situación para reducir los posibles movimientos en el árbol de juego. AlphaGo luego promedia las sugerencias de las dos redes para tomar una decisión final. Lo que hace que AlphaGo sea tan importante es que no solo sigue la teoría del juego, sino que también involucra un componente de aprendizaje. Al jugar contra sí mismo, AlphaGo mejora automáticamente su habilidad en el Go.
Futuro de AlphaGo
Los juegos de Go fueron maravillosos, pero lo más importante es la demostración que hizo AlphaGo sobre cómo los algoritmos de inteligencia artificial afectarán nuestras vidas y cómo pueden ayudar a los humanos a mejorar. En el movimiento número 37 del segundo juego, AlphaGo hizo una decisión muy sorprendente. Un campeón europeo de Go dijo: no es un movimiento humano. nunca he visto a un humano jugar así. es hermoso. Este campeón europeo de Go, que ayudó a enseñar a AlphaGo jugando contra él, dijo que aunque perdió casi todas las partidas, su comprensión del Go mejoró mucho debido a la forma inusual en que el programa jugaba. Esto también se reflejó en su ascenso en los rankings mundiales.
Según los datos, en Estados Unidos mueren alrededor de 40,500 pacientes debido a diagnósticos erróneos. La cantidad de información médica disponible es enorme, por lo que es imposible para los médicos analizar todo. Las inteligencias artificiales como AlphaGo pueden recopilar toda la literatura médica, así como casos médicos, imágenes médicas y otros datos en el sistema, y pueden proporcionar la mejor solución para ayudar a los médicos. Recientemente, AlphaGo estableció una asociación con el Servicio Nacional de Salud del Reino Unido para mejorar el proceso de atención médica con soluciones digitales. AlphaGo utiliza su potencia informática para analizar datos y registros de salud. Esto abrirá nuevas oportunidades de tratamiento para los pacientes y ayudará a los médicos en su labor. Además, la mayor eficiencia también reducirá los costos para las compañías de seguros.
Futuro de la Inteligencia Artificial
Las personas ya aprenden mucho de los mejores humanos, pero ahora se puede adquirir aún más conocimiento de la inteligencia artificial. La inteligencia artificial puede superar las capacidades humanas en ciertas situaciones, lo que puede hacer que a algunas personas les resulte incómodo. La inteligencia artificial utiliza muchas técnicas además de la inteligencia artificial en el juego de mesa representada por AlphaGo, abarcando diversos campos técnicos como el reconocimiento visual y el reconocimiento de voz. No es sorprendente que la IA pueda superar a los humanos en un área especializada. Sin embargo, en cuanto a inteligencia integral y capacidad de aprendizaje, los humanos son mucho mejores que las IA. Aunque el aprendizaje profundo ha avanzado mucho, el aprendizaje automático aún depende de un proceso de diseño manual. Además, el aprendizaje profundo requiere una gran cantidad de datos como base para el entrenamiento y el aprendizaje, y el proceso de aprendizaje no es lo suficientemente flexible.
La idea de que una inteligencia artificial integral controlará a los humanos y tendrá un impacto devastador en la sociedad humana es ficticia. No es imposible que la IA supere a los humanos, pero ese día aún está lejos, y el más allá seguirá estando bajo el control humano.
Ya sea que AlphaGo o Lee Sedol hayan ganado, en general la victoria es de la humanidad. La IA detrás de AlphaGo utiliza el aprendizaje automático y las redes neuronales para mejorar continuamente sus habilidades jugando contra sí misma. Esta técnica de inteligencia artificial también ofrece un potencial para mejorar nuestras vidas.
La IA ganó el juego de Go, pero el humano ganó el futuro.
Si quieres conocer otras notas parecidas a Alphago: revolución en el juego de go puedes visitar la categoría Inteligencia artificial.
