La Inteligencia Artificial Aplastó A Los Mejores Jugadores De Póker

Una división de Facebook conocida como FAIR (Desarrollo de Inteligencia Artificial de Facebook) en cooperación con la Universidad de Carnegie Mellons, creó una inteligencia artificial (IA) capaz de superar a cualquier jugador de póker humano.

Como sucedió en juegos como Dota, en el cual los jugadores profesionales acababan aplastados ante la IA de Elon Musk, ahora una IA consiguió derrotar a cinco jugadores de póker profesionales de una sola sentada.

Esta IA bautizada Pluribus realizó una serie de partidas de Texas Hold'em sin límite contra 6 personas, entre las cuáles estaban algunos de los mejores jugadores de póker profesionales, y les ganó a todos, de acuerdo al multimedio tecnológico The Verge. Facebook afirma que esta es la primera vez que un bot logró vencer a los mejores profesionales en "cualquier juego de referencia importante" cuando hubo más de un oponente a la vez.

Durante 12 días y 10.000 manos de póker, Pluribus se enfrentó a 12 profesionales en varias configuraciones; cinco bots de IA y un humano, y un bot y cinco jugadores de la vida real. Esta IA los derrotó consiguiendo promedio de 5 dólares por mano con ganancias por hora de alrededor de 1.000 dólares. Algunos de estos jugadores profesionales eran Chris Ferguson, Greg Merson, Darren Elias y Jimmy Chou. Para jugar contra la IA tuvieron un incentivo monetario para motivar su juego.

Esto es especialmente relevante ya que en juegos como Dota o el ajedrez todos los datos están ahí, y una simple IA puede saber reconocerlos. Pero en el póker hay información que una IA no es capaz de ver, como las cartas que tiene el rival. Esto provoca que haya estrategias diferentes a las que se encuentran en otros juegos, como el conocidísimo farol. Pluribus fue capaz de reconocer esa información oculta y jugar de la manera más efectiva.

Pluribus recibió un gran entrenamiento, y lo hicieron jugar contra copias de sí mismo, una técnica común en el entrenamiento de IA, jugando cientos de miles de manos contra sí mismo resultó en un proceso de capacitación efectivo

Gracias a estas mejoras, Pluribus puede presumir de ser muchísimo más eficiente que otras IAs. Usa menos de 128 GB de memoria y se ejecuta únicamente en 2 GPUs, además de haberse creado en un servidor de 64 núcleos con menos de 512 GB de memoria RAM en 8 días. La adaptación de este programa en servidores en la nube costaría solo 150 dólares, nada que ver contra los cientos de miles que cuestan otras IAs de vanguardia.

Para estar en consonancia con la complejidad que supone jugar contra 6 personas al póker, los investigadores idearon una forma de que Pluribus decidiera qué movimiento realizar. En lugar de tratar de predecir cómo jugarían sus oponentes hasta el final del juego (un cálculo que se volvería increíblemente complejo en unos pocos pasos, Pluribus fue diseñado para adealantarse solo dos o tres movimientos por
delante. Este fue el verdadero avance, según el co-creador de Pluribus, Noam Brown.

La clave de Pluribus residía en la mentira, o en la manipulación de esta. Fue capaz de engañar a sus oponentes, exprimiendo las ganancias de las manos más escuetas. Era predeciblemente impredecible; según su creador, Pluribus no veía algo engañoso como tal, sino que se centraba en la decisión que, en esa situación específica, le haría conseguir más dinero.

Además, las IAs desarrolladas hasta ahora adquirieron sus habilidades sobrehumanas aproximándose a lo que se conoce como "equilibrio de Nash", un conjunto de estrategias (una por jugador) en la que ninguno de ellos se beneficia por cambiar su estrategia siempre y cuando la táctica del rival tampoco cambie. Esto implica que una máquina gana cuando el rival no puede mantener el equilibrio.

Según Brown: "Lo que mostramos es que una IA puede engañar, y puede mentir mejor que cualquier humano".

"Pluribus ha alcanzado un rendimiento sobrehumano en un juego de póker multijugador, lo que es un hito clave que ha permanecido inalcanzado durante décadas", dijo Tuomas Sandholm, co-creador de Pluribus. Esta "habilidad para derrotar a cinco jugadores en un juego tan complicado abre nuevas oportunidades para emplear la IA para resolver una gran variedad de problemas reales", agregó.

Queda la esperanza de que el prodigio de Pluribus se pueda llevar a otras áreas que compartan similitudes con el Póker Texas; información oculta, varias personas involucradas y numerosos resultados.

Estos profesionales quedaron interesados en las estrategias de Pluribus.

Según Michael Gagliano, "fue increíblemente fascinante jugar contra el bot de póker y ver algunas de las estrategias que eligió. Hubo varias jugadas que los humanos simplemente no están haciendo en absoluto, especialmente en relación con su tamaño de apuesta".

Por su parte, Ferguson admitió que "Pluribus es un oponente muy difícil contra el que jugar. Es muy difícil sujetarlo en cualquier tipo de mano. También es muy bueno para hacer apuestas de poco valor en el 'river'. Es muy bueno para extraer valor de sus buenas manos".

"Su mayor fortaleza reside en su habilidad para usar estrategias variadas", comentó Darren Elias, uno de los jugadores con más títulos del World Poker Tour. "Es lo mismo que las personas tratan lograr. Hacerlo de una forma aleatoria y hacerlo de forma consistente. La mayoría de la gente sencillamente no puede".


 

 

Fuente:omicrono.elespanol.com

 

 


 
Banner
Banner
Banner