Canal de noticias

Contacto oficial

     
Pluribus Poker bot

Pluribus Poker: El Bot de IA Que Está Revolucionando el Mundo del Póker

En 2019, un equipo de la Universidad Carnegie Mellon y de Facebook AI Research sacudió el mundo del póker y de la IA con Pluribus, un bot que en realidad podía vencer a jugadores profesionales de élite en Texas Hold’em sin límite de seis jugadores.

Saltemos a 2025, y Pluribus sigue siendo un tema candente en charlas sobre IA. Mientras todos hablan de sistemas generativos como ChatGPT, Claude y Gemini, muchos investigadores creen que Pluribus fue un punto de inflexión, uno que todavía está moldeando estrategias, ciberseguridad, negociaciones e incluso el descubrimiento de fármacos hoy.

¿Cómo logró este bot afrontar el juego de cartas más complejo del mundo, donde el farol y el pensamiento inteligente son cruciales? Y quizá la pregunta más grande ahora: ¿podría una versión de Pluribus infiltrarse en salas de póker online?


Por qué Pluribus importa

Antes de que llegara Pluribus, la mayoría de las victorias de IA en póker se limitaban a los formatos heads-up (solo dos jugadores). Bots como DeepStack y Libratus habían alcanzado lo que muchos llamaban “nivel sobrehumano” en partidas uno contra uno usando matemáticas complejas para llegar a un equilibrio de Nash, básicamente una estrategia muy difícil de superar.

Pero en el póker multijugador era un juego completamente distinto. A diferencia del ajedrez o Go, donde ambos jugadores ven todo, el póker se basa en la información imperfecta: nunca sabes del todo qué tiene tu oponente. En partidas multijugador el juego se complica enormemente. Debilidades invisibles en juegos uno contra uno podían explotarse en una mesa de seis jugadores, donde colusión, faroles y tamaños de pila cambian continuamente.

De hecho, en 2018 muchos expertos pensaban que la IA no lograría dominar el Hold’em sin límite de seis jugadores durante décadas—si es que alguna vez lo hacía.

Entonces apareció Pluribus.


Dentro de la máquina

Según el artículo histórico en Science 2019, Pluribus se construyó sobre dos ideas brillantes:

  1. Entrenamiento en Autojuego
    En lugar de alimentarlo con miles de millones de manos de póker, el equipo dejó que Pluribus jugara contra copias de sí mismo. En ocho días en un servidor de 64 núcleos (costo aproximado $150), la IA aprendió sus propias estrategias mediante prueba y error. Este enfoque salió mucho más barato que otros avances en aprendizaje por refuerzo que costaron millones.
  2. Búsqueda con Mirada Limitada
    A diferencia de las IA de ajedrez que planifican mucho hacia adelante, Pluribus solo consideraba unas pocas jugadas. Combinaba esto con “planos” probabilísticos de escenarios comunes, logrando un equilibrio entre ser impredecible y eficiente. Este método le dio un filo dinámico y humano sin atarse a estrategias rígidas.

¿El resultado final? Una IA que ejecutaba jugadas tan extrañas pero efectivas que incluso los profesionales veteranos dudaban de sus instintos.


Un estilo de juego único

Lo que realmente distinguió a Pluribus no fueron solo sus victorias, sino la manera en que jugaba.

  • Sin limpear
    Los pros a veces hacían limp (igualaban la ciega grande antes del flop), pero Pluribus lo evitaba completamente—algo que después los pros consideraron mejor.
  • Uso del “Donk Betting”
    Normalmente criticada, la apuesta de donk (apostar contra el agresor inicial) se convirtió en una de sus firmas. Resultó que sus donk bets estaban perfectamente cronometradas, inclinando los pozos de formas sorprendentes.
  • Faroles inusuales
    Para los humanos, el farol es un riesgo. Para Pluribus, era simplemente matemática. No se dejaba atrapar por emociones y ejecutaba faroles maximizando el potencial a largo plazo.
  • Check-raises en lugares inesperados
    Movidas vistas como “demasiado sofisticadas” aparecían con regularidad en su juego, mostrando que las máquinas no siguen las reglas humanas del póker.

Contra profesionales como Darren Elias (récord de títulos del World Poker Tour) y Chris Ferguson (campeón del Main Event de WSOP 2000), Pluribus ganaba aproximadamente $5 por mano, lo que equivale a unos $1,000 por hora en 10,000 manos.

Como dijo Elias después de ser derrotado mano tras mano:

“Sientes que juega a un nivel superior al nuestro… No vi fallos importantes en su enfoque.”


Por qué en 2025 aún importa Pluribus

Entonces, seis años después, ¿por qué seguimos hablando de este bot de póker?

Porque el salto de Pluribus—navegar juegos multijugador con información imperfecta—sigue siendo uno de los mayores retos de la IA.

  • La IA generativa como los modelos GPT sirven para predecir texto pero fallan en estrategias competitivas.
  • Los sistemas robóticos se diseñan para entornos controlados.
  • Muchos problemas reales se parecen más al póker que al ajedrez: ciberseguridad, mercados financieros, acuerdos multiparte, incluso simulaciones militares, todos con información oculta, alianzas cambiantes y jugadores que no cooperan.

Como señaló la AAAS, el diseño de Pluribus podría ayudar a que la IA negocie estrategias de ciberseguridad, diseñe fármacos contra infecciones difíciles y apoye simulaciones militares.

Pero para la gente común, la gran pregunta es—¿podría alguien meter a Pluribus o a sus sucesores en salas de póker online?


¿Podría Pluribus romper el póker online?

Pluribus nunca fue liberado para uso público. Los investigadores fueron claros: temían un mal uso en partidas reales, donde una IA apenas mejor podría drenar miles de jugadores humanos.

Aun así, sus requisitos de hardware simples—solo ocho días de entrenamiento en un servidor único de $150—indican que no es un proyecto lejano. Comparado con GPT-4, que costó una fortuna desarrollarlo, un entusiasta dedicado en 2025 podría recrear un bot más pequeño al estilo Pluribus con herramientas open-source de aprendizaje por refuerzo.

Esto se complica:

  • Los sitios de póker online como PokerStars o WSOP.com ya usan medidas de detección de bots, cazando patrones de decisión extraños.
  • Pero las IA tipo Pluribus podrían variar lo suficiente como para escapar al radar. Su imprevisibilidad—la misma que confundió a Elias y Ferguson—las hace difíciles de identificar.
  • Si apareciera uno de estos bots, probablemente estaría dominando juegos medios o incluso de altos stakes online, arrasando tanto con aficionados como profesionales.

Hasta ahora no hay pruebas sólidas de que Pluribus o una copia exacta ya esté en la arena online. Pero a medida que la computación se abarata y el aprendizaje por refuerzo se propaga, los reguladores y sitios de póker podrían enfrentarse a un juego interminable del gato y el ratón. Y se podría decir que ese juego empezó con Pluribus.


La visión más amplia: el póker como modelo de la realidad

El póker no trata solo de cartas—refleja la vida real. La gente decide con información parcial, intentando superar rivales con pistas, faroles y decisiones inciertas.

Por eso DARPA, el Departamento de Defensa y compañías financieras han mostrado interés en la investigación de IA de póker. Pluribus no solo ganó a las cartas; demostró que las máquinas pueden sobresalir en situaciones desordenadas, competitivas y con múltiples jugadores.

Algunas áreas a considerar:

  • Ciberseguridad: Defender sistemas contra hackers con estrategias cambiantes es como un juego de faroles más largo.
  • Comercio financiero: Los mercados son juegos multijugador llenos de información incompleta—justo el terreno donde Pluribus prosperó.
  • Salud: Diseñar fármacos contra bacterias que evolucionan implica prever movimientos ocultos de patógenos.

Cada una de estas áreas necesita lo que Pluribus demostró: la capacidad de funcionar bien sin visibilidad total, con estrategias mixtas flexibles.


Limitaciones que aún existen

Aunque Pluribus impresionó, no era una IA general.

  • Era estática: Una vez entrenada, no actualizaba en tiempo real. A diferencia de los modelos GPT actuales que absorben datos nuevos constantemente.
  • Se enfocaba solo en Texas Hold’em sin límite, formato six-max—pruébalo en PLO o limit Hold’em y quizá no vaya tan bien.
  • Rendía mejor en entornos estructurados y de alto volumen—como juegos de cash online—donde la varianza se nivela. En torneos en vivo de bajo número de manos, los resultados podrían cambiar.

Es crucial destacar que su estrategia blueprint no era garantizada óptima; simplemente era difícil de batir en muchas manos.


Conclusión: La sombra de Pluribus en 2025

Seis años después de deslumbrar al mundo del póker y de la IA, Pluribus sigue siendo un hito clave que nos impulsa a repensar la estrategia, el riesgo y la inteligencia.

Su verdadero impacto quizá no esté solo en el póker sino en cómo sus lecciones se derraman hacia ciberseguridad, biotecnología y negociaciones reales. Aun así, la idea de bots como Pluribus acechando silenciosos en salas online en 2025 resulta inquietante y fascinante.

Como dijo el profesional Chris Ferguson después de su duelo contra Pluribus:

“No se cansa. No se emociona. Solo juega.”

Eso probablemente está en el corazón de la inteligencia de máquina—y por eso los logros de Pluribus resuenan más allá de la mesa de póker.


Referencias

Preguntas Frecuentes sobre Pluribus AI

¿Qué es Pluribus AI y por qué es significativo?

Pluribus es una IA de póker desarrollada por la Universidad Carnegie Mellon y Facebook AI Research en 2019. Fue la primera en derrotar a jugadores profesionales en Texas Hold’em sin límite de seis jugadores, marcando un hito en juegos multijugador con información imperfecta. A diferencia de IAs anteriores solo aplicables en heads-up, Pluribus dominó la dinámica compleja del póker multijugador.

¿Cuánto dinero ganó Pluribus contra jugadores profesionales?

Pluribus ganó en promedio unos $5 por mano y alrededor de $1,000 por hora jugando contra profesionales. En 10,000 manos contra Darren Elias y Chris Ferguson, mantuvo una tasa de victoria de ~30 miliblindes grandes, demostrando rendimiento sobrehumano.

¿Podría usarse Pluribus para hacer trampa en el póker online?

Los desarrolladores decidieron no publicar su código fuente para prevenir mal uso en póker en línea. Pero, dado que su entrenamiento requirió solo 8 días y $150, sistemas similares podrían recrearse. Los detectores de bots existen, aunque una IA tan impredecible podría pasarlos por alto.

¿Qué hace a Pluribus diferente de los jugadores humanos?

Pluribus nunca hace limp, usa donk betting con frecuencia, realiza faroles matemáticamente precisos sin emociones y ejecuta jugadas inusuales como check-raises en spots inesperados. Los profesionales dijeron sentirse incapaces de explotarlo.

¿Cómo fue entrenado Pluribus y qué recursos necesitó?

Pluribus se entrenó con autojuego durante ocho días en un servidor de 64 núcleos, costando apenas $150. Usó búsqueda de mirada limitada junto con estrategias probabilísticas para situaciones comunes.

¿Cuáles son las aplicaciones reales más allá del póker?

Sus técnicas sirven para ciberseguridad, diseño de medicamentos, robótica militar, mercados financieros y negociaciones. Cualquier dominio competitivo con información incompleta se beneficia de enfoques al estilo Pluribus.

¿Sigue actualizándose Pluribus en 2025?

Pluribus es un sistema fijo sin actualizaciones desde 2019. No aprende de nuevos datos como IAs modernas, pero sus innovaciones aún inspiran la investigación en juegos multijugador y toma estratégica.

¿Cuáles eran las limitaciones de Pluribus?

Funcionaba solo en Texas Hold’em sin límite seis-max, no en PLO ni torneos. Era estático y no se adaptaba en tiempo real. Su estrategia no era óptima teóricamente, pero difícil de vencer, brillando en cash games de alto volumen.