
Pluribus Poker: O Robô de IA Que Está Abalando o Mundo do Poker
Em 2019, uma equipe da Carnegie Mellon University e do Facebook AI Research abalou o mundo do pôquer e da inteligência artificial com o Pluribus, um bot que conseguiu derrotar jogadores profissionais de elite no Texas Hold’em sem limite de seis jogadores.
Avançando para 2025, o Pluribus ainda é um tema quente nas discussões sobre IA. Enquanto todos falam sobre sistemas generativos como ChatGPT, Claude e Gemini, muitos pesquisadores acreditam que o Pluribus foi um divisor de águas—um que ainda está moldando estratégias, cibersegurança, negociações e até a descoberta de medicamentos.
Como esse bot conseguiu enfrentar o jogo de cartas mais difícil do mundo, em que blefar e pensar de forma inteligente são fundamentais? E talvez a pergunta maior agora: será que uma versão do Pluribus poderia, de fato, se infiltrar em sites de pôquer online?
Por que o Pluribus é importante
Antes do Pluribus surgir, a maioria das vitórias da IA no pôquer se limitava a formatos heads-up (apenas dois jogadores). Bots como o DeepStack e o Libratus já tinham alcançado o chamado nível “sobre-humano” em partidas de dois jogadores, usando matemática avançada para chegar a um equilíbrio de Nash—basicamente uma estratégia muito difícil de vencer.
Mas no pôquer multijogador, o jogo era totalmente diferente. Diferente do xadrez ou do Go, onde ambos os jogadores veem todas as informações, o pôquer é baseado em informação imperfeita—você nunca sabe totalmente quais cartas seu oponente tem. Em jogos com múltiplos jogadores, a complexidade dispara. Fraquezas que não aparecem em partidas um contra um podem ser exploradas em mesas de seis jogadores, onde colusão, blefes e tamanhos de fichas mudam constantemente.
Na verdade, em 2018, muitos especialistas acreditavam que a IA não conseguiria dominar o Hold’em sem limite de seis jogadores por muito tempo—se é que conseguiria.
Então veio o Pluribus.
Dentro da máquina
De acordo com o artigo histórico de 2019 na Science, o Pluribus foi construído a partir de duas ideias brilhantes:
- Treinamento em Autojogo
Em vez de alimentá-lo com bilhões de mãos de pôquer, a equipe deixou o Pluribus jogar contra cópias de si mesmo. Em oito dias em um bom servidor de 64 núcleos (custo aproximado de US$150), a IA aprendeu suas próprias estratégias por meio de tentativas e erros. Isso foi muito mais barato do que outros avanços em aprendizado por reforço que custaram milhões. - Busca com Antevisão Limitada
Ao contrário das IAs de xadrez que planejam muitas jogadas à frente, o Pluribus só olhava alguns movimentos à frente. Ele combinava isso com “blueprints” probabilísticos para cenários comuns, equilibrando imprevisibilidade e eficiência. Esse método lhe deu uma vantagem dinâmica, parecida com a dos humanos, sem se prender a estratégias fixas.
O resultado final? Uma IA que fazia jogadas tão estranhas, mas eficazes que até jogadores experientes duvidavam de seus instintos.
Um estilo de jogo único
O que realmente diferenciou o Pluribus não foram apenas suas vitórias, mas a forma como jogava.
- Nunca dava limp
Jogadores profissionais às vezes apenas pagavam a big blind antes do flop (limp), mas o Pluribus evitava isso totalmente—um detalhe que os profissionais depois reconheceram como mais forte. - Uso do “Donk Betting”
Normalmente criticado, o donk bet (apostar contra o agressor inicial) virou marca registrada do Pluribus. E o mais surpreendente: suas apostas desse tipo eram sempre bem cronometradas, mudando o rumo dos potes. - Blefes incomuns
Para humanos, blefar é arriscado. Para o Pluribus, era apenas matemática. Ele não se deixava levar por emoções e executava blefes que maximizavam o retorno no longo prazo. - Check-raises em situações inesperadas
Jogadas geralmente vistas como “exageradas” apareciam com frequência em seu repertório, mostrando que a máquina não seguia as regras humanas do pôquer.
Contra profissionais como Darren Elias (recordista de títulos do World Poker Tour) e Chris Ferguson (campeão do Main Event da WSOP 2000), o Pluribus faturava cerca de US$5 por mão—o que dá em torno de US$1.000 por hora em 10.000 mãos.
Como disse Elias após ser derrotado repetidamente:
“Parece que ele joga em um nível mais alto que o nosso… Não vi grandes falhas na sua abordagem.”
Por que em 2025 ainda falamos do Pluribus
Então, seis anos depois, por que ainda estamos falando desse bot de pôquer?
Porque o salto que o Pluribus deu—navegar em jogos multijogador com informação imperfeita—ainda é um dos maiores desafios da IA.
- IA generativa como os modelos GPT são ótimos para prever texto, mas têm dificuldades em estratégias competitivas.
- Sistemas robóticos em geral são projetados para ambientes controlados.
- Muitos problemas do mundo real se parecem mais com pôquer do que com xadrez: cibersegurança, mercados financeiros, negociações multiparte, até simulações militares envolvem informações ocultas, alianças mutáveis e jogadores que não cooperam.
Como a AAAS observou, o design do Pluribus pode ajudar IA futuramente a negociar estratégias de cibersegurança, desenvolver medicamentos para infecções resistentes e até apoiar simulações militares.
Mas para as pessoas comuns, fica a maior dúvida—alguém poderia colocar Pluribus ou seus sucessores em sites de pôquer online?
Pluribus poderia destruir o pôquer online?
O Pluribus nunca foi disponibilizado para uso público. Os pesquisadores foram claros: havia receio de mau uso em jogos reais de pôquer, onde até uma IA apenas um pouco melhor poderia levar milhares de jogadores humanos à falência.
Dito isso, seu requisito de hardware simples—apenas oito dias de treino em um servidor de US$150—mostra que não se trata de um projeto tão impossível. Comparado com o GPT-4, cujo desenvolvimento custou fortunas, um entusiasta dedicado em 2025 poderia recriar uma versão menor de estilo Pluribus com ferramentas open-source de aprendizado por reforço.
Isso complica as coisas:
- Sites de pôquer online como o PokerStars ou WSOP.com já usam medidas contra bots, caçando padrões estranhos de decisão.
- Mas uma IA no estilo Pluribus poderia variar seu jogo o bastante para passar despercebida. Sua imprevisibilidade—que confundiu Elias e Ferguson—dificulta a identificação.
- Se um desses bots aparecesse, provavelmente estaria dominando jogos médios ou até de high stakes online, limpando tanto jogadores casuais quanto profissionais.
Até agora, não há provas sólidas de que o Pluribus ou uma cópia fiel tenha chegado ao cenário online. Mas, com a computação mais barata e o aprendizado por reforço se expandindo, reguladores e sites de pôquer podem se ver presos num eterno jogo de gato e rato. E pode-se dizer que esse jogo começou com o Pluribus.
O quadro maior: o pôquer como modelo da realidade
Pôquer não é apenas sobre cartas—ele reflete a vida real. As pessoas tomam decisões com informações parciais, tentando superar rivais com dicas, blefes e escolhas incertas.
É por isso que DARPA, o Departamento de Defesa e empresas financeiras demonstraram interesse em pesquisa de IA para pôquer. O Pluribus não apenas ganhou no jogo; ele mostrou que máquinas podem se destacar em situações bagunçadas, competitivas e com múltiplos jogadores.
Algumas áreas para refletir:
- Cibersegurança: defender sistemas contra hackers com estratégias em constante mudança é como um jogo de blefes mais longo.
- Negociações financeiras: mercados são jogos multijogador com informação incompleta—exatamente o ambiente onde o Pluribus brilhou.
- Saúde: desenvolver medicamentos contra bactérias em evolução significa se preparar para movimentos ocultos dos patógenos.
Cada uma dessas áreas precisa do que o Pluribus demonstrou: a capacidade de funcionar bem sem visão completa, usando estratégias mistas flexíveis.
Limitações que ainda existem
Embora o Pluribus tenha sido impressionante, ele não era uma IA geral.
- Era estático: uma vez treinado, não recebia atualizações em tempo real. Diferente dos modelos GPT atuais, que absorvem dados continuamente.
- Focado apenas em Texas Hold’em sem limite, formato de seis jogadores—se fosse colocado em PLO ou em Hold’em limitado, poderia não ter o mesmo desempenho.
- Desempenhava melhor em ambientes estruturados e de alto volume—como jogos de cash online—onde a variância se nivela. Em torneios ao vivo com menos mãos, os resultados poderiam variar.
Crucialmente, sua estratégia de blueprint não era garantidamente ótima; apenas se mostrou difícil de ser batida em muitas mãos.
Conclusão: A sombra do Pluribus em 2025
Seis anos após encantar o mundo do pôquer e da IA, o Pluribus continua sendo um marco que nos força a repensar estratégia, risco e inteligência.
Seu verdadeiro impacto pode não estar apenas no pôquer, mas na forma como suas lições se espalham para cibersegurança, biotecnologia e negociações reais. Ainda assim, a ideia de bots como o Pluribus espreitando silenciosamente nos sites de pôquer online em 2025 é ao mesmo tempo inquietante e fascinante.
Como disse o jogador profissional Chris Ferguson após enfrentar o Pluribus:
“Ele não se cansa. Não sente emoções. Ele apenas joga.”
Isso provavelmente está no cerne da inteligência de máquina—e é por isso que a façanha do Pluribus continua ecoando muito além das mesas de pôquer.
Referências
- Brown, N., & Sandholm, T. “IA sobre-humana para pôquer multijogador.” Science (2019)
- AAAS, “Inteligência artificial conquista o jogo de pôquer mais complexo do mundo” (2019)
- Science: “IA sobre-humana para pôquer heads-up sem limite” (2017)
Perguntas Frequentes sobre o Pluribus AI
O que é o Pluribus AI e por que ele é importante?
Pluribus é uma IA de pôquer desenvolvida pela Carnegie Mellon University e pelo Facebook AI Research em 2019. Foi a primeira a derrotar jogadores humanos profissionais no Texas Hold’em sem limite de seis jogadores, representando um marco nos jogos multijogador de informação imperfeita. Diferente de IAs anteriores limitadas ao formato heads-up, o Pluribus dominou a complexidade do jogo multijogador.
Quanto dinheiro o Pluribus ganhou contra jogadores profissionais?
Em média, o Pluribus ganhou cerca de US$5 por mão e US$1.000 por hora. Em 10.000 mãos contra Darren Elias e Chris Ferguson, manteve uma taxa de vitória de aproximadamente 30 mili big blinds, provando desempenho sobre-humano.
O Pluribus poderia ser usado para trapacear no pôquer online?
Os desenvolvedores não liberaram o código-fonte para evitar mau uso. Apesar disso, como foi treinado em apenas 8 dias por US$150, réplicas poderiam ser feitas. Sistemas de detecção existem, mas o estilo imprevisível do Pluribus poderia escapar deles.
O que diferencia o Pluribus dos jogadores humanos de pôquer?
Ele nunca faz limp, aposta donk com frequência, blefa matematicamente de forma fria e executa jogadas incomuns como check-raise em locais inesperados. Profissionais relataram sentir-se impotentes contra suas estratégias.
Como o Pluribus foi treinado e quais recursos precisou?
Foi treinado em autojogo por oito dias em um servidor de 64 núcleos, custando cerca de US$150. Usou busca de antevisão limitada com estratégias probabilísticas para diferentes cenários.
Quais são as aplicações reais do Pluribus além do pôquer?
As técnicas podem ser aplicadas em cibersegurança, farmacologia, robótica militar, finanças e negociações multijogador. Tudo que envolva informação incompleta pode se beneficiar do estilo Pluribus.
O Pluribus ainda é atualizado em 2025?
Não, permanece estático. Diferente de IAs modernas em aprendizado contínuo, seu design é fixo. Mas suas inovações ainda inspiram pesquisas em estratégias multijogador.
Quais eram as limitações do Pluribus?
Foi feito apenas para Texas Hold’em sem limite seis-max. Não se adapta em tempo real, e sua estratégia de blueprint não é garantidamente ótima. Seu melhor desempenho foi em cash games de alto volume, não em torneios curtos.