Como Bots Pensam: Árvores de Decisão
Um bot não “pensa” no sentido humano. Ele não tem intuição, nem momentos de insight, nem hesitação. Mas tem um sistema de tomada de decisão — e ele funciona mais rápido e com mais precisão do que o cérebro de qualquer profissional. Este artigo explica como funciona a lógica de um bot de poker — de scripts simples às soluções modernas de IA. Sem código, sem fórmulas, apenas linguagem simples.
O que “o bot pensa” realmente significa
Quando dizemos que um bot “pensa,” nos referimos ao processo de escolha de uma ação. Em cada etapa de uma mão, o bot recebe informações e produz uma decisão: fold, call, raise.
A diferença entre os bots está em como eles chegam a essa decisão.
Existem duas abordagens fundamentalmente diferentes:
-
Bot baseado em script — segue regras pré-escritas. “Se mão X e posição Y — execute Z”
-
Bot de IA — avalia a situação e seleciona a ação com o maior resultado esperado
Ambos “pensam.” Mas um é como uma calculadora simples, e o outro é como um computador de xadrez, como o IBM Deep Blue.
Árvore de decisão: o modelo básico
Imagine uma árvore onde cada galho é uma ação possível e cada nó é um ponto de decisão.
Exemplo simples: preflop
Você está no button (a posição mais vantajosa na mesa, pois você age por último após o flop). Todos deram fold até você. Você tem A♠K♦.
Suas opções com A♠K♦ no button (todos deram fold antes de você):
-
Fold — EV negativo. Você está descartando uma mão premium na melhor posição. Oportunidade desperdiçada.
-
Call (limp) — aproximadamente neutro. Você disfarça sua mão, mas perde a iniciativa. O oponente controla o pot.
-
Raise — o maior EV. Você toma a iniciativa, constrói o pot com uma mão forte e pressiona os blinds. Máximo potencial de lucro.
Cada galho tem seu próprio valor esperado (EV). O bot seleciona o galho com o maior EV.
Com AK no button com todos dando fold antes — fazer raise é obviamente melhor. Mas em situações mais complexas, a árvore se expande em centenas de galhos.
Como um bot baseado em script “pensa”
Um bot baseado em script opera com regras rígidas. Seu “pensamento” é um conjunto de condições:
SE mão está no top 10% E posição é late
→ RAISE 3bb
SE mão está no top 20% E houve um raise
→ CALL
SE mão é mais fraca que o top 30%
→ FOLD
Vantagens:
-
Previsibilidade — você sempre sabe o que ele vai fazer
-
Simplicidade — fácil de configurar
-
Estabilidade — não faz jogadas aparentemente inexplicáveis
Desvantagens:
-
Não se adapta aos oponentes
-
Fácil de explorar uma vez que o padrão é identificado
-
Não leva em conta o contexto completo (tamanhos de stack, histórico, tendências)
-
Joga da mesma forma contra um fish e contra um reg
Como um bot de IA “pensa”
Um bot de IA (como o PokerBotAI) não segue regras fixas. Ele avalia a situação e seleciona a ação ótima com base em análise. A arquitetura do PokerBotAI — o TriBrain Engine — é construída sobre três componentes-chave: um banco de dados de Hand History (300M+ mãos reais — acumuladas ao longo dos anos a partir de bancos de dados abertos, arquivos comprados, dados de parceiros e coleta proprietária desde o início dos anos 2000), uma rede neural (treinada em mais de 7 bilhões de mãos sintéticas e geradas por solvers), e algoritmos especializados que combinam teoria e prática em um sistema unificado de tomada de decisão.
O sistema conta com vários modelos especializados — para diferentes tipos de jogo, stakes e salas. O bot para NLH e o bot para PLO são IAs diferentes, cada uma otimizada para suas próprias condições. Os modelos são continuamente ajustados com dados de mesas ao vivo: a equipe de operações testa builds em condições reais, e os resultados são automaticamente retroalimentados no sistema. Esses são apenas os contornos gerais — detalhes arquitetônicos não são divulgados.
O que a IA vê em cada mão
-
Cartas — sua mão e o board
-
Posição — onde você está sentado em relação ao button
-
Tamanho do pot e apostas — a matemática atual
-
Stacks — quantas fichas cada jogador tem
-
Histórico do oponente — VPIP, PFR, 3-bet, fold to c-bet e centenas de outros parâmetros
-
Contexto da mão — o que aconteceu nas ruas anteriores
O processo de tomada de decisão
A IA passa por várias etapas em uma fração de segundo:
-
Determinar a range do oponente — quais mãos ele poderia ter jogado desta forma?
-
Calcular a equity — com que frequência vencemos contra essa range?
-
Avaliar o EV de cada ação — fold, call, raise — qual rende mais?
-
Considerar as tendências do oponente — esse jogador bluffa com frequência? Dá fold frequentemente a raises?
-
Selecionar a ação com o maior EV — a decisão final
Bot de script vs bot de IA: comparação completa
| Parâmetro | Bot Baseado em Script | Bot de IA |
|---|---|---|
| Princípio de operação | Regras fixas | Análise e cálculo |
| Adaptação ao oponente | Não | Sim, em tempo real |
| Aprendizado | Não | Sim, em 300M+ mãos reais |
| Consciência de contexto | Mínima | Completa (centenas de parâmetros) |
| Previsibilidade | Alta (facilmente legível) | Baixa (varia seu jogo) |
| Explorar jogadores fracos | Igual para todos | Máximo |
| Proteção contra exploração | Fraca | Base GTO |
| Taxa de desenvolvimento | Estática | Em melhoria contínua |
| Win rate típico | Negativo contra regs/pros/IA; ~0-5 BB/100 contra fish | 10-40 BB/100 |
Exemplo: uma situação, duas abordagens
Situação: Turn. O pot é $100. Você tem top pair com um bom kicker. O oponente aposta $75.
Top pair significa que sua carta corresponde à carta mais alta do board (por exemplo, você tem A♠Q♦ e o board é Q♣ 8♠ 3♦ — um par de damas, o mais alto do board). O kicker é a segunda carta na sua mão, que determina o vencedor quando ambos os jogadores têm o mesmo par. Um “bom kicker” é uma carta alta (ás, rei).
Bot baseado em script
Verificação: top pair? → Sim
Verificação: aposta > 50% do pot? → Sim
Regra: call com top pair contra aposta até 100% do pot
Decisão: CALL
O bot não sabe contra quem está jogando. Vai dar call tanto contra um nit tight (que só aposta com as nuts) quanto contra um maniac loose (que bluffa 70% das vezes).
Bot de IA
Aqui está o que realmente acontece dentro da rede neural — passo a passo:
Passo 1: Quanto sabemos sobre esse oponente?
A IA verifica seu banco de dados. Já jogamos contra esse jogador antes? Se sim — quantas mãos?
-
<20 mãos — quase nenhum dado. A IA joga próximo ao GTO (Game Theory Optimal) — uma estratégia matematicamente equilibrada que não pode ser explorada. Pense nisso como um “padrão seguro” contra um oponente desconhecido.
-
20-100 mãos — perfil básico disponível. A IA sabe se o jogador é tight ou loose, passivo ou agressivo. Começa a fazer pequenos ajustes.
-
100-500 mãos — perfil detalhado. VPIP, PFR, frequência de 3-bet, fold-to-c-bet, agressividade por rua. A IA explora ativamente as fraquezas.
-
500+ mãos — modelo comportamental completo. A IA prevê como esse jogador específico reage em quase todos os cenários.
Passo 2: Estimativa da range do oponente
É aqui que as redes neurais diferem da matemática simples. Um solver atribuiria uma range teórica com base na ação. A IA faz mais: ela constrói uma range personalizada para esse jogador específico, ponderada pelo histórico real dele. Conceitualmente similar ao que o Pluribus (a IA de poker da CMU que derrotou os melhores profissionais no No-Limit Hold’em de 6 jogadores) faz — ele não calcula uma estratégia fixa, mas busca a melhor resposta para o que espera que o oponente faça.
No nosso exemplo: o oponente aposta $75 em um pot de $100 no turn. Contra um jogador aleatório — isso pode significar qualquer coisa. Mas a IA tem 200+ mãos desse jogador específico:
-
VPIP: 18%, PFR: 14% — jogador tight
-
Agressividade no turn: 0,8 — raramente aposta sem uma mão forte
-
Em situações similares (overbet no turn contra um oponente), esse jogador apostou com two pair ou melhor em 80% das vezes
Passo 3: Cálculo de EV contra a range personalizada
A IA não apenas calcula “temos equity suficiente para o call.” Ela avalia o EV de cada ação possível — fold, call, raise — contra as tendências específicas desse oponente:
-
EV do fold: $0 (não perdemos nada a mais)
-
EV do call: Vencemos contra bluffs (~20% da range) mas perdemos contra value (~80%). Valor esperado: -$23. Não lucrativo.
-
EV do raise: Poderia tirar algumas mãos medianas, mas contra esse jogador tight que raramente bluffa — ele não vai dar fold. EV negativo.
Decisão: FOLD — a rede neural identifica que nosso top pair, normalmente uma mão forte, está na verdade atrás do padrão de apostas desse oponente específico.
Agora mude o oponente. Mesma mão, mesmo board, mas contra um jogador loose-aggressive (VPIP 42%, bluffa no turn 55% das vezes). A IA recalcula — o call se torna altamente lucrativo. Oponentes diferentes, decisões diferentes. Não porque as regras são diferentes, mas porque a rede neural constrói um modelo diferente para cada jogador.
GTO + exploit: a abordagem híbrida
O PokerBotAI usa uma combinação de duas estratégias:
- GTO (Game Theory Optimal) — a estratégia “imbatível”. Se você joga GTO, o oponente não pode explorar você independentemente do que ele faça.
- Exploit — desviar do GTO para maximizar o lucro contra erros específicos do oponente.
Como funcionam juntos
-
Sem dados sobre o oponente → jogar próximo ao GTO
-
Oponente dá fold com muita frequência → bluffar mais
-
Oponente faz call com muita frequência → bluffar menos, apostar mais para value
-
Oponente joga de forma previsível → exploração máxima
-
Oponente se adapta → voltar ao GTO
De onde a IA “conhece” o oponente
O PokerBotAI coleta e analisa dados sobre cada jogador:
-
Hand history — cada mão jogada contra esse oponente é salva
-
Banco de dados — mais de 300 milhões de mãos reais acumuladas a partir de bancos de dados abertos, arquivos de hand history comprados, dados de parceiros e anos de coleta proprietária — mais de 7 bilhões de mãos sintéticas e geradas por solvers para treinamento da rede neural
-
Estatísticas em tempo real — VPIP, PFR, 3-bet, fold to c-bet e muito mais
-
Memória entre sessões (cross-session memory) — mesmo que seja sua primeira vez nessa mesa, a IA pode já ter visto o oponente antes
Essa progressão de perfil é chamada de Curva de Adaptação (Adaptation Curve): após 20 mãos a IA tem dados suficientes para classificação básica, após 100+ mãos — um perfil detalhado, após 500+ — um modelo comportamental preciso.
Um de nossos clientes — um jogador experiente com mais de 20 anos de prática — descreveu assim: “Ele lê os jogadores. Realmente os lê. Jogo há 20 anos e nem sempre leio os oponentes com essa precisão. Mas o bot lê.”
Por que a IA supera os humanos
Não porque é “mais inteligente.” Mas porque:
-
Sem fadiga — a décima hora de jogo é tão precisa quanto a primeira
-
Sem tilt — um bad beat não afeta a próxima decisão
-
Sem ego — dá fold facilmente em mãos “bonitas” quando é a jogada certa
-
Cálculo instantâneo — calcula EV em milissegundos
-
Memória perfeita — lembra de cada mão com cada oponente
-
Aprendizado contínuo — melhora a cada mês que passa
Um humano pode superar o bot em uma única sessão. Em 100.000+ mãos — é estatisticamente improvável.
O poker continua sendo um dos principais benchmarks para avaliar as capacidades da inteligência artificial. Competições entre vários modelos de IA são realizadas regularmente — tanto LLMs (modelos de linguagem de grande escala) quanto bots de poker especializados. Um dos maiores eventos anuais é o MIT Pokerbots Competition (pokerbots.org), onde equipes de estudantes desenvolvem e testam bots de poker entre si.
Conclusão
O “pensamento” de um bot não é mágica nem uma caixa-preta. É um sistema para avaliar opções e escolher a melhor. A diferença entre um script e uma IA está na profundidade dessa avaliação.
Pontos-chave:
-
Um bot baseado em script segue regras. Uma IA calcula a decisão ótima
-
A IA considera centenas de parâmetros para cada oponente
-
A combinação GTO + Exploit fornece proteção e win rate máximo
-
A IA se adapta em tempo real; scripts não se adaptam
-
No longo prazo, a IA consistentemente supera tanto scripts quanto humanos
Veja também
“Tipos de Bots de Poker: Como Eles Veem, Clicam, Pensam e Decidem” — uma comparação detalhada das abordagens
“EV e Equity: Por Que o Bot Não Se Importa com a Sorte” — a matemática por trás das decisões
“Estratégia GTO: Por Que o Bot Se Torna Imbatível” — um mergulho mais profundo na teoria dos jogos
“Bot vs RTA vs Solver vs Treinador” — distinguindo as ferramentas
Quer ver como a IA toma decisões em tempo real? Rode o bot no modo de dicas — ele mostrará a ação recomendada e explicará a lógica. Solicite acesso de teste pelo @PokerBotAI_ShopBot no Telegram.
Related articles
Estratégia GTO: Por Que o Bot Se Torna Imbatível
Probabilidades de Pot e Implícitas em 5 Minutos
Variância e Tamanho de Amostra: Por Que Resultados Enganam