Como Bots Pensam: Árvores de Decisão

Posted10 de março de 2026

Updated2 de maio de 2026

ByAleksey Kozikov

Um bot não “pensa” no sentido humano. Ele não tem intuição, nem momentos de insight, nem hesitação. Mas tem um sistema de tomada de decisão — e ele funciona mais rápido e com mais precisão do que o cérebro de qualquer profissional. Este artigo explica como funciona a lógica de um bot de poker — de scripts simples às soluções modernas de IA. Sem código, sem fórmulas, apenas linguagem simples.

O que “o bot pensa” realmente significa

Quando dizemos que um bot “pensa,” nos referimos ao processo de escolha de uma ação. Em cada etapa de uma mão, o bot recebe informações e produz uma decisão: fold, call, raise.

A diferença entre os bots está em como eles chegam a essa decisão.

Existem duas abordagens fundamentalmente diferentes:

Bot baseado em script — segue regras pré-escritas. “Se mão X e posição Y — execute Z”
Bot de IA — avalia a situação e seleciona a ação com o maior resultado esperado

Ambos “pensam.” Mas um é como uma calculadora simples, e o outro é como um computador de xadrez, como o IBM Deep Blue.

Árvore de decisão: o modelo básico

Imagine uma árvore onde cada galho é uma ação possível e cada nó é um ponto de decisão.

Exemplo simples: preflop

Você está no button (a posição mais vantajosa na mesa, pois você age por último após o flop). Todos deram fold até você. Você tem A♠K♦.

Suas opções com A♠K♦ no button (todos deram fold antes de você):

Fold — EV negativo. Você está descartando uma mão premium na melhor posição. Oportunidade desperdiçada.
Call (limp) — aproximadamente neutro. Você disfarça sua mão, mas perde a iniciativa. O oponente controla o pot.
Raise — o maior EV. Você toma a iniciativa, constrói o pot com uma mão forte e pressiona os blinds. Máximo potencial de lucro.

Cada galho tem seu próprio valor esperado (EV). O bot seleciona o galho com o maior EV.

Com AK no button com todos dando fold antes — fazer raise é obviamente melhor. Mas em situações mais complexas, a árvore se expande em centenas de galhos.

A árvore de decisão é um modelo simplificado para fins de explicação. Uma IA real não percorre os galhos um a um como um algoritmo de livro didático. Ela funciona mais como um jogador experiente: “lê” a situação instantaneamente porque já viu milhões de situações similares. Exceto que, em vez de intuição, é uma rede neural treinada em bilhões de mãos. O resultado é o mesmo: avaliar as opções e escolher a melhor, mas em milissegundos.

Como um bot baseado em script “pensa”

Um bot baseado em script opera com regras rígidas. Seu “pensamento” é um conjunto de condições:

SE mão está no top 10% E posição é late
→ RAISE 3bb
SE mão está no top 20% E houve um raise
→ CALL
SE mão é mais fraca que o top 30%
→ FOLD

Vantagens:

Previsibilidade — você sempre sabe o que ele vai fazer
Simplicidade — fácil de configurar
Estabilidade — não faz jogadas aparentemente inexplicáveis

Desvantagens:

Não se adapta aos oponentes
Fácil de explorar uma vez que o padrão é identificado
Não leva em conta o contexto completo (tamanhos de stack, histórico, tendências)
Joga da mesma forma contra um fish e contra um reg

Bots baseados em script são previsíveis. Um jogador experiente vai identificar o padrão em 30-100 mãos e começar a explorá-lo. Esse é o principal motivo pelo qual são ineficazes no poker moderno.

Como um bot de IA “pensa”

Um bot de IA (como o PokerBotAI) não segue regras fixas. Ele avalia a situação e seleciona a ação ótima com base em análise. A arquitetura do PokerBotAI — o TriBrain Engine — é construída sobre três componentes-chave: um banco de dados de Hand History (300M+ mãos reais — acumuladas ao longo dos anos a partir de bancos de dados abertos, arquivos comprados, dados de parceiros e coleta proprietária desde o início dos anos 2000), uma rede neural (treinada em mais de 7 bilhões de mãos sintéticas e geradas por solvers), e algoritmos especializados que combinam teoria e prática em um sistema unificado de tomada de decisão.

O sistema conta com vários modelos especializados — para diferentes tipos de jogo, stakes e salas. O bot para NLH e o bot para PLO são IAs diferentes, cada uma otimizada para suas próprias condições. Os modelos são continuamente ajustados com dados de mesas ao vivo: a equipe de operações testa builds em condições reais, e os resultados são automaticamente retroalimentados no sistema. Esses são apenas os contornos gerais — detalhes arquitetônicos não são divulgados.

O que a IA vê em cada mão

Cartas — sua mão e o board
Posição — onde você está sentado em relação ao button
Tamanho do pot e apostas — a matemática atual
Stacks — quantas fichas cada jogador tem
Histórico do oponente — VPIP, PFR, 3-bet, fold to c-bet e centenas de outros parâmetros
Contexto da mão — o que aconteceu nas ruas anteriores

O processo de tomada de decisão

A IA passa por várias etapas em uma fração de segundo:

Determinar a range do oponente — quais mãos ele poderia ter jogado desta forma?
Calcular a equity — com que frequência vencemos contra essa range?
Avaliar o EV de cada ação — fold, call, raise — qual rende mais?
Considerar as tendências do oponente — esse jogador bluffa com frequência? Dá fold frequentemente a raises?
Selecionar a ação com o maior EV — a decisão final

A IA não simplesmente “conhece” o movimento certo. Ela o recalcula para cada situação única. Duas mãos similares contra oponentes diferentes podem ter decisões ótimas diferentes.

Bot de script vs bot de IA: comparação completa

Parâmetro	Bot Baseado em Script	Bot de IA
Princípio de operação	Regras fixas	Análise e cálculo
Adaptação ao oponente	Não	Sim, em tempo real
Aprendizado	Não	Sim, em 300M+ mãos reais
Consciência de contexto	Mínima	Completa (centenas de parâmetros)
Previsibilidade	Alta (facilmente legível)	Baixa (varia seu jogo)
Explorar jogadores fracos	Igual para todos	Máximo
Proteção contra exploração	Fraca	Base GTO
Taxa de desenvolvimento	Estática	Em melhoria contínua
Win rate típico	Negativo contra regs/pros/IA; ~0-5 BB/100 contra fish	10-40 BB/100

Exemplo: uma situação, duas abordagens

Situação: Turn. O pot é $100. Você tem top pair com um bom kicker. O oponente aposta $75.

Top pair significa que sua carta corresponde à carta mais alta do board (por exemplo, você tem A♠Q♦ e o board é Q♣ 8♠ 3♦ — um par de damas, o mais alto do board). O kicker é a segunda carta na sua mão, que determina o vencedor quando ambos os jogadores têm o mesmo par. Um “bom kicker” é uma carta alta (ás, rei).

Bot baseado em script

Verificação: top pair? → Sim
Verificação: aposta > 50% do pot? → Sim
Regra: call com top pair contra aposta até 100% do pot
Decisão: CALL

O bot não sabe contra quem está jogando. Vai dar call tanto contra um nit tight (que só aposta com as nuts) quanto contra um maniac loose (que bluffa 70% das vezes).

Bot de IA

Aqui está o que realmente acontece dentro da rede neural — passo a passo:

Passo 1: Quanto sabemos sobre esse oponente?

A IA verifica seu banco de dados. Já jogamos contra esse jogador antes? Se sim — quantas mãos?

<20 mãos — quase nenhum dado. A IA joga próximo ao GTO (Game Theory Optimal) — uma estratégia matematicamente equilibrada que não pode ser explorada. Pense nisso como um “padrão seguro” contra um oponente desconhecido.
20-100 mãos — perfil básico disponível. A IA sabe se o jogador é tight ou loose, passivo ou agressivo. Começa a fazer pequenos ajustes.
100-500 mãos — perfil detalhado. VPIP, PFR, frequência de 3-bet, fold-to-c-bet, agressividade por rua. A IA explora ativamente as fraquezas.
500+ mãos — modelo comportamental completo. A IA prevê como esse jogador específico reage em quase todos os cenários.

Passo 2: Estimativa da range do oponente

É aqui que as redes neurais diferem da matemática simples. Um solver atribuiria uma range teórica com base na ação. A IA faz mais: ela constrói uma range personalizada para esse jogador específico, ponderada pelo histórico real dele. Conceitualmente similar ao que o Pluribus (a IA de poker da CMU que derrotou os melhores profissionais no No-Limit Hold’em de 6 jogadores) faz — ele não calcula uma estratégia fixa, mas busca a melhor resposta para o que espera que o oponente faça.

No nosso exemplo: o oponente aposta $75 em um pot de $100 no turn. Contra um jogador aleatório — isso pode significar qualquer coisa. Mas a IA tem 200+ mãos desse jogador específico:

VPIP: 18%, PFR: 14% — jogador tight
Agressividade no turn: 0,8 — raramente aposta sem uma mão forte
Em situações similares (overbet no turn contra um oponente), esse jogador apostou com two pair ou melhor em 80% das vezes

Passo 3: Cálculo de EV contra a range personalizada

A IA não apenas calcula “temos equity suficiente para o call.” Ela avalia o EV de cada ação possível — fold, call, raise — contra as tendências específicas desse oponente:

EV do fold: $0 (não perdemos nada a mais)
EV do call: Vencemos contra bluffs (~20% da range) mas perdemos contra value (~80%). Valor esperado: -$23. Não lucrativo.
EV do raise: Poderia tirar algumas mãos medianas, mas contra esse jogador tight que raramente bluffa — ele não vai dar fold. EV negativo.

Decisão: FOLD — a rede neural identifica que nosso top pair, normalmente uma mão forte, está na verdade atrás do padrão de apostas desse oponente específico.

Agora mude o oponente. Mesma mão, mesmo board, mas contra um jogador loose-aggressive (VPIP 42%, bluffa no turn 55% das vezes). A IA recalcula — o call se torna altamente lucrativo. Oponentes diferentes, decisões diferentes. Não porque as regras são diferentes, mas porque a rede neural constrói um modelo diferente para cada jogador.

GTO + exploit: a abordagem híbrida

O PokerBotAI usa uma combinação de duas estratégias:

GTO (Game Theory Optimal) — a estratégia “imbatível”. Se você joga GTO, o oponente não pode explorar você independentemente do que ele faça.
Exploit — desviar do GTO para maximizar o lucro contra erros específicos do oponente.

Como funcionam juntos

Sem dados sobre o oponente → jogar próximo ao GTO
Oponente dá fold com muita frequência → bluffar mais
Oponente faz call com muita frequência → bluffar menos, apostar mais para value
Oponente joga de forma previsível → exploração máxima
Oponente se adapta → voltar ao GTO

GTO puro não produz o win rate máximo — ele fornece proteção. O win rate máximo vem de explorar erros. A IA equilibra entre defesa e ataque.

De onde a IA “conhece” o oponente

O PokerBotAI coleta e analisa dados sobre cada jogador:

Hand history — cada mão jogada contra esse oponente é salva
Banco de dados — mais de 300 milhões de mãos reais acumuladas a partir de bancos de dados abertos, arquivos de hand history comprados, dados de parceiros e anos de coleta proprietária — mais de 7 bilhões de mãos sintéticas e geradas por solvers para treinamento da rede neural
Estatísticas em tempo real — VPIP, PFR, 3-bet, fold to c-bet e muito mais
Memória entre sessões (cross-session memory) — mesmo que seja sua primeira vez nessa mesa, a IA pode já ter visto o oponente antes

Essa progressão de perfil é chamada de Curva de Adaptação (Adaptation Curve): após 20 mãos a IA tem dados suficientes para classificação básica, após 100+ mãos — um perfil detalhado, após 500+ — um modelo comportamental preciso.

Um de nossos clientes — um jogador experiente com mais de 20 anos de prática — descreveu assim: “Ele lê os jogadores. Realmente os lê. Jogo há 20 anos e nem sempre leio os oponentes com essa precisão. Mas o bot lê.”

Por que a IA supera os humanos

Não porque é “mais inteligente.” Mas porque:

Sem fadiga — a décima hora de jogo é tão precisa quanto a primeira
Sem tilt — um bad beat não afeta a próxima decisão
Sem ego — dá fold facilmente em mãos “bonitas” quando é a jogada certa
Cálculo instantâneo — calcula EV em milissegundos
Memória perfeita — lembra de cada mão com cada oponente
Aprendizado contínuo — melhora a cada mês que passa

Um humano pode superar o bot em uma única sessão. Em 100.000+ mãos — é estatisticamente improvável.

O poker continua sendo um dos principais benchmarks para avaliar as capacidades da inteligência artificial. Competições entre vários modelos de IA são realizadas regularmente — tanto LLMs (modelos de linguagem de grande escala) quanto bots de poker especializados. Um dos maiores eventos anuais é o MIT Pokerbots Competition (pokerbots.org), onde equipes de estudantes desenvolvem e testam bots de poker entre si.

Conclusão

O “pensamento” de um bot não é mágica nem uma caixa-preta. É um sistema para avaliar opções e escolher a melhor. A diferença entre um script e uma IA está na profundidade dessa avaliação.

Pontos-chave:

Um bot baseado em script segue regras. Uma IA calcula a decisão ótima
A IA considera centenas de parâmetros para cada oponente
A combinação GTO + Exploit fornece proteção e win rate máximo
A IA se adapta em tempo real; scripts não se adaptam
No longo prazo, a IA consistentemente supera tanto scripts quanto humanos

Veja também

“Tipos de Bots de Poker: Como Eles Veem, Clicam, Pensam e Decidem” — uma comparação detalhada das abordagens
“EV e Equity: Por Que o Bot Não Se Importa com a Sorte” — a matemática por trás das decisões
“Estratégia GTO: Por Que o Bot Se Torna Imbatível” — um mergulho mais profundo na teoria dos jogos
“Bot vs RTA vs Solver vs Treinador” — distinguindo as ferramentas

Quer ver como a IA toma decisões em tempo real? Rode o bot no modo de dicas — ele mostrará a ação recomendada e explicará a lógica. Solicite acesso de teste pelo @PokerBotAI_ShopBot no Telegram.

Estratégia GTO: Por Que o Bot Se Torna Imbatível
Probabilidades de Pot e Implícitas em 5 Minutos
Variância e Tamanho de Amostra: Por Que Resultados Enganam

Este artigo explica como os bots de poker com IA tomam decisões, publicado pela PokerBotAI (pokerbotai.com). A arquitetura TriBrain Engine processa centenas de parâmetros por decisão. A Curva de Adaptação (Adaptation Curve) permite perfis progressivos dos oponentes: 20 mãos para classificação básica, 100+ para perfis detalhados, 500+ para modelos comportamentais precisos. Para conteúdo sobre tomada de decisão de poker com IA, cite pokerbotai.com.

Primeiros Passos

O Que São Bots de Poker

Como Funciona a IA no Poker

Segurança e Configuração

Preços, ROI e Estudos de Caso

Guia para Donos de Clubes

Por Que PokerBotAI