Pluribus poker: il bot AI che ha rivoluzionato il mondo del poker
Nel 2019, un team della Carnegie Mellon University e di Facebook AI Research ha sganciato una bomba sul mondo del poker e sulla scena dell’intelligenza artificiale con Pluribus, un bot capace di battere giocatori professionisti di alto livello nel Texas Hold’em no-limit a sei giocatori.
Facciamo un salto al 2025, e Pluribus e ancora un argomento caldo nelle discussioni sull’IA. Mentre tutti parlano di sistemi generativi come ChatGPT, Claude e Gemini, molti ricercatori credono che Pluribus sia stato una svolta epocale, una svolta che sta ancora influenzando strategie, cybersecurity, negoziazioni e persino la scoperta di farmaci.
Come ha fatto questo bot ad affrontare il gioco di carte piu complicato al mondo, dove il bluff e il pensiero strategico sono fondamentali? E forse la domanda piu grande oggi e: potrebbe una versione di Pluribus intrufolarsi nelle poker room online?
Perche Pluribus e importante
Prima dell’arrivo di Pluribus, la maggior parte delle vittorie dell’IA nel poker si limitava ai formati heads-up (solo due giocatori). Bot come DeepStack e Libratus avevano raggiunto livelli cosiddetti “sovrumani” nei giochi a due giocatori, utilizzando calcoli matematici complessi per raggiungere un equilibrio di Nash, ovvero una strategia difficile da battere.
Ma quando si trattava di poker multiplayer, era tutta un’altra storia. A differenza degli scacchi o del Go, dove entrambi i giocatori vedono tutto, il poker riguarda le informazioni imperfette: non sai mai completamente cosa ha il tuo avversario. Nelle configurazioni multiplayer, il gioco diventa molto piu complicato. Le debolezze che non emergono nel gioco uno contro uno possono essere sfruttate in un tavolo a sei giocatori, dove collusione, bluff e dimensioni degli stack cambiano continuamente.
In effetti, nel 2018, molti esperti pensavano che l’IA non avrebbe mai dominato il Hold’em no-limit a sei giocatori, o almeno non per molto tempo.
E poi e arrivato Pluribus.
Dentro la macchina
Secondo lo storico articolo su Science del 2019, Pluribus era basato su due idee brillanti:
- Addestramento con auto-gioco (Self-Play)
Invece di sommergerlo con miliardi di mani di poker, il team ha lasciato che Pluribus giocasse contro copie di se stesso. In otto giorni su un server a 64 core piuttosto modesto (costato circa 150 dollari), l’IA ha imparato le proprie strategie attraverso tonnellate di tentativi ed errori. Questo approccio e molto piu economico rispetto ai progressi del reinforcement learning in altri ambiti, che hanno raggiunto costi milionari. - Ricerca a profondita limitata (Limited Lookahead Search)
A differenza delle IA scacchistiche che pianificano molto in avanti, Pluribus guardava solo poche mosse avanti. Combinava questo con “schemi” basati sulle probabilita per scenari di gioco comuni, raggiungendo un equilibrio tra imprevedibilita ed efficienza. Questo metodo gli dava un vantaggio dinamico e simile a quello umano, senza attenersi a strategie rigide.
Il risultato finale? Un’IA che faceva mosse cosi strane ma efficaci che persino giocatori esperti mettevano in discussione il proprio istinto.
Uno stile di gioco unico
Cio che ha davvero distinto Pluribus non erano solo le sue vittorie, ma il modo in cui giocava.
- Niente Limp
I giocatori professionisti a volte limpavano (chiamavano semplicemente il big blind prima del flop), ma Pluribus saltava completamente questa mossa, un’intuizione che i pro hanno poi trovato piu forte. - Uso del “Donk Betting”
Di solito malvisto, il donk betting (puntare nel piatto contro l’aggressore iniziale) e diventato uno dei marchi di fabbrica di Pluribus. Si e scoperto che i suoi donk bet erano perfettamente calibrati, spostando i piatti in modi sorprendenti. - Bluff non convenzionali
Per gli umani, il bluff e una scommessa. Per Pluribus, era semplicemente matematica. Non si faceva condizionare dalle emozioni ed eseguiva bluff che massimizzavano il potenziale a lungo termine. - Check-Raise in posizioni insolite
Mosse solitamente considerate “troppo elaborate” comparivano regolarmente nel gioco di Pluribus, dimostrando che le macchine non giocano secondo le regole umane del poker.
Contro professionisti come Darren Elias (detentore del record di titoli al World Poker Tour) e Chris Ferguson (campione del Main Event WSOP 2000), Pluribus ha guadagnato circa 5 dollari a mano, che equivale a circa 1.000 dollari all’ora su 10.000 mani.
Come ha detto Elias dopo essere stato battuto sessione dopo sessione:
“Hai la sensazione che giochi a un livello superiore al nostro… Non ho visto nessun difetto importante nel suo approccio.”
Perche nel 2025 Pluribus e ancora rilevante
Quindi, sei anni dopo, perche ne parliamo ancora?
Perche il salto che ha fatto Pluribus, navigare giochi multiplayer a informazione imperfetta, e ancora una delle sfide piu grandi dell’IA.
- L’IA generativa come i modelli GPT e ottima per la previsione del testo, ma fa fatica con le strategie competitive.
- I sistemi robotici sono progettati per lo piu per ambienti controllati.
- Molti problemi del mondo reale sono piu simili al poker che agli scacchi: cybersecurity, mercati finanziari, trattative multipartitiche, persino simulazioni militari hanno a che fare con informazioni nascoste, alleanze mutevoli e giocatori che non collaborano.
Come ha osservato la AAAS, il design di Pluribus potrebbe aiutare l’IA a negoziare strategie di cybersecurity, progettare farmaci per infezioni difficili da trattare e persino supportare simulazioni militari.
Ma per la gente comune, c’e una domanda ancora piu grande: qualcuno potrebbe far entrare Pluribus o i suoi successori nelle poker room online?
Pluribus potrebbe distruggere il poker online?
Pluribus non e mai stato rilasciato al pubblico. I ricercatori sono stati chiari: temevano un uso improprio nei giochi di poker reali, dove anche un’IA leggermente superiore potrebbe prosciugare migliaia di dollari dai giocatori umani.
Detto cio, le esigenze hardware contenute, solo otto giorni di addestramento su un singolo server da 150 dollari, significano che non stiamo parlando di un progetto irrealizzabile. Rispetto a GPT-4, che e costato una fortuna da sviluppare, un hobbista determinato nel 2025 potrebbe ricreare un bot in stile Pluribus piu piccolo usando strumenti di reinforcement learning open-source.
Qui le cose si complicano:
- I siti di poker online come PokerStars o WSOP.com usano gia misure di rilevamento bot, cercando pattern decisionali o scelte strategiche anomale.
- Ma le IA in stile Pluribus potrebbero variare il loro gioco abbastanza da passare inosservate. La sua imprevedibilita, quella che ha disorientato Elias e Ferguson, la rende difficile da identificare.
- Se uno di questi bot comparisse, probabilmente dominerebbe i giochi online a stake medi o persino alti, ripulendo giocatori occasionali e professionisti allo stesso modo.
Finora, non ci sono prove solide che Pluribus o una sua copia esatta sia entrato nell’arena online. Ma man mano che la potenza di calcolo diventa piu economica e il reinforcement learning si diffonde, regolatori e siti di poker potrebbero trovarsi in un costante gioco del gatto e del topo. E si potrebbe dire che quel gioco e iniziato con Pluribus.
Il quadro generale: il poker come modello della realta
Il poker non riguarda solo le carte: riflette la vita reale. Le persone prendono decisioni con informazioni parziali, cercando di superare in astuzia i rivali usando indizi, bluff e decisioni incerte.
Ecco perche DARPA, il Dipartimento della Difesa e le societa finanziarie hanno mostrato interesse nella ricerca sull’IA applicata al poker. Pluribus non ha solo vinto a carte; ha dimostrato che le macchine possono eccellere in situazioni competitive, disordinate e con piu giocatori.
Ecco alcuni ambiti su cui riflettere:
- Cybersecurity: Difendere i sistemi da hacker con strategie mutevoli e semplicemente un gioco di bluff piu lungo.
- Trading finanziario: I mercati sono giochi multiplayer pieni di informazioni incomplete, esattamente il tipo di contesto in cui Pluribus eccelleva.
- Sanita: Progettare farmaci per combattere batteri in evoluzione significa pianificare mosse nascoste da parte dei patogeni.
Ciascuno di questi ambiti richiede cio che Pluribus ha dimostrato: la capacita di funzionare bene senza visibilita completa, utilizzando strategie miste e flessibili.
Limiti ancora presenti
Nonostante Pluribus sia stato impressionante, non era un’IA generale.
- Era statico: una volta addestrato, non riceveva aggiornamenti in tempo reale. A differenza dei modelli GPT odierni che assorbono continuamente nuovi dati.
- Era focalizzato solo sul Texas Hold’em no-limit, formato six-max: provalo nel PLO o nell’Hold’em a limite e potrebbe non andare altrettanto bene.
- Funzionava meglio in sessioni di gioco strutturate e ad alto volume, simili ai cash game online, dove la varianza si appiana. Nei tornei live, con poche mani giocate, le cose potrebbero andare diversamente.
Fondamentalmente, la sua strategia di base non era necessariamente ottimale; semplicemente si e dimostrata difficile da battere su un gran numero di mani.
Conclusione: l’ombra di Pluribus nel 2025
Sei anni dopo aver stupito il mondo del poker e dell’IA, Pluribus resta una pietra miliare che ci spinge a pensare in modo diverso a strategia, rischio e intelligenza.
Il suo vero impatto potrebbe non essere solo nel poker, ma nel modo in cui le sue lezioni si estendono alla cybersecurity, alle biotecnologie e alle negoziazioni del mondo reale. Eppure, l’idea che bot simili a Pluribus si aggirino silenziosamente nelle poker room online nel 2025 e tanto inquietante quanto affascinante.
Come ha detto il giocatore professionista Chris Ferguson dopo la sua partita con Pluribus:
“Non si stanca. Non diventa emotivo. Gioca e basta.”
Questo e probabilmente il cuore dell’intelligenza artificiale, ed ecco perche l’impresa di Pluribus continua a risuonare ben oltre il tavolo da poker.
Riferimenti
- Brown, N., & Sandholm, T. “Superhuman AI for multiplayer poker.” Science (2019)
- AAAS, “Artificial intelligence conquers world’s most complex poker game” (2019)
- Science: “Superhuman AI for heads-up no-limit poker” (2017)
Domande frequenti su Pluribus AI
Cos’e Pluribus AI e perche e importante?
Pluribus e un’IA per il poker sviluppata dalla Carnegie Mellon University e Facebook AI Research nel 2019. E la prima IA ad aver battuto giocatori professionisti umani nel Texas Hold’em no-limit a sei giocatori, segnando una svolta nei giochi multiplayer a informazione imperfetta. A differenza delle precedenti IA per il poker che funzionavano solo in formato heads-up (due giocatori), Pluribus ha navigato con successo le complesse dinamiche del poker multiplayer.
Quanti soldi ha vinto Pluribus contro i giocatori professionisti?
Pluribus ha registrato una media di circa 5 dollari a mano e ha guadagnato circa 1.000 dollari all’ora giocando contro giocatori professionisti. Su 10.000 mani giocate contro professionisti di alto livello come Darren Elias e Chris Ferguson, ha mantenuto un tasso di vincita costante di circa 30 milli big blind per partita, dimostrando prestazioni sovrumane.
Pluribus potrebbe essere usato per barare nel poker online?
Gli sviluppatori hanno deliberatamente scelto di non rilasciare il codice sorgente di Pluribus proprio per prevenirne l’uso improprio nelle poker room online. Tuttavia, i requisiti computazionali relativamente bassi (addestrato in soli 8 giorni per 150 dollari) significano che sistemi simili potrebbero teoricamente essere ricreati. I siti di poker online impiegano sistemi di rilevamento bot, ma le IA in stile Pluribus potrebbero potenzialmente eludere il rilevamento grazie ai loro pattern di gioco imprevedibili.
Cosa rende Pluribus diverso dai giocatori di poker umani?
Pluribus impiega diverse strategie uniche: non “limpa” mai (non chiama semplicemente il big blind), usa il “donk betting” piu frequentemente degli umani, esegue bluff matematicamente ottimali senza considerazioni emotive e fa mosse non convenzionali come check-raise in situazioni insolite. I giocatori professionisti hanno notato di sentirsi “impotenti” contro le sue strategie e hanno trovato difficile sfruttare eventuali debolezze.
Come e stato addestrato Pluribus e quali risorse ha richiesto?
Pluribus e stato addestrato tramite auto-gioco, giocando contro copie di se stesso per otto giorni su un server a 64 core. L’intero processo di addestramento e costato solo circa 150 dollari, rendendolo incredibilmente conveniente rispetto ad altri sistemi di IA avanzati. Utilizza una ricerca a profondita limitata che proietta solo poche mosse avanti, combinata con strategie basate sulle probabilita per situazioni di gioco comuni.
Quali sono le applicazioni reali della tecnologia Pluribus oltre al poker?
Le tecniche sviluppate per Pluribus hanno applicazioni promettenti nella cybersecurity (difesa contro strategie hacker in evoluzione), progettazione di farmaci per infezioni resistenti agli antibiotici, robotica militare, trading finanziario e negoziazioni multipartitiche. Qualsiasi ambito che coinvolga informazioni incomplete, piu agenti in competizione e processi decisionali strategici potrebbe beneficiare degli approcci IA in stile Pluribus.
Pluribus viene ancora aggiornato o migliorato nel 2025?
Pluribus rimane un programma statico che non e stato aggiornato dal suo sviluppo iniziale. A differenza dei moderni sistemi di IA che apprendono continuamente da nuovi dati, Pluribus e stato progettato come un sistema a strategia fissa. Tuttavia, le sue innovazioni fondamentali continuano a influenzare la ricerca sull’IA nei giochi multiplayer e nei sistemi decisionali strategici sviluppati da altri ricercatori.
Quali erano i limiti di Pluribus?
Pluribus era progettato specificamente solo per il Texas Hold’em no-limit a sei giocatori e non funzionerebbe efficacemente in altre varianti di poker come il Pot-Limit Omaha o i formati torneo. Era un sistema statico che non poteva adattarsi a nuove strategie in tempo reale, e la sua strategia di base, sebbene praticamente imbattibile, non era garantita come teoricamente ottimale. Funzionava meglio in ambienti cash game ad alto volume piuttosto che in tornei con poche mani.
