Equilibrio di Nash: cos’è e come funziona
L’equilibrio di Nash è una combinazione di mosse (tecnicamente “profilo di strategie”) per la quale nessun giocatore riceve un beneficio maggiore nel variare la propria scelta. Esso prende il nome dal matematico ed economista John Nash ed è probabilmente il tipo di equilibrio più conosciuto di tutta la Teoria dei giochi. Nash sviluppò questo concetto durante i suoi anni a Princeton, unendo concetti di Matematica pura ad altri riguardanti le scelte ottime nei giochi.
Nash dimostrò che, date certe condizioni, esiste sempre un equilibrio nel quale ciascun giocatore deciderà la sua mossa indipendentemente da quella dell’avversario e non la varierebbe nemmeno se conoscesse quest’ultima.
Dove c’eravamo lasciati: il dilemma del prigioniero
Riprendiamo l’esempio trattato nel primo capitolo della “Trilogia dei giochi”: il dilemma del prigioniero.
Tralasciando la parte allegorica del dilemma, abbiamo due giocatori e ciascuno di essi può effettuare due mosse e per ognuna di esse può ottenere un certo guadagno (che chiameremo payoff).
Nel dilemma del prigioniero abbiamo parlato di strategie migliori per ciascun individuo ma non di strategie dominanti. Questo è stato un cambio di parole voluto perché, citando un famoso studioso, “C’è un luogo e un momento per ogni cosa”. Possiamo ora dare una definizione di questo concetto.
Cos’è una strategia dominante?
Una strategia dominante è quell’azione che permette al giocatore di ottenere il payoff più alto qualunque sia la mossa scelta dall’avversario.
Supponiamo di avere due individui, A e B.
- le azioni di A sono X che gli permette di ottenere 10 e Y che gli fa guadagnare 5
- B ha invece a disposizione le azioni Q, W, E, R, T, Y
Tra X e Y, la strategia dominante sarà quella che farà guadagnare un payoff maggiore ad A, nel confronto con le possibili mosse di B. Per determinare quale strategia sia dominante non è importante il payoff di ogni singola mossa, infatti una strategia dominante può anche essere quella che fa guadagnare meno al giocatore (Y nell’esempio).
Cosa accade se due giocatori scelgono contemporaneamente la loro strategia dominante?
Quando i due individui giocano la loro strategia dominante, danno vita ad un equilibrio di strategie dominanti. Questo è un caso particolare dell’equilibrio di Nash, in quanto si basa sull’ipotesi che ogni strategia di un giocatore sia una best response alla strategia scelta dall’avversario (o avversari).
Cos’è una best response?
Italianizzato in “risposta ottima”, è la strategia che consente al giocatore di ottenere il payoff maggiore o comunque di far accadere lo scenario a lui più favorevole. Questo concetto, all’apparenza banale, è di fondamentale importanza nell’equilibrio di Nash.
Equilibrio di Nash: un esempio pratico
Un esempio vale (a volte) più di mille parole.
Esempio a cura dell’autoreI colori indicano i payoff dei due giocatori mentre le lettere in verde sono le loro possibili mosse.
Come si trova l’equilibrio di Nash?
Un esempio di immediata comprensione consiste nel confrontare ogni “sfida” tra le possibili mosse dei due giocatori e, vedere quale mossa risulta quella più vincente.
Esempio a cura dell’autoreIn questo modo è facile determinare che la strategia dominante di Red sia A, in quanto gli permette di massimizzare il suo payoff qualunque mossa faccia Blue.
E per l’altro giocatore?
Anche qui si può ricorrere ad un trucchetto. Avendo determinato che A è la best response di Red, si deve guardare quale tra le mosse di Blue sia la migliore quando Red gioca A.
Alla luce di ciò, l’equilibrio di Nash risulta essere quello composto dalle mosse A e S.
Con questo si conclude il secondo capitolo della “Trilogia dei giochi. Se riterrete che leggere il terzo e ultimo articolo sia la vostra strategia dominante, allora ci vediamo venerdì prossimo.