Capítulo8 Equilíbrio de Nash em Estratégias Mistas

Considere o jogo “cara” ou “coroa” a seguir. Nesse jogo, dois jogadores escolhem entre cara (heads) ou coroa (tails) ao mesmo tempo. Se as escolhas forem iguais, o Jogador 1 ganha um ponto. Caso contrário, o Jogador 2 ganha um ponto. O objetivo dos jogadores é maximizar sua pontuação.

library(knitr)
# Definindo a matriz de payoff
payoff.mat <- matrix(c(1, -1, -1, 1), 
                     nrow = 2, ncol = 2, 
                     dimnames = list(c("Cara", "Coroa"), 
                                     c("Cara", "Coroa")))

# Renderizando a tabela de payoff
kable(payoff.mat)
Cara Coroa
Cara 1 -1
Coroa -1 1

Esse jogo é similar ao de par ou ímpar, que estamos acostumados

Exercício 8.1: jogue par ou ímpar com outra pessoa por 5 rodadas.

library(knitr)
# Definindo a matriz de payoff
payoff.mat <- matrix(c(1, -1, -1, 1), 
                     nrow = 2, ncol = 2, 
                     dimnames = list(c("Par", "Ímpar"), 
                                     c("Par", "Ímpar")))

# Renderizando a tabela de payoff
kable(payoff.mat)
Par Ímpar
Par 1 -1
Ímpar -1 1

Após o jogo, podemos perceber que os jogadores possuem interesses opostos e vocês esperam que o outro não consiga antecipar o que você irá fazer. Nesse caso, ele será indiferente entre jogar qualquer uma de suas estratégias, pois esperar que, na média, ambas gerem o mesmo payoff médio.

Uma estratégia mista é justamente um antidoto contra as tentativas dos outros jogadores advinharem o que você irá fazer. Considere o jogo de tênis. No saque, se seu adversiário antecipar o que você irá fazer, ele terá uma vantagem. Então, você precisa jogar de um jeito que ele não consiga angtecipar ou advinhar suas estratégias.

Considere o seguinte jogo.

C D
A (4,25) (12,5)
B (16,10) (8,15)

É fácil ver que não há equilíbrio de Nash em estratégias puras. Vocês viram que no jogo do par ou ímpar, o ideal é jogar cada estratégia com 50% de chance. Vamos tentar colocar alguma probabilidade nesse jogo? Que tal 50% para cada estratégia também?

Vamos calcular o payoff (utilidade) esperado das novas estratégias, para poder preenhcer a nova matriz de payoff aumentada.

C D 50% C, 50% D
A (4,25) (12,5) (8,15)
B (16,10) (8,15) (12.00,12.50)
50% C, 50% D (10.00,17.50) (10,10) (10.00,13.75)

Vamos calcular o Equilíbrio de Nash, se existe?

Novamente, não existe equilíbrio de Nash. Lembremos que estamos querendo deixar os jogadores indeferentes entre suas estratégias. Então, devemos procurar probabilidades que os deixem indiferentes. Isso significa que eles não poderão antecipar a estratégia do outro jogador se for um equilíbrio de Nash (é a melhor resposta simultaneamente).

Como achar essas probabilidades? O payoff esperado de jogar A e B, para o jogador 1 deve ser o mesmo, pois ele é indiferente dado o que o jogador 2 está fazendo. E a estratégia mista de 1 deve deixar 2 indiferente entre jogar C e D. Formalmente: Se 2 está misturando suas estratpegias para deixar 1 indiferente, então a utilidade esperada de 1 jogar A, dado que 2 está jogando C com probabilidade \(p_2c\) e D com probabilidade $ 1 - p_2c$, deve ser a mesma de 1 jogar B, dado que 2 está jogando C com probabilidade \(p_2c\) e D com o complemento.

Para o jogador 1, \(E[U(A)] = E[U(B)]\) e para o jogador 2, \(E[U(C)] = E[U(D)]\). Como calcular a utilidade esperada de jogar “A”? Suponha que o jogador 1 escolhe a com probabilidade \(p_1\), e B com probabilidade \(1-p_2\). Então:

\(E[U(A)] = p_2c*U(A| 2 joga C) + (1-p_2c)*U(A| dado 2 joga D ) = p_2c*4 + (1-p_2c)*12\)

\(E[U(A)] = p_2c*4 + 12 -p_2c*12 = 12 - 8*p_2c\)

\(E[U(B)] = p_2c*U(B| 2 joga C) + (1-p_2c)*U(B| dado 2 joga D ) = p_2c*16 + (1-p_2c)*8\)

\(E[U(B)] = p_2c*16 + 8 -8*p_2c = 8 + 8*p_2c\)

Se 1 está indiferente, então: \(E[U(A)] = E[U(B)]\)

\(12 - 8*p_2c = 8 + 8*p_2c\)

\(12 - 8 = 8*p_2c + 8*p_2c\)

\(4 = 16*p_2c\)

\(p_2c = 4/16\)

\(p_2c = 1/4\)

\(p_2d = 3/4\)

E agora fazemos a mesma coisa para o jogador 2. \(E[U(C)] = E[U(D)]\)

\(p_1a*U(C| 1 joga A) + (1-p_1a)*U(C| dado 1 joga B ) = p_1a*U(D| 1 joga A) + (1-p_1a)*U(B| dado 1 joga B )\)

\(p_1a*25 + (1-p_1a)*10 = p_1a*5 + (1-p_1a)*15\)

\(p_1a*25 + 10 -p_1a*10 = p_1a*5 + 15 - p_1a*15\)

\(p_1a*15 + 10 = 15 - p_1a*10\)

\(p_1a*25 = 5\)

\(p_1a = 5/25\)

\(p_1b = 4/5\)

Nossa matriz agora fica:

C D 1/4 C, 3/4 D
A (4,25) (12,5) (10,10)
B (16,10) (8,15) (10.00,13.75)
1/5 C, 4/5 D (13.60,13.00) (8.80,13.00) (10,13)

Podemos ver, em primeiro lugar, que na nova matriz de payoff, 1 é indiferente entre jogar A, B ou sua estratégia mista de equilíbrio se 2 de fato está misturando suas estratégias C e D com as probabilidade de equilíbrio. Notem que ele sempre ganha 10.

Do mesmo jeito, 2 sempre ganha 13 se 1 está em sua estratégia mista. Por fim, vemos que ambas são estratégias de equilíbrio de Nash. E, nesse caso, a única estratégia mista (ou pura) de equilíbrio.

Vamos agora fazer o mesmo exercício para o jogo do par ou ímpar e para pedra, papel tesoura.

Aplicação em ciência política.

Suponha duas candidatas, 1 e 2, que devem decidir onde alocar seus dias finais de campanha, seja no estado A ou estado B, nos EUA. As pesquisas indicam que esses são os estados que podem decidir a batalha. Suponha que as probabilidades de cada candidata ganhar a eleição são dadas como segue:

A B
A (0.5,0.5) (0.9,0.1)
B (0.9,0.1) (0.6,0.6)

Vamos calcular o ENEM (Eq. Nash em Estratégias Mistas)?

Ambas vão para A com prob 3/7 (aprox. 0.43) e B com prob 4/7 (aprox. 0.57).

Agora, suponha que, antes de implementar essas estratégias, novas pesquisas saem e a probabilidade muda. Se 1 for para B sozinha, sua prob é .7 e não .9. Isso é conhecimento comum. Portanto, isso poderia nos levar a crer que ela deveria gastar mais tempo em A, ou aumentar a probabilidade de ir para A. Mas os novos equilíbrios indicam que 1 agora vai para A com pob 1/5 e visitar b com 4/5. Isso porque 2 vai mudar sua estratégia e aumentar a prob de visitar A (de 3/7 para 3/5). E se ambos vão para A, a prob de 1 ganhar é menor do que se ela for para B sozinha.

Esse tipo de coisa acontece com frequência em esportes. Um jogador veterano atacante se machuca e alguém das divisões de base entra no lugar. E aí, ele comeca a receber mais passes e tem mais oportunidades de gol e, por isso, marca mais gols do que o veterano. Ocorre que, como ele tem menos chance de criar jogadas e fazer gols, é melhor deixar ele mais livre e marcar outros jogadores. Isso aumenta a chance de gol do novato, mas diminui a de todos os outros jogadores. Então, embora ele esteja marcando mais gols que o veterano, o time no geral estará com desempenho pior.

8.1 Pedra-papel-tesoura

Considere o jogo pedra-papel-tesoura. Assuma que vencer gera um payoff de 1, empate 0 e perder de -1. A matriz de payoff pode ser representada do seguinte modo:

Pedra Papel Tesoura
Pedra (0,0) (-1,1) (1,-1)
Papel (1,-1) (0,0) (-1,1)
Tesoura (-1,1) (1,-1) (0,0)

A correspondência de melhor resposta do jogador 1 para suas crenças a respeito do jogador 2 pode ser escrita da seguinte forma: \(s_1(s_2) =\) Papel quando \(s_2 = Pedra\) \(s_1(s_2) =\) Tesoura quando \(s_2 = Papel\) \(s_1(s_2) =\) Pedra quando \(s_2 = Tesoura\)

E de maneira análoga para o jogador 2. É fácil ver que não existe equilíbrio de Nahs em estratégias puras nesse jogo. Raciocínios do tipo: “se ele acha que vou jogar pedra, então ele jogará papel, de forma que devo jogar tesoura. Porém, se ele antecipar isso, ele jogará pedra, de forma que devo jogar papel. Mas ele pode antecipar isso também e jogar tesoura, mas aí eu jogo pedra…” leva a uma regressão que nunca terminará. Em certo sentido, tanto faz o que você joga, porque não é possível advinhar o que você o outro jogador irá fazer. Mas dizer tanto faz pode ser pensado como se você aleatorizasse e jogasse cada uma das três ações com a mesma probabilidade \(1/3\), e o mesmo o jogador 2. Nesse caso, dizemos que os jogadores estão jogando uma estratégia mista. Neste caso em particular, joga cada uma das t^Res ações com probabilidade \(1/3\).

Definição do Ronaldo Fiani (p. 192):

Quando, em vez de escolher entre suas estratégias uma dada estratégia para jogá-la com certeza, um jogador decide alternar entre suas estratégias aleatoriamente, atribuindo uma probabilidade a cada estratégia a ser escolhida, diz-se que o jogador utiliza estratégias mistas. Caso contrário, diz-se que emprega estratégias puras.

Nós vamos definir estratégias mistas da seguinte forma: Se o conjunto de estrartégias disponíveis para um jogador é \(S = (s_1, s_2, ..., s_m)\), então uma estratégia mista para aquele jogador é uma loteria sobre \(S\), \(p = (p_1, p_2, ..., p_m)\). Diz-se que o jogador escolheu a estratégia \(p\) se ele usa esta loteria para determinar qual estratégia pura irá implementar no jogo.

Em outras plavras, uma estratégia mista é uma distribuição de probabilidade que determina como uma estratégia pura será jogada por meio da realização dessa distribuição.

Definição 8.1. Se um conjunto de estatégias disponíveis para um jogador é \(S = {s_1, s_2, ..., s_n}\), então uma estratégia mista para aquele jogador é uma loteria sobre \(S\), \(p = (p_1, p_2, ..., p_n)\). Diz-se que o jogador escolhe essa estratégia \(p\) se ele usa essa loteria para determinar que estratégia pura irá implmentar quando de fato jogar o jogo.

8.2 Exercícios

Exercise 8.1 Qual o equilíbrio de Nash em Estratégias Mistas (ENEM) do Dilema do Prisioneiro?

Exercise 8.2 Qual o equilíbrio de Nash em Estratégias Mistas (ENEM)do jogo do Chicken??

Exercise 8.3 Para as perguntas abaixo, considere o seguinte jogo representado na forma estratégica: a) Existe algum equilíbrio de Nash em Estratégias Puras (ENEP)? Se sim, qual (ou quais)? b) Quantos equilíbrios de Nash em estratégias mistas existem?

Esquerda Centro
Alto (3,3) (3,3)
Baixo (3,3) (3,3)

Exercise 8.4 Considere o seguinte jogo representado na forma estratégica para as perguntas abaixo: a) Existe algum equilíbrio de Nash em Estratégias Puras (ENEP)? Se sim, qual (ou quais)?

  1. Existe ENEM em que os jogadores aleatorizam entre A e B? Explique.

  2. Existe ENEM em que os jogadores aleatorizam entre B e c? Explique.

A B C
A (4,4) (0,5) (-1,0)
B (5,0) (1,1) (0,0)
C (0,-1) (0,0) (1,1)

Exercise 8.5 Uma funcionária (jogadora 1) que trabalha para uma chefe (jogadora 2) pode tanto trabalhar (T) quanto enrolar (E), enquanto sua chefe pode tanto monitorar a funcionária (M) quanto ignorá-la (I). Como em muitos relacionamentos entre funcionária e chefe, se a funcionária estiver trabalhando, a chefe prefere não monitorá-la, mas se a chefe não estiver monitorando, a funcionária prefere enrolar. A matriz de payoff abaixo representa uma situação como essa. Responda às seguintes perguntas:

  1. escreva a fução de melhor resposta de cada jogadora (isto é, para a jogadora 1, qual probabilidade \(p\) ela deve escolher para cada possível escolha de probabilidade \(q\) da jogadora 2).

  2. qual o equilíbrio de Nash do jogo?

M I
T (1,1) (1,2)
E (0,2) (2,1)

8.3 Referências

Gauriot, R., Page, L., & Wooders, J. (2023). Expertise, gender, and equilibrium play. Quantitative Economics, 14(3), 981-1020.