View
1
Download
0
Category
Preview:
Citation preview
Teorema de Nash
Primeiro Seminário de Teoria dos Jogos
Maio de 2007
Fabrício Murai
2
Sumár io
● Objetivos● Notação e definições● Enunciado do Teorema● Teoremas do Ponto Fixo● Demostração do Teorema● Referências
3
Obje t i vos
● Apresentar a demonstração do Teorema de Nash
4
Notação e de f in i ções
● Jogo estático finito na forma normal:– Existem N jogadores, denotados por
. Vamos denotar o conjunto de índices por .
– Seja o número de estratégias de um jogador e o conjunto de índices por , sendo um elemento típico de representado por .
– Se é o resultado do jogo, a perda de é dada por .
f1; 2; :::;Ngmi
Pi f1; 2; :::;migMi
ni
fn1; n2; :::; nNgain1;n2;:::;nNPi
Mi
N
P1; P2; :::; PN
5
Notação e de f in i ções
● Um equilíbrio de Nash usando estratégias puras é uma N-upla , com , onde N inequações seguintes são satisfeitas para todo :
fn¤1; n¤2; :::; n¤Ng
ni 2Mi; i 2 N
a1¤ , a1n¤1 ;n
¤2;:::;n
¤N· a1n1;n¤
2 ;:::;n¤N
an¤ , ann¤1 ;n
¤2;:::;n
¤N· ann¤
1 ;n¤2;:::;nN
a2¤ , a2n¤1 ;n
¤2;:::;n
¤N· a2n¤
1 ;n2;:::;n¤N
... gn¤i 2Mi; i 2 N
6
Notação e de f in i ções
● Uma estratégia mista adotada por um jogador i é uma distribuição de probabilidade sobre , onde é a probabilidade de escolher a estratégia .– Exemplo:
yi
Mi yinjnj
Espaço de estratégias do jogador 1:
1-simplex 2-simplex
N = 2
mi = 2 mi = 3
7
Notação e de f in i ções
0 1
Outra representação:
1
1 Espaço de estratégiasdo jogador 1 e 2
1
1
1
y11
N = 3;mi = 2; 8i 2 N
N = 2;mi = 2; 8i 2 N
Espaço de estratégiasdo jogador 1
yi2 = 1¡ yi1
Todos esses são subespaçosdo fechados, limitados econvexos.
<n
8
Notação e de f in i ções
● Um equilíbrio de Nash formado por estratégias mistas é uma N-upla , onde as seguintes inequações são satisfeitas para todo
:yj 2 Y j ; j 2 N
fyi¤ 2 Y i; i 2 Ng
9
Notação e de f in i ções
X
M1
:::X
MN
y1n1y2¤n2 :::y
N¤nN a
1n1;:::;nN
X
M1
:::X
MN
y1n1y2¤n2 :::y
N¤nN a
1n1;:::;nN
X
M1
:::X
MN
y1¤n1y2n2 :::y
N¤nN a
2n1;:::;nN
...
)¹J1¤ ,X
M1
:::X
MN
y1¤n1y2¤n2:::yN¤nN a
1n1;:::;nN
·
¹J2¤ ,X
M1
:::X
MN
y1¤n1y2¤n2 :::y
N¤nN a
2n1;:::;nN ·
¹J1¤ ,X
M1
:::X
MN
y1¤n1y2¤n2 :::y
N¤nN a
1n1;:::;nN ·
Volta ao slide 16
10
Enunc iado do Teorema
● Todo jogo estático finito com N jogadores em forma normal possui pelo menos um equilíbrio não-cooperativo (equilíbrio de Nash) usando estratégias mistas.
Observação: Toda estratégia pura é uma estratégia mista.
11
Teoremas do Ponto F ixo
● Teorema do Ponto Fixo de Brouwer– Se é um subconjunto convexo e compacto
do e é uma função contínua mapeando em si mesmo, então existe pelo menos um tal que .
SS<n f
x 2 S f(x) = x
12
Demonst ração do Teorema
● Seja uma N-upla de estratégias mistas para o jogo de N jogadores. Vamos definir:
para cada e . Note que esta função é contínua.
fyi 2 Y i; i 2 Ng
Ãini(y1; :::yN) ,
X
M1
:::X
MN
y1n1y2n2 :::y
NnNa
in1;:::;nN
¡X
M1
:::X
Mi¡1
X
Mi+1
:::X
MN
y1n1 :::yi¡1ni¡1
yi+1ni+1 :::yNnNa
in1;:::;nN
ni 2Mi i 2 N
perda esperada
perda esperada usandoa estrat. pura
Voltar ao Slide 20
ni
13
Demonst ração do Teorema
● Agora, seja relacionado a por:
para cada e . Logo, é também uma função contínua. Então, introduzindo a transformação:
cini , maxfÃini ; 0g
ciniÃini
ni 2Mi i 2 N cini(y1; :::; yN )
Voltar ao Slide 20
¹yini =yini + c
ini
1 +P
j2Micij; ni 2Mi; i 2 N
observe que não estamosusando para não confundircom o índice de
cinini ¹yini
14
Demonst ração do Teorema
● Note que:
X
Mi
¹yini = 1
g¹yini ¸ 0 0 · ¹yini · 1yini · 1; cini ·
PMicinj ) ¹yinI · 1
X
Mi
¹yini =yin1 + y
in2 + ::: + y
inN + c
in1 + c
in2 + :::+ c
inN
1 +Pj2Mi
cijX
Mi
¹yini =
PMiyini +
Pni2Mi
cini1 +
Pj2Mi
cij
15
Demonst ração do Teorema
T
(¹y1; :::; ¹yN) = T (y1; :::; yN )
T
T
● E chamando-a de :
podemos observar que é um mapeamento contínuo de em si mesmo. Como é fechado, limitado e convexo, pelo Teorema do Ponto Fixo de Brouwer, o mapeamento tem pelo menos um ponto fixo.
QN YiQ
N Yi
16
Demonst ração do Teorema
● Agora iremos provar que é um equilíbrio de Nash usando estratégias mistas se e somente se for um ponto fixo desse mapeamento.
● Sentido direto:
Se é um equilíbrio de Nash usando estratégias mistas, então por definição, a função é não-positiva para todo , e , e por fim para todo , .
fyi¤ 2 Y i; i 2 Ng
fyi¤ 2 Y i; i 2 Ng
ni 2Mi i 2 Nni 2Mi i 2 Ncini = 0
Ãini(y1¤; :::; yN¤)
17
Demonst ração do Teorema
● Como
então:
provando que é um ponto fixo de .
¹yini =yini + c
ini
1 +P
j2Micij; cini = 0; ni 2Mi; i 2 N
T (y1¤; :::; yN¤) = (y1¤; :::; yN¤)
T
fyi¤ 2 Y i; i 2 Ng
18
Demonst ração do Teorema
● Sentido inverso:
Suponha que é um ponto fixo de , mas não é um equilíbrio de Nash. Então, para algum (por exemplo, ), existe um tal que:
Agora seja o índice onde a quantidade
fyi¤ 2 Y i; i 2 NgT
i 2 N i = 1
~y1 2 Y 1
X
M1
:::X
MN
y1n1y2n2 :::y
NnN a
1n1;:::;nN >
X
M1
:::X
MN
~y1n1y2n2 :::y
NnNa
1n1;:::;nN
(1)
~n1
19
Demonst ração do Teorema
alcança seu menor valor sobre .● Como é uma estratégia mista, o lado
direito da equação (1) pode ser limitado por baixo por (2) com :
~y1
(2)X
M2
:::X
MN
y2n2 :::yNnNa
1n1;:::;nN
ni 2Mi
n1 = ~n1X
M1
:::X
MN
y1n1y2n2 :::y
NnN a
1n1;:::;nN >
X
M1
:::X
MN
~y1n1y2n2 :::y
NnNa
1n1;:::;nN
>X
M2
:::X
MN
y2n2 :::yNnNa
1~n1;:::;nN
X
M1
:::X
MN
y1n1y2n2:::yNnN a
1n1;:::;nN
>X
M2
:::X
MN
y2n2 :::yNnNa1~n1;:::;nN
Voltar ao Slide 21
20
Demonst ração do Teorema
é equivalente a:
E mais:
X
M1
:::X
MN
y1n1y2n2 :::y
NnN a
1n1;:::;nN >
X
M2
:::X
MN
y2n2 :::yNnNa
1~n1;:::;nN
definição de Psi
c1~n1 > 0
cini ¸ 0) c1n1 ¸ 0definição de c
)PM1c1n1 > 0
Voltar ao Slide 22
Ã1~ni(y1; y2; :::; yN) > 0
21
Demonst ração do Teorema
● Agora seja o índice onde a quantidade (2) alcança o seu valor máximo.
● Então, podemos limitar superiormente o lado esquerdo de (1) pelo valor (2) quando :
n̂1
n1 = n̂1
X
M1
:::X
MN
y1n1y2n2 :::y
NnN a
1n1;:::;nN >
X
M1
:::X
MN
~y1n1y2n2 :::y
NnNa
1n1;:::;nN
X
M2
:::X
MN
y2n2 :::yNnNa
1n̂1;:::;nN >
X
M2
:::X
MN
y2n2 :::yNnNa
1n̂1;:::;nN >
X
M1
:::X
MN
y1n1y2n2 :::y
NnNa
1n1;:::;nN
22
Demonst ração do Teorema
é equivalente a:
E mais: )PM1c1n1 > 0
X
M2
:::X
MN
y2n2 :::yNnNa1n̂1;:::;nN >
X
M1
:::X
MN
y1n1y2n2:::yNnNa
1n1;:::;nN
c1n̂1 = 0
Resultado obtido em 20 CONTRADIÇÃO!
Ã1n̂i(y1; y2; :::; yN) < 0
¹y1n̂1 =y1n̂1 + c
1n̂1
1 +P
j2M1c1j
¹y1n̂1 < y1n̂1
23
Refe rênc ias
● T. Basar and G. J. Olsder● Fixed-Point Theorems
http://cepa.newschool.edu/het/essays/math/fixedpoint.htm
● Nash Equilibrium http://www.scs.carleton.ca/~maheshwa/MAW/MAW/node7.html
● Brouwer fixed point theorem http://en.wikipedia.org/wiki/Brouwer_fixed_point_theorem
● Mahalanobis http://mahalanobis.twoday.net/stories/308405/
Recommended