Upload
marco-sacramento-farias
View
218
Download
0
Embed Size (px)
Citation preview
1
Agentes que Negociam... Negociação... O que é? Utilidades... E Estratégias Equilíbrio de Nash Negociando Recursos
Leilões Negociando mais...
Protocolos Cenas dos Próximos Capítulos
2
Algumas Observações Importantes
““Não há SMA de um só agente...”Não há SMA de um só agente...” Diferentes agentes tem diferentes
influências no ambiente... Lembram da figurinha?
Agentes estão conectados por relações (muitas vezes de dependência), e têm objetivos próprios.
3
Recordando...Interação Objetivos Recursos Habilidade
sIndependência Compatíveis Suficientes SuficientesColab. Simples Compatíveis Suficientes InsuficientesColab. Coordenada
Compatíveis Insuficientes Insuficientes
Obstrução Compatíveis Insuficientes SuficientesCompet. Indiv. Incompatíveis Suficientes SuficientesCompet. Coletiva
Incompatíveis Suficientes Insuficientes
Conflito Recursos
Incompatíveis Insuficientes Suficientes
Conflito Coletivo Incompatíveis Insuficientes Insuficientes
4
E quando não é bem assim?
Conflitos...“When two people in business always agree, onde of them is
unnecessary” Willian Wrigley Jr.“If two or more parties are doing something together, there is
a high potential for Conflict” Muller & Dieng 2000 Duas abordagens na pesquisa em SMA
Centrada na Representação Agentes cognitivos/deliberativos
Centrada na Resolução Divisão de tarefas Alocação de Recursos Resolução de Conflitos
Rosenschein & Zlotkin
5
As primeiras definições... Galliers (1989)(B-CONFLICT x y p) = (B-CONF-I x y p) (B-
Confl-M x y p), onde(B-CONF-I x y p) = (Bel x p) (Bel x (Bel y
p)) (PR-GOAL x (Bel y p) q)(B-Confl-M x y p) = (BMB x y ((Bel x p) (Bel y p))) ((PR-GOAL x (Bel y p) q) (PR-GOAL y (Bel x p) q))
6
Voltando ao tema... O problema da negociação...
De Tarefas De recursos
7
Negociando... De acordo com o Aurélio...
Negociar significa manter relações para concluir tratados ou convênios
Para SMA... Negociação é uma forma de interação
entre agentes self-interested. Em outras palavras, é o processo de conseguir um acordo para cooperação entre agentes buscando seus objetivos pessoais.
8
Negociamos ... Para Determinar
A distribuição das Tarefas A distribuição dos Recursos A coordenação das atividades
Entre Dois Agentes Entre múltiplos agentes
Formação de coligações
9
O Processo deve Ser Eficiente
Em geral, os agentes ficam “mais felizes” depois da negociação
Estável Racionalidade Individual
Deve ser preferível atuar em grupo Racionalidade de grupo
É melhor participar deste grupo do que de outro Racionalidade de coligação
Ninguém quer sair da coligação
10
O Processo deve Ser... II Distribuído
Um coordenador central pode ser um gargalo de desempenho
Simétrico Atributos irrelevantes não devem
influenciar na decisão Rápido Simples
11
Como possibilitar? Precisamos definir...
A linguagem utilizada pelos participantes
Como cada um decide suas posições? Os Protocolos seguidos pelos agentes.
12
Duas Abordagens principais
Baseada em Teoria dos Jogos Análise das Situações Determina precisamente uma estratégia Hipóteses Restritas
Baseada em Guias Teorias Informais Não há hipóteses restritivas
Alguns Conceitos Básicos
14
Representando Preferências
Função de Utilidade i e j são dois agentes = {1, 2,...,n}
x é um estado do mundo. As preferências dos agentes são
capturadas pela função de utilidade.i : j :
15
Por exemplo... Imagine que eu seja um agente querendo ir
prá casa. 1 = chego em casa em 20min 2 = pego a caxangá e chego em 1 hora...
Em qual dos casos eu fico mais feliz? Definimos uma função de utilidade i (1 ) = 10 i (2 ) = 1
16
Encontros... Suponha que agentes i e j (capazes de
duas ações C ou D) têm a seguinte função:
i(D,D) = 1 i(D,C) = 1 i(C,D) = 4 i(C,C) = 4
j(D,D) = 1 j(D,C) = 4 j(C,D) = 1 j(C,C) = 4Onde : C = colaborar D = desistirO que você faria no lugar de i?
17
Matriz de Recompensa ij
D C
D 44
14
C 41
11
18
Um outro exemplo... Um avião está indo para Índia quando é
seqüestrado e pousa no Paquistão. Os seqües-tradores querem liberar 800 prisioneiros das prisões indianas. (A = acordo, E = Explodir, R = Resgate)
i(A,A) = 2 i(A,E) = -2 i(R,A) =0 i(R,E )= -3 s(E,A) = -1 s(E,R) = 0 s(A,A) =2 s(E,R)= 0
O que você faria no lugar do governo indiano?
19
Uma forma de Decidir Estratégias Dominantes
Uma estratégia 1 domina 2 para o agente i se todo o elemento de 1 é preferido a todos os elementos de 2.
1 domina fortemente 2 se 1 1 , 2 2 , 1 >i 2
20
Estratégias Dominantes..II Nem sempre teremos estratégias
fortemente dominantes! As vezes precisamos ter estratégias fracamente dominantes.
Uma estratégia 1 domina fracamente 2 todo o elemento de 1 é tão preferido quanto os elementos de 2. 1 1 , 2 2 , 1 i 2
21
Equilíbrio de Nash Duas estratégias estão em EN se:
Considerando que agente i executa S1 agente j não pode fazer melhor que executar S2.
Considerando que o agente j vai executar S2 i não pode fazer melhor que S1
No equilíbrio, os agentes não têm incentivo de se desviar... O problema é que nem todas as situações tem EN. E algumas situações têm mais de um EN.
22
Pensando mais um pouco...
Interações estritamente Competitivas... Quando temos dois agentes i e j, onde um i
prefere um estado 1 sss j prefere 2. 1 i 2 se e somente se 2 j 1
Interações de soma Zero. Quando a i (1) + j (1) = 0 Ex. um jogo de xadrez
Vamos ver um exemplo?
23
Um Problema Famoso... O dilema do Prisioneiro
Dois homens são acusados de um crime e mantidos incomunicáveis. Se um confessar e outro não – um vai ser livre e o outro preso por 3 anos
Se ambos confessarem ambos serão presos por dois anos
Se nenhum confessar ambos serão presos por um ano.
24
Recompensas... ij
confessa Cala
confessa 22
05
Cala 50
33
25
Decidindo o que fazer... Se eu calar, a maior recompensa é
zero Se eu confessar, o a maior
recompensa é dois... Então... É melhor confessar! O dilema do prisioneiro também
pode ser jogado interativamente...
26
Algumas Estratégias... All-D
Sempre confessa Randômico
O nome já explica... Tit-for-Tat
Cala no primeiro round No round t faça o que seu oponente
fez no round t-1
27
Mais estratégias... Tester: explorador de programas que
não castigavam deserção. Confessa na primera rodada. Se o oponente não retaliasse, jogava Tit-for-tat, senão, calava por dois rounds e desertava no terceiro.
Joss-Tit-for-tat, porém confessava 10% das vezes em que deveria calar...
28
Voltando para a questão... Alguns Conceitos básicos de Negociação
Conjunto de Negociação Conjunto das propostas que valem a pena fazer
Protocolo Define que propostas são as legais
Coleção de Estratégias Normalmente a estratégia dos agentes é privada
Regra de Acordo
29
Mas... E quando computar utilidades for
muito caro? Negociar envolve planejamento... E um modelo do oponente!
Vários aspectos sob negociação... O que se quer obter?
30
Agora... E esse babado de concordar?
Quando o problema é alocar recursos... Leilões
Se precisamos coordenar tarefas, decidir o que e quando fazer... Coordenação Argumentação
31
Um parêntese... Negociação
Ato de Discutir com o objetivo de atingir um consenso.
ArgumentaçãoApresentar argumentos contra ou a favor
de algo, com o intuito de convencer alguém de nossa própria opinião.
32
Voltando... Consensos dependem da capacidade
de negociação e argumentação dos agentes envolvidos...
Negociação governada por protocolos...
Como desenvolver estratégias para os agentes utilizarem enquanto negociam?
33
Parâmetros no design de Protocolos...
Sucesso Garantido... Em algum momento! Maximização do Bem-Estar Social
Maximiza a soma das utilidades dos participantes Pareto-Efficiência
Não há nenhum outro resultado que vá tornar um agente melhor de vida sem prejudicar os outros.
Individualmente Racional Jogar limpo é o melhor a fazer
Estabilidade Simplicidade e Distribuição
34
Alocando Recursos... Os Leilões
Forma de Negociação cada vez mais comum... Por ser um cenário de interação simples!
Duas classes de Agentes: Leiloeiro Compradores
Alguns fatores alteram o protocolo... Valor público? Ou privado? Valor Correlato
35
Dimensões dos Protocolos Determinação do Vencedor
First x Second Price Lances
Open-Cry Sealed Bid
Mecanismo Utilizado One Shot Crescente Descendente
36
Leilões Ingleses (English Auctions)
Características Open Cry First Price Ascendente
Que estratégia utilizar? Aumentar o lance em pequenos
incrementos, e depois se retirar Maldição do Vencedor
37
Leilões Holandeses (Dutch) Características
Open Cry Descending
Não Há estratégias dominantes Também sujeitos à Maldição do
Vencedor.
38
Outros First Price Sealed Bid
One Shot Agente deve oferecer um pouco menos do
que o valor estimado... Mas quanto menos?
Vickrey Second Price Sealed Bid Oferecer o valor real da mercadoria. Pode gerar comportamento anti-social ...
39
Lucro esperado Com compradores risk-neutral
Os 4 tipos geram lucros parecidos Com compradores avessos ao risco
Dutch e First Price Sealed são os melhores
Para Leiloeiros Avessos ao Risco English e Vickrey
40
Mentiras e Conluios Nada impede que os compradores se
juntem... Uma solução...
Impedir os compradores de se identificarem... Mas o leiloeiro também pode ser desonesto!
Shills Troca de valores
Contra-especulação...
41
Fim da Parte I... Vimos...
O conceito de estratégias A idéia de Negociação Leilões
Veremos. Negociação em outros domínios Argumentação
42
Negociando... Para situações mais complexas, leilões
não bastam... Qualquer negociação tem 4
componentes: Conjunto de negociação Um protocolo Uma coleção de estratégias Uma regra que determina quando o
consenso foi atingido
Alocando Tarefas...
44
Um Protocolo Famoso... A Contract net A1 reconhece que tem um problema A1 anuncia que precisa de um serviço
Pode envolver um broadcast geral... Um limitado... Ou um contato direto.
Ai,...,Aj respondem, oferecendo seus préstimos.
A1 contrata o serviço, via award. Quando o contratado termina, envia um
relatório ao contratante.
45
Quando recebemos as mensagens... Processando um anúncio...
Agente decide se é candidato... Guarda os detalhes da tarefa, para
poder competir por elas... Processando a oferta
Gerentes guardam as ofertas até o deadline. Depois a tarefa é alocada a um competidor.
46
Quando recebemos as mensagens... Processando o Award
Ganhador começa os procedimentos para executar a tarefa.
Requerimentos e Informação O conteúdo que chega é adicionado à
base de conhecimento do agente.
47
No entanto... A Contract Net assume um ambiente
cooperativo... O que nem sempre ocorre!
Um problema de alocação tem... Um conjunto de agentes Um conjunto de tarefas Uma função de custo Uma alocação inicial
48
Alocando Tarefas Um contratante passa a tarefa a frente se o
que ele tem que pagar é menos que o custo de fazê-la sozinho
Um contratado aceita uma tarefa se a recompensa é maior que o custo de fazê-la.
Vários tipos de contratos possíveisAtomicos
ClusterParesMulti-Contratos
49
Alocação de Tarefas... E mentiras Agentes podem exagerar os custos
da tarefa... Mas exageros podem tornar
contratos não Individual-Racional Agentes podem
Esconder tarefas Criar tarefas fantasmas Gerar tarefas sob demanda
50
Complicando... Quantas questões estão sendo discutidas?
Comprar um carro x Pechinchar no preço da cerveja
Quem está envolvido? Um prá um Muitos prá um Muitos prá muitos
Podemos ter até n(n-1)/2 threads de negociação
51
Dois tipos fundamentais de domínio
Orientados a Tarefas (DOT) Representados por uma tupla <T,Ag,C>
T é o conjunto de todas as tarefas Ag = {1,..,n} é o conjunto de participantes C é a função de custo para cada
subconjunto de tarefas. A função de custos é monotônica O custo de fazer nada é zero
52
Acordos... (Deals) Um acordo é uma alocação de tarefas. A utilidade do acordo é a diferença
entre o custo das tarefas que o agente faria inicialmente (Ti) e as tarefas que lhe foram atribuídas. Utilityi() n= c(Ti) –c(i) Se os agentes não chegarem a um acordo
temos o conflict deal. Cd = <Ti, Tj>
53
Mais sobre acordos Um acordo 1 domina 2 se
1 é tão bom quanto 2 para todos os agentes. 1 é melhor que 2 para algum agente.
1 domina fracamente 2 se a primeira condição se verifica.
Um acordo que não é dominado por nenhum outro é chamado de pareto-optimal. Assim, está na hora de parar de negociar!!!
é individual racional se domina fracamente o acordo de conflito. Caso contrário, há pelo menos um agente que se sairia melhor com o acordo de conflito.
54
Esquematicamente
Utilidade do Cd para j
Utilidade do Cd para i
Cd
Acordos do conjunto de negociação
55
Assim... O conjunto de possibilidades a
colocar em negociação consiste nos conjuntos de acordos que são Individual racional Pareto ótimo
56
Um protocolo... Protocolo de Concessão Monotônico
Negociação acontece em Turnos. No primeiro, ambos os agentes propõem
acordos no conjunto de negociação Um acorde é alcançado se
Utility1 (2 ) utility1(1) ou Utility2 (1 ) utility2(2) No caso das duas propostas serem equivalentes,
uma é escolhida randomicamente.
57
Mais sobre o Protocolo de Concessão Monotônico
Sem consenso, a negociação continua. A cada round, os agentes são proibidos de propor algo pior que no round anterior
Negociação termina com o conflict deal.
Protocolo verificável Termina... Mas não se sabe quando!
58
Como proceder... Propor o melhor deal... Para o
agente Quem deve ceder?
Depende da “vontade” de um agente arriscar conflito.
Maior a vontade se a diferença entre a proposta e o conflict deal for baixa.
59
Definindo Risco
Riskit= utilidade perdida aceitando a
oferta/ utilidade perdida causando conflito
1 se utility (jt) = 0
Riskit= utility (i
t) - utility (jt) /
utility (it)
60
Quanto ceder? O menos necessário para mudar o balanço
de risco. Se o risco de ambos for o mesmo... Deve-se jogar uma moeda.
Protocolo exponencial! Equilíbrio de Nash Agentes podem enrolar... Criando tarefas
fantasmas... Ou escondendo tarefas! Exemplo da condução escolar
61
Domínios Orientados a Valor
Um DOV é uma tupla <E, Ag, J, C> onde E é o conjunto de estados do ambientes Ag é o conjunto de Agentes participantes do
processo J é a coleção de planos conjuntos C : JxAg R é o custo de realização para cada
agente. Um encontro é o par <e,W>
E é o estado inicial W: Ex Ag
62
Domínios Orientados a Valor Os objetivos do Agente são
especificados por uma função de valor do domínio.
Como chegar lá? Coordenando esforços, Construindo planos
63
Argumentação Problemas com os TJs
Não se pode justificar escolhas Não se pode mudar de posição
Deu origem... Negociação baseada em
Argumentação
64
Argumentação Teoria dos Jogos tem suas desvantagens... Alguns outros tipos de argumentação...
Lógica Gera argumentos dedutivos
Emocional Você gostaria que fizessem isto com você?
Visceral Envolve o físico – por exemplo, quando alguém
gesticula para dar ênfase a um ponto Kisceral
Envolve apelos para o místico!
65
Argumentação Baseada em Lógica
Base |- (sentença, Justificativas) Base é um conjunto de sentenças
acordadas pelos agentes. Argumentos podem ser contra ou a favor
uma determinada proposição. Dois tipos básicos de argumento
Não trivial – derivado de um conjunto consistente de justificativas
Tautológico – se o conjunto de justificativas é vazio
66
Duas formas de Derrubar um Argumento
Negando o argumento... Supondo que se tenha dois argumentos
(1, 1) e (2,2) - 1rebate 2 se 1 2 contesta o Justificativa do Argumento
Supondo que se tenha dois argumentos (1, 1) e (2,2) e 1 e 2
67
Um exemplo...Humano(Heracles)Pai(Heracles, Zeus)Pai(Apolo, Zeus)Divino(X) mortal(X)Humano(X) mortal(X)Pai(X, Zeus) divino(X)(Pai(X, Zeus) divino(X))
68
Continuando...Podemos construir ARg1
(mortal(Heracles), {humano(Heracles), humano(X) mortal(X)})
(mortal(Heracles), {pai(Heracles,Zeus), Pai(X, Zeus) divino(X) Divino(X) mortal(X)})
((Pai(X, Zeus) divino(X)) {(Pai(X, Zeus) divino(X))}
69
Várias Classes de Argumento... Por ordem de aceitação
Todos os argumentos a partir da base Todos os argumentos não triviais Todos que não podem ser rebatidos Todos cujas justificativas não podem
ser contestadas Todos os tautológicos.
70
Diálogos para Argumentação
Um diálogo pode ser visto como uma série de contribuições – argumentos
Cada contribuição... Um movimento Um diálogo é uma sequencia de turnos Cada turno apresenta um argumento diferente Argumento corrente derruba o anterior Diálogo termina quando não é mais possível
argumentar.
71
Argumentação e Diálogo Argumentação é um jogo... Vários tipos
identificados Persuasão – conflito de opiniões Negociação – conflito de interesses Inquisição – crescimento do conhecimento geral Deliberação – tomada de decisão Perguntas – crescimento do conhecimento pessoal Conflitos Misto
72
Primeiro sistema de Argumentação... Persuader
Domínio de Negociações Trabalhistas Três agentes: trabalhadores,
sindicato e mediador Agentes modelados via suas crenças Agente tenta identificar o objetivo do
outro, e derrubar o mesmo
73
Alguns Exemplos de Modelos de Argumentação... Kraus, Sycara e Evenchik
Agentes tentam convencer os outros de que seus objetivos são interessantes...
Negociação começa com uma solicitação de serviço
Em caso de rejeição... Um argumento é gerado
Flag de Colisão Fator de Convencimento Valor de Aceitação
74
Cenas dos Próximos Capítulos Nesta Parte vimos...
Formas de expressar as preferências dos agentes...
Conceito de estratégias Algumas formas de negociação...
Domínios Orientados a Tarefa Domínios Orientados a Valor Argumentação