1 Agentes que Negociam... Negociação... O que é? Utilidades... E Estratégias Equilíbrio de Nash...

Preview:

Citation preview

1

Agentes que Negociam... Negociação... O que é? Utilidades... E Estratégias Equilíbrio de Nash Negociando Recursos

Leilões Negociando mais...

Protocolos Cenas dos Próximos Capítulos

2

Algumas Observações Importantes

““Não há SMA de um só agente...”Não há SMA de um só agente...” Diferentes agentes tem diferentes

influências no ambiente... Lembram da figurinha?

Agentes estão conectados por relações (muitas vezes de dependência), e têm objetivos próprios.

3

Recordando...Interação Objetivos Recursos Habilidade

sIndependência Compatíveis Suficientes SuficientesColab. Simples Compatíveis Suficientes InsuficientesColab. Coordenada

Compatíveis Insuficientes Insuficientes

Obstrução Compatíveis Insuficientes SuficientesCompet. Indiv. Incompatíveis Suficientes SuficientesCompet. Coletiva

Incompatíveis Suficientes Insuficientes

Conflito Recursos

Incompatíveis Insuficientes Suficientes

Conflito Coletivo Incompatíveis Insuficientes Insuficientes

4

E quando não é bem assim?

Conflitos...“When two people in business always agree, onde of them is

unnecessary” Willian Wrigley Jr.“If two or more parties are doing something together, there is

a high potential for Conflict” Muller & Dieng 2000 Duas abordagens na pesquisa em SMA

Centrada na Representação Agentes cognitivos/deliberativos

Centrada na Resolução Divisão de tarefas Alocação de Recursos Resolução de Conflitos

Rosenschein & Zlotkin

5

As primeiras definições... Galliers (1989)(B-CONFLICT x y p) = (B-CONF-I x y p) (B-

Confl-M x y p), onde(B-CONF-I x y p) = (Bel x p) (Bel x (Bel y

p)) (PR-GOAL x (Bel y p) q)(B-Confl-M x y p) = (BMB x y ((Bel x p) (Bel y p))) ((PR-GOAL x (Bel y p) q) (PR-GOAL y (Bel x p) q))

6

Voltando ao tema... O problema da negociação...

De Tarefas De recursos

7

Negociando... De acordo com o Aurélio...

Negociar significa manter relações para concluir tratados ou convênios

Para SMA... Negociação é uma forma de interação

entre agentes self-interested. Em outras palavras, é o processo de conseguir um acordo para cooperação entre agentes buscando seus objetivos pessoais.

8

Negociamos ... Para Determinar

A distribuição das Tarefas A distribuição dos Recursos A coordenação das atividades

Entre Dois Agentes Entre múltiplos agentes

Formação de coligações

9

O Processo deve Ser Eficiente

Em geral, os agentes ficam “mais felizes” depois da negociação

Estável Racionalidade Individual

Deve ser preferível atuar em grupo Racionalidade de grupo

É melhor participar deste grupo do que de outro Racionalidade de coligação

Ninguém quer sair da coligação

10

O Processo deve Ser... II Distribuído

Um coordenador central pode ser um gargalo de desempenho

Simétrico Atributos irrelevantes não devem

influenciar na decisão Rápido Simples

11

Como possibilitar? Precisamos definir...

A linguagem utilizada pelos participantes

Como cada um decide suas posições? Os Protocolos seguidos pelos agentes.

12

Duas Abordagens principais

Baseada em Teoria dos Jogos Análise das Situações Determina precisamente uma estratégia Hipóteses Restritas

Baseada em Guias Teorias Informais Não há hipóteses restritivas

Alguns Conceitos Básicos

14

Representando Preferências

Função de Utilidade i e j são dois agentes = {1, 2,...,n}

x é um estado do mundo. As preferências dos agentes são

capturadas pela função de utilidade.i : j :

15

Por exemplo... Imagine que eu seja um agente querendo ir

prá casa. 1 = chego em casa em 20min 2 = pego a caxangá e chego em 1 hora...

Em qual dos casos eu fico mais feliz? Definimos uma função de utilidade i (1 ) = 10 i (2 ) = 1

16

Encontros... Suponha que agentes i e j (capazes de

duas ações C ou D) têm a seguinte função:

i(D,D) = 1 i(D,C) = 1 i(C,D) = 4 i(C,C) = 4

j(D,D) = 1 j(D,C) = 4 j(C,D) = 1 j(C,C) = 4Onde : C = colaborar D = desistirO que você faria no lugar de i?

17

Matriz de Recompensa ij

D C

D 44

14

C 41

11

18

Um outro exemplo... Um avião está indo para Índia quando é

seqüestrado e pousa no Paquistão. Os seqües-tradores querem liberar 800 prisioneiros das prisões indianas. (A = acordo, E = Explodir, R = Resgate)

i(A,A) = 2 i(A,E) = -2 i(R,A) =0 i(R,E )= -3 s(E,A) = -1 s(E,R) = 0 s(A,A) =2 s(E,R)= 0

O que você faria no lugar do governo indiano?

19

Uma forma de Decidir Estratégias Dominantes

Uma estratégia 1 domina 2 para o agente i se todo o elemento de 1 é preferido a todos os elementos de 2.

1 domina fortemente 2 se 1 1 , 2 2 , 1 >i 2

20

Estratégias Dominantes..II Nem sempre teremos estratégias

fortemente dominantes! As vezes precisamos ter estratégias fracamente dominantes.

Uma estratégia 1 domina fracamente 2 todo o elemento de 1 é tão preferido quanto os elementos de 2. 1 1 , 2 2 , 1 i 2

21

Equilíbrio de Nash Duas estratégias estão em EN se:

Considerando que agente i executa S1 agente j não pode fazer melhor que executar S2.

Considerando que o agente j vai executar S2 i não pode fazer melhor que S1

No equilíbrio, os agentes não têm incentivo de se desviar... O problema é que nem todas as situações tem EN. E algumas situações têm mais de um EN.

22

Pensando mais um pouco...

Interações estritamente Competitivas... Quando temos dois agentes i e j, onde um i

prefere um estado 1 sss j prefere 2. 1 i 2 se e somente se 2 j 1

Interações de soma Zero. Quando a i (1) + j (1) = 0 Ex. um jogo de xadrez

Vamos ver um exemplo?

23

Um Problema Famoso... O dilema do Prisioneiro

Dois homens são acusados de um crime e mantidos incomunicáveis. Se um confessar e outro não – um vai ser livre e o outro preso por 3 anos

Se ambos confessarem ambos serão presos por dois anos

Se nenhum confessar ambos serão presos por um ano.

24

Recompensas... ij

confessa Cala

confessa 22

05

Cala 50

33

25

Decidindo o que fazer... Se eu calar, a maior recompensa é

zero Se eu confessar, o a maior

recompensa é dois... Então... É melhor confessar! O dilema do prisioneiro também

pode ser jogado interativamente...

26

Algumas Estratégias... All-D

Sempre confessa Randômico

O nome já explica... Tit-for-Tat

Cala no primeiro round No round t faça o que seu oponente

fez no round t-1

27

Mais estratégias... Tester: explorador de programas que

não castigavam deserção. Confessa na primera rodada. Se o oponente não retaliasse, jogava Tit-for-tat, senão, calava por dois rounds e desertava no terceiro.

Joss-Tit-for-tat, porém confessava 10% das vezes em que deveria calar...

28

Voltando para a questão... Alguns Conceitos básicos de Negociação

Conjunto de Negociação Conjunto das propostas que valem a pena fazer

Protocolo Define que propostas são as legais

Coleção de Estratégias Normalmente a estratégia dos agentes é privada

Regra de Acordo

29

Mas... E quando computar utilidades for

muito caro? Negociar envolve planejamento... E um modelo do oponente!

Vários aspectos sob negociação... O que se quer obter?

30

Agora... E esse babado de concordar?

Quando o problema é alocar recursos... Leilões

Se precisamos coordenar tarefas, decidir o que e quando fazer... Coordenação Argumentação

31

Um parêntese... Negociação

Ato de Discutir com o objetivo de atingir um consenso.

ArgumentaçãoApresentar argumentos contra ou a favor

de algo, com o intuito de convencer alguém de nossa própria opinião.

32

Voltando... Consensos dependem da capacidade

de negociação e argumentação dos agentes envolvidos...

Negociação governada por protocolos...

Como desenvolver estratégias para os agentes utilizarem enquanto negociam?

33

Parâmetros no design de Protocolos...

Sucesso Garantido... Em algum momento! Maximização do Bem-Estar Social

Maximiza a soma das utilidades dos participantes Pareto-Efficiência

Não há nenhum outro resultado que vá tornar um agente melhor de vida sem prejudicar os outros.

Individualmente Racional Jogar limpo é o melhor a fazer

Estabilidade Simplicidade e Distribuição

34

Alocando Recursos... Os Leilões

Forma de Negociação cada vez mais comum... Por ser um cenário de interação simples!

Duas classes de Agentes: Leiloeiro Compradores

Alguns fatores alteram o protocolo... Valor público? Ou privado? Valor Correlato

35

Dimensões dos Protocolos Determinação do Vencedor

First x Second Price Lances

Open-Cry Sealed Bid

Mecanismo Utilizado One Shot Crescente Descendente

36

Leilões Ingleses (English Auctions)

Características Open Cry First Price Ascendente

Que estratégia utilizar? Aumentar o lance em pequenos

incrementos, e depois se retirar Maldição do Vencedor

37

Leilões Holandeses (Dutch) Características

Open Cry Descending

Não Há estratégias dominantes Também sujeitos à Maldição do

Vencedor.

38

Outros First Price Sealed Bid

One Shot Agente deve oferecer um pouco menos do

que o valor estimado... Mas quanto menos?

Vickrey Second Price Sealed Bid Oferecer o valor real da mercadoria. Pode gerar comportamento anti-social ...

39

Lucro esperado Com compradores risk-neutral

Os 4 tipos geram lucros parecidos Com compradores avessos ao risco

Dutch e First Price Sealed são os melhores

Para Leiloeiros Avessos ao Risco English e Vickrey

40

Mentiras e Conluios Nada impede que os compradores se

juntem... Uma solução...

Impedir os compradores de se identificarem... Mas o leiloeiro também pode ser desonesto!

Shills Troca de valores

Contra-especulação...

41

Fim da Parte I... Vimos...

O conceito de estratégias A idéia de Negociação Leilões

Veremos. Negociação em outros domínios Argumentação

42

Negociando... Para situações mais complexas, leilões

não bastam... Qualquer negociação tem 4

componentes: Conjunto de negociação Um protocolo Uma coleção de estratégias Uma regra que determina quando o

consenso foi atingido

Alocando Tarefas...

44

Um Protocolo Famoso... A Contract net A1 reconhece que tem um problema A1 anuncia que precisa de um serviço

Pode envolver um broadcast geral... Um limitado... Ou um contato direto.

Ai,...,Aj respondem, oferecendo seus préstimos.

A1 contrata o serviço, via award. Quando o contratado termina, envia um

relatório ao contratante.

45

Quando recebemos as mensagens... Processando um anúncio...

Agente decide se é candidato... Guarda os detalhes da tarefa, para

poder competir por elas... Processando a oferta

Gerentes guardam as ofertas até o deadline. Depois a tarefa é alocada a um competidor.

46

Quando recebemos as mensagens... Processando o Award

Ganhador começa os procedimentos para executar a tarefa.

Requerimentos e Informação O conteúdo que chega é adicionado à

base de conhecimento do agente.

47

No entanto... A Contract Net assume um ambiente

cooperativo... O que nem sempre ocorre!

Um problema de alocação tem... Um conjunto de agentes Um conjunto de tarefas Uma função de custo Uma alocação inicial

48

Alocando Tarefas Um contratante passa a tarefa a frente se o

que ele tem que pagar é menos que o custo de fazê-la sozinho

Um contratado aceita uma tarefa se a recompensa é maior que o custo de fazê-la.

Vários tipos de contratos possíveisAtomicos

ClusterParesMulti-Contratos

49

Alocação de Tarefas... E mentiras Agentes podem exagerar os custos

da tarefa... Mas exageros podem tornar

contratos não Individual-Racional Agentes podem

Esconder tarefas Criar tarefas fantasmas Gerar tarefas sob demanda

50

Complicando... Quantas questões estão sendo discutidas?

Comprar um carro x Pechinchar no preço da cerveja

Quem está envolvido? Um prá um Muitos prá um Muitos prá muitos

Podemos ter até n(n-1)/2 threads de negociação

51

Dois tipos fundamentais de domínio

Orientados a Tarefas (DOT) Representados por uma tupla <T,Ag,C>

T é o conjunto de todas as tarefas Ag = {1,..,n} é o conjunto de participantes C é a função de custo para cada

subconjunto de tarefas. A função de custos é monotônica O custo de fazer nada é zero

52

Acordos... (Deals) Um acordo é uma alocação de tarefas. A utilidade do acordo é a diferença

entre o custo das tarefas que o agente faria inicialmente (Ti) e as tarefas que lhe foram atribuídas. Utilityi() n= c(Ti) –c(i) Se os agentes não chegarem a um acordo

temos o conflict deal. Cd = <Ti, Tj>

53

Mais sobre acordos Um acordo 1 domina 2 se

1 é tão bom quanto 2 para todos os agentes. 1 é melhor que 2 para algum agente.

1 domina fracamente 2 se a primeira condição se verifica.

Um acordo que não é dominado por nenhum outro é chamado de pareto-optimal. Assim, está na hora de parar de negociar!!!

é individual racional se domina fracamente o acordo de conflito. Caso contrário, há pelo menos um agente que se sairia melhor com o acordo de conflito.

54

Esquematicamente

Utilidade do Cd para j

Utilidade do Cd para i

Cd

Acordos do conjunto de negociação

55

Assim... O conjunto de possibilidades a

colocar em negociação consiste nos conjuntos de acordos que são Individual racional Pareto ótimo

56

Um protocolo... Protocolo de Concessão Monotônico

Negociação acontece em Turnos. No primeiro, ambos os agentes propõem

acordos no conjunto de negociação Um acorde é alcançado se

Utility1 (2 ) utility1(1) ou Utility2 (1 ) utility2(2) No caso das duas propostas serem equivalentes,

uma é escolhida randomicamente.

57

Mais sobre o Protocolo de Concessão Monotônico

Sem consenso, a negociação continua. A cada round, os agentes são proibidos de propor algo pior que no round anterior

Negociação termina com o conflict deal.

Protocolo verificável Termina... Mas não se sabe quando!

58

Como proceder... Propor o melhor deal... Para o

agente Quem deve ceder?

Depende da “vontade” de um agente arriscar conflito.

Maior a vontade se a diferença entre a proposta e o conflict deal for baixa.

59

Definindo Risco

Riskit= utilidade perdida aceitando a

oferta/ utilidade perdida causando conflito

1 se utility (jt) = 0

Riskit= utility (i

t) - utility (jt) /

utility (it)

60

Quanto ceder? O menos necessário para mudar o balanço

de risco. Se o risco de ambos for o mesmo... Deve-se jogar uma moeda.

Protocolo exponencial! Equilíbrio de Nash Agentes podem enrolar... Criando tarefas

fantasmas... Ou escondendo tarefas! Exemplo da condução escolar

61

Domínios Orientados a Valor

Um DOV é uma tupla <E, Ag, J, C> onde E é o conjunto de estados do ambientes Ag é o conjunto de Agentes participantes do

processo J é a coleção de planos conjuntos C : JxAg R é o custo de realização para cada

agente. Um encontro é o par <e,W>

E é o estado inicial W: Ex Ag

62

Domínios Orientados a Valor Os objetivos do Agente são

especificados por uma função de valor do domínio.

Como chegar lá? Coordenando esforços, Construindo planos

63

Argumentação Problemas com os TJs

Não se pode justificar escolhas Não se pode mudar de posição

Deu origem... Negociação baseada em

Argumentação

64

Argumentação Teoria dos Jogos tem suas desvantagens... Alguns outros tipos de argumentação...

Lógica Gera argumentos dedutivos

Emocional Você gostaria que fizessem isto com você?

Visceral Envolve o físico – por exemplo, quando alguém

gesticula para dar ênfase a um ponto Kisceral

Envolve apelos para o místico!

65

Argumentação Baseada em Lógica

Base |- (sentença, Justificativas) Base é um conjunto de sentenças

acordadas pelos agentes. Argumentos podem ser contra ou a favor

uma determinada proposição. Dois tipos básicos de argumento

Não trivial – derivado de um conjunto consistente de justificativas

Tautológico – se o conjunto de justificativas é vazio

66

Duas formas de Derrubar um Argumento

Negando o argumento... Supondo que se tenha dois argumentos

(1, 1) e (2,2) - 1rebate 2 se 1 2 contesta o Justificativa do Argumento

Supondo que se tenha dois argumentos (1, 1) e (2,2) e 1 e 2

67

Um exemplo...Humano(Heracles)Pai(Heracles, Zeus)Pai(Apolo, Zeus)Divino(X) mortal(X)Humano(X) mortal(X)Pai(X, Zeus) divino(X)(Pai(X, Zeus) divino(X))

68

Continuando...Podemos construir ARg1

(mortal(Heracles), {humano(Heracles), humano(X) mortal(X)})

(mortal(Heracles), {pai(Heracles,Zeus), Pai(X, Zeus) divino(X) Divino(X) mortal(X)})

((Pai(X, Zeus) divino(X)) {(Pai(X, Zeus) divino(X))}

69

Várias Classes de Argumento... Por ordem de aceitação

Todos os argumentos a partir da base Todos os argumentos não triviais Todos que não podem ser rebatidos Todos cujas justificativas não podem

ser contestadas Todos os tautológicos.

70

Diálogos para Argumentação

Um diálogo pode ser visto como uma série de contribuições – argumentos

Cada contribuição... Um movimento Um diálogo é uma sequencia de turnos Cada turno apresenta um argumento diferente Argumento corrente derruba o anterior Diálogo termina quando não é mais possível

argumentar.

71

Argumentação e Diálogo Argumentação é um jogo... Vários tipos

identificados Persuasão – conflito de opiniões Negociação – conflito de interesses Inquisição – crescimento do conhecimento geral Deliberação – tomada de decisão Perguntas – crescimento do conhecimento pessoal Conflitos Misto

72

Primeiro sistema de Argumentação... Persuader

Domínio de Negociações Trabalhistas Três agentes: trabalhadores,

sindicato e mediador Agentes modelados via suas crenças Agente tenta identificar o objetivo do

outro, e derrubar o mesmo

73

Alguns Exemplos de Modelos de Argumentação... Kraus, Sycara e Evenchik

Agentes tentam convencer os outros de que seus objetivos são interessantes...

Negociação começa com uma solicitação de serviço

Em caso de rejeição... Um argumento é gerado

Flag de Colisão Fator de Convencimento Valor de Aceitação

74

Cenas dos Próximos Capítulos Nesta Parte vimos...

Formas de expressar as preferências dos agentes...

Conceito de estratégias Algumas formas de negociação...

Domínios Orientados a Tarefa Domínios Orientados a Valor Argumentação

Recommended