Prof. Frederico Brito Fernandes [email protected] Agentes Inteligentes

Prof. Frederico Brito [email protected]

AgentesAgentesInteligentesInteligentesAgentesAgentes

InteligentesInteligentes

Professor: Frederico Brito FernandesProfessor: Frederico Brito Fernandes 2/38Disciplina: Inteligência ArtificialDisciplina: Inteligência Artificial

• Agentes

(1) Definição


(1) Definição: algumas definições

• IBM: Intelligent agents are software entities that carry out some set of operations on behalf of an user, and in doing so employ some knowledge representation of the user’s goals or desires

• KidSim: Agent is a persistent software entity (agents have their own ideas about how to accomplish tasks) dedicated to a specific purpose (smaller than multifunctions applications)

• SodaBot: Software agents are programs that engage in dialogs to negotiate and coordinate transfer of information


(1) Definição: o que é um agente?• Agente é qualquer entidade que:

– percebe seu ambiente através de sensores (ex. câmeras, microfone, teclado, finger, ...)

– age sobre ele através de efetuadores (ex. vídeo, auto-falante, impressora, braços, ftp, ...)

• Mapeamento: seqüência perceptiva => ação

Ambient

e

Agente

Sensores

?

Atuadores

Percepções

Ações

RaciocinadorRaciocinador


(1) Definição: agente humano

Ambiente

Percepções

Ações

Atuadores

Sensores


Ambiente

Agente raciocínio

Conhecimento:- leis- comportamento

dos indivíduos,...

Objetivo:- fazer com que as leis sejam respeitadas

Ações:- multar- apitar- parar, ...

execuçãopercepção

(1) Definição: agente policial

}-{


(1) Definição: terminologia

• Percepção: entradas perceptivas do agente em qualquer momento

• Seqüência de percepções: história completa de tudo o que o agente já percebeu

• A escolha de uma ação de um agente em qualquer instante pode depender da seqüência inteira de percepção até o momento

• Uma função agente é o mapeamento de toda seqüência possível de percepções para uma ação– Tabela muito grande. Na verdade infinita.


(1) Definição: mundo do aspirador de pó

• Percepção: local e conteúdo, por exemplo, [A, sujo]

• Ações: Direita, Esquerda, Sugar, NoOp

Seqüência de Percepções Ação[A, limpo] Direita[A, sujo] Aspirar[B, limpo] Esquerda[B, sujo] Aspirar[A, limpo] [A, limpo] Direita[A, limpo] [A, sujo] Aspirar...[A, limpo] [A, limpo] [A, limpo] Direita[A, limpo] [A, limpo] [A, sujo] Aspirar...

Tabela Parcial de umaTabela Parcial de umafunção agentefunção agente


• Autonomia (IA)– raciocínio, comportamento guiado por objetivos

– reatividade

• Adaptabilidade & aprendizagem (IA)

• Comunicação & Cooperação (IA)

• Personalidade (IA)

• Continuidade temporal

• Mobilidade

(1) Definição: propriedades de agentes


(1) Definição: aprendizagem• O agente pode ter algum conhecimento anterior

• Ele também pode ganhar experiência e modificar e ampliar este conhecimento

• Se o ambiente é previamente conhecido:

– O agente não precisa aprender ou perceber

– Somente agir de forma correta

– Mas este tipo de agente se torna muito frágil

– Ex: aspirador de pó começando a limpar no final de um corredor de vento


(1) Definição: autonomia

• Autonomia sem racionalidade = burrice

– Ex. do agente que atravessa a rua sem olhar – não racional

• A ação correta seria olhar porque maximiza o desempenho

• Coleta de informações:

– A realização de ações com a finalidade de modificar percepções futuras é uma parte importante da racionalidade

– Ex: relógio que acerta as horas automaticamente quando o dono viaja para diferentes fusos horários


(1) Definição: autonomia funcional

• Não possui aprendizagem

• O agente sempre tem conhecimento “embutido” especificado pelo projetista, que lhe é inato e permite iniciar seu funcionamento. Assim como os animais...

• Se, além deste conhecimento, o agente consegue aprender por experiência e alterar seu comportamento, ele pode ter autonomia funcional, ou seja, fugir do funcionamento que lhe foi imposto pela “natureza”

• Agentes não autônomos só funcionam se as premissas do seu projeto não mudarem

– Exemplo.: programa tradicional, qualquer alteração nas condições do contexto implica numa alteração do conhecimento colocado no projeto do sistema.


(1) Definição: autonomia adaptativa

• Adapta-se por meio de aprendizagem

– Exemplo: agente de reconhecimento de fala, tem um conjunto pré-definido de padrões, mas pode aprender o sotaque de um novo usuário.

• Um agente inteligente verdadeiramente autônomo deveria ser capaz de operar com sucesso em um grande variedade de ambientes, dado um tempo suficiente para se adaptar.


(2) Agente Racional: (McCarthy & Hayes 69, Newell 81)

• Agente Racional: fazer a melhor coisa possível– segue o princípio da racionalidade: dada uma seqüência

perceptiva, o agente escolhe, segundo seus conhecimentos, as ações que satisfazem melhor seu objetivo.

• Racionalidade x Onisciência são diferentes!

– Onisciência poder saber os resultados de suas ações antecipadamente e com precisão

– Impossível de se atingir onisciência na realidade

– Racionalidade diferente de perfeição


• Racionalidade Onisciência, limitações de:– sensores

– efetuadores

– raciocinador (conhecimento, tempo, etc.)

– Agir para obter mais dados perceptivos é racional

• Exemplo:

– Ao atravessar uma rua deve-se observar se não vem carro nas duas direções, então posso atravessar. Mas...

• Não podemos condenar um agente que falha por não levar em conta algo que ele não pode perceber ou por uma ação que ele não é capaz de tomar

(2) Agente Racional: porém...


(2) Agente Racional: Fatores• 4 fatores do que é racional:

– A medida de desempenho• Critério que define o grau de sucesso de um agente na realização de uma dada

tarefa

– Exs. MD1: quantidade de lixo retiradas X horas de trabalho

MD2: quantidade de lixo retiradas X horas de trabalho descontadas a energia gasta e o nível de ruído produzido

– Esta medida deve ser imposta do exterior

– Má escolha da MD pode acarretar comportamento indesejado

– Compromissos entre objetivos múltiplos conflitantes

– Resta o problema de saber quando avaliar o desempenho

– O conhecimento anterior do ambiente

– As ações que o agente pode executar

– A seqüência de percepções até o momento


• Uma agente racional para o mundo do aspirador de pó:

– MD: 1 pt para cada quadrado limpo em uma unidade de tempo

– Conhece a “geografia” do ambiente, mas não sabe onde tem sujeira e nem a posição inicial.

• Quadrados limpos permanecem limpos e aspirar limpa o quadrado atual

• As ações Esquerda e Direita movem o agente nesta direções; exceto quando isto leva o agente para fora do ambiente (fica parado)

– Ações disponíveis: Esquerda, Direita, Apirar, NoOP (não faz nada)

– O agente percebe: a sua posição e se nessa posição existe sujeira

(2) Agente Racional: Exemplo


• 1º Passo:– Especificar o ambiente de tarefa de forma tão completa quanto possível– Ambientes de tarefas:

• Medida de desempenho• Ambiente • Atuadores• Sensores

• 2º Passo:– Especificar a arquitetura e o método de resolução do problema

• Agente tabela• Agente reativo• Agente reativo com estado interno (autômato) • Agente cognitivo (baseado em objetivos)• Agente otimizador (baseado em utilidade)• Agente adaptativo

(3) Modelagem usando agentes: Passos


(3) Modelagem usando agentes: Táxi• Agente Motorista de Táxi

– Desempenho– chegar no lugar certo– minimizar o consumo de combustível e desgaste– minimizar o tempo de percurso, custo da viagem– minimizar as infrações de leis de trânsito– minimizar os distúrbios aos outros motoristas– maximizar a segurança e conforto do passageiro– Obs.: alguns destes objetivos são conflitantes...

– Ambiente– estradas locais ou freeways, tipo de tráfego, neve, Inglaterra, Brasil, ...– o ambiente irá determinar a dificuldade da implementação

– Atuadores– Frear, acelerar, virar, falar com o passageiro, se comunicar com outros motoristas

– Sensores– Sensores de velocidade, aceleração, estado (mecânico) do veículo– GPS (Golbal Positioning System) para saber onde esta num mapa– Sensores infra-vermelhos para detectar a distância dos outros carros– Microfone ou teclado para o passageiro informar o destino


(3) Modelagem usando agentes: Exemplos

• Outros exemplos:Agente Dados

perceptivosAções Objetivos Ambiente

Diagnósticomédico

Sintomas,paciente, exames

respostas, ...

Perguntar,prescrever exames,

testar

Saúde do paciente,minimizar custos

Paciente,gabinete, ...

Análise deimagens de

satélite

Pixels imprimir umacategorização

categorizarcorretamente

Imagens desatélite

Tutorial deportuguês

Palavrasdigitadas

Imprimir exercícios,sugestões,

correções, ...

Melhorar odesempenho do

estudante

Conjunto deestudantes

Filtrador demails

mensagens Aceitar ou rejeitarmensagens

Aliviar a carga deleitura do usuário

Mensagens,usuários

Motorista detaxi

Imagens,velocímetro,

sons

brecar, acelerar,dobrar, falar com

passageiro, ...

Segurança,rapidez, economia,

conforto,...

Ruas, pedestres,carros, ...

Músico de jazz Sons seus e deoutros músicos,

grades deacordes

Escolher e tocarnotas no andamento

Tocar bem, sedivertir, agradar

Musicos,publico, grades

de acordes


• Classes de ambientes– Físico: robôs

– Software: softbots

– Realidade virtual (simulação do ambiente físico): softbots e avatares

• Propriedades de um ambiente– acessível x inacessível

– estático x dinâmico

– determinista x não-determinista

– discreto x contínuo

– episódico x não-episódico

– tamanho: número de percepções, ações, objetivos,...

(3.a) Ambientes


(3.a) Ambientes: Propriedades

• Acessível x Parcialmente Acessível: – quando os sensores do agente conseguem perceber o estado

completo do ambiente.

• Determinístico x Estocástico: – o próximo estado do ambiente pode ser completamente

determinado pelo estado atual e as ações selecionadas pelo agente.

• Episódico x Seqüencial: – a experiência do agente é dividida em episódios. Cada episódio

consiste em o agente perceber e então agir. Cada episódio não depende das ações que ocorreram em episódios prévios.


(3.a) Ambientes: Propriedades

• Estático x Dinâmico: – o ambiente não muda enquanto o agente está escolhendo a ação a

realizar. – Semi-estático: o ambiente não muda enquanto o agente delibera,

mas o "score" do agente muda.

• Discreto x Contínuo: – quando existe um número distinto e claramente definido de

percepções e ações em cada turno.

• Agente Único X Múltiplos Agentes– Palavras cruzadas – agente único– Xadrez – agentes múltiplos -> ambiente competitivo– Dirigir táxi – agentes múltiplos ->ambiente cooperativo– Comunicação é necessário em multi-agentes


(3.a) Ambientes: Exemplos

SIMAgente único

SIMDiscreto

SIMEstático

NÃOEpisódico

SIMDeterminístico

SIMAcessível

Direção de Táxi

Diagnótico médico

Xadrez com tempo

Palavras Cruzadas

• Complete o quadro abaixo


(3.a) Ambientes: Exemplos

NÃOSIMNÃOSIMAgente único

NÃONÃOSIMSIMDiscreto

NÃONÃOSEMISIMEstático

NÃONÃONÃONÃOEpisódico

NÃONÃOSIMSIMDeterminístico

NÃONÃOSIMSIMAcessível

Direção de Táxi

Diagnótico médico

Xadrez com tempo

Palavras Cruzadas


• função agenteSimples (percept) retorna açãomemória := atualizaMemória (memória, percept)

ação := escolheMelhorAção(memória)

memória := atualizaMemória (memória, ação)

retorna ação

• Arquiteturas– Agente tabela– Agente reativo– Agente reativo com estado interno (autômato) – Agente cognitivo (baseado em objetivos)– Agente otimizador– Agente adaptativo autonomia

complexidade

(3.b) Arquiteturas


ambiente

sensores

efetuadores

Tabelapercepções ações

. .

. .

Agente

• Dada uma percepção, procurar na tabela a ação correspondente

• Limitações– Mesmo Problemas simples -> tabelas muito grandes

• ex. xadrez 30100

– Nem sempre é possível, por ignorância ou questão de tempo, construir a tabela

– Não há autonomia nem flexibilidade

• Ambientes– acessível, determinista, episódico, estático, discreto e minúsculo!

(3.b) Arquiteturas: agente tabela


(3.b) Arquiteturas: agente tabela

• Ex: Agente aspirador de póTabelaTabela

Percepção Ação

[A,limpo] Direita

[A,sujo] Aspirar

[B,limpo] Esquerda

[B,sujo] Aspirar

ProblemaProblema::Construir a tabela é muitoConstruir a tabela é muitotrabalhoso!trabalhoso!

Função AGENTE-ASPIRADOR-TABELA ([posição, estado]): ação { ação = procura(Tabela, [posição,estado] retorna ação

}


• A decisão do agente só depende da percepção atual

• Agente motorista de táxi:– Usa regras de condição ação

• se carro_da_frente_estiver_freando então inicie_a_freagem

(3.b) Arquiteturas: agente reativo

sensores

efetuadores

Como está o mundo agora?

Que ação devo escolher agora? Regras “condição-ação”

a m

b i

e n

t e


• Vantagens e desvantagens– Regras condição-ação: representação inteligível, modular e eficiente

• ex. Se velocidade > 60 então multar– Não pode armazenar uma seqüência perceptiva, pouca autonomia

• Ambientes:– Reflexo imprescindível em ambientes dinâmicos – Acessível, episódico, pequeno

• Ex: Agente aspirador de pó:Função AGENTE-ASPIRADOR-REATIVO ([posição, estado]): ação {

se estado = sujo então retorna aspirarse posição = A então retorna direitasenão se posição = B

então retorna esquerda

}

(3.b) Arquiteturas: agente reativo

ProblemaProblema::Mesmo estando a sala limpa,Mesmo estando a sala limpa,quando o aspirador irá parar?quando o aspirador irá parar?


• O estado atual é dado em função do estado anterior (histórico) e do que foi percebido no ambiente.

• O agente tem um estado interno com as informações coletadas do ambiente.

(3.b) Arquiteturas: agente reativo(com estado interno)

sensores Agente


Regras “condição-ação”

estado: como o mundo era antes

como o mundo evolui

efetuadores

Que devo fazer agora?a m

b i

e n

t e

impacto de minhas ações


• Desvantagem: pouca autonomia– não tem objetivo, não encadeia regras

• Ambientes: determinista e pequeno. Ex. Tamagotchi

• Agente aspirador de pó:

Função AGENTE-ASPIRADOR-REATIVO ([posição, estado]): ação

{EstadoAnterior = [posição_anterior,estado_anterior]

se estado = sujo então retorna aspirar

se (posição = A e posição_anterior B)

então retorna direita

se (posição = B e posição_anterior A)

então retorna esquerda

retorna noop

}

(3.b) Arquiteturas: agente reativo(com estado interno)

ProblemasProblemas::(1) E para uma sala com mais de(1) E para uma sala com mais deduas posições?duas posições?(2) (2) Táxi chega a um cruzamento com três caminhos, e agora?

-> simplesmente reagir não dá, existem três reações possíveis e saber do passado do ambiente também não ajuda a decidir qual o caminho


• O agente precisa de algum tipo de informação sobre o seu objetivo– Objetivos descrevem situações desejáveis. Ex: estar no destino

• Combinando informações sobre:– O objetivo do agente

– Os resultados de suas ações

• O agente pode escolher ações que alcancem o objetivo

• A seleção da ação baseada em objetivo pode ser:– Direta: quando o resultado de uma única ação atinge o objetivo

– Mais complexa: quando será necessário longas seqüências de ações para atingir o objetivo

(3.b) Arquiteturas: agente cognitivo(baseado em objetivo)


• Para encontrar seqüências de ações que alcançam os objetivos– algoritmos de Busca e Planejamento

• A tomada de decisão envolve a consideração do futuro– “o que acontecerá se eu fizer isso ou aquilo?”

– “o quanto isso melhorará o meu desempenho?”

• Exemplos:– Objetivo: não bater no carro da frente

• se o carro da frente pára, pela forma de funcionamento do mundo, a única ação que atinge o objetivo de não bater é também parar.



sensores Agente


Objetivos

como o mundo evolui

efetuadores

Que devo fazer agora?

a m

b i

e n

t e

impacto de minhas açõesComo ele ficará se faço isto?


• Vantagens e desvantagens:– Mais complicado e ineficiente, porém mais flexível, autônomo– Não trata objetivos conflitantes

• Ambientes: determinista – ex.: xeque-mate no xadrez



• Se um estado do mundo é mais desejável que outro, então ele terá maior utilidade para o agente.

• Utilidade é uma função que mapeia um estado para um número real que representa o grau de satisfação com este estado.

• Nos casos onde existem objetivos conflitantes (velocidade x segurança) a utilidade pode determinar o peso adequado a cada objetivo.

• Qualquer agente racional deve se comportar como se possuísse uma função de utilidade cujo o valor esperado ele tenta maximizar.

(3.b) Arquiteturas: agente otimizador(baseado em utilidade)


• Ambiente: sem restrição• Desvantagem: não tem adaptabilidade

ambiente

sensores

efetuadores

Agente


Que ação devo escolher agora?Função de Utilidade

qual é o impacto de minhas ações

como o mundo evolui

Este novo mundo é melhor?

Como ele ficará se faço isto?


(3.b) Arquiteturas: agente otimizador(baseado em utilidade)


sensores

efetuadores

Agente

Gerador de problemas

crítico

elemento de aprendizagem

avaliação

objetivos de aprendizagem

elemento de execução (agente)

trocas

conhecimento

a m

b i

e n

t e

• Ambiente: sem restrição• Vantagem: tem adaptabilidade (aprende)• Ex. motorista sem o mapa da cidade

t

t+1

t

(3.b) Arquiteturas: agente que aprende

Documents

Prof. Frederico Brito Fernandes [email protected] Agentes Inteligentes