Aprendizagem e Recompensa

Preview:

Citation preview

APRENDIZAGEM E RECOMPENSA

Dr. Flávio Freitas Barbosa

Aprendizagem

“mudança relativamente duradoura de comportamento resultante da experiência”.

Behaviorismo

J.B. Watson

Estudo da mente:

Não-científico

Apenas ambiente

E-R

Skinner

Condicionamento Clássico

Condicionamento Clássico

EI RI

EN + EI

EC RC

Condicionamento clássico: aversivo ao som

Contigüidade

Extinção

Recuperação espontânea

Generalização do estímulo

Condicionamento Clássico

Condicionamento de segunda ordem

EC1 EC2 RC

Mais do que contigüidade

Significado evolutivo

Prontidão biológica (fobias)

Perspectiva cognitiva

Predição e expectativa

Modelo de Rescorla-Wagner

Condicionamento operante

“é o processo de aprendizagem em que as conseqüências de uma ação determinam a

probabilidade de ela ser realizada no futuro”

Condicionamento operante

E. Thorndike

Lei do efeito

Associação entre um comportamento e sua

conseqüência REFORÇO

Ação + reforço positivo

Aumenta a freqüência da ação que gera o reforço

PUNIÇÃO a ação deixa de ser realizada

Ação + reforço negativo

Aumenta a freqüência da ação que evita o reforço

CONDICIONAMENTO OPERANTE

Condicionamento operante

Modelagem

Reforçar sucessivas aproximações

Reforços primários

Comida, água

Reforços secundários

Dinheiro, nota 10 (condic. Clássico)

Condicionamento operante

Limitações biológicas Predisposições inatas

Distinção aquisição-desempenho

Aprendizagem sem reforço

Mapas cognitivos (E. Tolman)

insight

Condicionamento operante

Mapas cognitivos

Figure 6: Error curves for HR, HNR, HNR-R.

Aprendizagem por observação

Aprendizagem por imitação

Modelação

Reforço vicário

Neurônios-espelho

Aprendizagem por observação

Aprendizagem por observação

Qual é a base biológica da recompensa?

Condicionamento Operante

Comportamento Espontâneo

Recompensa

Aumento

Estimulação elétrica cerebral

Auto-administração de drogas de abuso

Vias Dopaminérgicas

Teoria de D. Hebb (1949)

“When an axon of cell A is near enough to excite cell B and

repeatedly or persistently takes part in firing it, some growth

process or metabolic change takes place in one or both cells such

that A's efficiency, as one of the cells firing B, is increased.”

Ativação

Reverberação

Plasticidade

“traço”

dica

evocação

Teoria de D. Hebb (1949)

Reverberação no circuito

Plasticidade sináptica

Redes neurais distribuídas

Recommended