29
APRENDIZAGEM E RECOMPENSA Dr. Flávio Freitas Barbosa

Aprendizagem e Recompensa

Embed Size (px)

Citation preview

Page 1: Aprendizagem e Recompensa

APRENDIZAGEM E RECOMPENSA

Dr. Flávio Freitas Barbosa

Page 2: Aprendizagem e Recompensa
Page 3: Aprendizagem e Recompensa

Aprendizagem

“mudança relativamente duradoura de comportamento resultante da experiência”.

Page 4: Aprendizagem e Recompensa

Behaviorismo

J.B. Watson

Estudo da mente:

Não-científico

Apenas ambiente

E-R

Skinner

Page 5: Aprendizagem e Recompensa

Condicionamento Clássico

Page 6: Aprendizagem e Recompensa

Condicionamento Clássico

EI RI

EN + EI

EC RC

Page 7: Aprendizagem e Recompensa

Condicionamento clássico: aversivo ao som

Page 8: Aprendizagem e Recompensa

Contigüidade

Extinção

Recuperação espontânea

Generalização do estímulo

Condicionamento Clássico

Page 9: Aprendizagem e Recompensa

Condicionamento de segunda ordem

EC1 EC2 RC

Page 10: Aprendizagem e Recompensa

Mais do que contigüidade

Significado evolutivo

Prontidão biológica (fobias)

Perspectiva cognitiva

Predição e expectativa

Modelo de Rescorla-Wagner

Page 11: Aprendizagem e Recompensa

Condicionamento operante

“é o processo de aprendizagem em que as conseqüências de uma ação determinam a

probabilidade de ela ser realizada no futuro”

Page 12: Aprendizagem e Recompensa

Condicionamento operante

E. Thorndike

Lei do efeito

Page 13: Aprendizagem e Recompensa

Associação entre um comportamento e sua

conseqüência REFORÇO

Ação + reforço positivo

Aumenta a freqüência da ação que gera o reforço

PUNIÇÃO a ação deixa de ser realizada

Ação + reforço negativo

Aumenta a freqüência da ação que evita o reforço

CONDICIONAMENTO OPERANTE

Page 14: Aprendizagem e Recompensa

Condicionamento operante

Page 15: Aprendizagem e Recompensa

Modelagem

Reforçar sucessivas aproximações

Reforços primários

Comida, água

Reforços secundários

Dinheiro, nota 10 (condic. Clássico)

Condicionamento operante

Page 16: Aprendizagem e Recompensa

Limitações biológicas Predisposições inatas

Distinção aquisição-desempenho

Aprendizagem sem reforço

Mapas cognitivos (E. Tolman)

insight

Condicionamento operante

Page 17: Aprendizagem e Recompensa

Mapas cognitivos

Figure 6: Error curves for HR, HNR, HNR-R.

Page 18: Aprendizagem e Recompensa

Aprendizagem por observação

Aprendizagem por imitação

Modelação

Reforço vicário

Neurônios-espelho

Page 19: Aprendizagem e Recompensa

Aprendizagem por observação

Page 20: Aprendizagem e Recompensa

Aprendizagem por observação

Page 21: Aprendizagem e Recompensa

Qual é a base biológica da recompensa?

Page 22: Aprendizagem e Recompensa

Condicionamento Operante

Comportamento Espontâneo

Recompensa

Aumento

Page 23: Aprendizagem e Recompensa

Estimulação elétrica cerebral

Page 24: Aprendizagem e Recompensa

Auto-administração de drogas de abuso

Page 25: Aprendizagem e Recompensa

Vias Dopaminérgicas

Page 26: Aprendizagem e Recompensa

Teoria de D. Hebb (1949)

“When an axon of cell A is near enough to excite cell B and

repeatedly or persistently takes part in firing it, some growth

process or metabolic change takes place in one or both cells such

that A's efficiency, as one of the cells firing B, is increased.”

Page 27: Aprendizagem e Recompensa

Ativação

Reverberação

Plasticidade

“traço”

Page 28: Aprendizagem e Recompensa

dica

evocação

Page 29: Aprendizagem e Recompensa

Teoria de D. Hebb (1949)

Reverberação no circuito

Plasticidade sináptica

Redes neurais distribuídas