14
Ciência de Dados Aplicada Aula 9: Overfitting

Aula 9: Overfittingw3.impa.br/~vitorgr/CDA/notebooks/Aula9.pdfAula 9: Overfitting Representação de características Amostras (X) Valor-alvo (y) Conjunto de treinamento e testes Treinamento

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Ciência de Dados Aplicada

Aula 9: Overfitting

Representação de características

Amostras (X)

Valor-alvo (y)

Conjunto de treinamento e testes

Treinamento é o processode estimar os parâmetros

do modelo

Avaliação

Revisão de termos importantes

Classificação

- Valor-alvo é discreto

- Tipos de problemas

Binária

Multi-Classe

Multi-Label

Regressão

- Valor-alvo é contínuo

- Geralmente osAlgoritmos de classificação possuem variações paracada tipo de problema

Classificação Multi-Label

Generalização, Overfitting e Underfitting

Quantidade de dados utilizados para treinar o algoritmo

É o problema principal quando estamos utilizando algoritmosde aprendizado de máquina

Tendência global dos dados de treinamento

Overfitting na RegressãoV

ariá

vel v

alor

-alv

o

Variável de entrada

Var

iáve

l val

or-a

lvo

Variável de entrada

Underfitting

Modelo IdealV

ariá

vel v

alor

-alv

o

Variável de entrada

OverfittingV

ariá

vel v

alor

-alv

o

Variável de entrada

Overfitting na ClassificaçãoC

arac

terí

stic

a 1

Característica 2

UnderfittingC

arac

terí

stic

a 1

Característica 2

Modelo IdealC

arac

terí

stic

a 1

Característica 2

OverfittingC

arac

terí

stic

a 1

Característica 2

OverfittingC

arac

terí

stic

a 1

Característica 2