15
CRI Minas Indústria 4.0 Case Vallourec: Golden Batch na produção de tubos 02 05 2018

CRI Minas Indústria 4 · Definição e Pesquisa S o l u ç ã o • Aprendizagem supervisionada • Dados desbalanceados • Ensemble learning Chandola, Banerjee and Kumar, 2009

Embed Size (px)

Citation preview

CRI Minas

Indústria 4.0Case Vallourec: Golden Batch na produção de tubos

0 2 0 5 2 0 1 8

2

Case Vallourec

G o l d e n B a t c hA n a l y s i s

Líder mundial em soluções tubulares premium, aVallourec assegura a máxima qualidade de seusprodutos através de processos de ponta e rigorosossistemas de avaliação. Neste cenário, a utilização desoluções de machine learning vem como um caminhonatural na busca contínua da excelência na produção.

A G E N D A

Nossa abordagem

1. Histórico

1.1 Fundadores

1.2 Trajetória

1.3 Cases

2. Case Vallourec

2.1 Golden Batch analysis

2.2 Especificação do problema

3. Solução

3.1 Definição e pesquisa

3.2 Desenvolvimento

4. Resultados

4.1 Resumo

4.2 Simulador

Sócios Fundadores

H i s t ó r i c o

4

Felipe Álvares

[email protected]

. Chief Data Scientist

. MatemáticoComputacional

. Mestre e Doutor emEstatística (UFMG))

Milton Pifano

[email protected]

. Senior Data Scientist

. Cientista da Computação

. Mestre e Doutorandoem Estatística (UFMG))

Acreditamos que a educação é o melhor caminho para a inovação.

Trajetória

H i s t ó r i c o

5Sempre de olho no futuro

1998Microsoft

2008 2014 2017 2018

Especialização Mestrado LwD

hence

2012ImageNet Competition

Deep Learning

2016Doutorado

Cases

H i s t ó r i c o

• Estrutuação e limpeza dos dados

• Modelos dinâmicos para previsão de vendas de sementes híbridas de arroz

• Aplicativo Web interativocom segmentação de previsão por região de interese

6Soluções assertivas e personalizadas. De um jeito fácil e descomplicado.

• Incorporação de IA no desenvolvimento de softwares para varejo

• Sistema de recomendaçãode produtos

• Sistema de previsão de vendas

Statistical Learning Otimização Não-Linear Machine Learning Machine Learning

• Golden Batch Analysis• Aplicativo Web interativo

para identificação de fatoresde influência na geração de peças imperfeitas

• Recomendação de configurações ótimas para minimização de erros

• Alocação ótima de recursos de mídia

• Aplicativo Web interativopara a simulação e otimização de cenáriosvariados

Golden Batch

Analysis

C a s e V a l l o u r e c

A ocorrência de defeitos é um fenômeno observado em qualquer linha de produção.

Podem ocorrer por uma combinação imensa de fatores, inviabilizando a identificação por monitoramentos ‘’tradicionais‘’.

Golden Batch

Analysis

C a s e V a l l o u r e c

A ocorrência de defeitos é um fenômeno observado em qualquer linha de produção.

Podem ocorrer por uma combinação imensa de fatores, inviabilizando a identificação por monitoramentos ‘’tradicionais‘’.

E se pudermos sair do tradicional?

Especificação do

problema

C a s e V a l l o u r e c

• Dados de entrada compostos por variáves comotipos de material, níveis de desgaste e parâmetrosde calibragem

• Linha de produção já eficiente faz com que a identificação de defeitos seja um processo de detecção de anomalias

Input

Produção

Classificação

Especificação do

problema

C a s e V a l l o u r e c

• Dados de entrada compostos por variáves comotipos de material, níveis de desgaste e parâmetrosde calibragem

• Linha de produção já eficiente faz com que a identificação de defeitos seja um processo de detecção de anomalias

• Inteligência artificial como instrumento para a identificação de padrões complexos e influentes nageração de defeitos

Input

Produção

Classificação

Classification /

Prediction /

Recommendation

Data Wrangling

Feature

selection

Input

Produção

Classificação

Definição e

Pesquisa

S o l u ç ã o

• Aprendizagem supervisionada• Dados desbalanceados• Ensemble learning

Chandola, Banerjee and Kumar, 2009. Anomaly detection: A survey. ACM computing surveys (CSUR), 41(3), p.15.

Sun, Wong and Kamel, 2009. Classification of imbalanced data: A review. Internation Journal of Pattern Recognition and Artificial Intelligence, 23(04), pp. 687-719.

Menardi and Torelli, 2014. Training and assessing classification rules with imbalanced data. Data Mining and Knowledge Discovery, 28(1), pp.92-122.

Chen and Guestrin, 2016. Xgboost: A scalable tree boosting system. In Proceedings of the 22nd acm international conference on knowledge discovery and data mining, pp. 785-794.

Khoshgoftaar, Golawala and Hulse, 2007. An empirical study of learning from imbalanced data using random forests. In 19th IEEE international conference on tools with artificial intelligence, 2, pp. 310-317.

12

Desenvolvimento

S o l u ç ã o

• 31 variáveis de entrada• 4 tipos de erro considerados• Seleção de métricas adequadas para o tratamento

do desbalanceamento• Seleção de modelos• Estratégia de penalização x Balanceamento artificial• Seleção de atributos mais relevantes• Engenharia de atributos

Resultados

S o l u ç ã o

• O modelo demonstrou ótima capacidade de separação nos cenários de teste

• No pior caso, o modelo teria previstoantecipadamente 66,67% da produção defeituosa

• No melhor caso, este percentual teria sido de 83,60%

Pior caso

Sensitividade (recall) 0.6666

Precisão 0.8182

Acurácia (IC 95%) (0.9869, 0.9959)

Melhor caso

Sensitividade (recall) 0.836

Precisão 0.8214

Acurácia (IC 95%) (0.8815, 0.911)

Simulador

S o l u ç ã o

• Aplicativo Web interativo para identificação de fatores de influência na geração de peças imperfeitas