14
AULA 2: APRESENTAÇÃO DA SUÍTE PENTAHO Prof. Esp. Tiago A. Silva RIBEIRÃO PRETO 2017 SISTEMAS DE APOIO À DECISÃO

AULA 2: APRESENTAÇÃO DA SUÍTE PENTAHO...componentes estão ligados (hop) corretamente. 11 20 21 12 Tudo verde? CONSIDERAÇÕES FINAIS No ambiente do Pentaho Data Integration nós

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

  • AULA 2: APRESENTAÇÃO DA SUÍTE PENTAHO

    Prof. Esp. Tiago A. Silva

    RIBEIRÃO PRETO 2017

    SISTEMAS DE APOIO À DECISÃO

  • PLANO DE AULA

    EXPOSITIVA E PRÁTICA (90 mim):

    TRANSFORMAÇÃO DE DADOS:

    XML para Microsoft Excel

    2 www.tiago.blog.br

    OBJETIVO: Aprender a configurar as transformações ETL com PDI (Pentaho Data Integration)

  • PRÁTICA • INSTALAÇÃO DAS “DEPENDÊNCIAS” DO PENTAHO:

    – JDK/JRE

    – MySQL

    – Conector MySQL JDBC

    • INSTALAÇÃO PDI – PENTAHO DATA INTEGRATION

    – Por que?

    • Atividades de ETL: Extraction, Transform, Load.

    • Primeiro passo para construir um Data Warehouse: juntar os dados.

    3 www.tiago.blog.br

  • COMEÇANDO

    Executar o Spoon

    Deu erro?

    • Memória RAM é suficiente?

    • Editar arquivo .bat ou .sh

    • Alterar variáveis: xms e xmx

    • Reduzir o valor, tente 512.

    4 www.tiago.blog.br

    Windows: *.bat Outros: *.sh

  • 5 www.tiago.blog.br

    O começo de tudo: Transformações

    1

    2

  • 6 www.tiago.blog.br

    Expressão regular para obter todos os

    arquivos XML de um diretório: .*xml

    3

    4

    5

    6

    7

    8

    Selecionando a entrada de dados: INPUT

  • 7 www.tiago.blog.br

    9

    10

    11

  • 8 www.tiago.blog.br

    12

    DICA: Para testar, troque todos os tipos para

    String!

    13

    14

  • 9 www.tiago.blog.br

    15

    16

  • 10

    Selecionando a saída de dados

    17

    18

    19

    www.tiago.blog.br

    ATENÇÃO: Antes de realizar essa etapa verifique se os

    componentes estão ligados (hop) corretamente.

  • 11 www.tiago.blog.br

    20

    21

  • 12

    Tudo verde?

    www.tiago.blog.br

  • CONSIDERAÇÕES FINAIS No ambiente do Pentaho Data Integration nós sempre vimos o

    esquema de entrada e saída de dados.

    É importante que você selecione o tipo adequado para cada tipo de campo, na dúvida e para testar use apenas string.

    DICA: veja a direção do hop quando for fazer a ligação, sempre da entrada de dados para a saída, exemplo XML -> Excel

    13 www.tiago.blog.br

  • OBRIGADO!

    [email protected] www.tiago.blog.br

    “Eu tinha chegado tão longe e me recusei a desistir porque em toda a minha vida eu sempre terminei a corrida.”

    ― Louis Zamperini