36
De Excel ® Para KNIME ® Author: Kathrin Melcher

De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

De

Excel® Para

KNIME®

Author: Kathrin Melcher

Page 2: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

2

Page 3: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

3

Do Excel para o KNIME From Excel to KNIME

Todos os direitos reservados © 2020 KNIME publicação concedida à HupData Data Analysis Solutions Tradução: Tiago Silva Azevedo Revisão: Marina Soares de Souza Diagramação: Felipe Rodrigues

Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução, armazenamento em um sistema de recuperação ou transmissão proibida de qualquer forma ou por qualquer meio, eletrônico, mecânico, fotocópia, gravação ou similares. Este livro foi atualizado para o KNIME 3.6. Para obter informações sobre permissões e vendas, escreva para:

HupData Data Analysis Solutions KNIMEPress

Avenida Paulista, 2028, 11º andar Technoparkstr. 1 01310-200, São Paulo – SP 8005 Zurich Brasil Switzeland

[email protected] [email protected]

Page 4: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

4

Sumário Uso Geral ................................................................................................................................................................................................................................................................. 6

Planilhas Workflows e Nodes ............................................................................................................................... 7

Pastas Workspace .............................................................................................................................................. 8

O KNIME Workbench ...................................................................................................................................................................................................................................... 9

Exibição da Tabela de Dados ....................................................................................................................................................................................................................... 10

Entrada/Saída ........................................................................................................................................................................................................................................................ 11

Abrindo um Arquivo Excel Excel Reader Node ............................................................................................................................... 12

Abrindo um arquivo CSV File Reader Node ................................................................................................................................. 13

Importando Conteúdos de Vários Arquivos do mesmo Tipo para uma Tabela Única ..................................................................................................................... 14

Importando Conteúdo de Várias Planilhas para uma Única Tabela .................................................................................................................................................... 15

Conectando a um Banco de Dados Database Connector Nodes ....................................................................................................................... 16

Dicas sobre leitura de arquivos no KNIME .................................................................................................................................................................................................... 17

Anexando / Juntando Dados ................................................................................................................................................................................................................................. 18

Anexando Dados Concatenate Node .................................................................................................................................... 19

VLOOKUP Filter and Joiner Node ............................................................................................................................ 20

Filtragem e Transformações .................................................................................................................................................................................................................................. 21

Filtrando / Removendo Linhas com um Valor Específico Row Filter ..................................................................................................................................................... 22

Filtrando / Removendo Linhas com Valores Diferentes Rule-based Row Filter .................................................................................................................................. 23

Classificando Linhas por Múltiplas Colunas Chaves Sorter Node .................................................................................................................................................. 24

Removendo colunas Column Filter Node .................................................................................................................................. 25

Reordenando e renomeando colunas Column Resorter and Column Rename Node .......................................................................................... 26

Alterando tipos de dados String to Number, Number to String, Strings to Date&Time ................................................................ 27

Agregações ............................................................................................................................................................................................................................................................ 28

Tabelas Dinâmicas Pivoting Node .......................................................................................................................................... 29

Tabelas Dinâmicas sem Colunas GroupBy Node ........................................................................................................................................... 30

Page 5: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

5

Funções Matemáticas e Funções de Texto ........................................................................................................................................................................................................... 31

Funções Matemáticas Math Formula Node ................................................................................................................................. 32

Funções Matemáticas Math Formula Node ................................................................................................................................ 33

Concatenação e Localização/Substituição Node de String Manipulation .................................................................................................................... 34

Page 6: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

6

Uso Geral

Page 7: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

7

Planilhas Workflows e Nodes

Excel KNIME Analytics Platform

O Microsoft Excel é um programa de planilhas, que apresenta ferramentas como cálculos, gráficos, tabelas dinâmicas e uma linguagem macro de programação (Visual Basic for Applications, VBA).

Usando matemática celular, macros e VBAs, você pode editar uma planilha. Pode ser desde uma matemática celular bem simples, como somar os valores das células A1 e B1 (= SUM (A1, B1)), como também pode ser uma lógica incorporada mais complexa.

KNIME Analytics Platform implementa programação visual. Isso significa que cada etapa da análise de dados é representada por meio de um bloco chamado node (nó) em um editor gráfico.

Uma sequência de nodes conectados é chamada de workflow (fluxo de trabalho) sendo o conceito correspondente de uma planilha do Excel com muitas funções e/ou VBAs.

Os dados são organizados por meio de tabelas de dados, onde cada célula de dados é identificada por um cabeçalho de coluna e um ID de linha. Para visualizar o conteúdo de uma tabela de dados, consulte a página 10.

Nota. Os nodes têm quatro estados possíveis, exibidos por um pequeno semáforo sob o próprio node:

- Não configurado -> luz vermelha

- Configurado -> luz amarela - Executado com sucesso -> luz verde - Executado com erro -> luz vermelha com uma cruz

Para mais detalhes sobre a Plataforma KNIME Analytics, clique em:

- R. Silipo, “KNIME Beginner’s Luck”, KNIME Press, 2018 - R. Silipo, J. Prinz, “KNIME Advanced Luck”, KNIME Press, 2018

Page 8: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

8

Pastas Workspace

Excel KNIME Analytics Platform

Os arquivos do Excel normalmente são salvos em pastas diferentes. Um único

arquivo de Excel pode conter várias planilhas.

A aba workspace (área de trabalho) define a pasta em que todos os workflows e dados são salvos. Um workflow corresponde a uma planilha do Excel com todas as fórmulas, visualizações e VBAs. Todos os projetos e conjuntos de dados salvos em uma workspace estão disponíveis no KNIME Explorer, localizado no canto superior esquerdo do KNIME workbench (ambiente de trabalho). O caminho para a workspace é selecionado logo no início, após a inicialização da KNIME Analytics Platform.

Você ainda pode alterar o espaço de trabalho após o lançamento do KNIME, acessando “Arquivo” no menu superior e selecionando “Switch Workspace”. Você pode ter vários espaços de trabalho, por exemplo para diferentes projetos ou clientes.

Page 9: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

9

O KNIME Workbench

Inicie o KNIME Analytics Platform na área de trabalho ou na pasta de instalação. O ambiente de trabalho do KNIME aberto inclui: “Workflow Editor”, “KNIME Explorer”, “Workflow Coach”, “Node Repository”, “Node Description”, “Outline” e “Console”. “KNIME Explorer” mostra a lista de fluxos de trabalho disponíveis no momento e servidores KNIME para o espaço de trabalho selecionado. “Workflow Coach” recomenda o próximo node com base nas estatísticas dos usuários do KNIME. “Node Repository” contém todos os nodes disponíveis. Uma caixa “Search” está disponível na parte superior deste painel para a procura de nodes. “Workflow Editor” na parte central, permite a criação e edição de workflows. “Node Description” mostra descrição textual, a tarefa do node e as definições de configuração para o node selecionado no “Workflow Editor” ou no painel de “Node Repository” O painel “Outline” oferece uma visão geral do workflow e o painel “Console” mostra mensagens de execução. Os workflows do KNIME são criados arrastando e soltando os node do painel “Node Repository” ou “Workflow Coach” no “Workflow Editor”. Os node são conectados entre si através de suas portas de entrada e saída. Basta clicar na porta de saída do primeiro node e soltar na porta de entrada do segundo node. Os node recém-criados mostram um status de luz vermelha: ainda não configurado. Para configurar um node, clique com o botão direito do mouse no node e selecione a opção “Configure” ou, como alternativa, clique duas vezes no node. A janela "Configuração" do node é aberta. Configure o node. Se a configuração for bem-sucedida, o status do node mudará para um semáforo amarelo. O node está agora configurado, mas ainda não foi executado. Para executar o node, clique com o botão direito do mouse no node e selecione a opção “Execute”. Se a execução for bem-sucedida, o node altera seu status para uma luz verde.

KNIME Explorer Workflow Editor

Node Description

Workflow Coach

Outline

Node Repository Console

Page 10: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

10

Exibição da Tabela de Dados

Excel KNIME Analytics Platform

No Excel, o que você vê é o que recebe. Isso significa que a tabela de dados que você vê é a tabela de dados final.

As tabelas de dados de saída produzidas após a execução do node estão sempre disponíveis.

- Click com o botão direito do mouse no node do workflow - Selecione a última opção no menu aberto

Note. alguns node como o de plotting e modeling, também tem uma função de "View" mais complexa. A opção que leva a essa "View" geralmente é exibida no meio do menu.

Row ID

Data Type

Column Header

Page 11: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

11

Entrada/Saída

Page 12: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

12

Abrindo um Arquivo Excel Excel Reader Node Excel KNIME Analytics Platform

Para abrir um arquivo do Excel você pode clicar duas vezes no arquivo, ou abrindo o Excel e indo em "Arquivo" no menu superior, selecionando "Abrir ..." e depois navegando até o arquivo que deseja abrir.

O node “Excel Reader (XLS)” lê uma única planilha de um arquivo Excel. Como no Excel, primeiramente, você precisa definir o caminho do arquivo. Em seguida, você pode selecionar a planilha. As opções de configuração adicionais permitem definir se a tabela possui cabeçalhos de coluna e/ou IDs de linha, além de especificar qual parte da planilha você deseja ler. Use o botão “Refresh” para atualizar a visualização de dados.

Nota 1: Os possíveis formatos de leitura são: Integer, Double e String. Um arquivo deve ser lido como String e posteriormente convertido para o tipo Data e Hora com um node "String To Date&Time". Nota 2: Com um loop, você pode ler automaticamente todas as páginas de um Excel.

File

Sheet

Column Headers

Page 13: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

13

Abrindo um arquivo CSV File Reader Node Excel KNIME Analytics Platform

Para abrir um arquivo CSV, clique em "Arquivo" no menu superior e selecione "Importar". Selecione arquivo CSV e escolha o arquivo que deseja abrir. Preencha todas as opções necessárias, como o caractere de separação, para ler corretamente o arquivo.

O node "File Reader" lê vários arquivos baseados em texto, por exemplo Arquivos CSV. Na janela de configuração você pode definir todas as opções necessárias, como caractere de separação, para leitura correta o arquivo.

Nota 1. Existem muitos formatos possíveis de leitura. Os formatos básicos são: Integer, Double e String. Um arquivo deve ser lido como String e posteriormente convertida para o tipo Data e Hora com um node "String To Date&Time".

Note 2. O KNIME também possui um node específico “CSV Reader” dedicado à leitura de arquivos csv

File

Delimiter

Column

ColumnType

Page 14: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

14

Importando Conteúdos de Vários Arquivos do mesmo Tipo para uma Tabela Única Excel KNIME Analytics Platform

Se você tiver uma pasta contendo vários arquivos do mesmo tipo (por exemplo, CSV), poderá abri-los todos ao mesmo tempo em diferentes instâncias do Excel. Siga as instruções da página anterior e selecione todos os arquivos que deseja abrir.

Para mover tabelas de dados juntas em uma única planilha, você deve continuar manualmente usando copiar e colar.

Nota: Antes de copiar e colar, verifique se todos os arquivos têm a mesma ordem de colunas.

Com um simples loop (ciclo) você pode ler automaticamente vários arquivos do mesmo tipo.

O node “List Files” cria uma lista dos documentos em uma pasta e seu URL. Além do diretório, você pode especificar a extensão de modo que apenas documentos desse tipo sejam listados. O loop (a parte entre os nodes azuis) lê um documento a cada iteração. Portanto, o node “Table Row to Variable Loop Star” cria uma variável de fluxo com a URL do próximo documento a cada iteração. Essa variável de fluxo é usada no node “Table Reader” para controlar o “Input location”. O node “Loop End” concatena o conteúdo dos diferentes documentos em uma única tabela de saída.

Note 1: A seção 7.1 do curso gratuito de E-Learning fornece uma introdução às variáveis de fluxo. Note 2: A seção 7.2 do curso gratuito de E-Learning fornece uma introdução aos loops no KNIME.

Page 15: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

15

Importando Conteúdo de Várias Planilhas para uma Única Tabela Excel KNIME Analytics Platform

Para mover dados de várias planilhas do Excel para uma planilha do Excel prossiga manualmente, usando copiar e colar.

Nota: Antes de copiar e colar, verifique se todos os arquivos têm a mesma ordem de colunas.

Com um simples loop, você pode ler todas as páginas de um arquivo de Excel automaticamente. O node “Read Excel Sheet Names (XLS)” cria uma lista de todos os nomes de planilhas. O loop (a parte entre os nodes azuis) lê uma planilha do arquivo do Excel a cada iteração. Portanto, a cada iteração, o node “Table Row to Variable Loop Start” cria uma variável de fluxo com o nome da planilha como seu valor. Essa variável de fluxo é usada no node “Excel Reader (XLS)” para controlar a seleção de planilha. O “Loop End” concatena o conteúdo das diferentes tabelas.

Nota 1:a Seção 7.1 do curso gratuito de E-Learning fornece uma introdução às variáveis de fluxo. Nota 2:a Seção 7.2 do curso gratuito de E-Learning fornece uma introdução aos loops no KNIME.

Page 16: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

16

Conectando a um Banco de Dados Database Connector Nodes Excel KNIME Analytics Platform

Você pode se conectar a um banco de dados no Excel. Uma descrição sobre como fazer isso está disponível no seguinte link: http://www.erpsoftwareblog.com/2017/01/microsoft-excel-connections-sql- databases/

Nota 1: O acesso para leitura de banco de dados é modular. As três fases (connect, SELECT, extract) podem ser executadas completamente em um node “Database Reader” ou construídas passo a passo com um node “Database Connector”, “Database Table Selector” e “Database Connection Table Reader”. E há mais node de banco de dados para ajudar a criar a query SQL. Nota 2: Os node de banco de dados apenas constroem a query SQL, eles não a executam. Somente o node final que extrai os dados executa a query SQL. Note 3: Vários node de conexão a banco de dados estão disponíveis para se conectar aos bancos de dados mais usados. No entanto, o node “Generic Database Connector” permite conectar-se a qualquer banco de dados via driver JDBC.

Page 17: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

17

Dicas sobre leitura de arquivos no KNIME Todos os node de leitura requerem caminhos para o local do arquivo de entrada. Vamos analisar algumas dicas e truques para isso:

Dica 1: Use Drag&Drop do KNIME Explorer:

Os arquivos de dados salvos na pasta do workspace estão disponíveis no painel KNIME Explorer (canto superior esquerdo). Para ler um desses arquivos, basta arrastar e soltar um arquivo do painel KNIME Explorer para o editor de workflow. O KNIME cria automaticamente o node correto do leitor e define o caminho do local de entrada.

Dica 2: Diferentes opções para definir caminhos de arquivo:

No KNIME, temos opções diferentes para fornecer um caminho de arquivo. Isso se torna importante quando você começa a compartilhar seus fluxos de trabalho ou exportá-los para outras instalações da KNIME Analytics Platform ou Servidores KNIME. Além da URL absoluta, o protocolo knime:// acessa locais relativos à pasta atual do workflow, pasta do workspace e ponto de montagem do servidor.

URL absoluta

URL relativo ao ponto de montagem

Caminho local

URL relativo à pasta atual do workflow

Page 18: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

18

Anexando / Juntando Dados

Page 19: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

19

Anexando Dados Concatenate Node Excel KNIME Analytics Platform

Selecione manualmente a área que deseja anexar, copie e cole o conteúdo abaixo da primeira tabela.

Nota 1: Antes de copiar e colar, verifique se todas as tabelas têm a mesma estrutura de coluna.

Nota 1: A ordem da coluna não precisa ser a mesma. Nota 2: Você pode decidir se deseja a interseção ou a união das colunas. Nota 3: Com o node “Concatenate (Optional In)”, você pode concatenar até quatro tabelas ao mesmo tempo. As portas de entrada vazias são portas de entrada opcionais. Se precisarmos concatenar mais de quatro tabelas, podemos usar uma sequência de node “Concatenate”.

Nota 4: O node “Concatenate” possui apenas duas portas de entrada e pode

concatenar apenas duas tabelas de dados.

Page 20: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

20

VLOOKUP Filter and Joiner Node Excel KNIME Analytics Platform

A função VLOOKUP é usada para diferentes tarefas. Os usos mais comuns são:

1. Procurar um determinado valor, por exemplo o preço de um determinado

produto. 2. Associar colunas com base em uma chave primária (valor de pesquisa),

por exemplo juntar informações do produto com base no ID do produto. Uma função alternativa para a segunda tarefa é INDEX MATCH.

1. Procure um determinado valor, por exemplo o preço de um determinado

produto..

Note 1: Sua tabela original completa ainda está disponível na porta de saída do node

“Table Reader”. Veja mais informações sobre os node “Row Filter” e “Column Filter” nas

páginas 22 e 25.

2. Unir colunas com base em uma coluna de junção, por exemplo junte informações do produto com base no ID do produto.

Filter Columns

Note 1: Similarmente aos bancos de dados, diferentes modos de junção estão disponíveis: junção interna, externa esquerda, externa direita e externa completa. O modo de junção que corresponde ao VLOOKUP é a junção externa esquerda (valores ausentes, caso não haja correspondência no intervalo que contém o valor de consulta). Note 2: A “Joining Column” é a coluna de pesquisa de valor.

Filter Columns

Joining Mode

Joining Key Columns

Page 21: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

21

Filtragem e Transformações

Page 22: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

22

Filtrando / Removendo Linhas com um Valor Específico Row Filter Excel KNIME Analytics Platform

Para filtrar os dados, selecione uma célula aleatória na tabela de dados, vá para a guia Início, clique no botão “Classificar e filtrar” e selecione “Filtro”.

Selecione o valor de seu interessado no menu suspenso.

Para remover linhas, selecione as linhas que deseja excluir, clique com o botão direito do mouse e selecione “Excluir linhas”.

No KNIME, não há diferença entre filtrar e remover linhas, pois a tabela original não é excluída e ainda está disponível na porta de saída do node anterior.

Nota 1: Se você estiver interessado apenas nas linhas com um valor específico, poderá

usar o node “Row Filter”.

Nota 2: Se você deseja incluir linhas com base em valores diferentes, pode usar o "Rule-based Row Filter” (veja a próxima página). Nota 3: À direita, você pode escolher se deseja incluir ou excluir as linhas com o valor correspondente. Nota 4: Outras opções de filtro estão disponíveis, por exemplo em um intervalo numérico, filtro as linhas por número ou ID da linha ou apenas pelos valores ausentes.

Filter Column

Value to in- or exclude

Page 23: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

23

Filtrando / Removendo Linhas com Valores Diferentes Rule-based Row Filter Excel KNIME Analytics Platform

Para filtrar os dados, selecione uma célula aleatória nas tabelas de dados, clique em " Sort& Filter" e selecione "Filter".

Selecione os valores de seu interesse no menu suspenso.

Para remover linhas, selecione as linhas que deseja excluir, clique com o botão direito do mouse e escolha "Excluir linhas".

No KNIME, não há diferença entre filtrar e remover linhas, pois a tabela original não é excluída e ainda está disponível na porta de saída do node anterior.

Nota 1: Na parte inferior da janela de configuração, você pode escolher se deseja incluir ou excluir correspondências VERDADEIRAS. Nota 2: O node “Rule-based Row Filter” possui várias funções diferentes para muitas opções avançadas de filtro. Nota 3: Linhas diferentes no quadro de expressão funcionam como um conjunção OR.

List of Columns

List of Functions

Expression

Page 24: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

24

Classificando Linhas por Múltiplas Colunas Chaves Sorter Node Excel KNIME Analytics Platform

Para classificar linhas por várias colunas, selecione as colunas pelas quais deseja classificar. Em seguida, clique em Classificar e filtrar e selecione "Classificação personalizada".

Com o node “Sorter”, você pode classificar por uma ou mais colunas, tanto em ordem crescente quanto decrescente.

Nota 1: Você pode adicionar quantas colunas-chave quiser clicando no botão “new columns”.

Page 25: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

25

Removendo colunas Column Filter Node Excel KNIME Analytics Platform

Para remover colunas, basta selecionar e excluir as colunas supérfluas.

Lembre-se: Se você remover uma coluna usada em um campo de cálculo, quebrará a sua fórmula.

Com o node “Column Filter”, você pode excluir colunas supérfluas. Lembre-se de que a tabela de dados completa ainda estará disponível na porta de saída do node anterior e para cálculos executados posteriormente.

Nota 1: Você pode usar os botões de seta no meio para mover colunas do quadro “Include” para o quadro “Exclude” e vice-versa.

Page 26: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

26

Reordenando e renomeando colunas Column Resorter and Column Rename Node Excel KNIME Analytics Platform

Para reorganizer colunas:

• Selecione o cabeçalho da coluna que você deseja mover

• Pressione ctrl + shift + seta para baixo • Clique e segure o contorno verde da coluna que você deseja mover

• Arraste sua coluna para a posição desejada

Para renomear uma coluna, basta clicar na célula da coluna e alterar o valor da célula.

Defina a ordem desejada das colunas, selecionando a que você deseja mover e usando os botões “Actions” à direita.

Clique duas vezes na coluna que deseja renomear, ative a caixa de seleção “Change” e defina o cabeçalho da coluna na caixa de texto.

Nota 1: Além do cabeçalho da coluna, você também pode alterar o tipo de dados.

Page 27: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

27

Alterando tipos de dados String to Number, Number to String, Strings to Date&Time Excel KNIME Analytics Platform

Para alterar o tipo de dados de uma coluna ou célula, selecione-o e vá para a guia Início. Em seguida, use o menu suspenso no meio.

Note 1: No node “String to Number”, você pode escolher entre diferentes tipos numéricos, por exemplo Duplo, Inteiro e Longo.

Page 28: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

28

Agregações

Page 29: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

29

Tabelas Dinâmicas Pivoting Node Excel

Para criar uma tabela dinâmica no Excel

• Clique em qualquer célula dentro do conjunto de dados

• Vá para a guia Inserir e clique em Tabela dinâmica (Pivot Table)

• Selecionar tabela / faixa e local de saída

• Escolha os campos da tabela dinâmica arrastando-os para “Colunas”,

“Linhas” e “Valores”.

O node “Pivoting” é configurado através de três guias:

• “Groups” define as colunas do grupo, também conhecidas como colunas no quadro "Rows" no Excel (IDs da linha final)

• “Pivots” define as colunas dinâmicas, também conhecidas como colunas no quadro "Colunas" no Excel (cabeçalhos das colunas finais)

• “Manual Aggregation” define as variáveis de agregação e os métodos de agregação

A opção de configuração “Value” corresponde à aba “Manual Aggregation”. O node “Pivoting” produz três tabelas de saída: a tabela dinâmica e os valores totais para colunas e linhas.

Nota 1: O node “Pivoting” não tem opção de filtro “Filter”, mas você pode usar simplesmente um node “Row Filter” anteriormente. Nota 2: No KNIME, você deve escolher pelo menos uma coluna para os Groups e Pivots. Caso deseje escolher apenas "Linhas", você pode usar o node “GroupBy”.

Rows

Columns

Values

Page 30: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

30

Tabelas Dinâmicas sem Colunas GroupBy Node Excel KNIME Analytics Platform

Crie uma tabela dinâmica conforme descrito na página anterior e arraste apenas as colunas para os quadros "Linhas" e "Valores".

O node “GroupBy” é configurado através de duas guias:

• “Groups” define as colunas do grupo, também conhecidas como colunas no quadro “Rows” no Excel (IDs da linha final)

• “Manual Aggregation” define as variáveis de agregação e os métodos de agregação

A opção de configuração “Value” corresponde à guia “Manual Aggregation”.

Rows

Columns

Page 31: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

31

Funções Matemáticas e Funções de Texto

Page 32: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

32

Funções Matemáticas Math Formula Node Excel KNIME Analytics Platform

Aqui está uma lista de fórmulas matemáticas usadas com frequência no Excel. Você encontrará uma tradução para as fórmulas KNIME na próxima página:

• SUM

• AVERAGE • MEDIAN

• SUMPRODUCT

• ABS

• SUMIF • Round functions

o ROUND o ROUNDUP o ROUNDDOWN

O node “Math Formula” possui uma longa lista de funções. A tabela na próxima página fornece uma tradução das funções do Excel mais usadas.

Nota 1: Você pode decidir se deseja acrescentar uma nova coluna ou substituir uma das colunas, usando as caixas de seleção abaixo do quadro “Expression”.

Nota 2: Ativando a caixa de seleção “Convert to Int”, você pode garantir que a coluna

anexada / substituída de saída seja do tipo Inteiro.

Columns

Funtions

Expression

Page 33: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

33

Funções Matemáticas Math Formula Node Excel KNIME Analytics Platform

SUM(number1;number2;…)

COL_SUM(Col) = Soma dos valores na coluna selecionada. Col1 + Col2. = Soma dos valores em Col1 e os valores em Col2 para

cada fila.

AVERAGE(number1;number2;…)

COL_MEAN(col_name) = Média dos valores na coluna selecionada. average(Col1, Col2,…) = Média dos valores das colunas selecionadas para

cada fila.

MEDIAN(number1;number2;…)

COL_MEDIAN(Col_name) = Mediana dos valores na coluna selecionada. Median(Col1, Col2,…) = Median of the values of the selected columns for

each row.

SUMPRODUCT(number1;number2;…)

Sequência de dois node “Math Formula”: Primeiro: Multiplique as duas colunas usando a expressão Col1 * Col2 e

adicione uma nova coluna. Segundo: Use COL_SUM na nova coluna.

ABS(number1)

abs(Col) = O valor absoluto para todos os valores na coluna selecionada

SUMIF(range; criteria)

Sequência de dois node “Math Formula”: Primeiro: Anexar nova coluna com if(criteria, column to sum ,0) Segundo: Use COL_SUM na nova coluna.

Round functions: ROUND(number1, num_digits) ROUNDUP(number1, num_digits) ROUNDDOWN(number1, num_digits)

round(Col, NumberOf Digits) = O número de dígitos é opcional. ceil(Col*10^(num_digits))/10^num_digits floor(Col*10^(num_digits))/10^num_digits

Page 34: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

34

Concatenação e Localização/Substituição Node de String Manipulation Excel KNIME Analytics Platform

1. A função CONCATENAR (texto1, texto2, ..) combina textos diferentes em uma célula.

2. Para encontrar e substituir um determinado valor, você deve ir para "Editar -> Localizar -> Substituir…” para abrir a caixa de diálogo abaixo.

Na caixa de diálogo exibida, você pode definir o valor que deseja substituir e o para qual valor deseja substituir.

Com o node “String Manipulation” você pode manipular colunas do tipo String. Por isso, muitas funções diferentes estão disponíveis.

1. CONCATENATE (text1, text2,..) do Excel

join(col1, col2 ,…) or join(col1, “sua propria string”,…)

Nota 1: Você pode associar os valores de diferentes colunas em linhas ou adicionar outro valor de String a uma coluna.

2. Find&Replace

Replace (string, search, replace)

Nota 1: String é o valor de String onde você deseja substituir algo. Pode ser uma coluna para aplicar a linha de substituição ou um valor fixo da String.

Page 35: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

35

Page 36: De Excel - hupdata.com · Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução,

36

Livreto KNIME para usuários do Excel Você é um usuário experiente do Excel e deseja começar a usar a Plataforma KNIME Analytics?

Às vezes, é difícil mudar de uma ferramenta ou de um software para outro. Mas este livreto é o ponto de partida perfeito, pois mapeia as funções e técnicas do Excel mais comumente usadas para seus equivalentes no KNIME. Descubra, por exemplo, como a leitura, filtragem, classificação e visualização de dados funcionam no KNIME.

Para uma introdução completa ao KNIME, consulte o livro "KNIME Beginner's Luck", disponível no website do KNIME Press, click em https://www.knime.com/knimepress

Sobre a Autora

Kathrin Melcher é atualmente cientista de dados no KNIME. É mestre em Matemática pela Universidade de Konstanz, Alemanha. Ela ingressou na equipe KNIME como Evangelista em maio de 2017 e tem um forte interesse em ciência de dados, machine learning e algoritmos. Ela ama ensinar e compartilhar seu conhecimento sobre esses tópicos.