40
Big data com Elasticsearch Roger Mattos Co-fundador e CTO

DevCommerce Conference 2016: Big data com Elastic Search

Embed Size (px)

Citation preview

Page 1: DevCommerce Conference 2016: Big data com Elastic Search

Big data com Elasticsearch

Roger MattosCo-fundador e CTO

Page 2: DevCommerce Conference 2016: Big data com Elastic Search

Quem são os seus consumidores e quais são seus interesses?

Page 3: DevCommerce Conference 2016: Big data com Elastic Search

E-Commerce database

1

1

1

Automação de campanhas personalizadas

Page 4: DevCommerce Conference 2016: Big data com Elastic Search

Volume atual

~1miLogs de comportamento por dia

~8k

Logs de comportamento por minuto

Page 5: DevCommerce Conference 2016: Big data com Elastic Search

Como coletamos e armazenamos nossos dados

Page 6: DevCommerce Conference 2016: Big data com Elastic Search

Desafios

● Filtros de audiencia em tempo real

● Consolidação e processamento de dados diários

● Inferir interesse de usuários baseado em navegação

Page 7: DevCommerce Conference 2016: Big data com Elastic Search

Segmentação de Audiência

Page 8: DevCommerce Conference 2016: Big data com Elastic Search

Campanha de Trending

Page 9: DevCommerce Conference 2016: Big data com Elastic Search

Bottlenecks

● Lentidão nas consultas de audiencias

● Demora no processamento de campanhas

● Queda de CTR (conversão) devido ao delay de entrega

Page 10: DevCommerce Conference 2016: Big data com Elastic Search

Big data com Elasticsearch

Leandro LustosaSoftware Engineer

Page 11: DevCommerce Conference 2016: Big data com Elastic Search

You Know, for search.

Page 12: DevCommerce Conference 2016: Big data com Elastic Search
Page 13: DevCommerce Conference 2016: Big data com Elastic Search

Para quê?

Busca

- FullText Search

-GeoÍndices

-Agregações

Analytics

-Near Realtime

-Ferramentas de Ingestão e Vizualização de

Dados

Fazer os dados terem sentido

Page 14: DevCommerce Conference 2016: Big data com Elastic Search

● Arquitetura Distribuida● API RESTFul ● Facilidade de Uso

Pontos Fortes

● Document Based● Open Source● Ecosistema

Page 15: DevCommerce Conference 2016: Big data com Elastic Search

Index 1 Index 2 Index 3 Index 4

Arquitetura Distribuída

Page 16: DevCommerce Conference 2016: Big data com Elastic Search
Page 17: DevCommerce Conference 2016: Big data com Elastic Search
Page 18: DevCommerce Conference 2016: Big data com Elastic Search
Page 19: DevCommerce Conference 2016: Big data com Elastic Search
Page 20: DevCommerce Conference 2016: Big data com Elastic Search
Page 21: DevCommerce Conference 2016: Big data com Elastic Search

Exemplo de Consulta

Page 22: DevCommerce Conference 2016: Big data com Elastic Search
Page 23: DevCommerce Conference 2016: Big data com Elastic Search
Page 24: DevCommerce Conference 2016: Big data com Elastic Search
Page 25: DevCommerce Conference 2016: Big data com Elastic Search
Page 26: DevCommerce Conference 2016: Big data com Elastic Search
Page 27: DevCommerce Conference 2016: Big data com Elastic Search
Page 28: DevCommerce Conference 2016: Big data com Elastic Search
Page 29: DevCommerce Conference 2016: Big data com Elastic Search
Page 30: DevCommerce Conference 2016: Big data com Elastic Search
Page 31: DevCommerce Conference 2016: Big data com Elastic Search

Na Social Miner

● Processamento de dados de navegação

● Monitoramento de Serviços e Infraestrutura

● Visão para a equipe de Negócios

Page 32: DevCommerce Conference 2016: Big data com Elastic Search

● ~6 milhões de usuários

● ~60 milhões de logs (2 meses)

● ~7 milhões de páginas processadas e indexadas

O que e como nós processamos

● 3 Máquinas

● 32 GB de RAM

● 4 Cores

Page 33: DevCommerce Conference 2016: Big data com Elastic Search

● Configuração Padrão vs Produção

● Alterações de Schema

● Quanto Hardware utilizar

● Como dividir os Shards

Dificuldades

Page 34: DevCommerce Conference 2016: Big data com Elastic Search

● Dados Quentes x Frios

● Múltiplos Shards x Múltiplos Índices

Modelagem de Dados

Page 35: DevCommerce Conference 2016: Big data com Elastic Search

● Na dúvida, escolha memória.

● Metade para a aplicação, metade para o sistema operacional.

● Sempre tenha uma réplica de cada shard, de preferência em

zonas de disponibilidade distintas.

● Proteja seu Endpoint.

Deploy

Page 36: DevCommerce Conference 2016: Big data com Elastic Search

Monitoramento de Serviços e Infraestrutura

Page 37: DevCommerce Conference 2016: Big data com Elastic Search

Visão de Negócio

Page 38: DevCommerce Conference 2016: Big data com Elastic Search

Quem usa?

Page 39: DevCommerce Conference 2016: Big data com Elastic Search

Conclusão

Memória Importa

Pense nos Shards

Sempre tenha uma réplica

Page 40: DevCommerce Conference 2016: Big data com Elastic Search

Roger MattosCo-fundador e CTO

Obrigado!

[email protected]

@roger_mattos

linkedin.com/in/rmattos

Leandro LustosaSoftware Enginner

[email protected]

@llustosa_s

linkedin.com/in/leandro-lustosa-24672121