34
NoSQL & Cassandra Edward Ribeiro 2013

Cassandra Trip Brasil

Embed Size (px)

Citation preview

Page 1: Cassandra Trip Brasil

NoSQL & Cassandra

Edward Ribeiro2013

Page 2: Cassandra Trip Brasil

Agenda

• Big Data

• Cloud Computing

• NoSQL

• Teorema CAP

• Cassandra– Arquitetura e Modelo de Dados

Page 3: Cassandra Trip Brasil

Os SGBDs relacionais reinam soberanos por mais de 30 anos...

Page 4: Cassandra Trip Brasil
Page 5: Cassandra Trip Brasil

Big Data

Page 6: Cassandra Trip Brasil

O que é Big Data?

• “Uma coleção de dados tão grande e complexa que se torna difícil (N.E: as vezes impossível) processá-la usando ferramentas de bancos de dados atuais ou aplicações tradicionais de processamento de dados.”

● Genoma Humano● Cliques em sites● Redes sociais● etc

Page 7: Cassandra Trip Brasil

O quão “Big” é Big Data?

eBay possui:

● 4.000.000.000 de registros/dia● 2.000.000.000.000 de registros em uma

tabela de eventos● 6 PB de dados compactados para 1.2 PB

Fonte: 14th Int'l Workshop on High Perf Transaction Sys, 2011

Page 8: Cassandra Trip Brasil
Page 9: Cassandra Trip Brasil

OK, mas lembre-se...

Page 10: Cassandra Trip Brasil
Page 11: Cassandra Trip Brasil
Page 12: Cassandra Trip Brasil
Page 13: Cassandra Trip Brasil
Page 14: Cassandra Trip Brasil

Seu site é um grande sucesso

Escalabilidade

E agora???

Page 15: Cassandra Trip Brasil
Page 16: Cassandra Trip Brasil

A solução

Academia Indústria

Page 17: Cassandra Trip Brasil

Computação em Nuvem

Page 18: Cassandra Trip Brasil

Computação em Nuvem

Page 19: Cassandra Trip Brasil

Data Centers

Page 20: Cassandra Trip Brasil

NoSQL

Page 21: Cassandra Trip Brasil

NoSQL

● Alta escalabilidade● Partição de dados● Scale Out > Scale Up

●Alta vazão (throughput)

●Sem Relational● schemaless (alguns!)

●Sem Transações ACID (ainda!)

Page 22: Cassandra Trip Brasil

NoSQL

●Sem SQL● MongoDB e Cassandra possuem ling. de consulta

derivada, direta ou indiretamente, do SQL

●Arquitetura Distribuída● Clusters LAN● Hardware de prateleira

Page 23: Cassandra Trip Brasil

Teorema CAP

Page 24: Cassandra Trip Brasil

Cassandra

● Banco NoSQL de código fonte aberto criado pelo Facebook;

● Mantido pela fundação Apache e por empresas como DataStax

http://www.slideshare.net/jbellis/cassandra-summit-2013-keynote

Page 25: Cassandra Trip Brasil

Cassandra - Quem usa?● Twitter

● Netflix

● Nasa

● Adobe

● IBM

● etc

Page 26: Cassandra Trip Brasil

Cassandra - Desempenho

Page 27: Cassandra Trip Brasil

"Bigtable: A Distributed Storage System for Structured Data", Fay Chang, Jeffrey Dean, Sanjay Ghemawat, Wilson C. Hsieh, Deborah A. Wallach, Mike Burrows, Tushar Chandra, Andrew Fikes, and Robert E. Gruber in OSDI'06: Seventh Symposium on Operating System Design and Implementation, Seattle, WA, November, 2006.

Page 28: Cassandra Trip Brasil

Cassandra – Modelo de Dados

1920011

FC: dados-pessoaisRowKeyFC: acessos

Família de Colunas Família de Colunas

Nome: “Bruno” Idade: 11 a-2013-08-12Nome: “Bruno” a-2013-09-05

2000852

FC: dados-pessoais FC: acessos

Nome: “Bruno” CPF: 1111111111111 a-2013-02-01Nome: “Gi”

...

Page 29: Cassandra Trip Brasil

Arquitetura

Memtable

Disco

RAM

Write Operation SSTable Files

Read Operation

Flush

Log File

Page 30: Cassandra Trip Brasil

"Dynamo: amazon's highly available key-value store", Giuseppe DeCandia, Deniz Hastorun, Madan Jampani, Gunavardhan Kakulapati, Avinash Lakshman, Alex Pilchin, Swaminathan Sivasubramanian, Peter Vosshall, Werner Vogels in SIGOPS Oper. Syst. Rev., New York, NY, USA, October, 2007.

Page 31: Cassandra Trip Brasil

Hashing Consistente

ID = 23

ID = 90

ID = 203

ID = 350

ID = 112

100

Page 32: Cassandra Trip Brasil

É o fim dos SGBDs relacionais?

Page 33: Cassandra Trip Brasil
Page 34: Cassandra Trip Brasil