nosqlbr cassandra

Preview:

DESCRIPTION

Presentation at NoSQLbr

Citation preview

Ben Coverstonben.coverston@datastax.com@bcoverston

Apache Cassandra: Uma Introdução

Eu

Ben Coverston Diretor de Operações DataStax Como é que um gringo fala Português? Morou em Santa Catarina de 1994-1996

Datastax e Cassandra

Júlio 2008 Contribuído de Facebook á comunidade

Março 2009 Introduzido à incubadora Apache

DataStax, Fundado Abril 2010 Primeira conferência: Augusto 2010

Quem está usando Ela?

Financeiro Governo Mídia Social Publicidade Energia Varejo Saúde

Cassandra, você é diferente

Como é diferente?

O melhor combinação de Escalabilidade Performance Disponibilidade

Escalabilidade

Através uma esquema distribuída Sem ponto único de falha Todos os nós são o mesmo

O fracasso é inevitável

Então…

ou…

A falta é um caso especial

? ?

Nós de Cassandra

Nós de Cassandra (cont.)

Falha com Cassandra

Modelagem de dados com Apache Cassandra

Flexível Fundado em Big Table Escalável

Feito Em Big Table

Google Finance Google Reader Gmail Google App Engine Google Book Search YouTube . . .

Dados Primitivas Column Family

chave nome : valor nome : valor nome :valor

chave nome : valor nome : valor nome : valor

chave nome : valor nome: valor

chave nome : valor nome : valor nome : valor

nome : valor

Twissandra

Aplicação escrito em Cassandra www.twissandra.com

UsuáriosColumn Family Usuários

alice nome : Allison senha : *

bob nome : Roberto

senha : *

eve nome : Evelyn senha : *

chuck nome : Carlos senha : * site : datastax.com

EstadoColumn Family Tweets

LMNO timestamp : 175695372

corpo : estou tão equivicado? user : carlos

AXML timestamp : 125695372

corpo: recebeu a minha mensagem?

user : alice

DEXDL timestamp : 155695372

corpo: ouvi o que diz. user : eve

BADFO timestamp : 135695372

corpo : manda-me a senha.

user : mallory

Pesquisando Dados em Twissandra

Quem esta seguindo um usuário? A quem segue um usuário? Monstra os meus tweets.

UserLine Monstra os tweets de todos que eu

estou seguindo. TimeLine

Column Family Followers

Quem Segue Alice?

alice bob : mallory : trent :

Column Family Following

Quem é seguido por Alice?

alice bob : carlos : david :

Column Family UserLine

UserLine do Alice

alice 125695372 : AXML

126695372 : XCVL

127695372 : XENY

bob 125795372 : SDFG

126895372 : XCVN

eve 125694372 : FDHL

arthur 125600000 : AXML

125800000 : XCVL

127900000 : XENY

Column Family Timeline

TimeLine do Alice

bob 125795372 : SDFG

126895372 : XCVN

eve 1279900000 : FDHL

arthur 125600000 : AXML

125800000 : XCVL

127900000 : XENY

alice 125795372 : SDFG

125800000 : XCVL

1279900000 : FDHL

Bob da um novo estadoColumn Family Tweets

LUMP timestamp : 200000000 body : Oi

Aliceuser : bob

AXML timestamp : 125695372

body : recebeu a minha mensagem?

user : alice

DEXDL timestamp : 155695372

body : ouvi o que diz. user : eve

BADFO timestamp : 135695372

body : manda-me a senha!

user : mallory

Column Family UserLine

bob 127695372 : XENY

126695372 : XCVL

200000000 : LUMP

Column Family TimeLine

UserLine e TimeLine

alice 125795372 : SDFG

125800000 : XCVL

1279900000 : FDHL 200000000 : LUMP

125695372 : AXML

bob 125795372 : SDFG

126895372 : XCVN

200000000 : LUMP

eve 1279900000 : FDHL

200000000 : LUMP

Usando o Timeline

alice

Column Family Tweets

LMNO timestamp : 175695372

body : am I always the third wheel? user :

chuck

AXML timestamp : 125695372

body : bob did you get my message? user :

alice

DEXDL timestamp : 155695372

body : I heard what you said user : eve

BADFO timestamp : 135695372

body : send me your password!

user : mallory

Vista Geral

O que é um “Column Family”? Modelar Data Estático Modelar ‘Queries’ ou Perguntas

What’s new in Apache Cassandra 1.0

Compressão Memtable Thresholds LevelDB Desempenho Outras Coisas…

Compressão

Compressão

2-4x redução no tamanho dos dados 25-35% melhoria na velocidade a ler 5-10% melhoria na velocidade a

escrever O melhor quando as colunas são um

tanto congruente

Gerência Memória

Gerência Memória e Espaço Disquete

Cache filharas fora do ‘Heap’ Afinação do Armazenamento Reclamação do Armazenamento Disque

Compacção

Compacção Overview

Compacção ‘Tiered’

Compacção ‘Leveled’

Desempenho

Desempenho

Ler Improvado pelas fatias Improvado por leitura nomeada

Escrever Alocação Arena pelos Memtables Diminuição da Fragmentação

Rede Redução das cópias

Desempenho(Cont.)

Outros Coisas…

Hints

Reexecutar os dados a processor quando falha

Armazenado e otimizada para reexecutar

Recolocação dos Nós Compacção Multi-threaded

Também Hadoop

Existe intergeração com Hadoop Brisk DataStax Enterprise

Cassandra e muito bom para OLTP E bom também dos aplicações analíticas Sem ETL (Extratar, Transformar,

Carregar)

Mas Informacões

www.datastax.com

Free Documentation Technical White Papers Technical Articles Tutorials User Forums User/Customer Case Studies FAQ’s Videos Blogs Software downloads

Perguntas?@bcoverstonben.covetston@datastax.com