7
Crawlers Tips & Tricks.

Crawlers - Tips & Tricks - #desconf 2010

Embed Size (px)

Citation preview

Page 1: Crawlers - Tips & Tricks - #desconf 2010

CrawlersTips & Tricks.

Page 2: Crawlers - Tips & Tricks - #desconf 2010

@paverama

@caroljanovik

@rafaelss

Page 3: Crawlers - Tips & Tricks - #desconf 2010
Page 4: Crawlers - Tips & Tricks - #desconf 2010

Crawler é...

• ... um programa que fica rodando em algum lugar, extraindo os dados que tu precisa

• ... uma ***puta*** dor de cabeça

Page 5: Crawlers - Tips & Tricks - #desconf 2010

Por quê?

• Dão trabalho

• Podem ser demorados

• Consomem processamento/memória

• Podem derrubar o site “crauleado”

• Nem todo mundo gosta de ser a “vítima” de um crawler

Page 6: Crawlers - Tips & Tricks - #desconf 2010

Então:• Não use a tecnologia errada

• Não tente capturar tudo

• Não derrube o site alheio

• Organize seu código

• Tenha cuidado com libs/frameworks de terceiros

• Crie formas de tratar os erros

• ...

Page 7: Crawlers - Tips & Tricks - #desconf 2010

Obrigado!@rafaelss