11
Algoritmos de Big Data com R Richard Brochini

Hackathon Inmetrics e Fiap: Algoritimos de Big Data com R

Embed Size (px)

Citation preview

Algoritmos de Big Data com R

Richard Brochini

O que é Big Data?

Grandes quantidades de dados que possam ser compilados e usados nas tomadas de decisões e ações.

De onde vem os dados?

●Planilhas de dados●Sensores

Hoje em dia de qualquer fonte é possível coletar dados!

●Redes Sociais

O que é mineração de dados?

É a forma que separamos os dados para que um determinado sistema

possa processa-los

Como podemos processar os dados?

Qual linguagem de programação usar?Qualquer linguagem pode ser usada

para processar dados e gerar relátorios

Por que usar a

●É uma linguagem para desenvolvimento integrado, para cálculos estatísticos e gráficos.

●O código fonte é aberto, permitindo que você faça as adaptações necessárias para melhorar a performance na sua infraestrutura.●Novas metodologias são incorporadas rapidamente

Quem usa?

- Google usa para fazer o cálculo e análise de campanhas pagas e para análise de dados de tráfego- Microsoft usa para recomendar produtos do Xbox e é utilizado para gerar os relatório da AZURE ML- Uber usa para calcular métricas dos seus serviços em tempo real- Twitter incorporou dentro da sua plataforma como um Data Science toolbox para melhorar as métricas e experiências dos usuários

Entendendo a linguagem

Falando sobre Machine Learning

- É um sub-campo da inteligência artificial dedicado ao desenvolvimento de algoritmos e técnicas que permitem o computador aprender

- Algumas partes da aprendizagem automática estão intimamente ligadas à mineração de dados e estatística.- Sua aplicação prática inclui o processamento de linguagem natural, motores de buscas, diagnósticos médicos, bioinformática, reconhecimento de fala, reconhecimento de escrita, visão computacional e locomoção de robôs.

Vamos Programar!

Como caso de estudo prático vamos utilizar:- Twitter como fonte de dados de Big Data- R como liguagem responsável por minerar e processar os dados

- O conceito de processamento de linguagem natural de Machine Learning, usando o algoritmo Bayes através da lib sentiment.

Contatos

Consultoria e Desenvolvimento

Richard Brochini

E-Mail: [email protected]: http://richard.brochini.com/Linkedin: https://br.linkedin.com/in/richardbrochini