Upload
lamdang
View
222
Download
0
Embed Size (px)
Citation preview
2010
Estatística e Modelos Probabilísticos
COE241Edmundo de Souza e Silva
Rosa M. M. Leão
Segundo semestre de 2010
LAND – COPPE/PESC – UFRJ
2010
Professores
● Edmundo de Souza e Silva - [email protected]
Sala H-318 (COPPE/PESC)
● Rosa M. M. Leão - [email protected]
Sala H-318 (COPPE/PESC)
2010
Website
http://www.land.ufrj.br/~classes/est-prob
notas de aula (slides)
listas de exercícios
datas de provas, dicas, etc.
Informações
Lista de email do curso (ver website)
Fórum para anúncios gerais
Visitem a Página do Curso!
2010
Altamente recomendada
Será passada lista de presença
Pequena ajuda no final
Presença
Horário Aulas iniciam às 13:10
Horário de atendimento
1 hora por semana (horário a definir)
Utilizem!
2010
Duas provas e uma prova final (se necessário)
1 trabalho
Avaliação
Listas não valem nota, entretanto...
provas serão baseadas nas listas
(pequena) ajuda no final (se necessário)
Cálculo das médias (ver website)
P2 tem maior peso
2010
Segunda Chamada
Somente com atestado médio
Ou boa justificativa comunicada
antes de perder a prova
Prova com toda a matéria, aplicada
depois da prova final
2010
Outline do Curso
Informação e Motivação
Definições Básicas de Probabilidade
Variáveis Aleatórias Discretas e Contínuas
Variáveis Aleatórias Conjuntas
Média, Variância, Correlação
Distribuição e Esperança Condicional
Distribuição amostral
Inferência Estatística
2010
Livros e Referências
Notas de aula (ver website)
“Probability & Statistics with Reliability, Queuing and
Computer Science Applications”, por K.S. Trivedi. Willey,
2001
“Introduction to Probability Models”, por S.M. Ross,
Academic Press, 2006
Probabilidade e Estatística, Walpole, Myers, Myers, Ye, 8a
edição, Pearson/Prentice Hall, 2008
Alguns disponíveis na biblioteca!
2010
Recomendação para Sucesso
Estudar a matéria da semana
Fazer listas de exercíciosprovas serão baseadas nas listas
Utilizem o horário de atendimentonão deixem dúvidas acumularem
Venham às aulasparticipem das discussões
2010
Objetivo do Curso
Aprender conhecimentos básicos de estatística e probabilidade e como a teoria pode ser usada na avaliação de sistemas de computação
Como?
Construir modelo probabilístico do comportamento do sistema, calcular estatísticas do sistema, para prever seu desempenho
2010
Por que usar probabilidade ?
A maioria dos eventos que ocorrem nos sistemas/vida real são aleatórios
Exemplo:
Tempo de busca no Google
Perda de um pacote em um roteador
Tempo até que ocorra uma falha em um computador
Tempo de acesso ao Skype
Tempo de espera na fila de um banco
2010
Áreas onde a teoria é usada
Estatística e Probabilidade
Processos Estocásticos
Simulação Medições
Teoria de Filas
Redes Bayesianas
2010
Importância
Prever desempenho de um sistema
Identificar seus gargalos
Avaliar mudanças no sistema
Modelagem é fundamental para muitos sistemas
Google, BitTorrent, NASA, Sprint (ISP), etc.
2010
Medidas de Desempenho
● Comunicações / Diversão● Throughput ou Vazão
● Tempo de download
● Tempo para iniciar a exibição de um vídeo
● Tempo que um vídeo fica parado
● Utilização de um recurso
2010
Medidas de Desempenho
● Aviação / Sistema Bancário● Tempo até que ocorra uma falha
● Tempo até que ocorra um reparo
● Probabilidade de falha
● Tempo de resposta
2010
Medidas de Desempenho
● Biologia / Medicina● Probabilidade de uma determinada sequência
de gens
● Probabilidade de uma população ter um certo
tipo de doença
● Tempo de vida de uma certa população
2010
Estatísticas das Medidas de Desempenho
Média
Variância
Distribuição de probabilidade
Correlação
2010
Exemplo de estudo (1) Tempo de resposta de um sistema deve estar abaixo de
um limite com uma certa probabilidade e sua média não deve ser superior a um certo valor
Cálculo da
frequência
(histograma)
Cálculo da média: 5*0.08 + 10*0.03 + 20*0.01 + 30*0.08 + 40*0.09 + 50*0.06 + 60*0.12 + 70*0.11 + 80*0.22 + 90*0.14 + 100*0.06 = 61
2010
Exemplo de estudo (2) Uma nova droga reduz a pressão arterial em 85% dos
pacientes
Uma droga antiga tem o mesmo efeito em 80% dos pacientes
A nova droga é mais cara e pode trazer alguns efeitos colaterais
A nova droga deveria ser adotada ?
Estudo depende da população observada
Inferência estatística ajuda no processo de decisão
2010
Exemplo de estudo (3)
Uma empresa só pode tolerar 5% dos itens que fabrica defeituosos no longo prazo
Dado que foram encontrados mais do que 5% em uma dada amostra, isto significa que a empresa não está cumprindo com as suas metas ?
Qual a “importância” dos dados coletados ?
Como garantir que a amostra é “suficiente” ?