24
Reconhecimento de padrões de Reconhecimento de padrões de comportamento individual comportamento individual baseado no histórico de baseado no histórico de navegação em um navegação em um Web Site Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa: Redes de Computadores SBSEG 2007 SBSEG 2007

Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

Embed Size (px)

Citation preview

Page 1: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

Reconhecimento de padrões Reconhecimento de padrões de comportamento individual de comportamento individual

baseado no histórico de baseado no histórico de navegação em um navegação em um Web SiteWeb Site

Danielle CostaLuiz Fernando Rust

Área de Pesquisa: Redes de Computadores

SBSEG 2007SBSEG 2007

Page 2: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

IntroduçãoObjetivosProposta para avaliação comportamental

Coleta da assinaturaAspectos da construção de web sitesCálculo da confiança

Avaliação experimentalMetodologiaResultados e análise

Conclusões e trabalhos futuros

Estrutura

Page 3: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

Foco da pesquisa: Avaliação comportamental.Contexto em que avaliação comportamental é pesquisada:

mecanismo de segurança para aplicações Web baseado em confiança (idéia básica >conceito de confiança>medida de confiança).

finalidade do mecanismo: despender menos tempo para comprovar a identificação.

Introdução

a

c

b

g h

f

e

i

d k

j

l

n o

m

Análise Comportamental

ok ?

Troca Credenciais ok ?

não

sim

sim não

Macro - estado X Macro - estado Y

Page 4: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

IntroduçãoObjetivosProposta para avaliação comportamental

Coleta da assinaturaAspectos da construção de web sitesCálculo da confiança

Avaliação experimentalMetodologiaResultados e análise

Conclusões e trabalhos futuros

Estrutura

Page 5: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

Objetivos

Construção do web site experimental como gerador de subsídios para avaliação comportamental.

Investigação de novas técnicas passíveis de serem empregadas para quantificar a confiança.

Esclarecimentos: comportamento informações de uso (trilha, dados temporais...) trilha de navegação = instância comportamentalassinatura conjunto de instâncias do mesmo indivíduohistórico comportamental conjunto de comportamentos do

mesmo indivíduo

Page 6: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

IntroduçãoObjetivosProposta para avaliação comportamental

Coleta da assinaturaAspectos da construção de web sitesCálculo da confiança

Avaliação experimentalMetodologiaResultados e análise

Conclusões e trabalhos futuros

Estrutura

Page 7: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

Coleta das assinaturas

Formulação do problema: tarefa de aprendizagem.

Modelo simplificado de aprendizagem baseado em instâncias (Instance-Based Learning - IBL):

Conceito IBL

Classificação da instância

Representação da instância

Geração das instâncias: por meio de um experimento com diferentes usuários.

a

c b

e g

f j

i h

d

l n

a c f g k

a c f g k

k

I n s t â n c i a c o m p o r t a m e n t a l =

a

c b

e g

f j

i h

d

l n

a c f g k

a c f g k

k

= a c f g k

a c f g k

k

=

Page 8: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

Aspectos da construção de web sites

Convenções.

Aspectos observados:maneira de associar as instâncias aos seus respectivos usuários; delimitação do início e término de uma instância comportamental; delimitação de um macro-estado;captura do comportamento com o uso do navegador.

Page 9: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

Cálculo da Confiança

SComp: Similaridade comparativa– Similitude entre a instância atual e o conjunto de instâncias que

compõe a assinatura – Espelha o quanto este comportamento se aproxima dos demais

previamente capturados

SIntra: Intra-similaridade– Independente da amostra atual de instância comportamental– Qualidade da assinatura do usuário – Representa se um usuário possui um comportamento bem formado

SInter: Inter-similaridade– Qualidade da assinatura de um usuário em função do conjunto

completo de assinaturas (de diferentes usuários)

TrustM = SCompM*SIntraM*SInterM

Page 10: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

Cadeias de MarkovCondição inicial: as páginas do web site são os estados da cadeia de Markov e os links as transições que envolvem os estados.

Seja aij a probabilidade de transição do estado i para o estado j, então a matriz 3 x 3 é a seguinte:

aij= número de vezes que houve transição do estado i para o estado j / número de ocorrências do estado i na assinatura.Ex.: 1 # 2 # 3

SComp:

0.06 0.2 0.3 2312 aa

Cálculo da Confiança

Page 11: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

Distância de LevenshteinAplica-se o algoritmo para o cálculo da Distância de Levenshtein;

Ex.:Principal#PopNacional#RockNacional#Detalhes#ConcluirVenda#

Principal#RockNacional#Detalhes#ConcluirVenda#

Principal#RockNacional#Detalhes#ConcluirVenda#

Realiza-se a normalização pelo valor máximo das distâncias;

Calcula-se a média das distâncias: (soma das distâncias normalizadas)/(quantidade de trilhas da assinatura);

Quanto menor a distância maior a similaridade entre as trilha. SIntra: 1 -

Cálculo da Confiança

Page 12: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

Distância de FrobeniusCondição inicial: cada histórico de navegação é representado por uma matriz de transição de probabilidade de Markov.

Calcula-se a Distância de Frobenius entre a matriz do usuário e as demais matrizes existentes. Ex.:

Realiza-se a normalização pelo valor máximo das distâncias;

Calcula-se a média das distâncias: (soma das distâncias normalizadas)/(quantidade de distâncias).

        SInter : é a média das distâncias de Frobenius

Cálculo da Confiança

Page 13: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

IntroduçãoObjetivosProposta para avaliação comportamental

Coleta da assinaturaAspectos da construção de web sitesCálculo da confiança

Avaliação experimentalMetodologiaResultados e análise

Conclusões e trabalhos futuros

Estrutura

Page 14: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

Metodologia1ª etapa: definição do contexto do experimento.

2ª etapa: projeto e implementação do web site Linguagem: HTML e PHP. Agentes de software: coletam os comportamento

3ª etapa: testes com o experimentoDois testes on-line com um grupo de pessoas que receberam as instruções de acesso à loja. Foram gerados pelos participantes 21 históricos e 179 instâncias comportamentais.

4ª etapa: aplicação das técnicas para obter a medida de confiança para cada usuário.

5ª etapa: definição do limiar de confiança

Page 16: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:
Page 17: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

Resultados e análise

Os valores considerados para o Trust são os resultados da aplicação da Distância de Levenshtein para SComp e SIntra e Frobenius para SInter.

Page 18: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

Resultados e análiseObservações:

o IP de fato não identifica o usuário com precisão;

falta de permissão para a utilização do Cookie;

problemas de condução foram verificados no ambiente estruturado inicialmente na forma de um grafo fortemente conexo;

a alteração da estrutura do site por uma estrutura mais condutora, não comprometeu a liberdade de navegação dos participantes (contingente de páginas alteradas foram aquelas de acesso comum a todos os participantes);

o monitoramento dos eventos das páginas permitiu coletar os comportamentos mesmo em situações onde o navegador era utilizado ou quando várias páginas eram mantidas em aberto.

Page 19: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

Resultados e análiseA medida de similaridade dada por Markov considera a ordem de aparecimento das páginas na trilha e a similaridade máxima entre elas. Ao contrário, a Distância de Levenshtein considera a parcialidade de similaridade entre trilhas. Por este motivo optou-se pela abordagem de Levenshtein também para SComp.

Os valores apresentados pela aplicação de Markov são resultados da estratégia de se associar um valor mínimo (10-4) de probabilidade a uma transição inexistente no histórico.

Observou-se uma outra característica de diferenciação comportamental: a diferenciação pelo tamanho da trilhas de navegação.  

Page 20: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

Resultados e análise

Limiar de confiança: patamar de aceitação mínimo para cada usuário.

Estratégia utilizada: a cada vez uma instância é teste e as outras treinamento. A quantidade de valores do Trust são tantos quantos forem as instâncias da assinatura.O thresold são valores entre 0:0,001:1. Ex.:

O melhor thresold é um valor para qual a soma do erro do Tipo I e erro do Tipo II é mínima.

Page 21: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

IntroduçãoObjetivosProposta para avaliação comportamental

Coleta da assinaturaAspectos da construção de web sitesCálculo da confiança

Avaliação experimentalMetodologiaResultados e análise

Conclusões e trabalhos futuros

Estrutura

Page 22: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

Conclusões e trabalhos futurosDescreve uma proposta de construção de um web site experimental como gerador de subsídios para a avaliação comportamental e a investigação de técnicas de reconhecimentos de padrões para quantificar os fatores de confiança.

Destaca-se a proposta de utilização de agentes de software para formação dos históricos comportamentais e resolução de problemas conhecidos. A linguagem de programação usada no desenvolvimento dos agentes permite ainda que o mecanismo seja reutilizado em outros ambientes. No entanto a utilização de Cookies é o fator limitante ao desempenho do mecanismo.

Page 23: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

Conclusões e trabalhos futuros

Outra importante contribuição é o procedimento proposto para quantificar os fatores de confiança. Abordagens foram investigadas e aplicadas ao cálculo de confiança.

O valor mínimo de confiança foi estabelecido para cada usuário.

Trabalhos em andamento incluem: a definição de um conjunto de diretrizes e a definição de quando a avaliação comportamental pode ser utilizada.

Page 24: Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

Perguntas?