56
Heitor Fernandes Credidio Padr˜ oes Estat´ ısticos do Movimento Ocular na Busca Visual Fortaleza – CE 2012

Padroes Estat´ısticos do Movimento Ocular na Busca Visualrepositorio.ufc.br/bitstream/riufc/13665/1/2012_dis_hfcredidio.pdf · que roupas as pessoas estavam vestindo. Em (g) que

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Heitor Fernandes Credidio

Padroes Estatısticos do Movimento Ocular

na Busca Visual

Fortaleza – CE

2012

Heitor Fernandes Credidio

Padroes Estatısticos do Movimento Ocular

na Busca Visual

Dissertacao de Mestrado apresentada ao De-partamento de Fısica da Universidade Fede-ral do Ceara, como parte dos requisitos paraa obtencao do Tıtulo de Mestre em Fısica.

Orientador:

Prof. Dr. Jose Soares de Andrade Jr.

Mestrado em Fısica

Departamento de Fısica

Centro de Ciencias

Universidade Federal do Ceara

Fortaleza – CE

2012

Dissertacao de Mestrado sob o tıtulo “Padroes Estatısticos do Movimento Ocular na

Busca Visual”, defendida por Heitor Fernandes Credidio e aprovada em 29 de Fevereiro

de 2012, em Fortaleza, Ceara, pela banca examinadora constituıda pelos doutores:

Prof. Dr. Jose Soares de Andrade Jr.Departamento de Fısica – UFC

Orientador

Prof. Dr. Andre Auto MoreiraDepartamento de Fısica – UFC

Prof. Dr. Liacir dos Santos LucenaDepartamento de Fısica – UFRN

Agradecimentos

Agradeco a todos os amigos e mentores sem os quais este trabalho jamais pronto: meuorientador Prof. Jose Soares de Andrade Jr., co-orientador Prof. Andre Auto Moreira,Elisangela Teixeira e Saulo-Davi Soares e Reis. Tambem agradeco a todos os estudantesdo Departamento de Fısica da Universidade Federal do Ceara que tiveram a pacienciade participar de nossos testes, assim como meus colegas que serviram de cobaia para aelaboracao desses testes. E tambem ao CNPq, CAPES e FUNCAP pelo apoio financeiro.

Resumo

Desde o trabalho pioneiro de Javal em 1879 sobre a leitura (E. Javal, 2010), o movi-mento ocular tem sido objeto de intensa pesquisa como uma forma de elucidar os meca-nismos internos de processos cognitivos que estao intimamente relacionados com a visao(A. L. Yarbus, 1967). Entre outras, uma tarefa cognitiva que e muito importante paranossa vida cotidiana e a de buscas visuais por objetos escondidos. Na presente disserta-cao, nos investigamos atraves de experimentos de rastreamento ocular, as propriedadesestatısticas associadas a busca por alvos escondidos em imagens em meio a diversos distra-tores. Nossos resultados mostram que o processo dual de movimento ocular, composto porsequencias de saltos pequenos (fixacoes) intercalados com saltos grandes menos frequentes(sacadas), apresenta assinaturas estatısticas caracterısticas. Mais precisamente, enquantoos saltos sacadicos seguem uma distribuicao log-normal de distancias, que e tıpica de pro-cessos multiplicativos, os comprimentos r dos saltos menores das trajetorias de fixacaosao consistentes com uma distribuicao em lei de potencia, P (r) ∼ r−α, onde α ≈ 3.1.Nossos achados corroboram elementos de complexidade anteriormente observados parabuscas visuais como uma tarefa cognitiva.

Abstract

Since the pioneering work of Emile Javal about reading in 1879 (E. Javal, 2010),the movement of the eyes has been the subject of intensive research as a way to elucidateinner mechanisms of cognitive processes that are closely related with vision (A. L. Yarbus,1967). Among others, a cognitive task that is rather frequent in our daily life is thevisual search of hidden objects. Here we investigate through eye-tracker experiments, thestatistical properties associated with the search of target images embedded in a landscapeof distractors. Our results show that the twofold process of eye movement, composedof sequences of small jumps (fixation) intercalated by fewer longer jumps (saccades),displays characteristic statistical signatures. More precisely, while the saccadic jumpsfollow a lognormal distribution of distances, which is typical of multiplicative processes,the lengths r of the smaller steps in the fixation trajectories are consistent with a power-law distribution, P (r) ∼ r−α, where α ≈ 3.1. Our findings corroborate previous complexbehaviour attributes observed for visual searching as a cognitive task.

Sumario

Lista de Figuras

Lista de Tabelas

1 Introducao p. 13

1.1 Processos Cognitivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 13

1.1.1 A Ciencia Cognitiva . . . . . . . . . . . . . . . . . . . . . . . . . p. 13

1.1.2 O Que e Cognicao? . . . . . . . . . . . . . . . . . . . . . . . . . . p. 14

1.1.3 Dois Sistemas Cognitivos . . . . . . . . . . . . . . . . . . . . . . . p. 16

1.2 Componentes vs. Interacao . . . . . . . . . . . . . . . . . . . . . . . . . . p. 17

1.3 Movimento Ocular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 18

1.4 Buscas Aleatorias e Buscas Visuais . . . . . . . . . . . . . . . . . . . . . p. 22

1.4.1 Voos de Levy e Buscas Aleatorias . . . . . . . . . . . . . . . . . . p. 23

1.4.2 Buscas Visuais . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 24

2 Metodologia p. 26

2.1 Equipamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 26

2.2 Testes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 28

2.3 Filtro de Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 30

3 Resultados p. 33

3.1 Busca 52 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 36

3.2 Wally . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 38

4 Conclusoes p. 42

Apendice A -- Conceitos de Estatıstica p. 44

A.1 Probabilidade e Distribuicao de Probabilidade . . . . . . . . . . . . . . . p. 45

A.2 Media e Variancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 46

A.3 Algumas Distribuicoes Importantes . . . . . . . . . . . . . . . . . . . . . p. 47

A.3.1 Distribuicao Gaussiana ou Normal . . . . . . . . . . . . . . . . . p. 47

A.3.2 Distribuicao Log-Normal . . . . . . . . . . . . . . . . . . . . . . . p. 47

A.3.3 Distribuicao de Pareto ou Lei de Potencia . . . . . . . . . . . . . p. 48

A.4 Histogramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 49

A.5 Estimacao de Parametros . . . . . . . . . . . . . . . . . . . . . . . . . . p. 50

Referencias Bibliograficas p. 52

Lista de Figuras

1.1 Capa do “Report of the State of the Art Committee to the Advisors

of the Alfred P. Sloan Foundation” mostrando as disciplinas comumente

incluıdas no contexto da ciencia cognitiva. . . . . . . . . . . . . . . . . . p. 14

1.2 Ilusao de Muller-Lyer. A linha horizontal de cima aparenta ser maior do

que a de baixo, embora ambas sejam do mesmo tamanho. . . . . . . . . p. 18

1.3 Experimento realizado por Yarbus (19) ao pedir para que os participantes

observassem a imagem“Um Visitante Inesperado”de Ilya Repin (a). Em

(b) mostra-se o movimento ocular realizado ao permitir que o participante

fizesse uma inspecao livre da imagem. Em (c) pediu-se que o participante

estimasse a condicao financeira da famılia. Em (d) pediu-se que estimasse

a idade das pessoas. Em (e) pediu-se que estimasse o que estava fazendo

a famılia antes da chegada do visitante. Em (f) que tentasse se lembrar

que roupas as pessoas estavam vestindo. Em (g) que tentasse se lembrar

a posicao dos objetos na sala. Em (h) que estimasse ha quanto tempo

a famılia nao via o visitante. A diferenciacao do padrao do olhar indica

que o movimento ocular varia de acordo com os objetivos cognitivos do

observador. Retirado de (19). . . . . . . . . . . . . . . . . . . . . . . . . p. 19

1.4 Grafico mostrando a coordenada x do olhar de um participante capturada

a 60 Hz realizando uma busca visual. Nele ficam claros os perıodos de

fixacao e sacadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 20

1.5 Grafico de captura de alta frequencia de duas sacadas (1000 Hz) realiza-

das por um indivıduo durante um exercıcio de leitura. Nele se ve que,

embora razoavelmente suave, a transicao entre sacada e fixacao nao e

clara. Deubel (21) sugere que o fim da sacada seja considerado nas ime-

diacoes dos pontos de maximo, localizados aproximadamente em 36 ms

e 118 ms. Retirado de (20, p. 31). . . . . . . . . . . . . . . . . . . . . . p. 21

1.6 Grafico mostrando as coordenadas x e y do olhar de um dos nossos par-

ticipante capturadas a 60 Hz durante uma fixacao de aproximadamente

70 ms onde pode se detectar uma sacada nula, isto e, uma sacada que

nao resulta em deslocamento do olhar, normalmente devido a movimen-

tos involuntarios do olho. . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 21

1.7 Grafico mostrando as coordenadas x e y do movimento do olho esquerdo

de um observador com gravacao a 500 Hz. Em destaque, os movimentos

de deriva, tremor e microssacadas. Na curva da coordenada x, uma vari-

acao para cima significa um deslocamento para a direta e uma variacao

para baixo significa um deslocamento para a esquerda. Retirado de (22). p. 22

2.1 Tobii T120 rastreador ocular da Universidade Federal do Ceara, o equi-

pamento de rastreamento ocular utilizado nos testes deste trabalho. . . . p. 28

2.2 Exemplo de estımulos utilizados no teste Busca 52 para o nıvel de difi-

culdade 0 (direita), 1 (centro) e 2(esquerda). . . . . . . . . . . . . . . . p. 29

2.3 Exemplo de estımulo utilizado no teste Wally com o detalhe mostrando

o alvo a ser encontrado pelos participantes. Reproduzido com permissao

de Walker Books Ldt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 30

2.4 Imagem ilustrando os diversos passos do filtro de Olsson. (a) Os dados

crus representando a trajetoria do olhar do participante com posicoes

capturadas a cada 17 ms. (b) Os agregados encontrados apos identifica-

dos os picos (mostrados em destaque). (c) A mediana de cada agregado.

(d) As fixacoes e sacadas finais. . . . . . . . . . . . . . . . . . . . . . . . p. 32

3.1 Exemplo do padrao de busca obtido no teste Busca 52 para os tres nı-

veis de dificuldade: facil (superior), medio (centro) e difıcil (inferior).

Percebe-se que a medida que a dificuldade aumenta, a busca se torna

menos sistematica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 34

3.2 Exemplo de padrao de busca obtido no teste Wally em uma imagem onde

havia um alvo (a imagem original era em cores, mostrada aqui em preto e

branco para facilitar a visualizacao da trajetoria do olhar). O cırculo na

imagem superior mostra o local do alvo. A imagem inferior e um detalhe

da imagem superior nas vizinhancas do alvo (mostrado em cores), onde

o padrao complexo da trajetoria do olhar pode ser melhor observado. . . p. 35

3.3 Distribuicao de frequencia de saltos (a distancia entre dois pontos de

olhar consecutivos) para os dados crus do teste Busca 52, para varios

participantes nas tres dificuldades. . . . . . . . . . . . . . . . . . . . . . . p. 36

3.4 Distribuicao de frequencia de saltos para os dados crus do teste Busca

52 mediado por todos os participantes validos nas tres dificuldades. O

intervalo sombreado mostra a regiao onde ocorre a superposicao das dis-

tribuicoes de saltos grandes e saltos pequenos. . . . . . . . . . . . . . . p. 37

3.5 Distribuicao de frequencias para o saltos fixacionais (esquerda) e saca-

dicos (direita) para as tres dificuldades do teste Busca 52. Nos saltos

sacadicos percebe-se que o maximo da distribuicao diminui a medida que

a dificuldade aumenta. Isso provavelmente se deve ao fato de que os

distratores ficam mais proximos uns aos outros em dificuldades maiores. . p. 37

3.6 Distribuicao de frequencia de saltos nos dados crus (a distancia entre dois

pontos de olhar consecutivos) para o teste Wally e varios participantes.

O intervalo sombreado mostra a regiao onde ocorre a superposicao das

distribuicoes de saltos grandes e saltos pequenos. . . . . . . . . . . . . . p. 39

3.7 Os graficos apresentam as distribuicoes de saltos fixacionais para diversos

participantes (superior esquerdo), as distribuicoes de saltos que perten-

cem a sacadas (superior direito) e as duas distribuicoes correspondentes

mediadas sobre todos os participantes (inferior). A curva de saltos fixa-

cionais e ajustada por uma lei de potencia, P (r) ∼ r−α, com expoente

α = 3.07 ± 0.01, e a curva dos saltos sacadicos e bem descrita por uma

distribuicao log-normal (Eq. A.14), com parametros µ = 4.44 e σ = 0.83. p. 40

3.8 Distribuicao de frequencias de tempos de fixacao de varios participantes

ajustada por uma curva log-normal, Eq. A.14, com parametros µ = 2.61

e σ = 0.57. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 41

3.9 Distribuicao de frequencias de raios de giracao das fixacoes de varios par-

ticipantes ajustada por uma lei de potencia, P (Rg) ∼ R−βg com expoente

β = 3.12. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 41

A.1 Graficos exemplificando as tres distribuicoes discutidas na Secao A.3 em

escala linear (linha de cima) e logarıtmica para ambos os eixos (linha de

baixo). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 49

A.2 Exemplo de criacao de um histograma de um conjunto de dados yi. (a)

Um conjunto de N = 50 dados criados aleatoriamente. (b) Os intervalos

Bi definidos para a elaboracao do histograma e a quantidade de pontos

Yi contidos em cada um. (c) O histograma final onde a altura f(x) de

cada caixa e Yi/(hN) onde h = 0.5 e a largura de cada intervalo. . . . . . p. 51

Lista de Tabelas

1.1 Caracterısticas dos dois sistemas cognitivos como apresentado por Kah-

neman (10). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 17

2.1 Especificacoes tecnicas do Tobii T120 utilizado nos testes. . . . . . . . . p. 27

2.2 Parametros utilizados no teste Busca 52. . . . . . . . . . . . . . . . . . . p. 29

13

1 Introducao

1.1 Processos Cognitivos

1.1.1 A Ciencia Cognitiva

O que nos tomamos por realidade? Quando tentamos entender o que alguem esta

falando ou lemos uma linha de texto o que o nossos orgaos receptores (neste caso ouvidos

e olhos) fazem e coletar informacao sobre o ambiente. O que o cerebro faz com essas

informacoes, isto e, como essa informacao e processada, e uma incognita que so nas ultimas

decadas tem comecado a ser elucidada. Como explica Neisser:

Tudo o que sabemos sobre a realidade e mediada nao apenas por orgaossensoriais mas tambem por um complexo sistema que interpreta e rein-terpreta as informacoes captadas por eles. [...] O ponto central e quever, ouvir e lembrar sao todos atos de construcao que podem usar maisou menos informacao dependendo das circunstancias. (1)

Neste contexto, a ciencia cognitiva, que tem se desenvolvido na segunda metade do

seculo XX, se propoe a estudar esse aspecto do pensamento humano atraves de recursos

desenvolvidos por uma serie de disciplinas, como a psicologia cognitiva, inteligencia ar-

tificial, linguıstica, filosofia, neurociencia e antropologia (como e evidenciado na capa do

“Report of the State of the Art Committee to the Advisors of the Alfred P. Sloan Founda-

tion” mostrado na Figura 1.1). Sendo uma area intrinsecamente multidisciplinar, e de se

questionar se de fato ha uma ciencia cognitiva ou se ha na verdade uma serie de disciplinas

estudando um mesmo assunto, cada uma com sua propria perspectiva. Embora nao haja

ainda um paradigma comum de pesquisa (2), ha tentativas de se definir o que compoe um

trabalho em processos cognitivos. Segundo Miller et al. (3) trata-se de uma area que diz

respeito a inteligencia, que se utiliza de metodos e resultados caracterısticos de pelo me-

nos duas das subdisciplinas citadas. Em outras palavras, nao ha vınculos impostos sobre

como processos cognitivos devam ser teorizados, desde que a pesquisa seja devidamente

interdisciplinar.

1.1 Processos Cognitivos 14

Figura 1.1: Capa do “Report of the State of the Art Committee to the Advisors of theAlfred P. Sloan Foundation” mostrando as disciplinas comumente incluıdas no contextoda ciencia cognitiva.

1.1.2 O Que e Cognicao?

Sendo a ciencia cognitiva uma area de estudos tao descentralizada, e de se esperar que

a propria definicao de cognicao seja um tanto vaga. Felizmente uma definicao mesmo que

superficial, e suficiente para despertar interesse em pesquisa sobre a natureza do assunto.

Cecilia Heyes (4) define cognicao como entidades teoricas que fornecem uma caracte-

rizacao funcional do sistema nervoso central. A cognicao pode ou nao ser foco de atencao

consciente, recebe inputs de outros processos cognitivos e de orgaos perceptores e fornece

output para outros processos e para o comportamento.

O que diferencia a cognicao de outros objetos de estudo da psicologia ou neurociencia

e que ela nao pode ser observada diretamente, ao contrario de tecidos cerebrais ou formas

de comportamento. Hipoteses sobre cognicao so podem ser testadas atraves de predicoes

no que dizem respeito a variacoes no comportamento ou manipulacoes do ambiente. Como

resume Chomsky (5), para entender a mente humana, e preciso considerar o que ha por

tras do comportamento e nos perguntar que tipo de regras ou processos governam os

comportamentos que observamos.

Uma vez definido, mesmo que tentativamente o que e cognicao, o proximo passo seria

desenvolver um arcabouco teorico sobre como realizar seu estudo. Como foi mencionado

na secao anterior, normalmente cada subdisciplina aborda o problema a sua maneira, mas

isso nao quer dizer que nao haja elementos comuns ao estudo dos processos cognitivos.

Von Eckardt (6) cita as seguintes suposicoes normalmente feitas no estudo dos processos

cognitivos, sobre as quais faremos algumas consideracoes adicionais:

1. Supoe-se que as capacidades cognitivas podem ser particionadas de forma que cada

1.1 Processos Cognitivos 15

uma delas pode ser estudada isoladamente.

Inicialmente essa hipotese parece nao se sustentar. E difıcil imaginar, por exemplo,

separar um processo de leitura de um de memoria. Entretanto evidencias experimentais

indicam que processos que aparentam ser intimamente relacionados, sao na verdade in-

dependentes, como sao os casos de afasia pura (7), onde pacientes perdem a capacidade

de ler sem perder a capacidade de escrever (ou vice-versa) apos sofrerem danos cerebrais.

Como dividir os processos cognitivos, entretanto, e uma questao empırica.

2. A ciencia cognitiva tende a se focar no indivıduo e a diminuir a importancia dos

papeis da cultura e sociedade.

3. Supoe-se que as capacidades cognitivas podem ser estudadas independentemente de

capacidades nao cognitivas.

Essas suposicoes permitem que seja possıvel estudar a cognicao independentemente

do contexto social e de outros aspectos da mente, pelo menos ate certo ponto. Caso seja

necessaria, as influencias da cultura e da sociedade podem ser incluıdas supondo que sao

mediadas pela percepcao individual.

4. Supoe-se que e util e significativo distinguir cognicao “normal” de “anormal”.

5. Supoe-se que adultos sao suficientemente semelhantes ao ponto de se poder falar

de um “cognitor tıpico”, e fazer generalizacoes ignorando diferencas individuais.

A adocao de um padrao de cognicao nao e uma opcao trivial, embora importante,

principalmente quando se trata de estudar processos cognitivos atraves da observacao de

diversos indivıduos. Essas suposicoes sao especialmente importantes para este trabalho.

6. Respostas a perguntas empıricas podem ser dadas em termos de processamento de

informacao.

Essa suposicao se apoia em evidencias bem suportadas de que para cada processo

cognitivo, ha um componente de processamento de informacao subjacente que o realiza

e, consequentemente, o explica.

7. Respostas a perguntas empıricas devem ser justificadas com bases empıricas.

Sem uma base teorica concisa, esta setima proposicao e uma forma de assegurar

que resultados da ciencia cognitiva possam ser efetivamente uteis para todas as suas

subdisciplinas.

8. Respostas a perguntas empıricas devem ser vinculadas a achados da neurociencia.

1.1 Processos Cognitivos 16

Von Eckardt (6) argumenta que se os cientistas se limitarem a utilizar dados psico-

logicos para testar suas hipoteses, essas hipoteses seriam extremamente subrestringidas.

A neurociencia, sendo uma area de estudo da estrutura neural de baixo nıvel, fornece

uma possıvel solucao para esse problema. Ha ceticismo quanto a possibilidade de se re-

duzir modelos de processamento de informacao a modelos neurais (8), porem mesmo que

uma relacao detalhada nunca seja encontrada, ha achados da neurociencia que a ciencia

cognitiva pode utilizar.

1.1.3 Dois Sistemas Cognitivos

Antes de analisarmos mais profundamente um processo cognitivo, e interessante estu-

darmos um aspecto interessante que tem tomado forma nas ultimas duas decadas, embora

se baseie em nocoes que ja tem mais de um seculo (9). Trata-se da nocao de que o ra-

ciocınio humano divide-se em dois sistemas distintos, chamados Sistemas 1 e 2 (tambem

chamados Sistemas Associativo e Regrado (9), Intuicao e Razao (10) ou Experimental e

Racional (11), entre outros (12)).

Para introduzir a nocao de cognicao de dois sistemas tente responder o mais rapido

possıvel as duas perguntas que seguem.

Qual das imagens abaixo representa um rosto feliz?

Agora tente identificar qual das expressoes matematicas abaixo e igual a 417.

√121× 14 + 201

√144× 10 + 301

√81× 15 + 282

A maioria das pessoas deve ser capaz de responder a primeira pergunta corretamente

sem precisar de muito esforco ou raciocınio logico. Nao e sequer necessario analisar cada

uma das imagens individualmente. O mesmo nao pode ser dito sobre a segunda pergunta.

Mesmo que um indivıduo seja muito talentoso em matematica, ele levara um tempo consi-

deravelmente maior para resolver as contas, mesmo que com a ajuda de uma calculadora.

Isso porque e necessario analisar cada uma das expressoes individualmente, sempre se

lembrando das regras de soma e multiplicacao que se aprende na escola e as aplicando

para os valores dados.

1.2 Componentes vs. Interacao 17

A primeira pergunta e um exemplo tıpico do Sistema 1, que e caracterizado por ope-

racoes que sao realizadas de forma rapida e automatica, requerem pouca atencao e podem

ser realizadas em paralelo com outras tarefas. O seu meio de operacao e normalmente

atraves de associacao com outras experiencias pessoais do indivıduo.

A segunda diz respeito ao Sistema 2, que e lento e sistematico. Ele e normalmente

realizado de forma serial e normalmente opera atraves da manipulacao de sımbolos apren-

didos atraves da linguagem e cultura.

Os dois sistemas podem ser resumidos pela dicotomia percepcao-conhecimento. A

percepcao e a informacao recebida pelos orgaos receptores (olhos, ouvidos, etc) que e

rapidamente processadas pelo cerebro baseando-se em experiencias semelhantes. Conhe-

cimento e um conjunto de regras ja assimiladas aplicado a uma analise delicada das

mesmas informacoes. O fato de que percepcao e conhecimento sao oriundos de dois siste-

mas distintos e independentes, pode ser ilustrada pela ilusao de Muller-Lyer (Figura 1.2).

Nela a percepcao nos induz a pensar que as linhas horizontais sao de tamanhos distintos.

Uma analise cuidadosa (com o auxılio de uma regua, talvez) mostra que ambas possuem

o mesmo tamanho. Porem mesmo sabendo que as linhas tem o mesmo tamanho, isso nao

tem algum efeito sobre a percepcao, que continua a nos dar a impressao de que as linhas

tem tamanhos diferentes. Um resumo das principais caracterıstica de cada sistema pode

ser visto na Tabela 1.1.

1.2 Componentes vs. Interacao

Cientistas cognitivos normalmente se focam em identificar as componentes da cog-

nicao. A cognicao visual, por exemplo, e dividida em uma componente de atencao, de

identificacao de caracterısticas, de reconhecimento, de integracao, entre outros (13). A

Sistema 1 Sistema 2

Rapido LentoParalelo SerialAutomatico ControladoSem Esforco EsforcosoAssociativo RegradoAprendizado Lento FlexıvelEmocional Racional

Tabela 1.1: Caracterısticas dos dois sistemas cognitivos como apresentado por Kahneman(10).

1.3 Movimento Ocular 18

Figura 1.2: Ilusao de Muller-Lyer. A linha horizontal de cima aparenta ser maior do quea de baixo, embora ambas sejam do mesmo tamanho.

informacao e processada por cada componente e passada para as seguintes, de forma que

o tempo levado para realizar uma tarefa cognitiva e resultado do tempo necessario para

realizar esse processamento. Recentes estudos sobre a natureza complexa dos processos

cognitivos (14) geraram interesse no estudo da interacao desses processos. O foco desses

estudos e determinar se o que domina o comportamento cognitivo sao as componentes em

si ou se sao as interacoes entre as componentes.

O argumento mais comumente utilizado e que processos dominados pelas interacoes

tendem a apresentar distribuicoes de frequencia que reflitam efeitos multiplicativos, como

log-normais e leis de potencia, enquanto processos dominados pelas componentes reflitam

uma natureza aditiva, aparecendo na forma de distribuicoes normais (15). Na ultima

decadas, diversos trabalhos apresentam evidencias de que, de fato, interacoes dominam

varias formas de cognicao (16, 17).

1.3 Movimento Ocular

Como foi dito na Secao 1.1.2, processos cognitivos, como a percepcao visual, nao

podem ser observados diretamente. Para estuda-los e preciso observar sua influencia no

comportamento de um indivıduo. A forma mais evidente de se estudar fenomenos relativos

a percepcao visual e observando o movimento ocular de um indivıduo. No passado, tal

investigacao era inviavel devido a limitacao tecnologica, ja que os movimentos oculares

sao rapidos demais para serem observados a olho nu. Isso nao impediu que de fato alguns

estudos importantes fossem realizados. Emile Javal (18) foi o primeiro a observar que o

movimento ocular e composto de momentos aproximadamente estacionarios seguidos por

saltos rapidos, chamados fixacoes e sacadas, respectivamente.

1.3 Movimento Ocular 19

(a) (b) (c)

(d) (e) (f)

(h)(g)

Figura 1.3: Experimento realizado por Yarbus (19) ao pedir para que os participantesobservassem a imagem “Um Visitante Inesperado” de Ilya Repin (a). Em (b) mostra-se omovimento ocular realizado ao permitir que o participante fizesse uma inspecao livre daimagem. Em (c) pediu-se que o participante estimasse a condicao financeira da famılia.Em (d) pediu-se que estimasse a idade das pessoas. Em (e) pediu-se que estimasse o queestava fazendo a famılia antes da chegada do visitante. Em (f) que tentasse se lembrarque roupas as pessoas estavam vestindo. Em (g) que tentasse se lembrar a posicao dosobjetos na sala. Em (h) que estimasse ha quanto tempo a famılia nao via o visitante. Adiferenciacao do padrao do olhar indica que o movimento ocular varia de acordo com osobjetivos cognitivos do observador. Retirado de (19).

Em 1969, Yarbus (19) publicou seu trabalho seminal sobre movimento ocular, onde

mostrava que o movimento do olhar de um indivıduo varia de acordo com o seu objetivo

cognitivo (um exemplo dos testes realizados por ele e mostrado na Figura 1.3).

Ao longo das decadas seguintes, a analise de movimentos oculares tornou-se ampla-

mente utilizada no estudo da cognicao visual. Entretanto, ainda hoje nao ha consenso no

que diz respeito a forma como as grandezas oculomotoras devem ser medidas, sendo que

muitos trabalhos ja foram feitos tentando solucionar esse problema (para uma revisao veja

(20, c. 2)). Felizmente a definicao e a forma de extracao de sacadas e fixacoes a partir

de dados crus permite um certo grau de liberdade, como veremos no Capıtulo 2 desta

dissertacao.

Em princıpio, observando o olhar de um indivıduo como mostra a Figura 1.4, parece

1.3 Movimento Ocular 20

50 100 150 200

Tempo (ms)

800

850

900

950

1000

Posi

ção d

o O

lhar

(px)

Fixação

Sacada

Figura 1.4: Grafico mostrando a coordenada x do olhar de um participante capturada a60 Hz realizando uma busca visual. Nele ficam claros os perıodos de fixacao e sacadas.

haver pouca ambiguidade quanto a identificacao de fixacoes e sacadas. Estudos de captura

de alta frequencia, entretanto, mostram que a transicao sacada-fixacao nao e tao trivial

(21), como mostra a Figura 1.5. Outro fator importante e identificar quando uma sacada

possui alguma funcionalidade. Ainda na Figura 1.5, notamos que a segunda sacada e

muito pequena, deixando duvidas quanto a necessidade de considera-la para a extracao

de informacao util.

Outro movimento digno de atencao sao as chamadas sacadas nulas. Elas sao movi-

mentos rapidos que, como mostrado na Figura 1.6, nao resultam na realocacao do olhar.

Assim como no caso das sacadas pequenas, nao ha meios confiaveis de determinar se uma

sacada nula constitui um evento funcional ou se e apenas um reflexo de irregularidades

oculomotoras. Na maior parte dos casos ela e considerada como parte da fixacao.

Alem disso, ha os movimentos oculares fixacionais, isso e, os movimentos oculares

que ocorrem durante as fixacoes e que possuem suas proprias particularidades. Eles sao

em geral divididos em movimentos de tremor, deriva e microssacadas (22). A Figura 1.7

mostra um exemplo. As microssacadas em particular vem sendo alvo de muita atencao

dos pesquisadores devido a aparente importancia destes eventos no controle das fixacoes

(23, 24).

De forma geral, e necessario estimar os dados de fixacao e sacadas a partir de dados

1.3 Movimento Ocular 21

Tempo (ms)Tempo (ms)

Posi

ção d

o O

lhar

(un. arb

itrá

rias)

Figura 1.5: Grafico de captura de alta frequencia de duas sacadas (1000 Hz) realizadas porum indivıduo durante um exercıcio de leitura. Nele se ve que, embora razoavelmente suave,a transicao entre sacada e fixacao nao e clara. Deubel (21) sugere que o fim da sacadaseja considerado nas imediacoes dos pontos de maximo, localizados aproximadamente em36 ms e 118 ms. Retirado de (20, p. 31).

1100 1120 1140 1160 1180 1200

Tempo (ms)

800

900

1000

1100

1200

lhar

(px)

Sacada Nula

Coordenada XCoordenada Y

Figura 1.6: Grafico mostrando as coordenadas x e y do olhar de um dos nossos partici-pante capturadas a 60 Hz durante uma fixacao de aproximadamente 70 ms onde pode sedetectar uma sacada nula, isto e, uma sacada que nao resulta em deslocamento do olhar,normalmente devido a movimentos involuntarios do olho.

1.4 Buscas Aleatorias e Buscas Visuais 22

Tremor

Deriva

Microssacada

Tempo (ms)

Posi

ção (

gra

us)

Coord. X

Coord. Y

Figura 1.7: Grafico mostrando as coordenadas x e y do movimento do olho esquerdo deum observador com gravacao a 500 Hz. Em destaque, os movimentos de deriva, tremor emicrossacadas. Na curva da coordenada x, uma variacao para cima significa um desloca-mento para a direta e uma variacao para baixo significa um deslocamento para a esquerda.Retirado de (22).

crus fornecidos pelos equipamentos de medicao. Na realidade o olhar de um indivıduo

nunca fica realmente estatico, como fica claro observando as Figuras 1.3-1.6. Para obter

os dados passıveis de processamento e analise e preciso passar os dados crus por um filtro

de dados. Ha atualmente uma variedade de filtros disponıveis e a escolha e normalmente

flexıvel, havendo filtros para propositos gerais e especıficos, por exemplo, para leitura

(25). Mesmo escolhendo-se o filtro apropriado para o tipo de tarefa realizada, ainda

resta a tarefa de determinar os parametros do filtro. De forma geral, filtros de dados

de movimento ocular possuem um ou dois parametros livres. Usualmente eles devem ser

escolhidos de forma a evitar fixacoes sem relevancia funcional para o processo estudado. A

escolha de parametro pode variar muito, por exemplo, eliminando-se fixacoes com menos

de 50ms (26), 100ms (27) e ate 140mns (28). A escolha de parametro corretos e crucial

mesmo que nao haja estudos comparativos para os diversos valores (20).

1.4 Buscas Aleatorias e Buscas Visuais

Buscas aleatorias vem sendo intensamente estudadas devido ao amplo espectro de

aplicacoes, indo desde o estudo do comportamento de predadores (29, 30) ate interacoes

Proteına-DNA (31). Um fator importante presentes nesses estudos e o fato de que todos

envolvem otimizacao de resultados, baseados na crenca de que sistemas naturalmente evo-

1.4 Buscas Aleatorias e Buscas Visuais 23

luıdos tendem a apresentar boa eficiencia ou, pelo menos, uma boa relacao entre eficiencia

e robustez (32). Uma estrategia de busca muito investigada e aquela que pode ser repre-

sentada na forma de voos de Levy, onde o tamanho de cada passo segue uma distribuicao

de probabilidade na forma de uma lei de potencia, P (d) ∝ d−α. Viswanathan et al. (29)

mostraram que, para α = 2.0, o voo possui um maximo de eficiencia.

1.4.1 Voos de Levy e Buscas Aleatorias

No modelo apresentado por Viswanathan et al. (29), um buscador percorre um espaco

preenchido com alvos pontuais uniformemente distribuıdos. O buscador se move para a

posicao do alvo mais proximo dentro do seu raio de visao rv. Caso nao haja alvos dentro

do seu raio de visao, o buscador se move em uma direcao aleatoria por uma distancia que

obedece a uma lei de potencia

P (l) ∝ l−α. (1.1)

Essa distribuicao sera melhor estudada na secao (). Esse tipo de movimento e comumente

chamado Voo de Levy. Enquanto percorre a distancia sorteada de acordo com a Eq.

1.1, o buscador continua procurando o alvo, movendo-se para a posicao do primeiro que

avistar. Seja λ o caminho livre medio do buscador entre dois alvos consecutivos. Para

duas dimensoes esse valor e igual a

λ =1

2rvρ, (1.2)

onde ρ e a densidade de alvos. A distancia media percorrida pelo buscador sera entao,

〈l〉 ≈∫ λ

rvl1−αdl + λ

λl−αdl

rvl−αdl

=

(

α− 1

2− α

)(

λ2−α − r2−αv

r1−αv

)

+λ2−α

r1−αv

(1.3)

Neste ponto, Viswanathan et al. (29) definem a eficiencia de uma busca como

η =1

〈l〉N , (1.4)

onde N e o numero medio de passos dados entre dois alvos consecutivos. Para buscas

destrutivas, isto e, buscas onde cada alvo so pode ser visitado uma vez, obtemos,

Nd ≈ (λ/rv)α−1, (1.5)

e para buscas nao-destrutivas,

Nn ≈ (λ/rv)(α−1)/2. (1.6)

1.4 Buscas Aleatorias e Buscas Visuais 24

Supondo-se que os alvos sao esparsamente distribuıdos, isto e, λ ≫ rv, e substituindo

a Eqs. 1.3 e 1.5 em 1.4, encontra-se que nao ha maximo de eficiencia para o caso de

busca destrutiva, e a busca e tao eficiente quanto menor for α. Para o caso da busca nao-

destrutiva encontra-se, substituindo as Eqs. 1.3 e 1.6 em 1.4, que a eficiencia e maxima

para

αopt = 2 +1

log (λ/rv). (1.7)

Assim, dado que a densidade de alvos seja suficientemente baixa, o expoente otimo para

a busca deve ser αopt = 2.

Benichou et al. (31) apresentam um modelo que aparenta estar mais em sintonia com

o que se conhece sobre o movimento ocular. Nele, o processo de busca e dividido em duas

fases: uma difusiva que corresponde a uma fase perceptiva, onde o buscador e capaz de

encontrar o alvo, e uma balıstica, que corresponde a um processo de realocacao, onde

o observador e incapaz de encontrar o alvo. Neste trabalho, argumenta-se que buscas

intermitentes sao mais eficientes que voos de Levy.

1.4.2 Buscas Visuais

No contexto de busca visuais, durante muito tempo o foco de pesquisa nessa area foi

o de atencao visual encoberta, isto e, a de mudanca do foco de atencao sem movimentos

oculares (20, c. 13). Um dos trabalho mais importantes dessa area foi realizado por

Treisman e Gelade (33), que foram capazes de distinguir processos paralelos e seriais em

processos de busca. Enquanto algumas tarefas de busca parecem faceis, outras podem ser

muito dispendiosas. E muito mais facil, por exemplo, achar um alvo vermelho quando

nao ha outro alvo vermelho entre os distratores, enquanto e muito mais difıcil encontrar

uma linha vertical vermelha no meio de uma multitude de linhas com diversas orientacoes,

vermelhas e verdes. Alem disso, estes autores mostraram que, para buscas do primeiro

tipo, o tempo de busca independe do numero de distratores, indicando a presenca de

um processo de analise em paralelo, onde toda a imagem e analisada de uma unica vez

atraves da atencao visual coberta. Isso ocorre pois e necessario identificar uma unica

caracterıstica do alvo (no caso do exemplo acima, a cor). No segundo caso, quando o alvo

nao e definido por uma unica caracterıstica, mas por um conjunto de caracterısticas (no

caso do exemplo, cor e orientacao), o tempo de busca aumenta linearmente com o numero

de distratores. A teoria recebeu o nome de Teoria de Integracao de Informacao (Feature

Integration Theory no original). O cerebro humano e capaz de identificar caracterısticas

paralelamente, mas so e capaz de integrar diferentes caracterısticas serialmente. Nesse

1.4 Buscas Aleatorias e Buscas Visuais 25

arcabouco, o movimento ocular propriamente dito nao possui nenhum papel. Isso porque

a atencao pode ser relocada mais rapidamente atraves de um processo atentivo coberto.

Atualmente a Teoria de Integracao de Informacao e considerada como um ponto de partida

para tratamentos mais elaborados sobre busca visual, pois trata-se de um modelo muito

simplificado (34).

Para que possamos introduzir um modelo de busca visual onde o movimento ocular

possui um papel central, e preciso entender como o olho e capaz de capturar informacao.

Ao contrario do que normalmente se pensa, nao somos capazes de analisar toda a imagem

captada pela retina para uma analise extensiva. Na verdade, somos capazes de analisar

apenas uma pequena area, chamada fovea, que se resume a area dentro de 2◦ a partir do

ponto de fixacao. Fora dela, a acuidade visual decai rapidamente (35). A consequencia

disso e que, em algumas situacoes, um alvo nao sera identificado ate que esteja dentro

de uma area centrada na fovea. Essa area e chamada regiao de conspicuidade (36). O

tamanho da regiao de conspicuidade pode variar de acordo com uma serie de parametros.

Alem disso sabe-se que se a area onde pode estar o alvo for maior do que a zona de

conspicuidade, movimentos oculares serao essenciais para trazer o alvo de volta a zona de

conspicuidade. E de se esperar, portanto, que o tamanho das sacadas esteja relacionado

com o tamanho da zona de conspicuidade, embora essa hipotese tenha sido pouco testada

(37).

26

2 Metodologia

2.1 Equipamento

Para testar nossas hipoteses, foram elaborados dois testes envolvendo buscas aleato-

rias. Para a realizacao dos testes utilizamos um equipamento de rastreamento ocular. O

modelo utilizado foi o Tobii T120 da companhia sueca Tobbi Technology. O equipamento

e composto por uma tela TFT LCD de 17” com resolucao maxima de 1280× 1024 pixels

onde sao exibidos os estımulos do teste (ver Figura 2.1). Este equipamento tem taxa de

captura de de 60Hz ou 120Hz, ou seja, pode capturar a posicao do olhar do participante

a cada 17ms ou 8ms, respectivamente. O rastreador ocular tambem e capaz de compen-

sar movimentos de cabeca, piscadas e outras fontes de ruıdo que normalmente alteram a

medida. Outras especificacoes tecnicas importantes do Tobii T120 sao as seguintes:

• Precisao: e definida como a diferenca media entre a posicao do olhar medido pelo

rastreador ocular e a posicao real. No equipamento T120, o valor e de 0.5◦;

• Deriva: e a mudanca na precisao devido a mudancas de luminosidade, como quando

se utiliza estımulos de muitas cores diferentes. No T120, a deriva e menor do que

0.2◦;

• Resolucao Espacial: representa a variacao do ponto do olhar entre cada quadro. No

T120 este parametro corresponde a 0.3◦;

• Angulo Maximo: e o angulo maximo entre o olhar do participante e o eixo central

da tela para o qual o equipamento e capaz de capturar a posicao de pelo menos um

dos olhos. No T120 o angulo maximo e de 35◦;

• Latencia: E o tempo medio entre a exibicao do estımulo e o momento em que a

primeira posicao do olhar valida e capturada pelo Eye Tracker. No T120 o tempo

de latencia e de no mınimo 33ms;

2.1 Equipamento 27

Tobii T120

Precisao 0.5◦ Deriva < 0.3◦

Resolucao Espacial 0.3◦ Angulo Maximo 35◦

Taxa de Captura 60Hz ou 120Hz Latencia min. 33msLiberdade de Movi-

mento da Cabeca30× 20× 30 cm

Tempo de Recupe-

racao de Piscadamax. 8ms

Tempo de Recupe-

racao de Rastrea-

mento

∼ 300msErro Devido a Mo-

vimentos da Ca-

beca

0.2◦

Captura Binocular Sim Monitor TFT-LCD 17”, 1280× 1024

Tabela 2.1: Especificacoes tecnicas do Tobii T120 utilizado nos testes.

• Liberdade de Movimento da Cabeca: A regiao onde pelo menos a posicao de um dos

olhos e captado pelo rastreador ocular. No T120 esta regiao e de 30× 20× 30 cm;

• Tempo de Recuperacao de Piscada de Olhos: o tempo medio levado pelo rastreador

ocular para voltar a capturar o olhar apos uma piscada de olhos involuntaria. No

T120 este tempo e de no maximo 8ms;

• Tempo de Recuperacao de Rastreamento: o tempo medio levado pelo Eye Tracker

apos uma interrupcao da captura, como quando o participante move o olhar para

fora da area de captura. No T120 este tempo e de aproximadamente 300ms;

• Erro Devido ao Movimento da Cabeca: e a mudanca na precisao nas bordas da tela

comparado com a precisao no centro. Isso inclui movimentos da cabeca nas tres

dimensoes. No T120 e de 0.2◦.

Um resumo das especificacoes tecnicas do rastreador ocular pode ser visto na tabela

2.1.

Durante os testes, o equipamento utiliza diodos de infravermelho localizados na parte

inferior do aparelho para gerar padroes de reflexao nas corneas do participante. O T120

utiliza duas tecnicas para realizar o rastreamento: A primeira e o metodo de pupila

clara, que emprega um iluminador proximo ao eixo otico do aparelho, fazendo com que

a pupila pareca iluminada (semelhante ao que causa o efeito dos olhos vermelhos em

fotografias). O segundo e o metodo de pupila escura, onde o iluminador e colocado distante

do eixo otico, fazendo a pupila parecer escura. Cada metodo pode ser mais eficiente

dependendo da situacao, sendo que o T120 identifica e utiliza automaticamente a melhor

forma de deteccao. Esses padroes de reflexao, junto com outras informacoes visuais sobre

o indivıduo (como distancia a tela e dilatacao das pupilas), sao coletados por sensores.

2.2 Testes 28

Figura 2.1: Tobii T120 rastreador ocular da Universidade Federal do Ceara, o equipamentode rastreamento ocular utilizado nos testes deste trabalho.

Complexos algoritmos de processamento de imagem identificam as informacoes relevantes

incluindo os padroes de reflexao das corneas, identificando a posicao tridimensional do

globos oculares do participante e finalmente calculando a posicao do olhar.

Antes de cada teste, cada participante passa por um processo de calibracao. Durante

esse processo, e pedido ao participante que fixe o olhar em certos pontos da tela chamados

pontos de calibracao, enquanto varias imagens dos olhos sao coletadas e analisadas. Essa

informacao e aplicada a modelos internos do sistema para gerar as posicoes do olhar

durante o teste. O processo de calibracao utilizado em todos os testes deste trabalho

consiste na apresentacao de nove pontos de calibracao em um fundo simples com apenas

uma cor. Um ponto desliza sobre a tela parando em cada ponto de calibracao e solicita-se

ao participante que acompanhe o movimento do ponto. O procedimento e entao repetido

ate que a calibracao seja considerada satisfatoria. Caso os testes sejam realizados ainda

com uma ma calibracao ao final, os dados do participante sao descartados.

2.2 Testes

No primeiro teste, que denominamos Busca 52, cada participante foi apresentado a

uma serie de imagens compostas por uma rede quadrada preenchida com diversos numeros

2, e escondido entre eles um unico numero 5. Foi pedido ao participante que achasse o

numero 5 na imagem. Esse teste foi adaptado do trabalho de Treisman e Gelade sobre

integracao de elementos em atencao seletiva (33).

As imagens foram dividas em tres grupos dependendo do que denominamos nıvel de

dificuldade. No nıvel de dificuldade 0, a imagem continha uma rede de 16× 13 numeros,

cada um com 76 pixels de lado. No nıvel de dificuldade 1, a imagem continha 33 × 26

2.2 Testes 29

Figura 2.2: Exemplo de estımulos utilizados no teste Busca 52 para o nıvel de dificuldade0 (direita), 1 (centro) e 2(esquerda).

numeros de 38 pixels de lado, e no nıvel de dificuldade 2, havia 35 × 40 numeros de 25

pixels de lado. Exemplos de estımulos podem ser vistos na Figura 2.2. Foi avisado a

cada participante que haveria um tempo limitado para encontrar o alvo em cada imagem,

embora nao tenha sido revelado quanto tempo teriam disponıvel. Na verdade, este tempo

variava de acordo com o nıvel de dificuldade: 1 minuto para o nıvel 0, 1 minuto e 30

segundos para o nıvel 1 e 2 minutos para o nıvel 2. Ao todo 15 imagens foram apresentadas

a cada participante, sendo 8 no nıvel de dificuldade 0, 4 de dificuldade 1, e 3 de dificuldade

2. Um resumo do teste pode ser visto na tabela 2.2.

As cores utilizadas nas imagens e os espacamento entre os numeros foram escolhi-

dos com o intuito diminuir os esfeitos de fadiga ocular durante os testes e evitar que o

participante fosse capaz de encontrar o alvo atraves da identificacao de padroes na visao

periferica.

DificuldadeNumero deImagens

Tamanhoda Rede

Tamanho dosDistratores

TempoDisponıvel

0 8 16× 13 76 px 1min

1 4 33× 26 38 px 1min 30 s2 3 35× 40 25 px 2min

Tabela 2.2: Parametros utilizados no teste Busca 52.

No segundo teste, que denominamos Wally, cada participante foi apresentado a uma

sere de ilustracoes da serie de livros Onde Esta Wally? do ilustrador ingles Martin Hand-

ford (38, 39). Os livros contem ilustracoes grandes, coloridas e extremamente detalhadas

com dezenas de personagens realizando alguma acao em um determinado local (ver exem-

plo na Figura 2.3). O objetivo do participante e encontrar o personagem Wally em meio

aos inumeros distratores da imagem (40).

As imagens foram escolhidas entre as disponıveis de forma que os distratores estives-

2.3 Filtro de Dados 30

sem o mais uniformemente possıvel distribuıdos no campo da ilustracao. Assim como no

teste anterior, cada participante tinha um tempo limitado para achar o alvo, neste caso 2

minutos para cada imagem. Foram exibidas 6 imagens para cada participante, sendo que

em apenas duas delas havia de fato um alvo.

Figura 2.3: Exemplo de estımulo utilizado no teste Wally com o detalhe mostrando o alvoa ser encontrado pelos participantes. Reproduzido com permissao de Walker Books Ldt.

2.3 Filtro de Dados

Um processo importante na analise de dados de testes de rastreamento ocular e a

filtragem dos dados. Como mencionado na Secao 1.3, e importante determinar quais sao

os pontos de fixacao e as sacadas de uma observacao. Devido a presenca de ruıdos e ao

fato de que o olhar de uma pessoa nao permanece fixo em um unico ponto, e necessario

filtrar as posicoes dos olhares afim de extrair as informacoes relevantes. Como veremos

no Capıtulo 3, neste trabalho foi utilizado uma variante do filtro desenvolvido por Olsson

(25), o qual, por completude descreveremos aqui.

O output fornecido pelo Eye Tacker e uma sequencia de pontos si que representam a

posicao do olhar na i -esima medida. Denota-se a real posicao do olhar ti, de forma que o

objetivo do filtro e criar uma estimativa ti o mais proxima possıvel de ti. Para identificar

pontos de fixacao e sacadas na sequencia si, analisa-se a diferenca entre as medias das

amostras dentro de duas janelas moveis, isto e,

mdepoisi =

1

r

r∑

k=1

si−k (2.1)

2.3 Filtro de Dados 31

mantesi =

1

r

r∑

k=1

si+k (2.2)

di =∣

∣m

depoisi −mantes

i

∣, (2.3)

onde r e o tamanho da janela. Quanto maior for o tamanho da janela, menor e o efeito

do ruıdo. A janela no entanto nao deve ser muito longa, pois corremos o risco de agrupar

varias sacadas em um unico intervalo. Pesquisas anteriores indicam que fixacoes duram de

150 a 600 ms (41), entretanto fixacoes mais curtas podem ocorrer ocasionalmente. Olsson

(25) mostrou que fixacoes menores do que 80 ms sao muito raras, portanto uma janela de

5 pontos para medidas a 60 Hz e suficiente para identificar a maioria das fixacoes. Sempre

que uma diferenca di for maior do que um limite h preestabelecido, sera considerada como

um pico. Se houver mais de um pico dentro de uma dada janela, apenas o maior pico e

considerado.

A essa altura, os pontos si estao divididos em agregados separados pelos picos di.

Cada agregado e associado a uma fixacao. Seja ik o ındice do k-esimo pico, neste caso a

k-esima fixacao fk e estimada atraves da mediana dos pontos localizados entre ik e ik+1

fk = mediana(sik , sik+1, sik+2, ..., sik+1). (2.4)

Se houver duas fixacoes consecutivas mais proximas do que um outro limite preestabelecido

D, entao os dois agregados que deram origem as duas fixacoes sao fundidos e uma nova

fixacao e calculada de acordo com a Eq. 2.4.

Uma vez identificadas as fixacoes, as sacadas sao trivialmente definidas como a dis-

tancia entre duas fixacoes. Uma sequencia resumida das etapas que constituem o filtro de

Olsson poderia ser escrita da seguinte forma:

1. Para cada ponto si, calcule di de acordo com as Eqs. 2.1, 2.2 e 2.3;

2. Se di > h, di e um pico;

3. Se houver picos dentro de uma mesma janela, considere apena o pico maior;

4. Os pontos de fixacao fk sao as medianas dos pontos localizados entre dois picos;

5. Caso haja |fk − fk+1| < D, as duas fixacoes sao unidas em uma.

Uma imagem ilustrativa do processo de filtragem proposto por Olsson pode ser vista

na Figura 2.4.

2.3 Filtro de Dados 32

(a) (b)

(c) (d)

Figura 2.4: Imagem ilustrando os diversos passos do filtro de Olsson. (a) Os dados crusrepresentando a trajetoria do olhar do participante com posicoes capturadas a cada 17ms. (b) Os agregados encontrados apos identificados os picos (mostrados em destaque).(c) A mediana de cada agregado. (d) As fixacoes e sacadas finais.

33

3 Resultados

Os teste descritos no capıtulo anterior foram realizados com 10 estudantes saudaveis

com idade media de 23 anos do Departamento de Fısica da Universidade Federal do Ceara.

A trajetoria do olhar de cada participante foi capturada em um Tobii T120 com resolucao

1280×1024 a 60 Hz, ou seja, e obtido um ponto a cada 17 ms. As dimensoes de espaco sao

dadas em pixels, o que para a resolucao utilizada equivale a aproximadamente 0.26 mm.

Exemplos do padrao de busca encontrados podem ser vistos nas Figuras 3.1 e 3.2.

Para extrair uma assinatura estatıstica do movimento do olhar durante uma busca

visual e preciso tratar os dados diferentemente de como os filtros normalmente o fazem.

O filtro de Olsson como descrito na secao 2.3 foi utilizado para separar os pontos em

agregados, cada agregado equivalendo a uma fixacao. Aqui, nao estamos interessados em

calcular a posicao das fixacoes, mas queremos identificar quais pontos do olhar pertencem

a fixacoes e quais pertencem a sacadas, tarefa que o filtro de Olsson nao realizaria com a

precisao desejada. Com esse objetivo, introduzimos neste ponto uma pequena modificacao

no filtro de Olsson. Calculamos inicialmente o raio de giracao de cada agregado de fixacao

na seguinte forma:

R2g =

1

N

N∑

k=1

|rk − r|2 , (3.1)

onde N e o numero de pontos pertencente a um agregado e rk suas posicoes. O centro de

massa de um agregado r e definido como,

r =1

N

N∑

k=1

rk. (3.2)

Quando um ponto esta a menos de um raio de giracao de distancia do centro de massa

do agregado, isto e, quando |rk − r| ≤ Rg, o ponto e considerado como parte da fixacao.

Caso contrario ele e considerado como parte de uma sacada. No caso de uma sacada

nula, todos os pontos envolvidos, mesmo os que se situam alem do raio de giracao, sao

considerados parte da fixacao.

3 Resultados 34

Figura 3.1: Exemplo do padrao de busca obtido no teste Busca 52 para os tres nıveis dedificuldade: facil (superior), medio (centro) e difıcil (inferior). Percebe-se que a medidaque a dificuldade aumenta, a busca se torna menos sistematica.

3 Resultados 35

Figura 3.2: Exemplo de padrao de busca obtido no teste Wally em uma imagem ondehavia um alvo (a imagem original era em cores, mostrada aqui em preto e branco parafacilitar a visualizacao da trajetoria do olhar). O cırculo na imagem superior mostra olocal do alvo. A imagem inferior e um detalhe da imagem superior nas vizinhancas doalvo (mostrado em cores), onde o padrao complexo da trajetoria do olhar pode ser melhorobservado.

3.1 Busca 52 36

3.1 Busca 52

Analisando o padrao de busca obtido no teste Busca 52 (exemplos na Figura 3.1),

percebeu-se que, para os nıveis de dificuldade menores, a maioria dos participante realizava

uma busca sistematica, varrendo a imagem da esquerda para a direita, de cima para

baixo, analisando cada distrator ate achar o alvo. No nıvel de dificuldade mais alto, esse

comportamento e menos comum e buscas aleatoria sao preferidas pelos observadores.

Inicialmente analisamos a distribuicao de frequencia de saltos (a distancia entre dois

pontos de olhar consecutivos) para os tres nıveis de dificuldade. A Figura 3.3 mostra os

resultados obtidos. Nao so foi encontrada uma notavel semelhanca entre participantes

diferentes, mas tambem entre nıveis de dificuldade diferentes. O comportamento geral do

olhar fica mais evidente observando as medias sobre todos os participantes (Figura 3.4).

Percebe-se na regiao de saltos entre 20 px e 100 px uma depressao na curva de frequen-

cia, que supomos indicar a superposicao de duas distribuicoes: uma relativa aos saltos

pequenos pertencentes as fixacoes, e outra correspondente aos saltos maiores referentes as

sacadas. Para testar essa hipotese, aplicamos inicialmente o filtro de Olsson na forma que

foi explicada na Secao 2.3, com o objetivo de identificar quais pontos do olhar pertencem

a fixacoes e a sacadas. No caso do movimento fixacional, calculamos o comprimento de

cada trajetoria que liga duas fixacoes e a respectiva distribuicao de frequencias, ver Figura

3.5.

100

101

102

103

10-6

10-4

10-2

100

100

101

102

103

100

101

102

103

Fre

quên

cia

Tamanho do Salto (px)

Dif. 0 Dif. 1 Dif. 2

Figura 3.3: Distribuicao de frequencia de saltos (a distancia entre dois pontos de olharconsecutivos) para os dados crus do teste Busca 52, para varios participantes nas tresdificuldades.

3.1 Busca 52 37

1 10 100 1000 100001e-08

1e-06

0.0001

0.01

1

Dificuldade 0

Dificuldade 1

Dificuldade 2

Tamanho do Salto (px)

Fre

quên

cia

Figura 3.4: Distribuicao de frequencia de saltos para os dados crus do teste Busca 52mediado por todos os participantes validos nas tres dificuldades. O intervalo sombreadomostra a regiao onde ocorre a superposicao das distribuicoes de saltos grandes e saltospequenos.

101

102

10310

-8

10-6

10-4

10-2

100

Fre

quên

cia

100

101

102

Tamanho do Salto (px)

10-6

10-4

10-2

100

Fre

quên

cia

Dificuldade 0

Dificuldade 1

Dificuldade 2

Dificuldade 0

Dificuldade 1

Dificuldade 2

Tamanho do Salto (px)

Figura 3.5: Distribuicao de frequencias para o saltos fixacionais (esquerda) e sacadicos(direita) para as tres dificuldades do teste Busca 52. Nos saltos sacadicos percebe-se que omaximo da distribuicao diminui a medida que a dificuldade aumenta. Isso provavelmentese deve ao fato de que os distratores ficam mais proximos uns aos outros em dificuldadesmaiores.

3.2 Wally 38

Observamos que a curva de distribuicao para os saltos fixacionais apresenta um com-

portamento tıpico em lei de potencia (Eq. A.15) com um expoente α = 2.87 ± 0.01.

Por sua vez, os movimentos sacadicos sao muito bem descritos por uma distribuicao log-

normal (Eq. A.14) onde µ = 4.81 e σ = 0.82 para a dificuldade 0, µ = 4.59 e σ = 0.85

para a dificuldade 1 e µ = 4.51 e σ = 0.91 para a dificuldade 2. A moda da distribuicao

se desloca para a esquerda a medida que a dificuldade aumenta, refletindo o fato de que

os distratores estao mais proximos, assim e necessario sacadas mais curtas para mudar a

area de busca.

Distribuicoes log-normais sao tıpicas de processos multiplicativos de variaveis indepen-

dentes, e leis de potencia surgem de processos multiplicativos de variaveis interdependentes

(42). A emergencia desse tipo de comportamento em cognicao visual e normalmente atri-

buıda ao fato de que a dinamica dos processos cognitivos e dominada pela interacao entre

os componentes da cognicao (43). A ocorrencia destas distribuicoes ja foi observada em

diversas tarefas cognitivas (16, 17, 44).

3.2 Wally

O mesmo tratamento foi feito para o teste Wally. Observou-se que o tamanho dos

saltos obedece uma distribuicao de frequencias bimodal semelhante ao obtido no teste

Busca 52, como pode ser visto na Figura 3.6.

Aplicando-se o modelo descrito na secao anterior para separar movimentos fixacionais

de sacadicos, obtivemos os resultados mostrados na Figura 3.7, que apresentam compor-

tamento muito semelhante ao teste Busca 52.

Alem disso, analisamos tambem a distribuicao dos tempos de fixacao. No filtro utili-

zado isso equivale ao numero de pontos pertencentes a um agregado (Figura 3.8). Encon-

tramos novamente um padrao log-normal com parametros µ = 2.61 e σ = 0.57.

Tambem analisamos a distribuicao de raios de giracao dos agregados. O comporta-

mento encontrado se assemelha a uma lei de potencia com expoente o que pode indicar

uma correlacao. Sendo os saltos fixacionais da ordem dos raios de giracao, isso indicaria

que os movimentos fixacionais tem como funcao manter o olhar restrito a uma regiao,

possivelmente para extrair informacao detalhada da regiao observada.

3.2 Wally 39

1 10 100 1000 10000

Tamanho do Salto (px)

1e-08

1e-06

0.0001

0.01

1

Fre

qu

ênci

a

Figura 3.6: Distribuicao de frequencia de saltos nos dados crus (a distancia entre doispontos de olhar consecutivos) para o teste Wally e varios participantes. O intervalosombreado mostra a regiao onde ocorre a superposicao das distribuicoes de saltos grandese saltos pequenos.

3.2 Wally 40

Tam. Salto (px)

100

101

102

103

Tamanho do Salto (px)

10-6

10-4

10-2

100

Fre

quên

cia

100

101

102

Tam. Salto (px)

10-6

10-4

10-2

100

Fre

quên

cia

fixações

101

102

103

sacadas

-3.13

Ajuste Lei de Potência

Ajuste Log-Normal

-3.07

Figura 3.7: Os graficos apresentam as distribuicoes de saltos fixacionais para diversos par-ticipantes (superior esquerdo), as distribuicoes de saltos que pertencem a sacadas (superiordireito) e as duas distribuicoes correspondentes mediadas sobre todos os participantes (in-ferior). A curva de saltos fixacionais e ajustada por uma lei de potencia, P (r) ∼ r−α,com expoente α = 3.07 ± 0.01, e a curva dos saltos sacadicos e bem descrita por umadistribuicao log-normal (Eq. A.14), com parametros µ = 4.44 e σ = 0.83.

3.2 Wally 41

10 100

Tempo de Fi ão (passos)1e-06

0.0001

0.01

1

Fre

quên

cia

Ajuste Log-Normal

Dados Experimentais

Figura 3.8: Distribuicao de frequencias de tempos de fixacao de varios participantes ajus-tada por uma curva log-normal, Eq. A.14, com parametros µ = 2.61 e σ = 0.57.

1 10 100 1000

Raio de Giração (px)

1e-05

0.0001

0.001

0.01

0.1

1

Fre

qu

ênci

a

-3.13

Ajuste Lei de Potência

Dados Experimentais

-3.12

Figura 3.9: Distribuicao de frequencias de raios de giracao das fixacoes de varios partici-pantes ajustada por uma lei de potencia, P (Rg) ∼ R−β

g com expoente β = 3.12.

42

4 Conclusoes

Neste trabalho estudamos as principais propriedades estatısticas do movimento ocular

durante uma tarefa de busca visual. Encontramos diversas caracterısticas tıpicas de sis-

temas complexos, como invariancia de escala e presenca de processos multiplicativos, que

ja foram observadas em diversas tarefas cognitivas (43, 45), inclusive em buscas visuais

(46).

No teste Busca 52 vimos que o padrao de busca dos indivıduos muda de acordo com a

complexidade da imagem, sendo que em imagens mais simples (com menos distratores) os

participantes tendem a efetuar buscas sistematicas, enquanto em imagem mais complexas

a busca passa a ser aleatoria. Qual seria a natureza dessa mudanca de comportamento e

de que forma o processo de busca se beneficia dela ainda permanece uma incognita. Alem

disso, achamos que as buscas sistematicas sao indistinguıveis de buscas aleatorias no que

diz respeito a distribuicao de frequencia de saltos.

Encontramos um comportamento bimodal nas distribuicoes de saltos do olhar, re-

fletindo o padrao de fixacoes e sacadas do movimento ocular. Ao usar filtros de dados

para analisar separadamente os dois movimentos, encontramos uma distribuicao em lei de

potencia para os movimentos fixacionais e uma forma log-normal para os movimentos saca-

dicos, indicando que o primeiro provavelmente e o resultado de um processamento serial

de informacao, enquanto o ultimo resulta de processamento em paralelo. Tais resulta-

dos pareceram independentes do participante efetuar uma busca sistematica ou aleatoria,

como foi observado nos dois testes realizados.

Apesar de algumas diferencas individuais, todos os resultados referentes as distri-

buicoes de saltos apresentam uma similaridade notavel entre os participantes. Possıveis

trabalhos futuros podem se dedicar a investigacao do motivo por tras de tamanha uni-

formidade no movimento ocular, possivelmente devido a algum processo de otimizacao,

como ja existe evidencias (47). Tais trabalhos devem ser focados em testes que enfoquem

o tempo levado para achar o alvo, isto e, o tempo de busca, afim de estabelecer uma liga-

4 Conclusoes 43

cao entre o movimento ocular em buscas visuais e os principais modelos ja estabelecidos

de buscas aleatorias.

Por fim, um estudo das propriedades difusivas dos movimentos oculares fixacionais

pode ajudar a elucidar perguntas sobre como se da o controle das fixacoes e como isso

esta ligado a eficiencia de busca visuais, ja que um processo sub-difusivo significaria uma

fixacao mais controlada, embora com uma area de busca mais restrita, enquanto em um

processo super-difusivo ocorreria justamente o contrario.

44

APENDICE A -- Conceitos de Estatıstica

Isaac Newton afirmou em sua obra maxima, Princıpios Matematicos da Filosofia

Natural, que na natureza devem ser entendidas como verdadeiras as conclusoes que se

extraem atraves da inducao geral, ate serem refutadas por um fenomeno qualquer (48).

Esta afirmacao e parte de um conjunto regras desenvolvidas por Newton para guiar o

raciocınio cientıfico, uma formalizacao inicial do que hoje e conhecido como o metodo

cientıfico.

O metodo cientıfico, possui um papel central no desenvolvimento de teorias relacio-

nadas a cognicao humana, assim como em todas as ciencias naturais. Ele e normalmente

divido em quatro estagios: observacao de um fenomeno natural, formulacao de hipoteses

que expliquem esse fenomeno, determinacao de consequencias logicas das hipoteses, e rea-

lizacao de testes com o intuito de observar tais consequencias. Caso elas sejam observadas,

a hipotese e tomada como verdadeira ate que seja observado um fenomeno que contradiga

a hipotese, que e entao rejeitada ou adaptada as novas observacoes.

Os testes de hipoteses, entretanto, raramente fornecem resultados simples na forma

de um ”sim” ou ”nao”. Nossa compreensao da natureza e limitada pelo fato de que o

nosso conhecimento e sempre incompleto, sujeito as imprecisoes das medidas e a outras

limitacoes fısicas (pode-se argumentar, por exemplo, que ha uma infinitude de experimen-

tos capazes de testar uma hipotese, e que a sua veracidade so pode ser definitivamente

atestada com a realizacao de todos eles, o que e impossıvel).

Frente a essa limitacao fundamental foi desenvolvida a inferencia estatıstica, que e o

processo de inferir a veracidade de uma hipotese a partir do nosso conhecimento incom-

pleto da natureza.

A.1 Probabilidade e Distribuicao de Probabilidade 45

A.1 Probabilidade e Distribuicao de Probabilidade

Dado que toda informacao obtida atraves de experimentos e inerentemente incom-

pleta, e possıvel encarar o nosso conhecimento do universo atraves de um arcabouco

probabilıstico, isto e, ao inves de se perguntar se uma hipotese A e verdadeira ou falsa,

e mais viavel se perguntar com que probabilidade, tendo em vista os dados disponıveis,

pode-se dizer que a hipotese A e verdadeira. Para issso nos utilizaremos de conceitos de

probabilidade e estatıstica desenvolvidos ao longo dos seculos.

Suponha que desejamos realizar a medida de uma grandeza que admite valores discre-

tos Yi. Define-se a probabilidade pi associado a cada resultado possıvel como um numero

real que deve obedecer as seguintes propriedades

pi ≥ 0 (A.1)

i

pi = 1, (A.2)

isto e, a probabilidade de um resultado possıvel e sempre maior ou igual a zero, e a soma

das probabilidades de todos os resultados possıveis deve ser igual a unidade.

Pode-se tomar como exemplo um dado comum de seis lados, isto e, Y = {1, 2, 3, 4, 5, 6}.Um dado e considerado justo se ele possui a mesma probabilidade de retornar qualquer

um dos seis valores quando rolado. Usando entao a Eq. A.2, obtem-se que a probabilidade

de o dado rolar qualquer valor e p = 1/6.

No caso de grandezas que admitem valores contınuos ao longo da reta real, uma

probabilidade e atribuıda a todos os intervalos possıveis da reta. Essas probabilidades sao

regida por uma funcao f(x) denominada funcao de densidade de probabilidade. Assim, a

probabilidade de que uma grandeza Y seja encontrada no intervalo [a, b] e dada por

p(Y ∈ [a, b]) =

∫ b

a

f(x)dx. (A.3)

A densidade de probabilidade deve obedecer o equivalente contınuo das propriedades dadas

pelas Eqs. A.1 e A.2,

f(x) ≥ 0 (A.4)∫

−∞

f(x)dx = 1. (A.5)

A partir deste ponto, todos os resultados serao dados tomando que as distribuicoes

de probabilidade sao contınuas.

A.2 Media e Variancia 46

A.2 Media e Variancia

A media e a variancia de uma distribuicao sao informacoes importantes sobre uma

distribuicao. Elas funcionam como uma especie de “resumo” da distribuicao.

A media (tambem chamada de valor esperado ou primeiro momento) de uma distri-

bucao, denominado E(X) ou µ, e um definido como

E(X) =N∑

i=1

Xipi, (A.6)

ou no caso contınuo

E(X) =

−∞

xf(x)dx. (A.7)

Essa relacao nao e chamada de media levianamente. O fato de que

1

N

i

Xi ≈ E(X) (A.8)

dado um conjunto grande de N variaveis aleatorias independentemente distribuıdas {Xi}e chamado Lei do Grandes Numeros.

E importante entretanto nao se deixar ser enganado pelo termo “valor esperado”, pois

E(X) nao e necessariamente o valor mais provavel dado pela distribuicao. De fato, o valor

medio pode ter probabilidade nula, como e caso do dado justo citado anteriormente, que

possui valor esperado de 3.5, mesmo que as faces do dado so possuam valores inteiros. O

valor para o qual f(x) e maximo e chamado a moda de uma distribuicao.

A variancia, por sua vez, e chamada V(X) ou σ e e dada por

V(X) =√

E(X − µ)2 =

N∑

i=1

(xi − µ)2pi. (A.9)

No caso contınuo

V ar(x) =⟨

x2⟩

− 〈x〉2 =∫

−∞

x2f(x)dx−[∫

−∞

xf(x)dx

]2

. (A.10)

A variancia, tambem conhecida por desvio medio quadratico, e assim chamada pois mede

o desvio da distribuicao em relacao a media. Isso quer dizer que se sorteassemos pontos

que obedecessem a uma distribuicao com variancia pequena, esperarıamos que a maior

parte dos pontos sorteados se localizassem proximos a media.

A.3 Algumas Distribuicoes Importantes 47

A.3 Algumas Distribuicoes Importantes

A.3.1 Distribuicao Gaussiana ou Normal

A distribuicao Gaussiana, tambem chamada distribuicao Normal, e provavelmente a

distribuicao de probabilidade mais presente na natureza. Isso ocorre devido ao Teorema

do Limite Central. Esse teorema afirma que a soma de uma serie de variaveis aleatorias

com media e variancia bem definidas tende a se distribuir na forma de uma distribuicao

normal, que e dada pela equacao

f(x) =1√2πσ2

exp

[

−(x− µ)2

2σ2

]

. (A.11)

Assim, fenomenos naturais que sejam consequencia de processos aditivos, tendem a obe-

decer distribuicoes normais, como ocorre em processos difusivos (49) e na distribuicao de

QI (50). Substituindo a Eq. A.11 em A.7 e A.10 obtemos que 〈x〉 = µ e V ar(x) = σ2.

A.3.2 Distribuicao Log-Normal

Embora seja habitual que as influencias que resultem em uma medida sejam aditivas,

e portanto resultem em uma distribuicao normal, esse nem sempre e o caso. Tomemos

o exemplo que West e Schlesinger (42) fornecem baseado no trabalho de Shockley (51),

que afirma que a lista de habilidades importantes para um pesquisador e: (1) capacidade

de pensar em um bom problema, (2) a capacidade de trabalhar nele, (3) a capacidade de

reconhecer um resultado significativo, (4) saber reconhecer a hora de parar e escrever os

resultados, (5) saber escrever adequadamente, (6) saber se aproveitar construtivamente de

crıticas, (7) ter determinacao para submeter um artigo para um jornal e (8) ter disposicao

para responder as objecoes dos referees. Cada uma dessas capacidades esta associada

uma probabilidade pi de que um indivıduo realizar tal capacidade. Assim a produtividade

cientıfica de um indivıduo seria

P = p1p2p3...p8, (A.12)

de forma que

logP = log p1 + log p2 + log p3 + ...+ log p8. (A.13)

Como as probabilidades de cada capacidade sao variaveis independentes, pelo teorema do

limite central, logP sera distribuıdo na forma de uma Gaussiana. O que se pode dizer

entao da distribuicao de P? Ela obedecera a uma distribuicao chamada log-normal, dada

A.3 Algumas Distribuicoes Importantes 48

pela expressao

f(x) =1

x√2πσ2

exp

{

−(log x− µ)2

2σ2

}

. (A.14)

Devido aos processos multiplicativos possuırem uma resposta nao linear a variacoes dos

coeficientes, a distribuicao log-normal e assimetrica como mostra a Figura A.1. A media

da distribuicao log-normal e 〈x〉 = exp(µ + σ2/2) e a variancia e dada por V ar(x) =

(exp [σ2]− 1) exp (2µ+ σ2).

Diversos sistemas fısicos apresentam padroes log-normais, como a distribuicao de ta-

manho de partıculas de minerios sujeitos a fragmentacao (52), diversas medidas de tecidos

biologicos, como massa e comprimento (53) e ate tamanhos de partıculas em um aerosol

(54).

A.3.3 Distribuicao de Pareto ou Lei de Potencia

A ultima distribuicao que abordaremos aqui e a distribuicao de Pareto, tambem co-

nhecida como lei de potencia. As distribuicoes de Pareto sao dadas pela expressao

f(x) ∝ x−α. (A.15)

A primeira observacao importante a se fazer e que se α = 1, a distribuicao nao pode

satisfazer a condicao dada pela Eq. A.5. Isso significa que um sistema real que obedeca

a uma distribuicao desse tipo, deve obrigatoriamente obedecer a outras distribuicoes bem

comportadas nos limite x → 0 e x → ∞, ou ainda deve obedecer a uma distribuicao que,

para valores intermediarios de x, se comporte como a Eq. A.15. Mostraremos aqui que a

distribuicao log-normal apresenta essa propriedade (42).

Para isso tomemos a variavel auxiliar τ = x/eµ de forma que podemos reescrever a

Eq. A.14 na forma

f(τ)dτ =1√2πσ2

exp

{

−(log τ)2

2σ2

}

d(log τ). (A.16)

Fazendo o logaritmo da Eq. A.16 obtemos,

log f(τ) = − log τ − (log τ)2

2σ2− 1

2log(2πσ2). (A.17)

Se tomarmos σ2 como muito grande, porem finito, vemos que (log τ)2/2σ2 torna-se des-

prezıvel, e obtemos por fim que,

f(τ) ∝ 1

τ(A.18)

A.4 Histogramas 49

1 2 3 4 5 0 20 40 60 0 5 10 15 20

11 1 10 100 1 10 1005432

f(x)

f(x)

Normal Log-Normal Pareto

x x x

xxx

Figura A.1: Graficos exemplificando as tres distribuicoes discutidas na Secao A.3 emescala linear (linha de cima) e logarıtmica para ambos os eixos (linha de baixo).

A distribuicao de Pareto e de interesse fısico por apresentar propriedades extraor-

dinarias, como invariancia de escala, isto e, f(λx) = λ−αf(x). Se α < 2, a media da

distribuicao, assim como a variancia, divergem, e se 2 < α < 3, a media converge, mas a

variancia diverge. Neste caso, a distribuicao nao converge para uma Gaussiana de acordo

com o Teorema do Limite Central.

Leis de potencia aparecem em uma serie de sistemas fısicos, como fenomenos de tran-

sicao de fase (55), distribuicao de conexoes entre sıtios da internet (56) e a distribuicao de

frequencias de palavras da lıngua inglesa (57). Mesmo em sistemas cognitivos esse tipo

de distribuicao ja foi observada (46, 58).

A.4 Histogramas

A importancia de se estudar as distribuicoes de probabilidade, como foi dito na Secao

A.3, deve-se ao fato de que elas refletem muitas das propriedades dos sistemas que repre-

sentam. E importante, portanto, ser capaz de estimar a distribuicao de frequencias de

uma serie de dados experimentais. O metodo mais comum e possivelmente o mais simples

de fazer isso e o metodo do histograma. Um histograma e tipicamente um modelo de es-

tatıstica nao-parametrica, isto e, nenhuma suposicao sobre a distribuicao e feita a priori,

toda informacao e obtida apenas a partir dos dados. Isso nao quer dizer, entretanto, que

A.5 Estimacao de Parametros 50

modelos de estatıstica nao-parametrica nao dependam de parametros, mas o numero e a

natureza dos parametros nao sao pre-determinados.

Para criar um histograma de um conjunto de n dados, suponhamos que a distribuicao

f que os dados obedecam seja valida em uma regiao que podemos supor, sem perda de

generalidade, seja no intervalo [0, 1]. Neste caso, para um numero inteiro m, definimos os

intervalos na forma,

B1 =

[

0,1

m

)

, B2 =

[

1

m,2

m

)

, ..., Bm =

[

m− 1

m, 1

]

. (A.19)

Definimos a largura dos intervalos como h = 1/m. Se Yi for a quantidade de pontos

observados dentro do intervalo Bi, entao o histograma f(x) e dado pela equacao

f(x) =1

n

m∑

i=1

Yi

hI(x ∈ Bi), (A.20)

onde I(x ∈ Bi) e uma funcao que retorna 1 se x ∈ Bi, caso contrario retorna 0. Percebe-

se que a distribuicao estimada f(x) e sempre constante dentro de um dado intervalo. O

processo e melhor ilustrado pela Figura A.2.

O numero de intervalos m e um parametro livre, mas que deve ser escolhido cuidado-

samente. Poucos intervalos podem acarretar na perda de informacao dos dados, e muitos

intervalos geram estimativas muito ruidosas. Ha diversos metodos para estimar o numero

otimo de intervalos, embora na maioria dos casos seja utilizado o bom senso.

Uma vez criado o histograma, e possıvel estimar os parametros de uma distribuicao

proposta atraves de regressao nao-linear e testes de hipotese.

A versatilidade de metodos nao-parametricos vem com um custo: eles normalmente

sao mais eficientes quando a quantidade de dados e razoavelmente grande, em outros casos

estatısticas parametricas podem ser mais adequadas.

A.5 Estimacao de Parametros

Um aspecto importante da

Tomando um conjunto de dados X = xi e uma distribuicao de probabilidade f(x; θ),

onde θ e θ ∈ Θ Define-se a funcao de verossimilhanca

L(θ|X) =N∏

i=1

f(xi|θ). (A.21)

A.5 Estimacao de Parametros 51

0 10 20 30 40 502

3

4

5

6

7

8

y

Nº da Amostra

(a)

Nº da Amostra0 10 20 30 40 50

2

3

4

5

6

7

8

B1

B2

B3

B4

B5

B6

B7

B8

B9

Y1= 2

Y2= 6

Y3= 10

Y4= 10

Y5= 6

Y6= 6

Y7= 5

Y8= 4

Y9= 1

y

B2

B7

(b)

3 4 5 6 70

0.1

0.2

0.3

0.4

B1

B2

B3

B4

B5

B6

B7

B8

B9

y

f(x)^

(c)

Figura A.2: Exemplo de criacao de um histograma de um conjunto de dados yi. (a) Umconjunto de N = 50 dados criados aleatoriamente. (b) Os intervalos Bi definidos paraa elaboracao do histograma e a quantidade de pontos Yi contidos em cada um. (c) Ohistograma final onde a altura f(x) de cada caixa e Yi/(hN) onde h = 0.5 e a largura decada intervalo.

52

Referencias Bibliograficas

1 NEISSER, U. Cognitive psychology. Oxford: Appleton-Century-Crofts, 1967. (Centurypsychology series).

2 GARDNER, H. The Mind’s New Science. New York: Basic Books, Inc., 1985.

3 KINTSCH, W.; MILLER, J.; POLSON, P. Method and tactics in cognitive science.Hillsdale: L. Erlbaum Associates, 1984.

4 HEYES, C.; HUBER, L. The evolution of cognition. Cambridge: MIT Press, 2000.(Vienna series in theoretical biology).

5 BLOCK, N. Readings in philosophy of psychology. Cambridge: Harvard UniversityPress, 2000. (Language and thought series, v. 2).

6 ECKARDT, B. von. What is Cognitive Science? Cambridge, Massachusetts: MITPress, 1995.

7 KOLB, B.; WHISHAW, I. Fundamentals of Human Neuropsychology. New York:Worth Publishers, 2008.

8 CHURCHLAND, P. Neurophilosophy: toward a unified science of the mind-brain.Cambridge: MIT Press, 1986. (Computational models of cognition and perception).

9 SLOMAN, S. A. The empirical case for two systems of reasoning. PsychologicalBulletin;Psychological Bulletin, v. 119, n. 1, p. 3–22, 1996.

10 KAHNEMAN, D. A perspective on judgment and choice: Mapping boundedrationality. American Psychologist;American Psychologist, v. 58, n. 9, p. 697–720, 2003.

11 EPSTEIN, S. Integration of the cognitive and the psychodynamic unconscious.American Psychologist;American Psychologist, v. 49, n. 8, p. 709–724, 1994.

12 STANOVICH, K. E.; WEST, R. F. Individual differences in reasoning: Implicationsfor the rationality debate? Behavioral and Brain Sciences, v. 23, n. 05, p. 645–665, 2000.

13 TREISMAN, A. In: . New York: Clarendon Press/Oxford University Press,1993. cap. The perception of features and objects., p. 5–35.

14 ELMAN, J. Rethinking innateness: a connectionist perspective on development.Cambridge: MIT Press, 1997. (Bradford Books).

15 HOLDEN, J. G.; ORDEN, G. C. V.; TURVEY, M. T. Dispersion of response timesreveals cognitive dynamics. Psychological Review, v. 116, n. 2, p. 318–342, 2009.

Referencias Bibliograficas 53

16 LEMOINE, L.; TORRE, K.; DELIGNIERES, D. Testing for the presence of 1/fnoise in continuation tapping data. Canadian Journal of Experimental Psychology, v. 60,n. 4, p. 247–257, 2006.

17 ANDERSON, J. R.; SCHOOLER, L. J. Reflections of the environment in memory.Psychological Science, v. 2, n. 6, p. 396–408, 1991.

18 JAVAL, E. Physiologie de la lecture et de l’ecriture. Cambridge: CambridgeUniversity Press, 2010. (Cambridge Library Collection - Printing and PublishingHistory).

19 YARBUS, A. Eye movements and vision. New York: Plenum Press, 1967.

20 UNDERWOOD, G. Eye guidance in reading and scene perception. Oxford: Elsevier,1998.

21 DEUBEL, H.; BRIDGEMAN, B. Fourth purkinje image signals reveal eye-lensdeviations and retinal image distortions during saccades. Vision Research, v. 35, n. 4, p.529 – 538, 1995.

22 LIANG, J.-R. et al. Scaling of horizontal and vertical fixational eye movements.Phys. Rev. E, v. 71, p. 031909, Mar 2005.

23 ENGBERT, R.; KLIEGL, R. Microsaccades keep the eyes’ balance during fixation.Psychological Science, v. 15, n. 6, p. 431, 2004.

24 MICROSACCADES: Small steps on a long way. Vision Research, v. 49, n. 20, p.2415 – 2441, 2009.

25 OLSSON, P. Real-time and Offline Filters for Eye Tracking. Dissertacao (Mestrado)— Kungliga Tekniska Hogskolan, Stockholm, Sweden, 2007.

26 INHOFF, A.; BRIIHL, D.; SCHWARTZ, J. Compound word effects differ in reading,on-line naming, and delayed naming tasks. Memory & Cognition, Springer New York,v. 24, p. 466–476, 1996.

27 VITU, F.; O’REGAN, J.; MITTAU, M. Optimal landing position in reading isolatedwords and continuous text. Attention, Perception, & Psychophysics, Springer New York,v. 47, p. 583–600, 1990.

28 RAYNER, K. Eye movements and visual cognition: scene perception and reading.Berlin: Springer-Verlag, 1992. (Springer series in neuropsychology).

29 VISWANATHAN, G. M. et al. Optimizing the success of random searches. Nature,v. 401, n. 6756, p. 911–914, Oct 1999.

30 EDWARDS, A. M. et al. Revisiting levy flight search patterns of wanderingalbatrosses, bumblebees and deer. Nature, v. 449, n. 7165, p. 1044–1048, Oct 2007.

31 BENICHOU, O. et al. Intermittent search strategies. Rev. Mod. Phys., AmericanPhysical Society, v. 83, p. 81–129, Mar 2011.

Referencias Bibliograficas 54

32 JIN, Y.; SENDHOFF, B. Trade-off between performance and robustness: Anevolutionary multiobjective approach. In: FONSECA, C. et al. (Ed.). EvolutionaryMulti-Criterion Optimization. Berlin: Springer/Heidelberg, 2003, (Lecture Notes inComputer Science, v. 2632). p. 68–68.

33 TREISMAN, A. M.; GELADE, G. A feature-integration theory of attention.Cognitive Psychology, v. 12, n. 1, p. 97 – 136, 1980.

34 TREISMAN, A.; SATO, S. Conjunction search revisited. Journal of Experimental

Psychology: Human Perception and Performance, v. 16, n. 3, p. 459–478, 1990.

35 ANSTIS, S. M. Letter: A chart demonstrating variations in acuity with retinalposition. Vision research, v. 14, n. 7, p. 589–92, Jul 1974.

36 ENGEL, F. Visual conspicuity, directed attention and retinal locus. Vision Research,v. 11, n. 6, p. 563 – 575, 1971.

37 MIURA, T. From eye to mind: Information acquisition in perception, search, andreading. In: . Oxford: North-Holland, 1990. cap. Active function of eye movementand useful field of view in a realistic setting., p. 119–127.

38 HANDFORD, M. Where’s Wally? The Wonder Book. London: Walker Books, 1997.

39 HANDFORD, M. Where’s Wally? The Great Picture Hunt. London: Walker Books,2006.

40 BROCKMANN, D.; GEISEL, T. The ecology of gaze shifts. Neurocomputing, v. 2,p. 643–650, 1999.

41 DUCHOWSKI, A. Eye tracking methodology: theory and practice. Berlin: Springer,2007.

42 WEST, B. J.; SHLESINGER, M. F. On the ubiquity of 1/f noise. InternationalJournal of Modern Physics B, v. 3, n. 6, p. 795 – 819, 1989.

43 STEPHEN, D. G.; MIRMAN, D. Interactions dominate the dynamics of visualcognition. Cognition, v. 115, n. 1, p. 154 – 165, 2010.

44 ORDEN, G. C. V.; HOLDEN, J. G.; TURVEY, M. T. Self-organization of cognitiveperformance. Journal of Experimental Psychology: General, v. 132, n. 3, p. 331–350,2003.

45 LIMPERT, E.; STAHEL, W. A.; ABBT, M. Log-normal distributions across thesciences: Keys and clues. BioScience, v. 51, n. 5, p. pp. 341–352, 2001.

46 AKS, D. J.; ZELINSKY, G. J.; SPROTT, J. C. Memory across eye-movements: 1/fdynamic in visual search. Nonlinear Dynamics, Psychology, and Life Sciences, v. 6, p.1–25, 2002.

47 NAJEMNIK, J.; GEISLER, W. S. Optimal eye movement strategies in visual search.Nature, v. 434, n. 7031, p. 387–391, Mar 2005.

48 NEWTON, I. The mathematical principles of natural philosophy. [S.l.]: printed forBenjamin Motte, 1729. (The Mathematical Principles of Natural Philosophy, v. 2).

Referencias Bibliograficas 55

49 CRANK, J. The mathematics of diffusion. Oxford: Clarendon Press, 1979. (Oxfordscience publications).

50 EMBRETSON, S.; REISE, S. Item response theory for psychologists. Hillsdale: L.Erlbaum Associates, 2000. (Multivariate applications book series).

51 SHOCKLEY, W. On the statistics of individual variations of productivity in researchlaboratories. Proceedings of the IRE, v. 45, n. 3, p. 279 –290, march 1957.

52 KOLMOGOROV, A. N. On the logarithmic normal law of particle distributionduring breakup. Doklady Akademii Nauk SSSR, v. 31, p. 99, 1941.

53 HUXLEY, J. Problems of Relative Growth. Charleston: BiblioBazaar, 2011.

54 JOHNSSON, J.; BLADH, H.; BENGTSSON, P.-E. On the influence of bimodal sizedistributions in particle sizing using laser-induced incandescence. Applied Physics B:

Lasers and Optics, v. 99, p. 817–823, 2010.

55 STANLEY, H. Introduction to phase transitions and critical phenomena. Oxford:Oxford University Press, 1987.

56 MEDINA, A.; MATTA, I.; BYERS, J. On the origin of power laws in internettopologies. ACM COMPUTER COMMUNICATION REVIEW, v. 30, p. 18–28, 2000.

57 CANCHO, R. F. i.; SOLe, R. V. Least effort and the origins of scaling in humanlanguage. Proceedings of the National Academy of Sciences, v. 100, n. 3, p. 788–791,2003.

58 STEPHEN, D. G. et al. Levy-like diffusion in eye movements during spoken-languagecomprehension. Phys. Rev. E, American Physical Society, v. 79, p. 056114, May 2009.