6
Estudo Comparativo sobre a Percepção de Pistas Sonoras em Ambientes Virtuais Alyson Matheus de Carvalho Souza [email protected] Selan Rodrigues dos Santos [email protected] Departamento de Informática e Matemática Aplicada — DIMAp Universidade Federal do Rio Grande do Norte — UFRN Campus Lagoa Nova, 59072-970, Natal/RN, Brasil Resumo O trabalho apresentado neste artigo tem como objetivo estudar os diferentes sistemas de som disponíveis para aplicações de Realidade Virtual. Tentamos explicar as diferenças encontradas entre estes sistemas e a partir daí oferecer diretrizes de como eles devem interagir com a aplicação de RV. Em seguida, apresentamos a realização dos experimentos de teste para fones, caixas estéreo e mono. Por último, explicamos o porquê da eficiência de cada dispositivo, assim como discutimos o motivo de termos chegado a conclusões sobre qual o melhor método para a tarefa especificada. 1. Introdução A Realidade Virtual (RV), que busca inserir o usuário em um ambiente virtual através de estímulos aos sentidos do mesmo, tem evoluído de maneira rápida e constante quanto à visão. A maioria dos sistemas de RV se preocupa em enfatizar o sentido da visão, buscando gerar tanto imagens mais realistas e/ou em estereoscopia, bem como oferecer mecanismos para possibilitar a imersão no mundo virtual, através do uso de head-mounted displays (HMD) ou mesmo CAVEs. Em contrapartida, a renderização sonora tem sido pouco explorada nos sistemas de RV tradicionais. Tendo em vista o grande papel que nossa audição tem no nosso senso de localização e presença, faz-se necessário estudar e desenvolver mecanismos que possibilitem a integração do estímulo auditivo nas aplicações de RV. O objetivo é provocar uma sensação de imersão ainda maior, assim como uma maior facilidade no cumprimento de tarefas que exigem uma percepção sonora precisa por parte do usuário da aplicação. Ao analisarmos a última edição do WRVA e as três últimas do SVR — as duas maiores reuniões da área de RV no Brasil — é possível perceber que foram publicados nos anais menos de 10 artigos relacionados a som [6,7,8,9]. Isso comprova o fato que esta área de pesquisa de RV está sendo pouco explorada aqui no Brasil. Nesse artigo, utilizamos três diferentes sistemas de exibição de som em busca de identificar qual deles melhor atende a necessidade de uma aplicação de Realidade Virtual de mesa desenvolvida para testar a capacidade do usuário de diferenciar sons diversos e descobrir sua localização espacial. A hipótese primária, H1, a ser testada é a de que, por se tratar de um sistema de Realidade Virtual de mesa, onde não há movimentação do monitor, o fone será a melhor solução para cumprir a tarefa de maneira eficiente. A hipótese secundária, H2, que investigamos é que as caixas estéreo apresentam melhor desempenho que a configuração mono, uma vez que tal sistema apresenta uma pista auditiva a mais, em relação à renderização em mono. Para testar as hipóteses levantadas, realizamos testes com usuários utilizando o design entre-sujeitos, testando os três sistemas de som. Nesse experimento buscamos medir o tempo que era necessário para o cumprimento das tarefas, assim como a taxa de erro dos usuários e o caminho que eles percorriam. O objetivo era encontrar diversos sons vindos de lugares diferentes no espaço, no menor tempo possível, com a menor taxa de erro que os usuários conseguissem. Foram feitos testes com usuários de ambos os sexos, numa faixa etária entre 18-27 anos. Os participantes obtiveram um resultado que satisfez a hipótese primária mas refutou a hipótese secundária. A validação dos resultados foi feita através do método ANOVA. Este artigo está organizado da seguinte maneira: a Seção 2 apresenta alguns trabalhos relacionados, a Seção 3 introduz alguns conceitos fundamentais para a compreensão do trabalho e do experimento realizado; a Seção 4 descreve os detalhes de implementação, enquanto que a Seção 5 detalha os experimentos realizados; a Seção 6 analisa os resultados obtidos e a

Estudo Comparativo sobre a Percepção de Pistas … comprova o fato que esta área de pesquisa de RV está sendo pouco explorada aqui no Brasil. Nesse artigo, utilizamos três diferentes

  • Upload
    buianh

  • View
    212

  • Download
    0

Embed Size (px)

Citation preview

Estudo Comparativo sobre a Percepção de Pistas Sonoras em Ambientes Virtuais

Alyson Matheus de Carvalho Souza [email protected]

Selan Rodrigues dos Santos [email protected]

Departamento de Informática e Matemática Aplicada — DIMAp

Universidade Federal do Rio Grande do Norte — UFRN Campus Lagoa Nova, 59072-970, Natal/RN, Brasil

Resumo

O trabalho apresentado neste artigo tem como objetivo estudar os diferentes sistemas de som disponíveis para aplicações de Realidade Virtual. Tentamos explicar as diferenças encontradas entre estes sistemas e a partir daí oferecer diretrizes de como eles devem interagir com a aplicação de RV. Em seguida, apresentamos a realização dos experimentos de teste para fones, caixas estéreo e mono. Por último, explicamos o porquê da eficiência de cada dispositivo, assim como discutimos o motivo de termos chegado a conclusões sobre qual o melhor método para a tarefa especificada. 1. Introdução

A Realidade Virtual (RV), que busca inserir o usuário em um ambiente virtual através de estímulos aos sentidos do mesmo, tem evoluído de maneira rápida e constante quanto à visão. A maioria dos sistemas de RV se preocupa em enfatizar o sentido da visão, buscando gerar tanto imagens mais realistas e/ou em estereoscopia, bem como oferecer mecanismos para possibilitar a imersão no mundo virtual, através do uso de head-mounted displays (HMD) ou mesmo CAVEs.

Em contrapartida, a renderização sonora tem sido pouco explorada nos sistemas de RV tradicionais. Tendo em vista o grande papel que nossa audição tem no nosso senso de localização e presença, faz-se necessário estudar e desenvolver mecanismos que possibilitem a integração do estímulo auditivo nas aplicações de RV. O objetivo é provocar uma sensação de imersão ainda maior, assim como uma maior facilidade no cumprimento de tarefas que exigem uma percepção sonora precisa por parte do usuário da aplicação.

Ao analisarmos a última edição do WRVA e as três últimas do SVR — as duas maiores reuniões da área de RV no Brasil — é possível perceber que foram

publicados nos anais menos de 10 artigos relacionados a som [6,7,8,9]. Isso comprova o fato que esta área de pesquisa de RV está sendo pouco explorada aqui no Brasil.

Nesse artigo, utilizamos três diferentes sistemas de exibição de som em busca de identificar qual deles melhor atende a necessidade de uma aplicação de Realidade Virtual de mesa desenvolvida para testar a capacidade do usuário de diferenciar sons diversos e descobrir sua localização espacial.

A hipótese primária, H1, a ser testada é a de que, por se tratar de um sistema de Realidade Virtual de mesa, onde não há movimentação do monitor, o fone será a melhor solução para cumprir a tarefa de maneira eficiente. A hipótese secundária, H2, que investigamos é que as caixas estéreo apresentam melhor desempenho que a configuração mono, uma vez que tal sistema apresenta uma pista auditiva a mais, em relação à renderização em mono.

Para testar as hipóteses levantadas, realizamos testes com usuários utilizando o design entre-sujeitos, testando os três sistemas de som. Nesse experimento buscamos medir o tempo que era necessário para o cumprimento das tarefas, assim como a taxa de erro dos usuários e o caminho que eles percorriam. O objetivo era encontrar diversos sons vindos de lugares diferentes no espaço, no menor tempo possível, com a menor taxa de erro que os usuários conseguissem.

Foram feitos testes com usuários de ambos os sexos, numa faixa etária entre 18-27 anos. Os participantes obtiveram um resultado que satisfez a hipótese primária mas refutou a hipótese secundária. A validação dos resultados foi feita através do método ANOVA.

Este artigo está organizado da seguinte maneira: a Seção 2 apresenta alguns trabalhos relacionados, a Seção 3 introduz alguns conceitos fundamentais para a compreensão do trabalho e do experimento realizado; a Seção 4 descreve os detalhes de implementação, enquanto que a Seção 5 detalha os experimentos realizados; a Seção 6 analisa os resultados obtidos e a

última seção contém nossas considerações finais e algumas indicações de trabalhos futuros.

2. Trabalhos Relacionados

O trabalho que foi utilizado como base para

escrevermos esse artigo foi o Virtual Audio Systems [2]. Neste artigo, Kapralos et al. discutem as diferentes pistas auditivas que podem ser simuladas virtualmente para criarmos efeitos sonoros consideravelmente mais imersivos para o usuário dos sistemas. Além disso, eles descrevem o funcionamento da audição humana e as maneiras que temos de simular efeitos que nossa audição percebe no mundo real.

Já em [5], os autores tratam também de como diferentes configurações em relação ao som podem afetar o desempenho de usuários em um sistema de Realidade Virtual. No trabalho, eles procuram utilizar diferentes frequências sonoras para guiar um usuário através de um caminho em um ambiente virtual. A idéia se assemelha bastante a tarefa solicitada em nosso experimento. Ambos requeriam que o participante identificasse a localização da fonte sonora posicionada em um ambiente virtual (AV). Porém, no trabalho deles, todo o experimento foi conduzido utilizando apenas fones de ouvido e um dispositivo de rastreamento para a cabeça do usuário. A utilização de diferentes sistemas sonoros poderia ter alterado o resultado do experimento, assim como a satisfação dos participantes em terem realizado o experimento. 3. Conceitos Básicos

Antes de iniciarmos a discussão do trabalho em si, colocaremos algumas definições necessárias para o entendimento do mesmo. Primeiramente, discutiremos quatro tipos de som, dos quais dois serão utilizados no trabalho. Em seguida, discutiremos a utilização de alto-falantes ou fones de ouvido. 3.1 Sons Mono, Estéreo, Surround e 3D

O som monaural, ou mono, é o tipo mais básico de som. Nesse tipo de sistema, só há um canal de áudio. Como a emissão é feita sempre igualmente para todos os alto-falantes, nosso cérebro é privado de sua capacidade de utilizar-se de pistas sonoras como a diferença de tempo e intensidade entre a chegada do som a um ouvido ou ao outro para posicionar uma fonte de áudio no espaço.

Sendo assim, não podemos enganá-lo de modo a fazê-lo entender o posicionamento de uma fonte virtual em um espaço qualquer do mundo virtual. Por isso, esse tipo de som é o que tem menor efeito imersivo.

Sua única vantagem é ter o menor custo computacional. Sua utilização de maneira eficiente termina ficando restrita a pouquíssimos tipos de aplicação. Para um melhor efeito sonoro, deveremos nos utilizar do som estereofônico.

O som estereofônico, ou estéreo, é uma reprodução de um som usando dois ou mais canais de áudio independentes, emitidos através de uma configuração simétrica de alto-falantes de uma maneira que seja criada a impressão que o som é ouvido de direções variadas, como na audição natural. Ou seja, podemos enganar o cérebro do usuário a perceber objetos como estando posicionados em qualquer lugar que desejarmos de um plano transverso (horizontal) a partir do centro da cabeça do usuário. Com isso já começamos a ter vantagens na elaboração do áudio de nossa aplicação de RV.

Como já foi dito, um sistema que possua dois ou mais canais é considerado um sistema de som estéreo, porém, atualmente, a palavra estéreo costuma ser utilizada apenas para sistemas que se utilizam de apenas dois canais de áudio. A partir de três canais, passamos a chamar esse sistema de sistema de som surround.

Figura 1: Configuração de um sistema de som 22.2 a ser utilizado em um cinema. Como podemos ver, há três camadas de áudio para gerar o efeito de altura. No exemplo da foto há também duas torres de falantes simples, que visam melhorar ainda mais o som. Fonte: www.highdefforum.com

Em sistemas de som surround temos um número maior de canais, a fim de obter uma maior fidelidade na reprodução do áudio gravado. Podem ser encontradas variações partindo do som 3.0, com 3 canais para 3 alto-falantes, até o som 22.2 (Figura 1), que tem 24 canais e o mesmo número de alto-falantes, sendo 2 destes subwoofers, responsáveis por emitir frequências sonoras mais baixas. Há também a

possibilidade de utilização de fones de ouvido para o som surround, através da mixagem de canais para que o som seja reproduzido apenas nas duas saídas do fone. Em sistemas de som surround mais potentes, como o 22.2, ou com fones de ouvido, podemos também simular a altura da fonte sonora no ambiente virtual, saindo assim de um sistema de coordenadas 2D para um 3D em relação ao som. Com isso, surge o efeito sonoro que denominamos som 3D.

Um dispositivo de áudio 3D permite ao usuário perceber a posição de uma fonte de áudio, sendo emitida através de um número fixo de alto-falantes ou de um par de fones de ouvido, como vindo de uma localização arbitrária em um espaço tridimensional. A tecnologia de som espacializado (ou 3D) vai muito além das técnicas de som estéreo e surround, por permitir que uma fonte de áudio tenha atributos como esquerda - direita, frente - trás, cima – baixo [1]. Ou seja, para o áudio tridimensional, nós podemos definir exatamente de que local no espaço estará vindo o som simulado pela aplicação, incluindo se está vindo de cima ou de baixo, da frente ou de trás do usuário, criando assim um nível de realismo extremamente alto. 3.2 Alto-falantes x Fones de Ouvido

A escolha da utilização de alto-falantes ou fones de ouvido também tem uma grande importância na hora de definirmos a aplicação que estaremos trabalhando. Cada um tem diferentes capacidades, vantagens e desvantagens. Isso é o que será discutido nesta seção.

Não importando o tipo de fone utilizado, teremos um isolamento dos ouvidos em relação a sons externos, o que favorece muito a imersão do usuário no ambiente virtual. Além disso, não é necessário se preocupar muito com calibração, pois basta atentarmos para qual é o lado esquerdo e o direito do fone. Também é uma vantagem do fone o preço. Bons fones de ouvido podem ser adquiridos por um valor bem menor do que um sistema de alto-falantes surround.

Porém, há também as desvantagens. Os fones de ouvido devem ser vestidos, o que os torna um dispositivo intrusivo. Também, a utilização prolongada de fones de ouvido ou o volume excessivamente alto dos mesmos pode trazer malefícios à saúde. Outro problema é que fones de ouvido funcionam apenas para um usuário. Caso mais de um usuário queira se beneficiar da aplicação, teríamos grandes problemas para emitir o som corretamente para todos. Além disso, a comunicação interpessoal fica prejudicada, pois o isolamento já citado de sons externos faz com que o usuário não escute o que os outros dizem.

Por fim, o problema mais grave surge quando

vamos trabalhar com sons emitidos através de fones de ouvido. Caso a aplicação permita o usuário se movimentar e o movimento da cabeça do usuário não seja bem rastreado, podemos ter uma infidelidade da informação sonora, pois os fones se movimentarão junto à cabeça do usuário e o som será emitido do mesmo jeito, como se a cabeça dele tivesse na posição que estava inicialmente.

No caso de alto-falantes, desde os sistemas mais simples até os mais complexos, podemos utilizá-los em grupo. As pessoas imersas no ambiente poderão se mover a vontade, pois os falantes estão fixos e não irão interferir na localização do som. O problema na verdade é onde fixar estes alto-falantes. As calibrações dos sistemas de som se tornam mais complicadas à medida que eles avançam. Um simples sistema de som 5.1, que tem apenas seis caixas de som, já apresenta dificuldades na hora de sua montagem.

Além da dificuldade de calibração, o preço de sistemas mais potentes é bastante elevado. A gama de frequências sonoras que podem ser atingidas com os alto-falantes é sem dúvida bem maior que as que se consegue com fones de ouvido, pois as caixas podem variar de tamanho e profundidade. Outro problema que em alguns casos pode ser grave no caso dos alto-falantes é o não isolamento do usuário em relação ao ambiente. Com isso, o áudio fica sujeito a ruídos e a barulhos exteriores, o que pode fazer com que o usuário termine perdendo um pouco da experiência real que o dispositivo que está utilizando o áudio propõe. 4. Metodologia

Nesta seção descrevemos o desenvolvimento do programa utilizado para fazer os testes, assim como o formato que foi adotado para os experimentos de validação da hipótese. Por fim, falaremos sobre a realização do experimento. 4.1 Desenvolvimento do sistema

O objetivo principal do trabalho apresentado neste artigo é o de comparar sistemas de som distintos em relação à eficiência de cada um deles. Para atingir este objetivo, desenvolvemos um sistema de Realidade Virtual de Mesa onde usuários seriam capazes de testar os diferentes sistemas de som em uma configuração de igualdade para todos e assim, a partir dos dados colhidos destes experimentos, seríamos capazes de chegar a alguma conclusão sobre estes sistemas de som.

O programa de teste foi desenvolvido usando a versão gratuita do Unity [4], que oferece várias funcionalidades tanto em relação à parte visual quanto

em relação a áudio. O Unity foi escolhido para o experimento por ser um programa de fácil utilização, o que diminuiu consideravelmente o tempo de aprendizado dele em relação a ferramentas mais adequadas e complexas, como OpenAL ou Fmod. Um cenário quadrangular, somente com chão e paredes, foi desenvolvido no Blender, assim como um cubo, que serviu como modelo para os emissores de som no cenário. Além desses objetos, utilizamos o First Person Controller (FPS), oferecido pelo Unity.

Esse Prefab, como o nome indica, é um controlador em primeira pessoa, que o usuário, através de WASD + Mouse, move no cenário. O FPS também é o responsável por ser o Audio Listener da cena. Ou seja, ele que capta os sons emitidos e reproduz na saída de áudio. O FPS foi posicionado no centro do cenário e as quatro caixas foram posicionadas de maneira equidistante na frente, atrás e dos lados do controlador.

Cada uma dessas caixas era uma Audio Source. Quando o usuário movia o controlador, o áudio era captado de maneira diferente e assim reproduzido de maneira diferente nos alto-falantes. Isso dava ao usuário as pistas sonoras que eram necessárias para identificar cada uma das caixas. Toda a parte lógica da aplicação foi feita utilizando scripts do Unity, ou novos scripts, desenvolvidos em C#, uma das linguagens aceitas pelo Unity.

As faixas sonoras utilizadas no experimento são de nossa autoria.

Figura 2: Screenshot do programa de testes. Na imagem, o cubo verde representa um instrumento que o usuário já marcou. A sinalização na parte inferior indica em vermelho qual instrumento deve ser encontrado e as caixas embaixo mostram quais instrumentos já foram pedidos e então marcados pelo usuário.

Um problema encontrado no desenvolvimento da renderização sonora foi que o Unity só é capaz de reproduzir som estéreo. Com isso, não conseguimos uma maneira justa de reproduzir o som em sistemas de som mais complexos, como o Surround 5.1. A emissão de som mono ainda foi possível graças à mixagem de

dois canais de áudio, formando apenas um que foi emitido em uma caixa em frente ao usuário. Além desse sistema, utilizamos um par de caixas de som para emitir o som estéreo. O terceiro método utilizado foi o fone de ouvido estéreo.

4.2 Design do experimento

O formato experimental escolhido para esse trabalho foi o intra-sujeitos. Esse formato foi escolhido primeiramente para podermos aproveitar melhor o número pequeno de pessoas que tínhamos disponíveis para testes. Também, por se tratar de uma análise subjetiva, que pode variar de maneira significativa de pessoa para pessoa, utilizar esse design experimental nos dava uma maior segurança em relação à variância de erro associada a capacidades individuais.

Para diminuir ao máximo o chamado carryover (capacidade do usuário de levar a experiência adquirida em um teste para o próximo), a ordem a qual os participantes faziam os experimentos foi variada, de maneira que, no final, tivéssemos o mesmo número de pessoas executando cada combinação. Também é importante dizer que, obedecendo a um dos princípios do formato experimental utilizado, os cenários foram criados de maneira a serem diferentes entre si, porém, com igual dificuldade.

Antes de começar o experimento, os usuários leram e assinaram termos de consentimento, concordando em participar do teste e também liberando a utilização de seus resultados para essa pesquisa. Em seguida, os usuários responderam um questionário de experiência prévia, para termos maior controle sobre como tratar os resultados de cada usuário. Depois disso, eles foram submetidos ao experimento de verdade.

Para começar o experimento, os usuários primeiramente fizeram um treinamento auditivo para reconhecer cada instrumento que faria parte da música tocada no experimento real. Depois que se julgaram capazes de identificar cada um dos instrumentos, eles passaram a um cenário de teste onde havia apenas duas caixas para serem marcadas, sem som algum.

O objetivo dessa parte era familiarizar os usuários com o controle WASD e também com a marcação de caixas. O WASD é um sistema clássico de controle de câmera em primeira pessoa, popularizado na década de 90 em jogos como Wolfstein 3D e DOOM. Neste sistema de controle as teclas W e S movimentam a câmera, respectivamente, pra frente e para trás. As teclas A e D realizam deslocamentos laterais de câmera e o mouse controla a orientação da câmera. Para marcar uma caixa, o usuário deveria se aproximar dele e então clicar com o botão esquerdo do mouse. Uma vez marcada, a caixa ficava em uma cor diferente,

mostrando que ela já tinha sido selecionada. O instrumento o qual a caixa controlava continuava a tocar normalmente. Quando o usuário se considerava pronto, ele mesmo dava início ao experimento real.

Figura 3: Screenshots do treinamento. Na parte superior, duas imagens da parte do treinamento onde os usuários aprendiam a reconhecer cada instrumento. O som do instrumento tocava e o nome aparecia na tela, em vermelho. Nas figuras de baixo, o treinamento de marcação das caixas.

Como já foi dito, o usuário começava no centro de um quadrado que tinha as quatro caixas como vértices. Cada caixa emitia o som de um instrumento que fazia parte da música. Uma caixa de texto ficava no centro inferior da tela, indicando qual instrumento o usuário deveria encontrar. Uma vez que ele encontrasse o instrumento requisitado (a marcação poderia ser correta ou não), o instrumento requisitado era alterado.

Após marcar a última caixa, a aplicação era finalizada e um log individual era salvo. O arquivo de log gerado continha o nome do participante, o tempo que ele levou para concluir a tarefa, qual caixa ele marcou como qual e o caminho percorrido pelo usuário dentro da aplicação. O caminho salvo no log foi construído através da captura da posição do usuário no plano, em intervalos de meio segundo. Após concluir o primeiro experimento, o sistema de som era trocado (como foi dito, respeitando uma ordem definida de modo a igualar o número de usuários de cada uma das permutações) e então o usuário era submetido ao segundo programa de teste. O segundo programa funciona da mesma maneira que o primeiro, porém, sem a fase de treinamento, visto que o usuário já utilizou o sistema no primeiro teste. Nesse segundo teste, a ordem que os instrumentos eram pedidos foi diferente, assim como o posicionamento de cada som no ambiente. A configuração do experimento manteve-se a mesma.

Com a conclusão do segundo teste, o sistema de som era novamente trocado, dessa vez para o que faltava e então o usuário começava um terceiro teste. Novamente, as configurações do experimento foram

mantidas, trocando-se apenas a ordem em que os instrumentos eram pedidos e a posição deles no espaço. Uma vez concluída essa tarefa, partíamos para a parte final do experimento.

Na parte final do experimento o participante preenchia um formulário subjetivo relatando sua experiência com o sistema. Nesse formulário foram colhidas sugestões, críticas e também o mais importante: a estratégia usada pelo usuário para a localização dos sons no ambiente virtual. Com essas informações, junto às obtidas no primeiro formulário, a interpretação dos dados seria sem dúvida mais coerente. 4.3 Realização do experimento

Os experimentos foram realizados em dois dias, em uma sala fechada, com condicionador de ar e luz artificial, de modo a manter as condições ambientais para os experimentos sempre iguais.

O computador utilizado para os experimentos foi um Notebook com placa de áudio Realtek, com suporte a Virtual Surround Sound, processador AMD Turion™ X2 RM-72 de 64 bits, com 2.1GHz em cada núcleo, placa de vídeo ATI Radeon™ HD 3200 e 4 GB de memória RAM, rodando o Windows 7 Ultimate X64. Essa configuração permitiu o experimento rodar com uma taxa mínima de 200 frames por segundo, sendo uma qualidade mais que satisfatória para o experimento.

Os testes foram feitos com 24 voluntários, sendo 19 homens e 5 mulheres, com idades entre 18-27 anos. Todos os usuários que participaram do experimento possuíam experiência prévia com utilização de teclado e mouse, sendo 67% deles jogadores assíduos de jogos de computador, todos eles fãs de músicas e 25% deles, instrumentistas. 5. Análise dos Resultados

Os resultados obtidos foram analisados através de uma ANOVA Fator Único, comparando o tempo que foi levado pelos participantes para concluir cada tarefa.

A ANOVA gerou um p = 0,049 e um F = 3,15, sendo 3,12 o F crítico. Com esses dados, podemos afirmar que houve de fato uma variância entre os resultados obtidos e que não foi apenas uma variação aleatória, mesmo que os dados tenham ficado tão próximos do limite

Em relação ao tempo, 46% dos participantes obtiveram o melhor resultado com o fone, 37% com a caixa mono e os 17% restantes, com o sistema estéreo. Isso deu uma vantagem ao fone em relação ao tempo médio. O tempo médio do fone foi de 66,31 segundos,

enquanto o mono, que ficou em segundo lugar teve uma média de 80,51 e o sistema estéreo 88,09.

Figura 4: Média e desvio padrão obtidos nos diferentes sistemas de áudio.

A taxa de erro também foi medida, porém, a variação foi mínima. Para o fone, a taxa de erro média foi de 20%. Para as caixas estéreo, 19%. Para a caixa mono, 22%. 6. Conclusões

Os resultados que foram obtidos no experimento realizado comprovaram a hipótese de que o fone seria a melhor opção para esse experimento. Por se tratar de uma aplicação de Realidade Virtual de mesa, onde não há a movimentação da tela, o fone não teria uma de suas grandes desvantagens citada na Seção 3.2, que é a perda de orientação. Sem esse problema, o fone é uma alternativa bastante interessante em relação às caixas de som, pois nele fica mais fácil distinguir de qual direção o som está vindo.

Já a segunda hipótese levantada não foi comprovada. O sistema mono terminou vencendo o sistema estéreo. Imaginamos que isso aconteceu pois, segundo o questionário aplicado após o teste, a estratégia preferida pelos usuários quando se utilizando das caixas de som foi a de se aproximar de cada caixa e perceber qual instrumento ficava mais forte (ou mais alto) em cada uma delas. Assim, não era necessário perceber de que lado vinha cada som, só importando o volume. Assim, o sistema estéreo perdia a grande vantagem em relação ao mono. Outra coisa que foi a favor do sistema mono foi que, graças ao conhecimento dos usuários que não seria possível identificarem de que lado viria o som, os usuários partiam diretamente em direção as caixas que emitiam os instrumentos. Com isso, a movimentação dos usuários no sistema mono foi bem mais “ativa” que no estéreo, o que pode ter ajudado a diminuir o tempo, já que menos tempo era gasto parado, tentando ouvir de

onde vinha o som. Baseado nisso, concluímos que, para um

experimento como esse, não traria tantas vantagens ao desenvolvedor buscar caixas de som. O fone faria tudo que lhe é necessário e deixaria o usuário mais satisfeito. 7. Trabalhos Futuros

Na área de trabalhos futuros, desejamos trabalhar com diferentes sistemas de som e uma plataforma mais adequada, como OpenAL. Já que o experimento mostrou que é possível fazer testes deste tipo, nos interessamos agora por trabalhar com sistemas de som mais avançados, utilizando Surrounds 5.1 e 7.1que já estão no mercado a preços acessíveis.

Também seria interessante começar a trabalhar com som 3D. Aprofundar os estudos nessa área pode trazer contribuições para a comunidade.

Por fim, seria interessante estender nossos estudos para outros tipos de objetivo, diferentes de localizar fontes sonoras. 8. Referências [1] Cohen, M., & Wenzel, E. (1995). The design of multidimensional sound interfaces. In W. Barfield & T. Furness (Eds.), Virtual Environments and Advanced Interface Design (pp.291–346). New York: Oxford University Press. [2] B. Kapralos, M. R. Jenkin, E. Millos, Virtual Audio Systems, Presence, Vol. 17, No. 6, December 2008, 527–549. [3] Gatehouse, R. W. (Ed.) (1982). Localization of Sound: Theory and Applications. Groton, CT: Amphora Press. [4] www.unity3d.com, acessado em 27/08/2010. [5] Walker, B. N., & Lindsay, J. (2006). Navigation performance with a virtual auditory display: Effects of beacon sound, capture radius, and practice. Human Factors, 48(2), 265-278. [6] http://sites.unisanta.br/wrva/st.asp#st1, acessado em 18/10/10. [7] Proceedings of the X Symposium on Virtual and Augmented Reality - SVR2008; Vol.: 1 [8] Proceedings of the XI Symposium on Virtual and Augmented Reality - SVR2009; Vol.: 1 [9] Proceedings of the XII Symposium on Virtual and Augmented Reality - SVR2010; Vol.: 1