INTERAÇÃO COM A TELEVISÃO DIGITAL ATRAVÉS DA WEBCAM

Embed Size (px)

Citation preview

PONTIFCIA UNIVERSIDADE CATLICA DE MINAS GERAIS

INTERAO COM A TELEVISO DIGITAL ATRAVS DA WEBCAM

Vtor Galindo Lanna

Belo Horizonte

3

2010

Vtor Galindo Lanna

INTERAO COM A TELEVISO DIGITAL ATRAVS DA WEBCAM

Monografia apresentada ao curso de Cincia da Computao do Instituto de Cincias Gerais, Exatas como e Informtica para da a Pontifcia Universidade Catlica de Minas pr-requisito concluso de curso.

Orientadora: Rosilane Ribeiro da Mota

Belo Horizonte 2010

Vtor Galindo Lanna Interao com a televiso digital atravs da webcam

Monografia apresentada ao curso de Cincia da Computao do Instituto de Cincias Exatas e Informtica da Pontifcia Universidade Catlica de Minas Gerais, como pr-requisito para a concluso de curso.

Rosilane Ribeiro da Mota (orientadora) PUC Minas

Marcelo Souza Nery PUC Minas

Carolina Anglica Barbosa Saliba PUC Minas

Belo Horizonte, 22 de junho de 2010.

A todos aqueles que me incentivaram, motivaram, e, principalmente, a todos aqueles com quem aprendi.

AGRADECIMENTOS

A todos aqueles que divulgam respostas a dvidas e bugs misteriosos na internet. Os problemas mais obscuros, especficos e inusitados puderam assim encontrar uma resposta. Aos meus amigos, que colaboraram oferecendo solues alternativas e fora, sempre prontos a ajudar. minha famlia, junto comigo durante todo o processo. minha orientadora, compreensiva e objetiva. A todos aqueles sem os quais esse momento nunca seria possvel.

RESUMO

Esse trabalho consiste no estudo relativo implementao de um modo de interao mais adequado s possibilidades da televiso digital do que o controle remoto, utilizando Viso Computacional e levando em conta a acessibilidade e a implementao em si. Assim, identifica-se melhor os problemas e potenciais de tal implementao, bem como o ambiente e as ferramentas mais apropriadas. Para a captura de imagens, utilizada somente uma webcam comum, acessvel maior parte da populao. A aplicao simples de modo que os escassos recursos de um set-top-box1 no sejam problema. Palavras-chave: Televiso Digital. Ginga. Ginga-J. TVD. TVDI. Interface. Modo de interao. Interao. Viso Computacional. Televiso. Xlet.

1

Set-top-box um equipamento que se conecta a um televisor e a uma fonte externa de sinal, e transforma este sinal em contedo no formato que possa ser apresentado na tela (SET-TOP BOX, 2010).

ABSTRACT

This work consist in a study about the implementation of a way of interaction with digital television more adequate than the remote controller, using computer vision and considering accessibility, as well as the implementation itself. With it, it is possible to better identify the problems and potentials of such implementation, as well as the environment and tools which are most appropriate for it. In order to capture the images, a common webcam is used, accessible to most of the population. It is a simple application, so the fact that the settop-box doesnt have much resources is not a problem. Key-words: Digital Television. Ginga. Ginga-J. Interface. Interaction. Computer Vision. Television. Xlet.

LISTA DE SIGLAS

GART Gesture and Activity Recognition Toolkit JMF - Java Media Framework JRE Java Runtime Environment PDA - Personal Digital Assistant SMS Short Message Service TV Televiso UML Unified Modeling Language

SUMRIO1 INTRODUO.......................................................................................................................9 1.1 Contextualizao...............................................................................................................9 1.2 Definio do Problema....................................................................................................10 1.3 Justificativa.....................................................................................................................11 1.4 Organizao da Monografia............................................................................................11 1.5 Objetivos.........................................................................................................................13 1.5.1 Objetivo Geral..........................................................................................................13 1.5.2 Objetivos Especficos...............................................................................................13 2 REVISO DE LITERATURA..............................................................................................14 2.1 Modos de interao alternativos para a televiso digital................................................14 2.2 Interao por Viso Computacional com a televiso......................................................15 4 METODOLOGIA..................................................................................................................16 4.1 Desenvolvendo para a TV Digital brasileira...................................................................16 4.2 Trabalhando com Viso Computacional.........................................................................17 4.3 Utilizando Viso Computacional para interagir com a TV.............................................19 4.4 Diagramas UML.............................................................................................................21 4.4.1 Diagrama de classe...................................................................................................22 4.4.2 Diagrama de sequncia............................................................................................22 4.4.2 Diagrama de componentes.......................................................................................23 4.5 Testes..............................................................................................................................24 4.6 Limitaes da implementao.........................................................................................25 5.1 Concluso........................................................................................................................26 5.2 Trabalhos futuros............................................................................................................26

9

1 INTRODUO

1.1 Contextualizao

O primeiro sistema de televiso digital, o DVB-S, foi publicado em 1994, no Reino Unido. Treze anos depois, em 2 de dezembro de 2007, ocorreu a primeira transmisso oficial de sinal digital da televiso aberta terrestre, com a presena de mais de 2000 pessoas, incluindo o presidente Lus Incio Lula da Silva e o ministro das Comunicaes Hlio Costa (TELECO, 2010). Oficialmente, a previso de que, em 2013, a transmisso se estender por todo o territrio nacional e, em 29 de junho de 2016, acontecer o encerramento das transmisses analgicas no pas. Essa nova tecnologia traz muitas possibilidades, como alta qualidade de som e imagem, ausncia de rudo, otimizao do espectro de frequncias e facilidade de gravao de programas. E, o mais importante, tambm oferece a possibilidade de acesso internet, incluindo e-mail, SMS (Short Message Service), videoconferncia e internet banking (WAISMAN, 2006). Segundo dados do IBGE (PICCOLO, 2006), 90% dos lares brasileiros possui aparelhos televisores, mas 79% dos brasileiros nunca acessou a internet. A televiso digital se tornou, ento, a nova aposta do governo para incluso digital e, por sua vez, a democratizao da informao (PICCOLO, 2006). Essa tecnologia revela um potencial enorme, devido possibilidade de interatividade. Possuindo um canal de retorno, a TV deixa de ser unidirecional podendo ser utilizada para participao em shows, envio de mensagens de texto, jogos, uso do telefone, propaganda interativa, comrcio eletrnico, navegao na internet, dentre outros. H uma mudana de paradigma: o telespectador passa a ser um usurio ativo que pode realizar escolhas navegando por aplicativos, pela programao e enviando informaes. H inclusive a possibilidade de romper com o modelo tradicional de comunicao na televiso, que de um para muitos, e adotar o modelo da internet, de muitos para muitos (WAISMAN, 2006). Mais do que uma oferecer melhor qualidade, a TV digital uma nova mdia, apresentando conceitos tanto da verso analgica quanto de sistemas computacionais. E uma nova mdia necessita de um novo meio de interao.

10

1.2 Definio do Problema

O modo de interao um ponto crtico na utilizao de qualquer mdia, pois reflete e determina a forma como o homem se relaciona com ela e como ela se relaciona com os usurios e programadores. Ele e a interface levam a um maior ou menor grau de utilizao e, por isso, a facilidade de uso um dos fatores determinantes para o sucesso (WAISMAN, 2006). Cada mdia um meio diferente com caractersticas especficas, que o meio de interao deve levar em considerao. O controle remoto a forma de interao tradicional, j amplamente utilizada na televiso analgica. Entretanto, mesmo nesse caso, usurios j se encontravam insatisfeitos por perderem o dispositivo. Agora na televiso digital, a interface tem se mostrado ainda mais inadequada. Poucos botes dificultam a interao com um dispositivo que apresenta possibilidades to diversas, muitos botes confundem o usurio e a tornam mais complexa e menos natural. No relatrio Easy TV (FREEMAN et al., 2003), os principais problemas de usabilidade encontrados referentes ao controle remoto foram dificuldade de uso e dificuldade em achar o boto certo a ser pressionado. Isso se deve tanto ao nmero excessivo de botes quanto a problemas de nomenclatura, terminologia inconsistente, smbolos confusos, sequncias de botes pouco lgicas para chegar a algum lugar no aplicativo e botes que no funcionam em todos os aplicativos. A falta de padronizao dos controles confunde os usurios, com diferentes interfaces, funes e posies dos botes, exigindo um enorme esforo mental para aprender qual sequncia de aes realiza qual operao. J que a TV digital assemelha-se em vrios aspectos a um computador, h a possibilidade de se utilizar mouse e teclado. Eles, no entanto, so pouco prticos quando no tpico ambiente em que a televiso utilizada, que mais relaxado e pode no contar com apoio para o mouse. Alm disso, na maior parte do tempo, so desnecessariamente complexos. Muitas pesquisas foram feitas em busca de alternativas, mas, apesar de apresentarem seus mritos, todas possuem problemas srios que dificultariam sua implementao se aplicadas ao contexto brasileiro. Esses problemas e as pesquisas em si so detalhados na Seo 2.

11

Esse trabalho sugere a interao por meio da Viso Computacional como uma alternativa natural e acessvel. A Viso Computacional o conjunto de mtodos e tcnicas atravs dos quais sistemas computacionais podem ser capazes de interpretar imagens (WANGENHEIM, Aldo von; COMUNELLO, Eros, 2005). A webcam uma cmera de vdeo de baixo custo que capta imagens e as transfere para um computador ou dispositivo equivalente, como o set-top-box. Ela o equipamento sugerido neste trabalho para interao atravs da Viso Computacional.

1.3 Justificativa

A utilizao de Viso Computacional como meio de interao uma opo que se destaca pela sua naturalidade, constantemente buscada na Interao Humano-Computador por implicar um aprendizado mais rpido da interface e uma memorizao melhor. O nico equipamento adicional necessrio uma webcam, bem mais econmica e presente nos lares brasileiros do que as outras opes pesquisadas, as quais so detalhadas na Seo 2. Alm disso, as possibilidades de comandos so potencialmente ilimitadas, considerando, por exemplo, os diferentes gestos possveis e combinaes, o que indica um tipo de interface capaz de se adaptar s mais variadas aplicaes.

1.4 Organizao da Monografia

Essa monografia est organizada da seguinte forma: o Captulo 2 apresenta uma reviso da literatura sobre a televiso digital, Viso Computacional aplicada interao e Viso Computacional aplicada interao com a televiso digital. O Captulo 3 trata dos objetivos deste trabalho. O Captulo 4 apresenta a metodologia adotada para o estudo e a implementao, detalhando-os. O Captulo 5 apresenta a concluso e trabalhos futuros propostos com base no aplicativo criado.

12

13

1.5 Objetivos

1.5.1 Objetivo Geral

O objetivo geral desse trabalho ajudar a suprir a necessidade de um diferente modo de interao para a televiso digital, implementando uma alternativa mais flexvel, natural e acessvel do que aquelas presentes no estado da arte.

1.5.2 Objetivos Especficos

A fim de atingir o objetivo geral deste trabalho, este foi dividido nos seguintes objetivos especficos: identificar uma alternativa que atenda aos requisitos procurados; identificar ambientes e ferramentas adequados para seu desenvolvimento; implementar esta alternativa (um modo de interao por meio da Viso Computacional) pelo meio da qual seja possvel interagir com a televiso digital; avaliar as limitaes da implementao e possveis solues.

14

2 REVISO DE LITERATURA

2.1 Modos de interao alternativos para a televiso digital

Entre as pesquisas da rea, destaca-se Berglund (2005), que elaborou um prottipo para acessar a televiso atravs de um guia de programao em papel digital e uma caneta digital. Tal soluo, no entanto, seria pouco vivel para a realidade brasileira, tendo em vista o alto custo do equipamento. O trabalho de Gomes, Lima e Nevado (2006), direcionado para a televiso brasileira, tambm utiliza o papel, mas atravs do cdigo de barras. Como a televiso no um meio adequado para a leitura de longos textos (GOMES; LIMA; NEVADO, 2006), continuar-se-ia a utilizar o papel comum, e cdigos de barras no papel permitiram o acesso ao contedo extra na televiso. Um leitor de barras acoplado ao controle remoto leria o cdigo, transmitiria o sinal para o set-top-box que, atravs do recurso de vdeo por demanda, obteria o vdeo equivalente. No entanto, apesar desse novo modo de interao apresentar possibilidades promissoras, ele no resolve os problemas encontrados com o modo de interao tradicional (isto , o controle remoto), tratando-se apenas de um complemento interface j existente. Robertson et al. (1996) apresentam a utilizao de um Personal Digital Assistant (PDA). PDAs j so utilizados como controles remotos (ROBERTSON et al. 1996), mas com a televiso digital eles se mostram mais versteis e capazes de serem utilizados mais facilmente num grande nmero de aplicaes interativas. Porm, eles apresentam custo superior s condies da maioria da populao brasileira, o que dificulta seu uso como forma padro de interao com a nova mdia. Enns e Mackenzie (1998) sugerem uma relevante alternativa ao controle remoto tradicional: uma verso com touch-pad. Com essa alterao, o problema com o nmero de botes do controle reduzido, uma vez que ou eles so apresentados na tela, ou acessa-se os comandos por traos no touch-pad. Assim, quando novos recursos so adicionados televiso, no preciso uma mudana em hardware, apenas em software. Essa alternativa tambm apresenta a vantagem de o usurio s manter a ateno na tela, sem precisar olhar

15

para o controle. A alternativa com touch-pad, porm, apresenta o mesmo problema do PDA: custo praticamente invivel para a maior parte da populao. Outra opo que no depende de hardware adicional a interao vocal. (IBRAHIM; JOHANSSON, 2002; BERGLUND; OVARFORDT, 2003; FUJITA et al, 2003; BERGLUND; JOHANSSON, 2004) so alguns dos trabalhos j existentes na rea, mas o mais relevante o trabalho de Carvalho, Guimares e Macedo (2008). Alm de ser voltado diretamente para TV brasileira assim como o trabalho de Gomes, Lima e Nevado (2006), destaca-se por se direcionar a aplicaes para a televiso em geral, e no somente a guias para a televiso, como os outros trabalhos. Alm disso, o nico que usa a linguagem VoiceXML. A interao vocal uma boa soluo para a questo dos hardwares no acessveis. Porm, de acordo com Berglund e Johansson (2004), os usurios desejam que o controle permanea mesmo com integrao vocal, uma vez que em determinadas situaes (silncio durante um filme, ou uma conversa na televiso, por exemplo) tal dispositivo se mostra mais adequado. Surge ento a alternativa de interao por meio de Viso Computacional, tratada na prxima seo.

2.2 Interao por Viso Computacional com a televiso

A ideia de usar Viso Computacional para interagir com a TV no nova. Freeman e Weissman (1995) a implementaram na televiso analgica. Seu projeto era limitado pela tecnologia da poca, precisava de um computador para operar e era mais restrito por precisar tambm de hardware especializado. Reichow (2009) mencionou a possibilidade da utilizao de gestos como forma de interao com a televiso digital, mas no foi alm disso. Barreto et al. (2010) fez um trabalhado bem parecido; entretanto, utilizaram cmeras e LEDs infravermelhos, que so equipamentos de custo mais elevado. No foram encontrados outros trabalhos na rea.

16

4 METODOLOGIA

Este trabalho foi desenvolvido em trs etapas. Primeiro, estudou-se o ambiente televisivo para uma melhor compreenso das possibilidades, do ambiente e das linguagens envolvidas. Sabendo a linguagem a ser utilizada, passou-se para a prxima etapa, estudar como a utilizar para fazer as operaes de Viso Computacional desejadas. A ltima etapa foi fazer a Viso Computacional operar em um aplicativo para televiso digital e afetar seu funcionamento.

4.1 Desenvolvendo para a TV Digital brasileira

A televiso digital brasileira utiliza o middleware Ginga (SOUZA et al. 2007), que dividido nos mdulos Ginga-NCL e Ginga-J. O Ginga-NCL predominantemente declarativo e o Ginga-J predominantemente imperativo, mas ambos so capazes de produzir softwares hbridos. Inicialmente, o Ginga-NCL foi escolhido por estar mais definido e ser amplamente utilizado, enquanto o Ginga-J estava com seu desenvolvimento paralisado. Alm disso, o Ginga-NCL usa a potente linguagem de script Lua, que imperativa, podendo assim compensar essa falha. No entanto, aps o estudo, foi descoberto que no possvel no NCL implementar uma forma de interao alternativa. Ento, o Ginga-J foi selecionado. Foi escolhido o emulador XleTView (XLETVIEW, 2010) para rodar a aplicao, por ser o mais utilizado e, pelo que foi visto, o mais completo.

17

4.2 Trabalhando com Viso Computacional

Para criar um aplicativo de Viso Computacional utilizou-se o Processing (PROCESSING, 2010), um ambiente de desenvolvimento Java, junto com uma verso Java da biblioteca OpenCV, de cdigo aberto (MARENGONI; STRINGHINI, 2010). A linguagem Java foi escolhida por ser a linguagem utilizada na programao de Xlets2. Processing e OpenCV so ferramentas chave em Viso Computacional em Java, possuindo muitos recursos teis. O software desenvolvido foi dividido em duas partes. Na primeira fase, de preparao, capturada uma imagem da webcam. Ela considerada o fundo, e considerada-se que no h ningum em frente a cmera nesse momento. A imagem convertida para preto-e-branco e borrada, para diminuir o rudo.

Figura 1: Diagrama da fase de preparao.

2

Xlet uma aplicao projetada para o Java TV, similar a um applet do Java (XLET, 2010). O Java TV parte do Ginga-J. Por isto desenvolve-se Xlets para Ginga-J.

18

A segunda fase a de operao. Imagens so continuamente capturadas da cmera. Nessa fase, o usurio coloca a mo em frente cmera, e a aplicao detectar em que posio ela est. Cada imagem capturada passa pelo mesmo processo da imagem de fundo, e ento feita uma diferena entre as duas. O resultado ento mostra o que fundo e o que no . Captura-se ento os blobs3 da imagem atravs do OpenCV e seleciona-se o maior, que ser a mo. Este armazenado como uma sequncia de pontos, que representam o contorno da mo. A imagem um plano cartesiano cuja origem o canto superior esquerdo e s h pontos positivos. Ento, procura-se o menor X (coordenada horizontal), para determinar se a mo entrou na rea esquerda ou se est na rea direita. Se o menor X for menor que a metade da rea capturada pela cmera, considera-se que a mo est esquerda e, do contrrio, direita. O processo equivalente realizado com o menor Y (coordenada vertical) para determinar se a mo est acima ou abaixo. O resultado mostrado na Figura 3.

Figura 2: Diagrama da fase de operao.3

Um blob uma regio de uma imagem que pode ser delimitada por um nico contorno (BLOB EXTRACTION, 2010).

19

Figura 3: Identificao da regio onde est a mo. Utilizou-se um mtodo do Processing para destacar o blob identificado.

4.3 Utilizando Viso Computacional para interagir com a TV

Ao incorporar o cdigo da aplicao a um Xlet, o Processing no mais necessrio. Ele foi usado como ferramenta de desenvolvimento por ser possvel obter feedback mais

20

facilmente atravs dele, mas ele no necessrio para o funcionamento da aplicao final. Apenas a biblioteca OpenCV ser necessria para trabalhar com a Viso Computacional. A fase de preparao foi incorporada ao mtodo startXlet, que serve para inicializao do aplicativo. StartXlet tambm cria um thread responsvel pela execuo da fase de operao. Esse mtodo precisa retornar rapidamente, por isso operaes mais longas requerem um thread separado. No thread, um loop infinito monitora a webcam, capturando uma imagem a cada cinco segundos. Esse intervalo foi criado para evitar sobrecarregar o Xlet, pois operaes feitas para a televiso tem o processamento muito limitado. A imagem passa ento pelo mesmo processo que anteriormente, e identificada a regio em que a mo est. Tal informao retornada ao Xlet atravs de um inteiro (h um cdigo para cada regio). O Xlet ento faz a operao que desejar com essa informao, como, nesse exemplo, exibir uma mensagem.

Figura 4: Aplicao de televiso digital em funcionamento

Uma diferena que esta aplicao leva em conta o ponto de vista do usurio, e no o da cmera, para definir o que esquerda e o que direita. As fotografias da mo foram tiradas com uma cmera fotogrfica normal.

21

A operao poderia ser tambm alterar o volume ou mudar de canal. possvel inclusive considerar como regio no-detectada os casos em que a imagem da cmera for igual ao fundo.

Figura 5: Estado em que no h deteco de mo.

possvel tambm para o Xlet guardar a regio anterior. Assim, o aplicativo poder verificar se a mo passou de no detectada para esquerda e ento direita, o que significar ir para o prximo canal, ou passou de no detectada para direita e ento para esquerda, para ir para o canal anterior. O mesmo raciocnio pode ser utilizado para volume.

4.4 Diagramas UML

A UML uma linguagem de modelagem padro em sistemas orientados a objetos, composta por vrios diagramas que descrevem graficamente as caractersticas do sistema e auxiliam em sua melhor compreenso. As prximas sees utilizam destes para melhor descrever a implementao desenvolvida.

22

4.4.1 Diagrama de classe

Conforme a definio de Booch et al.(2000) um diagrama de classes aquele que mostra um conjunto de classes, interfaces, colaboraes e seus relacionamentos. A aplicao possui a classe XletMain, que implementa a interface Xlet e inicializa todas as variveis, alm de criar uma instncia de MyThread. MyThread herda da classe Thread e um thread que opera paralelamente classe principal, e tem como funo monitorar a webcam para deteco de comandos. Ele possui uma referncia XletMain para poder retornar os comandos quando estes forem detectados e identificados. A classe MyThread precisou ser criada porque os mtodos de XletMain retornam pouco depois de chamados, por sua natureza (aplicao para televiso digital) e por isso, no poderiam ser utilizados para monitoramento da webcam.

Figura 6: Diagrama de classes do sistema

4.4.2 Diagrama de sequncia

O diagrama de sequncia representa a interao entre os objetos do sistema no decorrer do tempo. Abaixo, podemos ver exatamente como as duas classes do sistema interagem e como o usurio interage com elas.

23

Figura 7: Diagrama de sequncia do sistema

4.4.2 Diagrama de componentes

Um componente uma pea modular de um sistema lgico ou fsico. Nesse sistema, o componente XletMain rodado atravs do emulador XleTView, que funciona atravs do ambiente Java, JRE (Java Runtime Environment). XletMain possui um objeto OpenCV para as operaes de Viso Computacional, que acessado pelo MyThread. O objeto OpenCV utiliza a JMF, Java Media Framework, para lidar com mdia como a webcam. O objeto MyThread instanciado pelo XletMain e possui uma referncia ele, atravs da qual retorna o resultado de seu monitoramento.

24

Figura 8: Diagrama de componentes do sistema

4.5 Testes

Todos testes foram executados em frente uma parede branca, sendo esta a nica coisa em frente webcam no incio da aplicao. Testes foram executados em diferentes iluminaes (perodo matutino, vespertino e noturno) e tanto utilizando a mo quanto utilizando objetos. Tambm foi testado o caso de mais de uma mo e de objetos sobrepostos. O perodo vespertino aquele em que a deteco funcionou melhor. No perodo matutino, o excesso de iluminao deixou a imagem com baixo contraste, o que dificultou a deteco da mo. No perodo noturno, a webcam, com menor quantidade de luz, teve maior quantidade de rudo, o que gerou um nmero maior de falso-positivos. A aplicao no diferencia uma mo de algum outro objeto. Objetos sobrepostos so interpretados como um objeto. No caso de mais de uma mo, s uma delas detectada.

25

4.6 Limitaes da implementao

A implementao no apropriada para um ambiente real, pois no distingue a mo de outros objetos em movimento ou de qualquer outro objeto acrescentado ou retirado aps a inicializao do aplicativo. Alm disso, normalmente em uma situao real a primeira imagem no ser vazia. A webcam provavelmente estar junto da televiso, com uma viso ampla, ento uma implementao por regies como essa no funcionar. Ela tambm tem possibilidades de comandos limitadas com s quatro regies, mas utilizar mais regies poderia ficar complicado para o usurio entender. possvel obter mais comandos se eles forem uma sequncia de regies, o que fica menos intuitivo para o usurio. Quando a iluminao exclusivamente artificial, h mais rudo na webcam e podem acontecer falsopositivos. A implementao tambm se baseia na localizao de um nico ponto, escolhido com base na posio do usurio. Para um caso genrico, o ideal seria escolher o ponto central da mo.

26

5. CONCLUSO E TRABALHOS FUTUROS

5.1 Concluso

Com a implementao de um aplicativo de interao com a televiso digital por meio da viso computacional, conseguiu-se realizar o objetivo deste trabalho. A utilizao da webcam ao invs de outro equipamento mais sofisticado o torna mais acessvel que muitos trabalhos na rea. A flexibilidade e naturalidade foram alcanadas, ainda que limitadas. Esse trabalho pode ser usado como base para o desenvolvimento de uma interface por meio de gestos, que cumpre melhor esses requisitos de um alternativo modo de interao. Todos objetivos especficos foram alcanados. Durante o desenvolvimento deste trabalho, pode-se observar o quanto os projetos da televiso digital (em especial a brasileira) esto em fase inicial, e se faz necessrio ainda muito estudo e desenvolvimento de aplicativos na rea. Foi possvel chegar a essa concluso pela falta de um emulador atual do Ginga-J e de funes importantes no emulador XleTViewer, como a mudana entre canais. Com o estudo da rea, tambm foi possvel concluir que uma aplicao como essa, na prtica, tem que ser residente e inserida pelo fabricante, para poder trocar de canais sem ser encerrada (outros aplicativos esto inerentemente ligados a canais, e so encerrados quando ocorre a troca). A principal contribuio deste trabalho, no entanto, apresentar uma alternativa ao controle remoto, intuitiva, acessvel e potencialmente verstil, contribuindo para uma convergncia de reas ainda pouco estudada.

5.2 Trabalhos futuros

Diversas melhorias podem ser feitas em cima deste trabalho. A fim de otimizar a utilizao de recursos (que so escassos nos set-top-boxes, em que as aplicaes so rodadas)

27

este aplicativo pode ser desenvolvido em C, como um componente do middleware ao invs de uma aplicao a ser rodada por ele. Pode utilizar o equivalente ferramenta GART 4 para reconhecer gestos, ao invs de regies, aumentando assim a sua versatilidade e resolvendo a questo da distncia da webcam e do ponto a ser identificado. Pode melhorar o processamento da imagem, a fim de se certificar que o que foi encontrado uma mo. Isso pode ser feito segmentando a pele atravs de um histograma de cor, procurando pelo maior crculo preenchido dentro disso ou procurando por pontas de dedos. Uma outra possibilidade a identificao de vrias mos e reconhecimento de suas aes simultaneamente, seja para aes distintas ou conjuntas. Nos trabalhos futuros importante considerar a acessibilidade, mas essencial sempre levar em conta o processamento e memria limitados do set-top-box, a necessidade de resposta em tempo real e a baixa tolerncia a falhas do ambiente televisivo.

4

GART (Gesture and Activity Recognition Toolkit) um toolkit de interface com o usurio projetado para permitir o desenvolvimento de aplicaes baseadas em gestos (LYONS; BRASHEAR; WESTEYIN, 2007).

28

REFERNCIAS

BARRETO, Francisco de Paula; CAETANO, Alexandra Cristina Moreira; ANTUNES, Gustavo Bezerra Leite; JNIOR, Erisvaldo Gadelha Saraiva; SANTOS, Rodolfo Arruda. CYBERTV Arte na TvDigital. Festival Internacional de Arte e Mdia, 2010. BERGLUND, A; BERGLUND, E.; LARSSON, A.; BANG, M. The Paper Remote: An Augmented TV Guide and Remote Control. International Journal: Universal Access in the Information Society (UAIS), Springer-Verlag Heidelberg, 2005. BERGLUND, A.; JOHANSSON, P. Using speech and dialogue for interactive TV navigation. International Journal: Universal Access in the Information Society (UAIS), Springer-Verlag Heidelberg, 2004. BERGLUND, A; OVARFORDT, P. Error resolution strategies for interactive television speech interfaces. In Human-Computer Interaction - INTERACT 2003. BLOB EXTRACTION. Disponvel em: < http://en.wikipedia.org/wiki/Blob_extraction> Acesso em: 22 nov. 2010. BOOCH, Grady; RUMBAUGH, James; JACOBSON, Ivar. UML Guia do Usurio, p. 472. Editora Campus. Rio de Janeiro RJ, 2000. CARVALHO, Lucas A. M. C.; GUIMARES, Adolfo P.; MACEDO, Hendrik T. Architecures for Interactive Vocal Environment to Brazilian Digital Middleware. ACM, 2008. ENNS, Neil R. N.; MACKENZIE, I. Scott. Touchpad-based remote control devices. ACM, 1998. FREEMAN , W.T.; WEISSMAN, C.D. Television Control by Hand Gestures. Proc. Intl Workshop on Automatic Face and Gesture Recognition, Zurich, Switzerland, p. 179-183, Junho 1995.

29

FREEMAN, Jonathan.; LESSITER, Jane; WILLIAMS, Allan; HARRISON, David. Easy TV 2002 research report. ITC and Consumers Association, 2003. FUJITA, K.; KUWANO, H.; TSUZUKI, T.; ONO, Y.; ISHIHARA, T. A new digital TV interface employing speech recognition. International Conference on Consumer Electronics. ICCE 2003., p. 356-357, 2003. GOMES, Fbio de J. L.; LIMA, Jos V. de; NEVADO, Rosane A. de. O Papel Comum como Interface para TV Digital. ACM, 2006. IBRAHIM , Aseel.; JOHANSSON, Pontus. Multimodal dialogue systems for interactive TV applications. Proceedings ICMI'02 Conference, p. 117-122, 2002. LYONS, Kent; BRASHEAR, Helene; WESTEYN, Tracy; KIM, Jung Soo; STARNER, Thad. GART: The Gesture and Activity Recognition Toolkit. Proceedings of the 12th international conference on Human-computer interaction: intelligent multimodal interaction, p. 718-727, 2007. MARENGONI, Maurcio; STRINGHINI, Denise. Tutorial: Introduo Viso

Computacional usando OpenCV. Revista de Informtica Terica e Aplicada, 2010. PICOLLO, Lara Shicbelsky Gody; BARANUSKAS, Maria Ceclia C. Desafios de Design para a TV Interativa. Anais do IHC, 2006. PROCESSING. Disponvel em: < http://www.processing.org/> Acesso em: 22 nov. 2010. ROBERTSON, Scott; WHARTON, Cathleen; ASHWORTH, Catherine; FRANZKE, Marita. Dual Device User Interface Design: PDAs and Interactive Television. ACM, 1996. REICHOW, Matheus Garcez. Desenvolvimento de aplicaes com sensibilidade ao contexto em TV digital. Universidade Federal de Pernambuco, 2009. SET-TOP BOX. Disponvel em: < http://pt.wikipedia.org/wiki/Set-top_box> Acesso em: 22 nov. 2010.

30

SOUZA FILHO, G. L. de, LEITE, L. E. C. e BATISTA, C. E. C. F. 2007. Ginga-J: The Procedural Middleware for the Brazilian Digital TV System. Journal of the Brazilian Computer Society. Vol. v12, p. 47-56, 2007. TELECO. Disponvel em: < http://www.teleco.com.br/tvdigital_cronog.asp > Acesso em: 06 dez. 2010. XLET. Disponvel em: < http://en.wikipedia.org/wiki/Xlet> Acesso em: 22 nov. 2010. XLETVIEW. Disponvel em: < http://www.xletview.org/ > Acesso em: 22 nov. 2010. WAISMAN, Thais. Usabilidade em servios educacionais em ambiente de TV digital. Universidade de So Paulo, 2006. WANGENHEIM, Aldo Von; COMUNELLO, Eros. Viso computacional: Seminrio Introduo Viso computacional. The Cyclops Project. PPGCC-INE-UFSC. 2005. Disponvel em: Acesso em: 05 dez. 2010.