3
Inteligência Artificial I - Visão Computacional Michel Alves dos Santos * 07 de Junho de 2011 1 Percebendo o Mundo Como podemos perceber o mundo a nossa volta? Resposta: através de nossos sentidos. E o mais importante deles é a visão. Nesse momento faz-se juízo a celebre frase ‘uma imagem vale mais do que mil palavras’. 2 Anatomia do Olho Humano e Processo de Visão O globo ocular, com cerca de 25 milímetros de diâmetro, é o responsável pela captação da luz refletida pelos objetos à nossa volta. Essa luz atinge em primeiro lugar nossa córnea, que é um tecido transparente que cobre nossa íris como o vidro de um relógio. Em seu caminho, a luz agora passa através do humor aquoso, penetrando no globo ocular pela pupila, atingindo imediatamente o cristalino que funciona como uma lente de focalização, convergindo então os raios luminosos para um ponto focal sobre a retina. Na retina, mais de cem milhões de células fotossensíveis transformam a luz em impulsos eletroquímicos, que são enviados ao cérebro pelo nervo óptico. No cérebro, mais precisamente no córtex visual ocorre o processamento das imagens recebidas pelo olho direito e esquerdo completando então nossa sensação visual. O olho humano é um órgão da visão, no qual uma imagem óptica do mundo externo é produzida e transformada em impulsos nervosos e conduzida ao cérebro. 3 Visão Computacional Campo da Computação Gráfica que desenvolve teoria e tecnologia para a construção de sistemas artificiais capazes de analisar entradas visuais. * Bacharelando em Ciência da Computação, Universidade Federal do Estado de Alagoas(UFAL), Bol- sista do Laboratório de Modelagem Geométrica e Visão Computacional do Centro de Pesquisa em Ma- temática Computacional(CPMAT), Brasil - Maceió/AL, Tel: 8805-0582 E-mail: [email protected], [email protected] 1

Computer Vision - Presentation Notes

Embed Size (px)

Citation preview

Page 1: Computer Vision - Presentation Notes

Inteligência Artificial I - Visão Computacional

Michel Alves dos Santos ∗

07 de Junho de 2011

1 Percebendo o MundoComo podemos perceber o mundo a nossa volta? Resposta: através de nossos sentidos.

E o mais importante deles é a visão. Nesse momento faz-se juízo a celebre frase ‘umaimagem vale mais do que mil palavras’.

2 Anatomia do Olho Humano e Processo de VisãoO globo ocular, com cerca de 25 milímetros de diâmetro, é o responsável pela captação

da luz refletida pelos objetos à nossa volta. Essa luz atinge em primeiro lugar nossa córnea,que é um tecido transparente que cobre nossa íris como o vidro de um relógio. Em seucaminho, a luz agora passa através do humor aquoso, penetrando no globo ocular pelapupila, atingindo imediatamente o cristalino que funciona como uma lente de focalização,convergindo então os raios luminosos para um ponto focal sobre a retina. Na retina, maisde cem milhões de células fotossensíveis transformam a luz em impulsos eletroquímicos, quesão enviados ao cérebro pelo nervo óptico. No cérebro, mais precisamente no córtex visualocorre o processamento das imagens recebidas pelo olho direito e esquerdo completandoentão nossa sensação visual.

O olho humano é um órgão da visão, no qual uma imagem óptica do mundo externo éproduzida e transformada em impulsos nervosos e conduzida ao cérebro.

3 Visão ComputacionalCampo da Computação Gráfica que desenvolve teoria e tecnologia para a construção

de sistemas artificiais capazes de analisar entradas visuais.∗Bacharelando em Ciência da Computação, Universidade Federal do Estado de Alagoas(UFAL), Bol-

sista do Laboratório de Modelagem Geométrica e Visão Computacional do Centro de Pesquisa em Ma-temática Computacional(CPMAT), Brasil - Maceió/AL, Tel: 8805-0582 E-mail: [email protected],[email protected]

1

Page 2: Computer Vision - Presentation Notes

4 Máquinas e PercepçãoPercepção de máquina é a habilidade de usar a entrada de sensores (como câmeras, mi-

crofones, sonar e outrs aparelhos) para deduzir aspectos do mundo. Visão Computacionalé a habilidade de analisar entradas visuais. Alguns subproblemas da área de percepção demáquina são o reconhecimento de linguagem(fala ou discurso), o reconhecimento facial e oreconhecimento de objetos.

http://en.wikipedia.org/wiki/Artificial_intelligence

5 Harry Porter’s Collection of Robot Videoshttp://web.cecs.pdx.edu/~harry/Robots/index.html

6 KismetO Robô-babá, que toma conta de bebês enquanto os pais trabalham ou vão jantar fora,

por enquanto só existe em desenho animados. Mas a situação oposta já é realidade - umrobô-bebê, paparicado o tempo todo por uma babá humana. Kismet, uma cabeça metá-lica de 3,6 quilos acoplada a um computador, é o projeto mais recente do Laboratório deInteligência Artificial do MIT, o Instituto de Tecnologia de Massachusetts, nos EstadosUnidos. Ele sorri e arregala doces olhos azuis quando tem um companheiro para brincar.Se está sozinho, fica triste e entediado. Kismet é o irmão caçula de Cog, o robô do MIT queestá sendo desenvolvido há quatro anos para "aprender"por conta própria - quando algumde seus movimentos dá errado, seu computador apaga as conexões elétricas responsáveispelo fracasso. No estágio atual, o Cog já tem a inteligência de um gatinho recém-nascido.Para avançar mais, terá de aprender a se comunicar com os humanos. A cabeça robóticainterativa surgiu para ajudar na tarefa. No futuro, as duas engenhocas deverão ser fun-didas numa só. "Queremos construir sistemas capazes de interagir com seres humanos",explica a cientista da computação Cynthia Breazeal, a "mãe"do Kismet. Por enquanto,suas habilidades se limitam a um repertório de nove expressões faciais, que ele manifestaem reação aos estímulos recebidos de fora. Quando Cynthia agita na sua frente um ursinhode pelúcia ou qualquer outro objeto, ele sorri, satisfeito. Se a pesquisadora fica imóvel,Kismet faz cara de triste; e fica irritado quando o brinquedo é chacoalhado num ritmorápido. Essa é a sua maneira de sinalizar se o estímulo recebido é adequado, insuficenteou excessivo. Kismet não ouve, não fala e é incapaz de perceber o que significam os gestoscaptados pela sua visão. Para os seus criadores, tudo bem. O bebê-robô não veio ao mundopara ser um Einstein - basta conseguir se expressar. Cynthia acredita que, com o tempo,seus recursos se tornarão mais sofisticados. "Nós também não nascemos com a capacidadede nos relacionar com o mundo", observa. "Se os seres humanos podem aprender, nadaimpede que um dia as máquinas também desenvolvam essa habilidade", diz a mãe coruja.Se a sua criatura não chegar tão longe, servirá ao menos como inspiração para as fábricasde brinquedos eletrônicos.

2

Page 3: Computer Vision - Presentation Notes

7 Curiosidades sobre o KismetRodney Brooks, que dirigia até recentemente o Laboratório de Ciência da Computação e

Inteligência Artificial do MIT, decidiu em 1993 que desenvolveria um novo robô, invertendoo processo dominante nas pesquisas da época. Ele abandonou a idéia de que as máquinasdeveriam dispor de um sistema cognitivo, e se concentrou em equipá-las com sentidos etorná-las capazes de ação. O Cog, criado em 1993 e desenvolvido nos 11 anos posteriores,foi criado para aprender como se fosse uma criança, com base em impulsos sensórios emotores.

Já Cynthia Breazal, que começou a trabalhar com Brooks como aluna de pós-graduação,em 1990, depois de cuidar de boa parte do trabalho básico de computação do Cog, decidiuque seu projeto de doutorado seria a criação de um novo robô sociável. O projeto ganhouo nome de Kismet, e se tornou o mais expressivo dos robôs sociáveis construídos até então,dada sua capacidade de expressar algumas emoções básicas por meio de mudanças emsua expressão facial - ou seja, posição dos olhos, lábios, sobrancelhas e orelhas de papelcor-de-rosa.

Acionado por 15 computadores funcionando em paralelo, o Kismet funcionava maispor aprendizado social do que em modo cognitivo. O robô foi dotado da capacidade dereconhecer objetos de cores brilhantes, e de reagir à presença deles com uma expressãoentusiasmada. Na ausência de estímulos, ele assumia uma expressão entediada. Quandoos cientistas começaram a acenar com objetos coloridos para o aparelho, surgiu um des-dobramento inesperado: o robô reconhecia os objetos e demonstrava entusiasmo; os sereshumanos, animados com a reação, redobravam seus esforços de exibição do objeto. Comisso, era estabelecido um loop de retroalimentação social semelhante ao que surge quandouma pessoa brinca com um bebê.

8 Site com Alguns Trabalhos Interessanteshttp://www.math.tau.ac.il/~dcor/

3