Procesamiento de Imagens

  • Upload
    ejmcsic

  • View
    223

  • Download
    0

Embed Size (px)

Citation preview

  • 8/12/2019 Procesamiento de Imagens

    1/248

    PROYECTO FIN DE CARRERA

    RECONOCIMIENTO DE IMGENES A

    TRAVS DE SU CONTENIDO

    AUTOR: Antonio Peralta SezMADRID, Junio 2009

    UNIVERSIDAD PONTIFICIA COMILLAS

    ESCUELA TCNICA SUPERIOR DE INGENIERA (ICAI)

    INGENIERO EN INFORMTICA

  • 8/12/2019 Procesamiento de Imagens

    2/248

    Autorizada la entrega del proyecto del alumno/a:Antonio Peralta Sez

    EL DIRECTOR DEL PROYECTORafael Palacios Hielscher

    Fdo.: Fecha: / /

    V B del Coordinador de ProyectosDavid Contreras Brcena

    Fdo.: Fecha: / /

  • 8/12/2019 Procesamiento de Imagens

    3/248

    I

    RESUMEN

    Los buscadores de imgenes actuales, como Google images, se basan principalmente en el

    nombre del archivo que contiene la imagen, en el nombre del enlace y en el texto que aparece

    en la pgina donde se encuentra la imagen. Es decir que la bsqueda se basa en informacin

    de tipo texto y no en informacin grfica.

    El objetivo de este proyecto es desarrollar algoritmos de tratamiento digital de imgenes

    que permitan clasificar fotografas en base al contenido grfico.

    La idea para el desarrollo de este proyecto se basa en la creacin de un conjunto deimgenes para posteriormente segmentar la imagen, y extraer de ella objetos y fondos

    conocidos, y clasificarlas de acuerdo a los elementos localizados.

    En este proyecto se ha desarrollado tres algoritmos de alto nivel para el

    reconocimiento de los siguientes elementos:

    Imgenes con cielo. Imgenes con csped. Imgenes con caras.

    Para la identificacin de los dos primeros casos, se combina la informacin de dos

    algoritmos de ms bajo nivel que identifican el color y la textura. Para la identificacin

    del color, primero se realiza un estudio de las proyecciones RGB y HSV, en el cual se

    analiza cual de los dos mtodos es ms apropiado.

    Para la clasificacin de un color se calcula el grado de pertenencia de un punto a

    funciones de densidad FDP obtenidas experimentalmente a partir de imgenes reales.

    Fig 3-Cielo25

    Fig 1- Cesped8

    Fig 2- Rostro3

  • 8/12/2019 Procesamiento de Imagens

    4/248

    II

    La deteccin de las texturas se realiza mediante el anlisis del histograma de la imagen

    en escala de grises.

    Por ltimo, el algoritmo localizador de caras, se basa en la identificacin previa de

    los ojos, donde se aplican restricciones de tipo geomtrico. A continuacin se intentaidentificar una boca, en la parte inferior de los ojos centrado entre ambos. En caso de

    localizar afirmativamente los ojos y la boca, en la geometra apropiada, la respuesta del

    algoritmo ser afirmativa.

    A continuacin se muestra algunos resultados obtenidos con los algoritmos cielos y

    rostros, tras un anlisis completo de la fotografa.

    Todos estos algoritmos se desarrollan en matlab, debido a la gran capacidad de

    clculo matricial que ofrece y a la facilidad de trabajo con imgenes gracias a la Image

    Precessing Toolbox.

    Todos los algoritmos desarrollados han sido evaluados con una librera de imgenes

    formada por fotografas de diversos contenidos, iluminacin, ubicacin geometra, etc.

    Fig 5-Resultados del algoritmo

    de cielo (verde indica

    clasificado como cielo)

    Fig 4- Resultado obtenido tras analizar la

    fotografa con el algoritmo rotro.

  • 8/12/2019 Procesamiento de Imagens

    5/248

    III

    ABSTRACTThe current search engine images, such as Google image, base their search on the

    file name that contains the picture, link name, or the text of the website in which the

    picture appears. In other words, they base their search on text information, and not on

    graphic information.

    The objective of this project is to develop digital image processing algorithms to

    classify pictures in accordance with the graphic information.

    The main idea of this project is to create a set of images, segment them, and extractthe familiar objects and backgrounds from the pictures, in order to classify them.

    In this project, three high level algorithms have been developed to recognize the

    following elements:

    Image with sky Image whith grass Image whith face

    The information of two low level algorithms, that indentify the color and the

    texture, is combined to identify images with sky, and image with grass. A study of the

    RGB and HSV projections is carried out to identify the color; this study analyzes which

    method, RGB or HSV, is more appropriated.

    The grade of membership of a point to a density function FDP (obtained

    experimentally throw real images) is calculated to classify the color.

    Fig 3-Cielo25

    Fig 2- Cesped8

    Fig 1- Rostro3

  • 8/12/2019 Procesamiento de Imagens

    6/248

    IV

    The detection of textures is carried out by means of the analysis of the grey scale

    image histogram.

    Finally, the algorithm that locates faces applies geometric restrictions to identify the

    eyes. After identifying the eyes, the algorithmic tries to identify the mouth under theeyes, and centered between them. In the case of locating the eyes and mouth in the

    correct geometry, the algorithms answer will be affirmative.

    Next, the results of the sky and face algorithms are shown after a complete analysis

    of the pictures.

    All of these algorithms were developed in Matlab owing to its high capacity of

    matrix calculation, and its facility of working with images due to the Image Processing

    Toolbox.

    Every one of the algorithms has been evaluated using an image library that consists

    of pictures of several contents, illumination, geometric location, etc

    Fig 5- Result of sky algorithm

    (green means classified as sky)

    Fig 4- Result of the face algorithm.

  • 8/12/2019 Procesamiento de Imagens

    7/248

    V

    1 Introduccin y estado del arte.................................................................... - 1 -

    1.1 Reconocimiento de caracteres. ............................................................... - 3 -

    1.1.1 Introduccin .......................................................................................... - 3 -

    1.1.2 Arquitectura de reconocimiento de caracteres manuscritos ................. - 5 -

    1.1.3 Extraccin de caractersticas ................................................................ - 7 -

    1.1.4 Comparacin......................................................................................... - 8 -

    1.1.5 Conclusiones ........................................................................................ - 9 -

    1.2 Reconocimiento de firmas.................................................................... - 10 -

    1.2.1 Introduccin ........................................................................................ - 10 -

    1.2.2 Verificacin de firma off-line ............................................................. - 11 -

    1.2.3 Descripcin del sistema ...................................................................... - 12 -

    1.2.4 Modelos HMM ................................................................................... - 18 -

    1.2.5 Resultados obtenidos .......................................................................... - 19 -

    1.2.6 Conclusiones ...................................................................................... - 21 -

    1.3 Reconocimiento de rostros y expresiones faciales............................... - 22 -

    1.3.1 Introduccin ........................................................................................ - 22 -

    1.3.2 Descripcin del sistema ...................................................................... - 22 -

    1.3.3 Programa............................................................................................. - 30 -

    1.3.4 Resultados .......................................................................................... - 31 -

    2 Identificacin de necesidades......................................................................... - 33 -

    2.1Introduccin IDN...................................................................................... - 33 -

    2.2Documento de concept del sistema............................................................ - 34 -

    2.2.1 Objetivos del sistema .......................................................................... - 34 -

    2.2.2 Alcance del sistema ............................................................................ - 35 -

    2.2.3 Topologa de usuario finales .............................................................. - 36 -

  • 8/12/2019 Procesamiento de Imagens

    8/248

    VI

    2.2.4 Restricciones....................................................................................... - 36 -

    3 Plan de gestin............................................................................................ - 38 -

    3.1Descripcin general del proyecto............................................................. - 38 -

    3.2Diagrama de actividades a realizar.......................................................... - 39 -

    3.3Descripcin detallada de las actividades.................................................. - 40 -

    3.4Diagrama del equipo de trabajo............................................................... - 46 -

    3.5Descripcin de actividades de cada integrante......................................... - 47 -

    3.6Estimacin del esfuerzo de cada integrante.............................................. - 51 -

    3.7 Presupuesto............................................................................................... - 52 -

    3.8 Planificacin de las actividades................................................................ - 53 -

    4 Estudio de arquitectura................................................................................. - 55 -

    4.1Introduccin E-ARQ.................................................................................. - 55 -

    4.2Hardware/software del sistema actual...................................................... - 57 -

    4.3Especificaciones de las aternativas. .......................................................... - 59 -

    4.4Evaluacin de las alternativas.................................................................. - 65 -

    4.4.1 Evaluacin tcnica .............................................................................. - 65 -

    4.4.2 Evaluacin econmica ........................................................................ - 66 -

    4.5 Seleccin de la alternativa........................................................................ - 67 -

    5. Reconocimiento de colores............................................................................ - 69 -

    5.1Introduccin.............................................................................................. - 69 -

    5.2Modelo RGB.............................................................................................. - 79 -5.3Modelo HSV.............................................................................................. - 81 -

    5.4Estudio RGB del Cielo.............................................................................. - 83 -

    5.5Estudio RGB del csped............................................................................ - 88 -

    5.6Estudio RGB: cielo vs csped.................................................................... - 92 -

    5.7 Conclusin RGB........................................................................................ - 96 -

    5.8Estudio HSV: Cielo.................................................................................... - 98 -

  • 8/12/2019 Procesamiento de Imagens

    9/248

    VII

    5.9Estudio HS Csped.................................................................................. - 100 -

    5.10HS Cielo y Csped................................................................................. - 101 -

    5.11Estudio de conflictos............................................................................. - 102 -

    5.11.1 Conflictos en RGB: interior ........................................................... - 102 -

    5.11.2 Conflictos en RGB: fondo marino .................................................. - 107 -

    5.11.3 Conflictos en HSV: interior ............................................................ - 111 -

    5.11.4 Conflictos en HSV: fondo marino .................................................. - 112 -

    5.12Eleccin RGB o HSV............................................................................. - 113 -

    5.12.1 RGB ................................................................................................ - 114 -

    5.12.2 HSV ................................................................................................ - 117 -

    5.12.3 Conclusin ...................................................................................... - 119 -

    5.13Descripcin del algoritmo. .................................................................... - 120 -

    5.13.1 Algoritmo azul ................................................................................ - 120 -

    1.13.1 Algoritmo verde ............................................................................. - 122 -

    6. Reconocimiento de texturas........................................................................ - 124 -

    6.1Introduccin............................................................................................ - 124 -

    6.2A travs de su histograma....................................................................... - 127 -

    6.2.1 Textura lisa ....................................................................................... - 127 -

    6.2.2 Textura binaria.................................................................................. - 135 -

    6.2.3 Textura rugosa .................................................................................. - 142 -

    6.3Descripcin del algoritmo textura........................................................... - 149 -6.4Texturas a travs de la funcin statxture[F1]......................................... - 153 -

    6.4.1 Textura lisa ....................................................................................... - 154 -

    6.4.2 Textura binaria.................................................................................. - 155 -

    6.4.3 Textura rugosa .................................................................................. - 156 -

    7. Anlisis combinado de color y texturas..................................................... - 158 -

    7.1Descripcin del algoritmo reconocimiento de cielo............................... - 159 -

  • 8/12/2019 Procesamiento de Imagens

    10/248

    VIII

    7.2Descripcin del algoritmo para reconocimiento de csped. ................... - 161 -

    8. Detector caras.............................................................................................. - 163 -

    8.1Introduccin............................................................................................ - 163 -

    8.2 YCbCr...................................................................................................... - 164 -

    8.3Descripcin algoritmo implementado..................................................... - 166 -

    8.3.1 Funcin rostro. .................................................................................. - 166 -

    8.3.2 Funcin ojos ..................................................................................... - 167 -

    8.3.3 Funcin labio .................................................................................... - 170 -

    8.3.4 funcin Localizador (basado en geometras) .................................... - 173 -

    9. Pruebas......................................................................................................... - 179 -

    9.1Evaluacin del algoritmo de deteccin de cielo...................................... - 179 -

    9.2Evaluacin del algoritmo de csped....................................................... - 182 -

    9.3 Pruebas del algoritmo de identificacin textura..................................... - 185 -

    9.4Detalles de evaluacin del algoritmo de reconocimiento de cielo.......... - 187 -

    9.5 Pruebas algoritmo reconocimiento......................................................... - 193 -

    Conclusiones..................................................................................................... - 198 -

    Algoritmos cielo y csped.............................................................................. - 198 -

    Algoritmo de deteccin de rostros................................................................. - 199 -

    Bibliografa....................................................................................................... - 200 -

    Definiciones e imagenes................................................................................ - 200 -

    Libros de consulta......................................................................................... - 202 -Anexo A. Biblioteca imgenes cielo................................................................ - 203 -

    Anexo B. Biblioteca imgenes csped. ........................................................... - 211 -

    Anexo C. Biblioteca imgenes interior.......................................................... - 216 -

    Anexo D. Biblioteca imgenes submarinas................................................... - 220 -

    Anexo E. Biblioteca imgenes rostros. ........................................................... - 222 -

    Anexo F. Cdigo del algoritmo cielo.............................................................. - 228 -

  • 8/12/2019 Procesamiento de Imagens

    11/248

    IX

    Anexo G. Codigo del algoritmo reconocimiento de caras. ........................... - 233 -

  • 8/12/2019 Procesamiento de Imagens

    12/248

    Reconocimiento de imgenes a travs de su contenido

    1

    1 Introduccinyestadodelarte

    Los buscadores de imgenes actuales, como Google images, se basan principalmente en el

    nombre del archivo que contiene la imagen, en el nombre del enlace y en el texto que aparece

    en la pgina donde se encuentra la imagen. Es decir que la bsqueda se basa en informacin

    de texto y no en informacin grfica.

    En la actualidad, Google est desarrollando algoritmos basados en el contenido de las

    imgenes reconociendo formas y analizando su parecido, para ello centran en un subconjunto

    de las imgenes que Google ha catalogado, ya que el anlisis y comparacin de imgenesdigitales requiere de un coste computacional tremendo. Realizar esta labor para todas las

    imgenes indexadas por el buscador sera una tarea casi imposible, a da de hoy.

    El campo del procesamiento de imgenes est continuamente evolucionando.

    Durante los ltimos aos ha habido un incremento significativo en el inters en

    campos como morfologa de imgenes, redes neuronales artificiales, procesamiento

    de imgenes a color y/o en escalas de grises, compresin de datos de imgenes,

    reconocimiento de imgenes y sistemas de anlisis de imgenes basados en

    conocimiento.

    El reconocimiento es un atributo bsico del ser humano, as como de

    otros organismos vivos. Este reconocimiento es generado normalmente por medio de

    patrones.[D1]

    Entre las principales aplicaciones del reconocimiento de formas cabe destacar

    las siguientes:

    Reconocimiento de caracteres. [D2]

    Anlisis de documentos.

    Reconocimiento de firmas.[D3]

    Reconocimiento de huellas dactilares.

    Reconocimiento de piezas industriales.

    Reconocimiento de texturas.

    Deteccin de defectos para control de calidad.

  • 8/12/2019 Procesamiento de Imagens

    13/248

    Reconocimiento de imgenes a travs de su contenido

    2

    Reconocimiento de rostros y expresiones faciales.[D4]

    A continuacin se muestran a modo de introduccin y de forma breve algunos

    estudios realizado sobre estos temas. Estos mismos estudios sirven para visualizar comose encuentra el estado del arte sobre estos temas en la actualidad.

  • 8/12/2019 Procesamiento de Imagens

    14/248

    Reconocimiento de imgenes a travs de su contenido

    3

    1.1 Reconocimientodecaracteres.1.1.1Introduccin

    [D2] En la actualidad el desarrollo de sistemas de reconocimiento de escritura es

    realizado casi en su totalidad, por empresas comerciales, quienes proponen el uso de

    estilos de escritura predeterminados para que el reconocimiento sea vlido, requiriendo

    para ello del aprendizaje del estilo por parte del dibujante. Con lo mencionado

    anteriormente se pretende hacer notar que los problemas en el rea del reconocimiento

    de escritura son numerosos, basta con que dos dibujantes distintos escriban la mismapalabra para comprobar que hay varias caractersticas que varan y que es preciso

    considerar para lograr el reconocimiento. Por esto, el involucrar diversos algoritmos de

    segmentacin y extraccin de caractersticas se vuelve necesario, sin embargo esto

    mismo ocasiona un incremento considerable en el trabajo y en la experiencia requerida

    para darle solucin.

    El estudio en sta rea no es algo reciente, ya desde los aos setenta se han

    realizado trabajos al respecto, y alrededor del mundo hay muchas personas dedicadas a

    investigar un pequeo aspecto sobre el reconocimiento de caracteres, ya sea sobre

    segmentacin, reconocimiento de patrones, contexto, semntica, etc., entre muchas otras

    reas, que pueden a su vez dirigirse hacia alfabetos de distintos idiomas. En el idioma

    espaol se han desarrollado pocos trabajos de este tipo, ya que la gran mayora de las

    soluciones comerciales se encuentran en ingls. El tema es extenso, pues comprende

    desde la captura de la escritura, el estudio o diseo de los medios electrnicos para

    realizarla, el anlisis de los datos y la comunicacin con el dibujante por medio de la

    programacin de interfaces, hasta la validacin y comprobacin de los resultados.

    Considerando que existe una gran cantidad de mtodos para realizar cada parte del

    proceso, segn el enfoque dado, se requiere sin duda del trabajo en equipo no slo de

    ingenieros, sino de personas de diversas disciplinas especializadas en reas

    relacionadas.

    A continuacin se describe un sistema de reconocimiento de caracteres por

    regiones, en particular las cinco vocales. La captura se realiza mediante una tableta

  • 8/12/2019 Procesamiento de Imagens

    15/248

    Reconocimiento de imgenes a travs de su contenido

    4

    digitalizadora, y los trazos de la escritura se guardan como imgenes en formato bmp. El

    algoritmo se basa en una estrategia por regiones en el dominio de la imagen y brinda al

    escritor/dibujante una mayor facilidad en la escritura, en cuanto a que se respeta la

    personalidad de ella, pues no se requiere del uso de un estilo predeterminado. Los

    resultados de la evaluacin preliminar del algoritmo propuesto, sobre una pequea base

    de datos, mostraron una alta tasa de reconocimiento para las diferentes vocales. Con la

    finalidad de situar el algoritmo propuesto dentro del contexto de la arquitectura general

    de un sistema de reconocimiento de caracteres manuscritos. El diseo e implementacin

    del algoritmo, as como los resultados de la evaluacin de su desempeo se presentan a

    continuacin.

  • 8/12/2019 Procesamiento de Imagens

    16/248

    Reconocimiento de imgenes a travs de su contenido

    5

    1.1.2Arquitecturadereconocimientodecaracteresmanuscritos

    La arquitectura de un sistema de reconocimiento de escritura manuscrita abarca

    desde la captura de la imagen inicial de la escritura, hasta el reconocimiento de la

    misma. El sistema se puede dividir de manera general en las secciones de pre-

    procesamiento, reconocimiento, y post-procesamiento, tal como se encuentran divididos

    la mayora de los sistemas de reconocimiento de la escritura manuscrita. El diagrama de

    la arquitectura para el reconocimiento de la escritura se muestra en la Fig. 1.

    Fig 6- Diagrama a bloques del sistema

    El proceso inicia con la adquisicin de los datos mediante una tableta

    digitalizadora. El escritor/dibujante utiliz la pluma incorporada y una interfaz grfica

    hecha en Matlab, con lo cual se obtuvieron trazos de hasta seis pixeles de ancho,

    guardados como imgenes en formato bmp. El siguiente paso del proceso es el

    preprocesamiento de la seal, que consiste de varias etapas. La seal de informacin

    puede ser amplificada y filtrada para corregir defectos como la atenuacin o el ruido. La

    siguiente etapa de adecuacin, a nivel pxel, puede incluir tratamientos tales como

    adelgazamiento (thinning), suavizado (smoothing), esqueletonizacin (squeletonizing),

    vectorizacin, etc. La aplicacin de estos procesos se considera parte del pre-

    procesamiento de la escritura, el cual incluye tambin a la segmentacin. En este

    sistema propuesto, solo se requiri de adelgazamiento y correccin de inclinacin.

  • 8/12/2019 Procesamiento de Imagens

    17/248

    Reconocimiento de imgenes a travs de su contenido

    6

    La segmentacin de la escritura se realiza antes de la aplicacin de los algoritmos

    de reconocimiento, y se divide en dos tipos: externa e interna. En la segmentacin

    externa se realiza la separacin de unidades de escritura, tales como caracteres o

    palabras. Dado que varias letras pueden escribirse con un solo trazo en la escritura

    cursiva, se requiere de algn reconocimiento previo a la separacin. A este tipo de

    segmentacin que requiere reconocimiento se le llama segmentacin interna. El sistema,

    utiliza tanto segmentacin externa, como interna. La segmentacin externa, es til para

    separar en caracteres las palabras formadas por la unin de entre dos a seis vocales. El

    mtodo consiste en el barrido de la imagen de la palabra, para la determinacin de

    puntos mximos y mnimos. Adems de secuencias de puntos mnimos, que indican la

    presencia de un enlace, el cual es analizado para lo obtencin del un corte central, quesepara a la vocal anterior de la siguiente. Aqu este tipo de segmentacin es requerida,

    debido a que la escritura analizada es enlazada y el reconocimiento se realiza carcter

    por carcter, con la finalidad de que el diccionario sea reducido (slo los caracteres del

    abecedario).

  • 8/12/2019 Procesamiento de Imagens

    18/248

    Reconocimiento de imgenes a travs de su contenido

    7

    1.1.3ExtraccindecaractersticasLas caractersticas extradas de la imagen del carcter una vez aislado (despus de

    la segmentacin), se basan en el anlisis de la matriz que lo representa. Las primeras

    caractersticas extradas son las variaciones que la vocal presenta en las regiones

    superior, inferior, izquierda y derecha. Estas variaciones se obtienen de las vocales

    prototipo y se guardan como cinco funciones para cada regin. Esas veinte funciones

    forman parte de la base de datos, con la que posteriormente las funciones que genere la

    vocal prueba (vocal desconocida) sern comparadas. Imgenes de vocales prototipo y

    las funciones superiores generadas para cada imagen se muestran en la Fig. 2.

    Una vez obtenidas todas las funciones para el carcter prueba (desconocido), se

    realiza un proceso de normalizacin, que consiste en un ajuste de estas funciones,

    debido a que su tamao vara, adems de que puede posicionarse en cualquier zona del

    rea de escritura. Es necesario entonces un proceso de escalamiento y alineacin. La

    alineacin obtiene el inicio de la funcin prueba con lo cual se recorre la funcin de tal

    forma que comience en la misma posicin que los caracteres prototipo. El siguiente

    paso es el escalamiento, que obtiene la longitud de la funcin prueba en x y en y, y

    calcula los factores de escalamiento fx=drx/dpx y fy=dry/dpy, en donde drx y dry, dpx y

    dpy son las mximas longitudes en x y en y de la funcin prototipo y prueba

    respectivamente. Esos factores permitirn el escalamiento de la funcin prueba al

    Fig 7-Imgenes prototipo y funciones superiores.

  • 8/12/2019 Procesamiento de Imagens

    19/248

    Reconocimiento de imgenes a travs de su contenido

    8

    tamao de la funcin prototipo. Con los procesos anteriores se pretende que la funcin

    que se obtenga de la prueba sea lo ms cercano a las caractersticas del prototipo

    (tamao y posicin), de tal forma que al comparar sea ms fcil el reconocimiento. Un

    resultado de esa normalizacin se muestra en la Fig. 3.

    Una vez obtenidas las funciones normalizadas, se sigue con la extraccin de

    caractersticas por regiones del carcter, cortes, ancho, puntos mximos, puntos

    mnimos, densidad, inclinacin, posicin de inicio, posicin de fin, caractersticas con

    las que se forman vectores con parmetros ordenados, que se extraen tanto para los

    caracteres prototipo, como para los prueba. Todos estos parmetros son obtenidos por

    barridos optimizados sobre la imagen.

    1.1.4Comparacin

    Finalmente la comparacin se realiza calculando las distancias geomtricas entre el

    vector obtenido para el carcter a reconocer y cada uno de los de la base de datos de

    prototipos. Al obtener dichas distancias, se observa cual es la mnima y el carcter

    prototipo relacionado con esa distancia mnima es asignado como el carcter

    reconocido.

    Fig 8- Normalizacin

  • 8/12/2019 Procesamiento de Imagens

    20/248

    Reconocimiento de imgenes a travs de su contenido

    9

    1.1.5Conclusiones

    Para un buen reconocimiento de la escritura manuscrita se requiere del estudio de

    una gran cantidad de variables. Aqu se ha descrito de manera general las funciones de

    los diferentes elementos que conforman a un sistema de reconocimiento de escritura

    manuscrita. De manera particular, se aboca a la problemtica de reconocimiento de

    caracteres manuscritos, y se propone un algoritmo sencillo para el reconocimiento de

    vocales. El algoritmo est basado en una estrategia por regiones en el dominio de la

    imagen. Los resultados de la evaluacin preliminar del algoritmo arrojaron una tasa de

    reconocimiento de las vocales superior al 97% lo que hace al algoritmo propuesto un

    buen candidato para una aplicacin real. Es importante mencionar que el algoritmo se

    probo con una pequea base de datos y que restara entonces validar los resultados con

    una base de datos ms grande.

  • 8/12/2019 Procesamiento de Imagens

    21/248

    Reconocimiento de imgenes a travs de su contenido

    10

    1.2 Reconocimientodefirmas1.2.1Introduccin

    [D3] En la sociedad actual, la seguridad se ha convertido en un tema prioritario. A

    fin de garantizar la proteccin de los sistemas frente a una mala utilizacin voluntaria,

    es necesario realizar un proceso de identificacin y verificacin de la identidad de cada

    persona de modo seguro, pero a la vez sencillo y natural.

    LaBiometra facilita la identificacin de cada individuo de forma unvoca mediantela medicin de diferentes caractersticas personales e intransferibles. Estas

    caractersticas individuales pueden clasificarse entre caractersticas fsicas, como por

    ejemplo la huella dactilar, el iris o la retina; y caractersticas del comportamiento, como

    la forma de hablar, escribir, firma o teclear.

    Existe an cierto reparo en la sociedad frente a los sistemas de identificacin

    biomtrica basados en caractersticas fsicas como las huellas, el iris o la retina, ya que

    son asociados con cuestiones penales. En cambio, los sistemas basados en el

    comportamiento, aunque proporcionan menor fiabilidad que los anteriores, son mejor

    aceptados socialmente.

    La Universidad Politcnica de Madrid, la Universidad Politcnica de Catalua, la

    Universidad de Valladolid y la Universidad del Pas Vasco participan conjuntamente, a

    travs de diferentes grupos de investigacin en el Proyecto de Investigacin titulado

    Aplicacin de la Identificacin de Personas mediante Multimodalidad Biomtrica en

    Entornos de Seguridad y Acceso Natural a Servicios de Informacin. El primer

    resultado de este esfuerzo comn ha sido la creacin de una Base de Datos Biomtricos

    Multimodal, que consta de huellas digitales, firmas manuscritas y voz, y que sirve de

    base para el resto de tareas de investigacin de los grupos participantes. El presente

    artculo es consecuencia de los trabajos de investigacin posteriores sobre firma

    manuscrita a partir de dicha base de datos.

  • 8/12/2019 Procesamiento de Imagens

    22/248

    Reconocimiento de imgenes a travs de su contenido

    11

    1.2.2Verificacindefirmaoff-line

    El uso de la firma manuscrita como modo de identificacin est muy arraigado y

    goza d una aceptacin social: firmamos con frecuencia para mostrar conformidad con el

    contenido de documentos o para autorizar transacciones comerciales.

    La verificacin de las firmas se limita normalmente a una inspeccin visual, como

    si se tratara de la comparacin de dos fotos, pero este mtodo no es eficaz frente a

    falsificadores y en la mayora de las ocasiones no se lleva a cabo proceso de

    verificacin alguno. La autorizacin de la verificacin de firmas manuscritas puede

    proporcionar la solucin adecuada para evitar posibles fraudes.

    La tecnologa biomtrica de verificacin automtica de firmas manuscritas se

    compone de dos reas principales de investigacin dependiendo del mtodo de

    adquisicin de los datos. La primera de ellas se refiere a la firma manuscrita on-line o

    dinmica, en la que se captura sobre una tableta digitalizadora la ejecucin completa de

    la firma. La otra rea hace referencia a la verificacin de firmas off-line o estticas. De

    la firma manuscrita slo est disponible su forma grfica en un documento escrito quees escaneado para obtener la representacin digital de la imagen. Los sistemas on-line

    cuentan con mayor informacin que los sistemas off-line, ya que, adems de la imagen

    2D de la firma, conocen sus parmetros dinmicos con el tiempo de adquisicin,

    velocidad, presin, inclinacin del bolgrafo, etc., lo cual los hace a priori ms atractivos

    desde el punto de la investigacin.

    En este artculo se presenta un sistema de verificacin de firmas off-line basado en

    tcnicas dinmicas, con el objetivo de acercar ambas reas de investigacin, probando la

    viabilidad de la aplicacin a la firma off-line de mtodos empleados habitualmente en

    sistemas dinmicos.

  • 8/12/2019 Procesamiento de Imagens

    23/248

    Reconocimiento de imgenes a travs de su contenido

    12

    1.2.3Descripcindelsistema

    A continuacin se hace una descripcin de los mdulos esenciales del sistema de

    verificacin off-line: adquisicin de firmas, base de datos, preprocesado, entrenamiento

    de los modelos, verificacin y seleccin de umbrales.

    A. Adquisicin de firmas manuscritas

    La captura de las firmas manuscritas se realiza de manera dinmica

    mediante una tableta digitalizadora Intuos A6 de WACOM y el lpiz Intuos

    Inking Pen. El lpiz permite firmar igual que con un bolgrafo convencional,

    con lo cual se dispone de una versin en papel de todas las firmas manuscritas

    digitalizadas en la base de datos.

    El rea activa de la tableta posee una resolucin de 100 puntos por

    milmetro y captura coordenadas x-y, presin, inclinacin y acimut a una

    frecuencia de 100 muestra por segundo. Todos los datos capturados de la firma,

    tanto puntos con presin o pen down, como puntos sin presin o pen ups, son

    almacenados en ficheros de la base de datos de firmas manuscritas dinmicas.Por otro lado, se almacenan las ejecuciones de cada firma en formato papel

    para su posterior proceso de escaneado.

    Fig 9- Firma propia del usuario9

    El proceso de escaneado a 600 puntos por pulgada pticos, no

    interpolados, genera el formato grfico esttico u off-line de las firmas. La

    figura 4 representa un ejemplo de una firma propia en formato esttico.

  • 8/12/2019 Procesamiento de Imagens

    24/248

    Reconocimiento de imgenes a travs de su contenido

    13

    B. Base de datos e firmas

    El sistema parte de una base de datos de firmantes, de cada uno de los

    cuales se dispone de 25 firmas propias y de 25 falsificaciones de 5 impostores,ya que cada firmante acta tambin de impostores proporcionando 25

    falsificaciones, 5 de cada uno de los 5 firmantes inmediatamente anteriores a l

    en la base de datos.

    Las falsificaciones almacenadas en la base de datos son de tipo entrenadas

    o skilled forgery,ya que cada impostor repite varis veces las firmas de la

    vctima, hasta considerar su imitacin lo suficientemente buena, antes de que

    dicha falsificacin sea adquirida y almacenada definitivamente. Con el nimode mejorar an ms la calidad de las falsificaciones se ha estimulado a los

    participantes con un premio. Todo esto hace que la calidad de las

    falsificaciones se alta.

    La base de datos de firmas manuscritas se crea con un conjunto de

    subcorpora independientes, uno por cada equipo de trabajo participante en el

    proyecto de investigacin, de 75 firmantes enlazados en una cola circular. El

    subcorpus utilizado en este trabajo ha sido adquirido en la Escuela de

    Ingenieros de Bilbao.

    C. Preprocesado de las firmas

    La ejecucin de una firma nunca es idntica a otra previa ya que depende

    de muchos factores, como puede ser el tamao, la zona de la tableta donde se

    adquiere, etc. Por ello se realiza un preporcesado para obtener la representacin

    de la firma independientemente de dichos factores.

    La segmentacin de cada firma manuscrita requiere extraer la firma

    esttica y off-line del fondo en la imagen electrnica obtenida tras el

    escaneado. Pare ello, es posible utilizar diferentes operaciones morfolgicas

    [I107], no teniendo en cuenta el factor de la rotacin de las firmas.

    Este trabajo se centra en los aspectos posteriores a esta etapa de

    segmentacin, ya que a travs de la informacin capturada con la tableta de

    digitalizacin, se pueden sintetizar la imagen de la firma independiente del

    fondo, eliminando cualquier rasgo dinmico de la misma. A partir de la

  • 8/12/2019 Procesamiento de Imagens

    25/248

    Reconocimiento de imgenes a travs de su contenido

    14

    informacin esttica de la firma, es decir, los puntos considerados como pen

    downs o con tinta de la misma, se genera artificialmente un fichero con la

    informacin grfica o imagen de la firma manuscrita.

    Las imgenes extradas del fondo de las firmas se normalizan a unas

    dimensiones mximas de 512 pxeles de ancho por 256 de alto y son

    justificadas al centro de dichas dimensiones. Las firmas con tendencia

    horizontal presentan lneas vacas y las de tendencia vertical columnas vacas.

    Fig 10-Firmas propias de los usuarios 9 y 28 normalizadas

    Cada una de las imgenes as generadas, guarda su propia escala de

    conversin de pxeles a milmetros y la relacin de aspecto es siempre de 2:1,

    vase la figura 5.

    Estos ficheros grficos contienen nicamente la informacin grfica 2D

    esttica de cada firma, ya que se ha eliminado cualquier parmetro temporal, de

    inclinacin o de presin obtenidos durante la captura.

    Partiendo de la imagen de la firma se realiza el ltimo paso del

    preporcesado, el relativo al seguimiento del contorno de la imagen de la firma.

    A travs del estudio de la conectividad se analizan las estructuras blob que

    conforman la imagen de la firma. Un blob representa una estructura continua

    identificable en una imagen por ser de un color distintivo de su fondo.

    El conjunto de blobs, resultado de la conectividad, incluye informacin de

    los ejes de inercia, el centro de gravedad, los puntos del permetro, etc. de cada

    blob. Adems de dichos datos es posible conocer la estructura jerrquica que

    relaciona cada blob de la imagen con el resto de blobs mediante su ralacin de

    parentesco.

  • 8/12/2019 Procesamiento de Imagens

    26/248

    Reconocimiento de imgenes a travs de su contenido

    15

    Fig 11- Blobs de la firma ejemplo presentada en la Fig. 2

    En la figura 6 se incluyen en azul los blobs pieza o hijos del fondo de la

    imagen y en rojo los blobs hijo dependientes de los anteriores. En el ejemplo se

    observan cuatro blobs pieza, uno principal y otro tres de menor tamao

    correspondientes a las letras b e i que se representan aisladas en la imagende la firma.

    Las cadenas de puntos (x, y) del permetro de blobs, tanto piezas como de

    sus hijos, que conforman la imagen constituyen la informacin biomtrica

    relevante en este trabajo. Dicha cadena de puntos (x, y) se recorre en sentido

    horario partiendo del punto situado ms arriba en la imagen.

    D. Entrenamiento del sistema

    Un sistema de verificacin de firmas requiere un proceso de entrenamiento

    de modelos representativos de las firmas que se desea verificar. Los modelos

    utilizados en este trabajo se denominan modelos ocultos de Markov o HMM

    (Hidden Markov Models).

    Un modelo HMM es por definicin un autmata de estados finitos

    estocsticos, a travs del cual se representa a una seal estocstica cuyascaractersticas estadsticas varan a lo largo del tiempo, mediante una secuencia

    de estados.

    Los modelos HMM se utilizan mayoritariamente para el reconocimiento

    de la voz, representada como una secuencia de muestras ordenadas en el

    tiempo campo en el que han demostrado una alta eficiencia. Tambin

    comienzan a usarse en otros campos como es el reconocimiento de imgenes.

  • 8/12/2019 Procesamiento de Imagens

    27/248

    Reconocimiento de imgenes a travs de su contenido

    16

    En este trabajo se utiliza como secuencia de muestras para el

    entrenamiento de los modelos, la cadena de puntos del permetro (x, y) de los

    blobs que conforman la imagen de las firmas propias listadas anteriormente.

    El entrenamiento del modelo HMM de cada firmante se realiza a partir de

    las versiones 00, 01, 02, 03, 04, 05, 10, 15, 20 de sus firmas originales, las 5

    primeras se utilizan para inicializar el modelo, mientras que el proceso de

    reestimacin se realiza con el conjunto de las nueve firmas.

    La topologa del modelo HMM que proporciona un mejor comportamiento

    es la denominada como izquierda derecha o left right (L-R) de 6 estados, en

    el que los estados inicial y final no se comportan como los otros cuatro estados

    intermedios del modelo, estados activos del mismo.

    E. Verificacin y Seleccin del Umbral

    Una vez obtenidos los modelos HMM de cada firmante, el proceso de

    verificacin consiste en calcular el dato de similitud entre el modelo y firma a

    verificar. A partir de dicho valor de similitud es posible determinar si la firma

    verificada fue ejecutada por un usuario impostor o por el propio firmante.

    La decisin se fundamenta en la utilizacin de un valor umbral, el cul seobtiene a partir de las curvas DET (Detection Error Tradeoff). Esta curva

    permite representar los datos relativos a las tasas de error que permiten calibrar

    la calidad o nivel de seguridad del sistema de verificacin, la tasa FAR (False

    Acceptance Rate) y la tasa FRR (False Reject Rate).

    Para la obtencin del umbral en el que el comportamiento de ambas tasas

    es ptimo es posible priorizar una de ellas, lo que implica empeorar la otra,

    para ello se utiliza una funcin coste:

    DCF = Cmiss x Pmiss x Ptrue + Cfa x Pfa x Pfalse.

    Siendo Cmiss la constant de la ponderacin de un falso rechazo, Cfa la

    ponderacin de una falsa aceptacin, Ptrue la probabilidad a priori y Pfalse, su

    complementacin (1-Ptrue).

  • 8/12/2019 Procesamiento de Imagens

    28/248

    Reconocimiento de imgenes a travs de su contenido

    17

    La tasa de error EER (Equal Error Rate) o tasa de equierror

    correspondiente al punto en que FAR y FRR coinciden, por lo que permite

    conocer el mejor funcionamiento mutuo de ambas tasas de error.

    El clculo de las curvas DET se realiza a travs del software de libre

    distribucin del NIST [I110] y mediante sus coeficientes estndar. Los valores

    estndar de los coeficientes se corresponden con los siguientes valores:

    Cmiss = 10, Cfa = 1 y Ptrue = 0.01 lo que provoca que se priorice

    fuertemente el valor de la tasa FAR frente al de la tasa FRR.

  • 8/12/2019 Procesamiento de Imagens

    29/248

    Reconocimiento de imgenes a travs de su contenido

    18

    1.2.4ModelosHMM

    Para la verificacin de las firmas estticas u off-line se parte de la secuencia de

    puntos de los permetros de los blobs que conforman la imagen de la firma. Dicha

    secuencia de puntos aunque no estn presentadas en funcin del tiempo, permiten

    aplicar los modelos HMM, tcnica dinmica de reconocimientos, a la verificacin de

    firmas off-line.

    Se utilizan dos posibles ordenamientos para las cadenas de puntos del permetro de

    los blobs de una firma, el ordenamiento por tamao (TAM) y el ordenamiento segn la

    distribucin Izquierda-Derecha (ID) de los blobs de la imagen de la firma. El

    ordenamiento ID prioriza a los blobs situados en posicin arriba abajo / izquierda

    derecha, adecuada para la escritura latina en la que se han capturado las firmas. Para el

    ordenamiento por tamao, se prioriza a los blobs de mayor tamao frente a los menores.

    Para ambos ordenamientos la generacin de la secuencia de puntos del permetro, a

    utilizar en el entrenamiento de modelos y la verificacin de las firmas, se realiza como

    la concatenacin de las cadenas de puntos de los permetros de los blobs ordenados. Se

    concatenan los puntos del blob pieza que es su padre, tras los cuales se insertan los

    puntos del siguiente blob pieza e hijos segn el orden utilizado.

    Para cada ordenamiento, TAM e ID, se genera un modelo HMM representativo de

    las firmas propias de cada firmante segn el ordenamiento utilizado.

    Fig 12- Ordenamiento segn ID (escala x 2)

    Una misma imagen de firma proporciona las mismas estructuras blob, por lo que la

    diferencia viene representada por la ordenacin de los puntos del permetro de los

  • 8/12/2019 Procesamiento de Imagens

    30/248

    Reconocimiento de imgenes a travs de su contenido

    19

    mismos. En la figura 7 se observa la ordenacin TAM frente a la ordenacin ID que se

    presenta en la figura 3. Ambas figuras incluyen una numeracin creciente entre los

    blobs hijos de la imagen en funcin del ordenamiento utilizado.

    1.2.5Resultadosobtenidos

    Se presentan los resultados de la calidad del sistema de verificacin de firmas off-

    line a travs de las tasas de error medias obtenidas para todos los firmantes de la base de

    datos, mediante los dos modelos HMM generados por usuario, el modelo TAM y el

    modelo ID.

    Tabla 1- Resultados para Tasa de Equierror para Skilled forgeries

    El sistema de verificacin proporciona un resultado de la tasa de equierror EER

    levemente mejor para el ordenamiento ID de los puntos del permetro de blob. conocida

    la naturaleza entrenada de las falsificaciones verificadas una tasa de equierror cercano al

    30 % es ptimo.

    El valor de la tasa EER se representa por un punto curva DET representada en la

    figura 8, el cual corresponde al mejor comportamiento mutuo de las tasas de error FAR

    y FRR obtenidas en el proceso de verificacin.

  • 8/12/2019 Procesamiento de Imagens

    31/248

    Reconocimiento de imgenes a travs de su contenido

    20

    Fig 13-Curva DET firmante 33

    Mediante la presentacin de la curva DET se puede observar el comportamiento

    relativo de las tasas FAR (eje x) y la tas FRR (eje y), en el que cuando una aumenta la

    otra disminuye y viceversa. Los valores ptimos de ambas tasas para los ordenamientos

    TAM e ID y firmas falsificadas entrenadas se presentan a continuacin:

    Tabla 2- Resultados para Skilled Forgeries

    En la tabla 2 se presentan los valores medios de las tasas de error obtenidas para los

    75 firmantes de la base de datos, mediante la utilizacin de los coeficientes estndar de

    NIST. Se obtiene una tasa de falsa aceptacin FAR cercana al 0 %. Lo que provoca un

    rechazo de todas las falsificaciones, frente a una tasa FRR elevada, lo que proporciona

    un rechazo de las firmas propias de los firmantes. En casos particulares de firmas

    estables difciles de falsificar, como en el caso del usuario 13 se observa un valor FAR

    igual a 0 y un valor de FRR de 12.5%.

  • 8/12/2019 Procesamiento de Imagens

    32/248

    Reconocimiento de imgenes a travs de su contenido

    21

    A partir de otros valores de coeficientes distintos a los estndares de NIST y

    conociendo el ERR, que es invariante, FRR ajustndolos a las necesidades de las

    aplicacin.

    El ordenamiento de los puntos del permetro de los blobs mediante la distribucin

    ID, es decir, el ordenamiento basado en la escritura latina, proporciona un mejor

    rendimiento del sistema.

    1.2.6Conclusiones

    Se ha desarrollado un sistema de verificacin de firmas off-line basado en HMM

    que ha sido probado sobre una base de datos de skilled forgerys.

    Se obtienen mejores resultado con modelos en los cuales los blobs se ordenan de

    arriba-abajo e izquierda-derecha que en modelos con blobs ordenado por tamaos, de

    mayor a menor.

  • 8/12/2019 Procesamiento de Imagens

    33/248

    Reconocimiento de imgenes a travs de su contenido

    22

    1.3 Reconocimientoderostrosyexpresionesfaciales

    1.3.1Introduccin

    [D4] Desde la percepcin del ser humano, la forma ms sencilla de reconocer

    personas es a travs del rostro, ya que este tiene caractersticas nicas como distancia

    entre los ojos, anchura de la nariz, forma de la barbilla, pmulos, forma de la boca, etc.

    El presente apartado describe un sistema computacional de seguridad basado en el

    reconocimiento de rostros, que explota las caractersticas anteriormente mencionadas.

    En el presente proyecto se ha desarrollado un procedimiento de deteccin de caras

    como parte de algoritmos de clasificacin de imgenes.

    1.3.2Descripcin

    del

    sistema

    El sistema estudiado est conformado por un programa desarrollado en MATLAB y

    por una parte de hardware. Esta ltima es conformada por una computadora conectada a

    una cmara web para poder capturar las imgenes de los rostros de diferentes personas.

    La cmara web estar colocada sobre un soporte, el cual a su vez tendr una base donde

    la persona colocar el rostro para que la cmara web pueda capturar la imagen

    respectiva. El diseo consiste en una caja, donde se encontrar la cmara web en unextremo y en el otro el soporte del rostro. Adems se colocar una lmpara fluorescente

    en la parte superior para asegurar una adecuada iluminacin. El esquema de la base

    propuesta se muestra en la Fig. 9.

  • 8/12/2019 Procesamiento de Imagens

    34/248

    Reconocimiento de imgenes a travs de su contenido

    23

    Fig 14- Base para la captura de imgenes

    En la parte de software, se ha implementado un algoritmo que permite segmentar

    las imgenes capturadas para obtener nicamente la imagen del rostro de esa forma se

    descarta informacin de otro tipo que puede ser no relevante para los objetivos del

    programa. Posteriormente, se procede con la descomposicin de las imgenes para

    luego aplicarles la tcnica de Anlisis de Componentes Principales, con lo cual

    finalmente se procede a realizar el reconocimiento. A continuacin se explicarn los

    temas involucrados para la realizacin del algoritmo y posteriormente los pasos que se

    siguieron para la implementacin del programa.

    1. Segmentacin de imgenes

    Una vez que la imagen es capturada con la cmara web, se procede con el algoritmo

    de segmentacin, el cual est basado en las proyecciones de las derivadas de las filas y

    columnas de los valores de la imagen.

    Previamente, se le aplica el filtrado de mediana a la imagen, para quitar el ruido y

    suavizar la imagen. Luego se procede a recuantizar la imagen a dos bits, para que los

    cambios sean ms bruscos y de esta manera las derivadas se detecten mejor. Luego, se

    obtiene el negativo de la imagen recuantizada para que el fondo y todo elemento no

    perteneciente al rostro sea oscuro y facilitar la segmentacin (ver Fig. 10).

  • 8/12/2019 Procesamiento de Imagens

    35/248

    Reconocimiento de imgenes a travs de su contenido

    24

    Fig 15- (a) Imagen capturada despus de aplicar el filtrado de mediana. (b) Imagen recuantizada

    a dos bits. (c)

    De la imagen negativa, se obtienen los vectores Pv(n) y Ph(n), que son las

    proyecciones de las columnas y las filas, respectivamente (ver Fig. 11). Como cada fila

    y columna tiene informacin de los valores de los pxeles, las proyecciones tienen la

    informacin de los pxeles de toda la imagen. A estos vectores se les calcula la derivada

    para poder ver los cambios de estos valores, es decir, cambios de tonalidades en la

    imagen.

    A partir de de Ph(n) y Pv(n), se obtienen las derivadas Ph(n) y Pv(n) (ver Fig. 12).

    , donde n es el ndice que corresponde a cada elemento que contienen los vectores.

    Fig 16- Proyecciones de filas y columnas

  • 8/12/2019 Procesamiento de Imagens

    36/248

    Reconocimiento de imgenes a travs de su contenido

    25

    Fig 17- Derivada de las proyecciones de filas y columnas, respectivamente

    Para las columnas, se obtiene el valor mximo, que indica la primera variacin de

    tonalidad. Este valor se va a usar para segmentar la imagen en el eje vertical. El valor

    mximo de Pv(n) puede ser expresado como :

    Pvmax = Pv(nmax) (1)

    donde:

    Pv(nmax) > Pv(n) para todo n nmax (2)

    El valor nmax es el ndice del valor mximo del vector. De la misma forma,

    nmin es el ndice del valor mnimo del vector.

    Luego se procede a calcular el valor :

    Lp = N nmax (3)

    Donde N es el nmero de columnas de la imagen y Lp el valor equivalente al

    nmero de columnas posteriores al valor mximo.

    Luego se procede a calcular el vector Pv1(n), el cual contendr los valores de las

    proyecciones posteriores al valor mximo. De manera similar, se calcula el vectorPv2(n). Este vector contiene los valores de Pv1(n) desde la mitad hasta el ltimo

  • 8/12/2019 Procesamiento de Imagens

    37/248

    Reconocimiento de imgenes a travs de su contenido

    26

    valor, ya que en este tramo se encuentra el valor mnimo, el cual indica la segunda

    variacin de tonalidad. Con estos valores, se procede a segmentar la imagen. El

    procedimiento matemtico se puede expresar como :

    Pv1(n) = Pv(n + nmax) n = 0, 1, ., Lp - 1 (4)

    Pv1(n) = Pv(n + nmax) n = 0, 1, ., Lp - 1 (5)

    Pv2(n) = Pv1(Lp/2 + n) n = 0, 1, ., Lp/2 - 1 (6)

    Pv2min = Pv2(nmin) (7)

    donde:

    Pv2(nmin) < Pv2(n) para todo n nmin (8)

    Luego se forma el vector con los valores de las proyecciones, desde el ndice del

    valor mximo hasta el ndice del valor mnimo, con lo cual se obtiene las proyecciones

    de la imagen segmentada con sus respectivos ndices. Estos ltimos son utilizados para

    indicar las columnas a descartar y finalmente segmentar la imagen en las columnas.

    Posteriormente se procede a segmentar la imagen en las filas. A diferencia de lascolumnas, en las filas no se utilizar la derivada de las proyecciones debido a que, como

    se puede observar en la figura 11, slo hay un cambio brusco cerca de la fila 50, lo cual

    indica que hay cambio de tonalidad. Si se observa la figura 6c, en las primeras filas

    tienen valores bajos, lo cual se ve reflejado en las proyecciones, y luego cambia a

    valores altos que corresponden al rostro. Pero en las ltimas filas, donde termina el

    rostro, no hay cambios significativos como en el caso de las columnas, por lo que no se

    podra utilizar el mismo tipo de segmentacin que en las columnas ya que no

    segmentara bien, para lo cual se requiere que el lmite inferior del rostro vaya apoyado

    en una base y de esta manera descartar la parte del cuello o los hombros. De las filas, se

    obtiene Ph(m), donde m = 0, 1, ., M-1 (M es el nmero de filas de la imagen).

    Luego se calcula el valor mximo del vector Ph(m) para segmentar la parte superior

    de la imagen :

    Ph(mmax) > Ph(m) para todo m mmax (9)

    Luego se obtiene :

  • 8/12/2019 Procesamiento de Imagens

    38/248

  • 8/12/2019 Procesamiento de Imagens

    39/248

    Reconocimiento de imgenes a travs de su contenido

    28

    Fig 19- Imagen segmentada

    2. Descomposicin Wavelet

    La descomposicin wavelet es una tcnica que se utiliza para descomponer la

    imagen de entrada en cuatro sub-imgenes. En el programa se utiliza la descomposicin

    wavelet para reducir las dimensiones de las imgenes sin perder la informacin facial

    necesaria. El resultado de la descomposicin est conformado cuatro sub-imgenes, que

    contienen detalles principales, detalles verticales, detalles horizontales y detalles

    diagonales. En el presente documento, se descompuso la imagen dos veces, por lo cual

    se obtienen cuatro subimgenes cuyas dimensiones son cuatro veces menor que la

    imagen original; sin embargo, los detalles principales no se pierden. Para el programa,

    se utiliza la sub-imagen con los detalles principales y se le normaliza, a fin de que el

    rango de grises, se encuentre entre 0 y 255.

  • 8/12/2019 Procesamiento de Imagens

    40/248

    Reconocimiento de imgenes a travs de su contenido

    29

    En la Fig. 15 se observa la descomposicin Wavelet de una imagen facial.

    Fig 20-Imagen facial y sus respectivas subimgenes. (wavelets)

    3. Anlisis de Componentes Principales (ACP)

    El ACP es un mtodo matemtico que da origen al mtodo de eigenfaces. El

    mtodo consiste en la recoleccin de imgenes de rostros de varias personas que son

    luego combinadas y convertidas en una matriz. Los vectores que conforman esta matrizson los denominado vectores eigenfaces. Estos pueden ser combinados

    adecuadamente para reconstruir cualquier imagen facial del conjunto.

    Para describir el mtodo, asmase en primer lugar que se tiene un conjunto de M

    imgenes, que previamente fueron segmentadas (de P filas y Q columnas), que son

    convertidas a vectores i. Con ello se construye una matriz que contiene a cada vector

    como columna. La matriz resultante presenta por tanto PxQ filas y M columnas.

  • 8/12/2019 Procesamiento de Imagens

    41/248

    Reconocimiento de imgenes a travs de su contenido

    30

    1.3.3Programa

    Inicialmente el programa adquiere una imagen de rostro en escala de grises. Luego

    se realiza el procedimiento ACP y se obtiene el vector eigenfaces de la imagen

    adquirida. En seguida el vector es comparado con todos los vectores de las imgenes

    proyectadas almacenadas, calculando la distancia euclidiana normalizada entre ellos. La

    distancia mnima obtenida ser la que indique el usuario registrado con el cual el rostro

    de entrada tiene mayor semejanza. Sin embargo, esta distancia mnima puede ser muy

    grande, lo que indicara que ninguno de los usuarios registrados coincide

    adecuadamente con el usuario de entrada. Para evitar este tipo de problemas, se

    procedi a establecer un umbral, a fin de colocar un lmite en la distancia mnima, y

    rechazar usuarios que no estn verdaderamente registrados. Si la distancia es menor al

    umbral, entonces el usuario se considera como identificado, mostrando en pantalla el

    nombre respectivo y su foto reconstruida.

    El programa ofrece tambin la opcin de modificar la dimensin del espacio y de

    esa forma alterar el tiempo de ejecucin del mismo. As mismo se ofrece la opcin depoder registrar un nuevo usuario en cualquier momento.

    La interfaz visual de usuario del sistema propuesto es mostrada en la Fig. 16.

  • 8/12/2019 Procesamiento de Imagens

    42/248

    Reconocimiento de imgenes a travs de su contenido

    31

    Fig 21-Interfaz visual del sistema propuesto

    1.3.4Resultados

    Con estas adiciones al programa, se procedi al reconocimiento de las imgenes y

    despus de comparar resultados se obtuvo lo siguiente:

    Verdaderos aciertos: 92.26%

    Verdaderos Rechazos: 89.94%

    Falsos aciertos: 7.04 %

    Falsos Rechazos: 10.06%

  • 8/12/2019 Procesamiento de Imagens

    43/248

    Reconocimiento de imgenes a travs de su contenido

    32

    2. IDENTIFICACION DE NECESIDADES

  • 8/12/2019 Procesamiento de Imagens

    44/248

    Reconocimiento de imgenes a travs de su contenido

    33

    2 Identificacin de necesidades

    2.1IntroduccinIDN

    Esta etapa es el soporte a la peticin que el cliente realiza para determinar las

    pautas generales de sus necesidades y del contexto del sistema.

    El cliente debe establecer sus objetivos y necesidades generales, como

    consecuencia del enlace entre los Sistemas de Informacin de la empresa y los sistemas

    Informticos a desarrollar.

    El objetivo es exponer el entorno global del problema en estudio, especificando:

    Objetivos del sistema: objetivos de tipo empresarial.

    Alcance del sistema: funciones de negocio a considerar dentro del alcance del

    proyecto. Tipologa de los usuarios finales: conocer a qu perfil de personas va dirigido el

    producto final a obtener.

    Restricciones: se considerarn las restricciones que puedan afectar al plan del

    proyecto y su desarrollo.

    Organizacin y funciones empresariales: conocer bien cmo est organizado el

    cliente, para ello se analizar el organigrama de la empresa.

    Antecedentes: informacin de los motivos que han llevado a la organizacin delcliente a realizar el proyecto.

    En la realizacin se obtendrn todos los datos necesarios para una buena

    identificacin de necesidades, se realizarn entrevistas, obteniendo un conjunto valioso

    de informacin del sistema.

    El producto que se obtiene se representara mediante el Documento de

    Conceptos del Sistema.

  • 8/12/2019 Procesamiento de Imagens

    45/248

    Reconocimiento de imgenes a travs de su contenido

    34

    2.2Documentodeconceptdelsistema

    PROYECTO

    RECONOCIMIENTO

    DE IMGENES

    DOCUMENTO DE CONCEPTOS DEL

    SISTEMA

    EMPRESA: IIT

    2.2.1

    Objetivos

    del

    sistema

    Hay dos objetivos globales en este proyecto:

    1. Reconocimiento de tipos de fondo: cielo, csped.

    1.1Generacin de un algoritmo capaza de clasificar las imgenes por su

    color. En nuestro caso que contengan azul (cielo) o verde (csped).

    1.2Generacin de un algoritmo capaza de diferenciar entre tres posiblestexturas. Las texturas que deber ser capaz de diferenciar son:

    Lisas

    Binarias

    Rugosas

    1.3A travs de la unin de ambos algoritmos, poder diferenciar imgenes

    que contengan cielo o csped, con una tasa de error inferior al 10%.

    2. Deteccin de personas.2.1 Localizacin de caras de personas en la imagen.

    2.2 Si en la imagen se ha localizado alguna cara en base a localizar ojos y

    boca. Se concluye que la imagen contiene personas.

  • 8/12/2019 Procesamiento de Imagens

    46/248

    Reconocimiento de imgenes a travs de su contenido

    35

    2.2.2Alcancedelsistema

    Reconocimiento de color: Para esta parte, habr que realizar un anlisis de los

    modelos de color RGB y HSV.

    Para ambos modelos de color, ser necesario estudiar si dado un color es posible

    identificar dicho color mediante sus coordenadas.

    En el caso de RGB, se comprobaran las siguientes proyecciones del espacio:

    R vs G

    R vs B

    G vs B

    R vs G vs B

    Tras realizar las evaluaciones pertinentes, se identificara la mejor entre las cuatro

    proyecciones para clasificar un color.

    En el caso HSV, se comprobaran las siguientes proyecciones del espacio:

    H vs S

    H vs V

    S vs V

    H vs V vs S

    Al igual que en modelo RGB, habr que identificar la mejor entre las cuatro

    proyecciones.

    Una vez seleccionados las proyecciones, se analizara con cul de los dos moleos es

    ms precios a la hora de clasificar el color.

    Reconocimiento de texturas: El reconocimiento de texturas, se realizara a travs de

    histogramas, para ello, ser necesario implementar un algoritmo capaz de clasificar las

  • 8/12/2019 Procesamiento de Imagens

    47/248

    Reconocimiento de imgenes a travs de su contenido

    36

    texturas como lisas, binarias o rugosas. Tambin ser necesario realizar un breve

    documento sobre la funcin statxture.

    Deteccin de caras: Para la deteccin de caras se crearan dos algoritmosindependientes, uno para la localizacin de los ojos, y otro para la localizacin de la

    boca. En ambos algoritmos se trabajara con la proyeccin YCbCr.

    2.2.3Topologadeusuariofinales

    Los usuarios finales sern empresas que por algn motivo necesiten clasificarimgenes de manera automtica en base al contenido.

    2.2.4Restricciones

    Las restricciones a las que est sujeto el proyecto son de tipo temporal, puesto que

    el plazo de entrega del proyecto no puede superar la primera semana de junio del 2008.

    Adems los algoritmos generados, debern consumir el mnimo nmero de

    recursos.

    Al ser un proyecto fundamentalmente de investigacin, la optimizacin del tiempo

    de ejecucin queda fuera del alcance, pero es necesario que los algoritmos sean

    suficientemente rpidos como para permitir correr los procesos de evaluacin.

  • 8/12/2019 Procesamiento de Imagens

    48/248

    Reconocimiento de imgenes a travs de su contenido

    37

    3. PLAN DE GESTION

  • 8/12/2019 Procesamiento de Imagens

    49/248

    Reconocimiento de imgenes a travs de su contenido

    38

    3 Plandegestin3.1Descripcingeneraldelproyecto

    A continuacin se mostrar una visin general del proyecto, el cual consiste en

    desarrollar algoritmos capaces de reconocer objetos en imgenes. Para lograr esto se

    utilizarn las siguientes tcnicas:

    1. Reconocimiento de colores: Se estudiar la imagen a travs de los colores, paraello se har un estudio previo entr dos formas posible de reconocimiento de

    colores, RGB y HSV. Esta tcnica es vlida para reconocimiento de cielos,

    nieve, mar, csped, etc, es decir, imgenes donde haya un color predominante.

    2. Reconocimiento de textura: Esta tcnica es ms compleja que el

    reconocimiento de colores, se utilizar para validar que una textura es lisa,

    binaria o rugosa. Un ejemplo podra ser el reconocer un rbol en distintos

    entornos, como uno rural y otro de ciudad, en donde los distintos elementos quelo rodean son muy distintos. El reconocimiento del rbol se podra hacer

    mediante la textura de la madera del tronco.

    3. Deteccin de caras: Para conseguir este objetivo se utilizara la proyeccin

    YCbCr. La deteccin de caras tendr que ser efectiva en aquellas imgenes que

    contengan a una persona de medio cuerpo para arriba, no teniendo porque ser

    efectiva en aquellas imgenes donde las personas salgan de cuerpo entero.

    Para el desarrollo de este proyecto se ha decidido utilizar como herramienta Matlab.

    Matlab es un leguaje matemtico capaz de ejecutar elevados clculos matriciales

    adems de poseer unas Toolbox de imgenes, necesarios para este proyecto.

  • 8/12/2019 Procesamiento de Imagens

    50/248

    Reconocimiento de imgenes a travs de su contenido

    39

    3.2Diagramadeactividadesarealizar

    A continuacin se muestra un diagrama de las distintas actividades de las que se

    compone el proyecto. Las actividades se numerarn de la forma WP XX.YY, donde

    XX corresponde a un nmero consecutivo referente a la tarea principal, e YY a la

    subtarea de XX.

    Reconocimiento de

    imgenes a travs de sucontenido

    WP-01

    ConstruccinLgica

    WP-02

    ConstruccinFsica

    WP-03

    Documentacin

    WP-00.01

    Color

    WP-00.02

    Textura

    WP-04

    Direccin deproyecto

    WP-00.03

    Localizadorde rostros

    WP-01.01

    Estudio deGaussinas

    WP-01.02

    Diseo detexturas

    WP-02.01

    Implantacinde Gaussinas

    WP-02.02

    Algoritmos

    WP-02.03

    Pruebas dealgorimos

    Fig 22-Diagrama de actividades

    WP-05

    Coordinacin

    WP-00

    Investigacin

  • 8/12/2019 Procesamiento de Imagens

    51/248

    Reconocimiento de imgenes a travs de su contenido

    40

    3.3Descripcindetalladadelasactividades

    A continuacin, se proceder a describir las actividades finales del proyecto,estas son aquellas actividades que no se dividan en otras sub-actividades.

    Identificador deActividad

    WP-00.01

    Nombre Color

    Entradas Informacin sobre los modelos de color RGBy HSV.

    Actividades Realizar un documento con los modelos decolor RGB y HSV, indicando las propiedades decada uno, para poder realizar los estudios

    pertinenetes.

    Salidas Documento RGB Documento HSV

    Gestin

    Tabla 3- W-00.01

    Identificador deActividad

    WP-00.02

    Nombre Textura

    Entradas Informacin sobre texturas

    Actividades Realizar un documento con las formas

    posibles de reconocimiento de textura.

    Salidas Documento sobre texturas

    Gestin

    Tabla 4-WP-00.02

  • 8/12/2019 Procesamiento de Imagens

    52/248

    Reconocimiento de imgenes a travs de su contenido

    41

    Identificador deActividad

    WP-00.03

    Nombre Localizador de rostrosEntradas Informacin sobre localizadores de rostros

    Actividades Realizar un documento con los mtodosempleados para alcanzar el objetivo.

    Salidas Documento YCbCr Documento sobre localizador de rostros

    Gestin

    Tabla 5-WP-00.03

    Identificador deActividad

    WP-01.01

    Nombre Estudio de Gaussinas

    Entradas Conjunto de puntos que definen los colores

    azul y verde.Actividades Estudiar la mejor forma a travs de

    gaussianas para clasificar un color como azul overde.

    Salidas Programa elegido para realizar laclasificacin.

    Gestin

    Tabla 6-WP-01.01

  • 8/12/2019 Procesamiento de Imagens

    53/248

    Reconocimiento de imgenes a travs de su contenido

    42

    Identificador deActividad

    WP-01.02

    Nombre Diseo de texturas

    Entradas Histogramas correspondientes a texturas lisas,binarias y rugosas.

    Actividades Definir la formar de diferenciar las distintasformas de texturas mediante los histogramas.

    Salidas Documento en el que se explica la formalgica de diferenciar entre las tres texturas

    definidas.

    Gestin

    Tabla 7-WP-01.02

  • 8/12/2019 Procesamiento de Imagens

    54/248

    Reconocimiento de imgenes a travs de su contenido

    43

    Identificador deActividad

    WP-02.01

    Nombre Implantacin de GaussianasEntradas Programa elegido para la clasificacin de un

    color mediante gaussianas.

    Actividades Implantar dentro del algoritmo el programa.

    Salidas Algortimo sin terminar.

    Gestin

    Tabla 8-WP-02.01

    Identificador deActividad

    WP-02.02

    Nombre Algoritmo

    Entradas Resultados de los documentos.

    Actividades Mediante la informacin recibida de losdocumentos desarrollados anteriormente, generarlos algoritmos de color y textura.

    Salidas Algoritmos terminados.

    Gestin

    Tabla 9-WP-02.02

    Identificador deActividad

    WP-02.03

    Nombre Pruebas de los algoritmos

    Entradas Algoritmos.

    Actividades Comprobar el grado de acierto de losalgoritmos generados.

    Salidas Eficiencia de los algoritmos generados.

    Gestin

    Tabla 10-WP-02.03

  • 8/12/2019 Procesamiento de Imagens

    55/248

    Reconocimiento de imgenes a travs de su contenido

    44

    Identificador deActividad

    WP-03

    Nombre Documentacin

    Entradas Informacin sobre los algoritmos

    Actividades Desarrollo de un documento final delproyecto.

    Salidas Documento final de proyecto.

    Gestin

    Tabla 11-WP-03

    Identificador deActividad

    WP-04

    Nombre Direccin del proyecto

    Entradas Documento final del proyecto

    Algoritmos generados

    Actividades Validacin del proyecto por parte del directordel proyecto.

    Salidas Documento firmado por el director deproyecto.Calificacin del proyecto por parte deldirector del proyecto

    Gestin

    Tabla 12-WP-04

  • 8/12/2019 Procesamiento de Imagens

    56/248

    Reconocimiento de imgenes a travs de su contenido

    45

    Identificador deActividad

    WP-05

    Nombre Coordinacin

    Entradas Documento final del proyecto

    Algoritmos generados

    Actividades Validacin del proyecto por parte delcoordinador del proyecto.

    Salidas Documento firmado por el coordinador delproyecto.Nota final del proyecto.

    Gestin

    Tabla 13-WP-05

  • 8/12/2019 Procesamiento de Imagens

    57/248

    Reconocimiento de imgenes a travs de su contenido

    46

    3.4Diagramadelequipodetrabajo

    Posteriormente se mostrar el organigrama del proyecto

    Como se observa en la Error! No se encuentra el origen de la referencia. 23 ,

    existe una colaboracin entre el director y el coordinador del proyecto, mientras que la

    funcin de Jefe de Proyecto depende tanto del director como del coordinador, y a su

    vez, de ste depende el analista, el programador y el diseador

    Coordinador delproyecto fin de

    carrera

    Director del proyectofin de carrera

    Jefe del proyecto

    Analista Programador Diseador

    Fig 23- Organigrama del proyecto

  • 8/12/2019 Procesamiento de Imagens

    58/248

    Reconocimiento de imgenes a travs de su contenido

    47

    3.5Descripcindeactividadesdecadaintegrante

    A continuacin se mostrar una relacin de tareas de cada integrante del equipo de

    trabajo:

    Identificador del

    integrante

    Coordinador

    Nombre David Contreras Brcena

    Tareas Concretar la definicin del proyecto

    Controlar/Supervisar el proyecto, junto con el

    director del mismo

    Supervisa los plazos de entrega

    Homogeniza la calidad de los proyectos

    Supervisin final del proyecto

    Tabla 14-Coordinador

  • 8/12/2019 Procesamiento de Imagens

    59/248

    Reconocimiento de imgenes a travs de su contenido

    48

    Identificador del

    integrante

    Director

    Nombre Rafael Palacios

    Tareas Dirigir el proyecto

    Facilitar las orientaciones adecuadas ante los

    problemas que vayan surgiendo

    Proponer una calificacin al coordinador delproyecto

    Controlar/Supervisar el proyecto, junto con el

    coordinador

    Tabla 15-Director

    Identificador del

    integrante

    Jefe de Proyecto

    Nombre Antonio Peralta Sez

    Tareas Gestiona el proyecto y es el mximo

    responsable del mismo

    Verifica el trabajo realizado por sus

    subordinados

    Tabla 16-Jefe de proyecto

  • 8/12/2019 Procesamiento de Imagens

    60/248

    Reconocimiento de imgenes a travs de su contenido

    49

    Identificador del

    integrante

    Analista

    Nombre Antonio Peralta Sez

    Tareas Analiza el contenido del proyecto, marcando

    pautas para la realizacin del mismo

    Tabla 17-Analista

    Identificador del

    integrante

    Programador

    Nombre Antonio Peralta Sez

    Tareas Lleva a cabo toda la parte de programacin

    del proyecto

    Instala el software necesario para llevar a

    cabo el proyecto

    Verifica la programacin haciendo un banco

    de pruebas para comprobar la calidad del proyecto

    Tabla 18-Programador

  • 8/12/2019 Procesamiento de Imagens

    61/248

    Reconocimiento de imgenes a travs de su contenido

    50

    Identificador del

    integrante

    Diseador

    Nombre Jaime Martn Talavera

    Tareas Analiza y define las interfaces que se deben

    llevar a cabo para la realizacin de la

    programacin

    Tabla 19-Diseador

  • 8/12/2019 Procesamiento de Imagens

    62/248

    Reconocimiento de imgenes a travs de su contenido

    51

    3.6 Estimacindelesfuerzodecadaintegrante

    Para el proyecto, la estimacin del esfuerzo de cada integrante es la que se muestra

    a continuacin (mostrada en horas/hombre):

    COORDINADOR DIRECTOR JEFEPROYECTO ANALISTA PROGRAMADOR DISEADOR TOTAL

    WP00 10 10 20

    WP01

    5

    15 30

    50

    WP02 5 30 50 110 40 235

    WP03 5 15 70 90

    WP04 10 10 5 25

    WP05 15 15

    TOTAL 15 25 80 165 110 40 435

    Tabla 20-Estimacin del esfuerzo

  • 8/12/2019 Procesamiento de Imagens

    63/248

  • 8/12/2019 Procesamiento de Imagens

    64/248

    Reconocimiento de imgenes a travs de su contenido

    53

    3.8Planificacindelasactividades

    A continuacin se muestra un diagrama de Gantt con la planificacin del proyecto

    Fig 24-Planificacin

    Tanto la documentacin, direccin del proyecto como la coordinacin se realiza en

    paralelo desde el inicio de proyecto al fin del mismo.

  • 8/12/2019 Procesamiento de Imagens

    65/248

    Reconocimiento de imgenes a travs de su contenido

    54

    4. ESTUDIO DE ARQUITECTURA

  • 8/12/2019 Procesamiento de Imagens

    66/248

    Reconocimiento de imgenes a travs de su contenido

    55

    4 Estudio de arquitectura

    4.1Introduccin

    E

    -ARQ

    En esta etapa se definirn las posibles soluciones de arquitectura tcnica que

    satisfagan tanto los requisitos como las restricciones de diseo. La arquitectura debe

    indicar que componentes bsicos de software, hardware y comunicaciones se deben

    adquirir o desarrollarse.

    Los objetivos entonces sern:

    Definir las posibles soluciones de arquitectura tcnica que satisfagan los

    requisitos y las restricciones de diseo.

    Elegir una alternativa propuesta, que ser la que se implante.

    Obtener la aprobacin del cliente o comit informtico para la alternativa

    elegida.

    Para la realizacin se llevara a cabo funciones tales como:

    Especificar la tecnologa hardware, software y de comunicaciones de cada

    alternativa.

    Evaluar cada alternativa en sus aspectos: estratgicos, organizativos,

    operativos, tcnicos y econmicos.

    Seleccionar la alternativa a adquirir o desarrollar.

    Elaborar la planificacin general del desarrollo y programacin delproyecto.

    Los productos que se obtienen son:

    Esquema grfico de funcionamiento de cada alternativa. Especificacin de

    los componentes software, hardware y de comunicaciones.

    Matriz de evaluacin de las distintas alternativas.

    Planificacin general del proyecto: etapas, actividades, hitos importantes,

    recursos y calendarios.

  • 8/12/2019 Procesamiento de Imagens

    67/248

    Reconocimiento de imgenes a travs de su contenido

    56

    El nmero de alternativas a considerar depende del tamao del proyecto a realizar y

    de la complejidad del mismo.

  • 8/12/2019 Procesamiento de Imagens

    68/248

    Reconocimiento de imgenes a travs de su contenido

    57

    4.2Hardware/softwaredelsistemaactual

    En la lista siguiente se enumeran los elementos hardware y software del los

    sistemas utilizado actualmente.

    Mquina 1

    Placa base: ASUS P5KPL

    o Chipset Intel G31

    o CPU Intel LGA775 Pentium 4

    o DDR2 de Dual-Channel

    o Audio Realtek ALC 662 6-chanel

    o Stack Cool

    o AI NOS

    o AI NET2

    Procesador: Intel P4 3.02 Ghz 800 mhz 2Mb Cache Socket 775

    o Processor Frequency: 3 GHz

    o CPUID String: 0F43h

    o Package Type: 775 pin

    o Core Voltage: 1.25V-1.388V

    o Bus Speed: 800 MHz

    o Thermal Guideline: 84.0W

    o Core Stepping: N0

    o Thermal Spec: 67.7C

    o L2 Cache Size: 2 MB

    o Manufacturing Technology: 90 nm

    o L2 Cache Speed: 3.00 GHz

    o Bus/Core Ratio: 15

    Memoria: CORSAIR DIMM DDR2 800 2 x 1024 MB xms2 CL4

    Tarjeta grfica: SPARKLE 6600 PCX 256MB TV HDTV

  • 8/12/2019 Procesamiento de Imagens

    69/248

    Reconocimiento de imgenes a travs de su contenido

    58

    o Bus de grficos PCI Express

    o Memoria 256MB

    o Interfaz de memoria 128 bits

    o Ancho de banda de memoria (GB/s.) 22,4

    o Tasa de relleno (miles de millones de pxeles/s) 6,7

    o Vrtices/s. (millones) 700

    o Pxeles por ciclo de reloj (pico) 12

    o RAMDAC (MHz) 400

    Disco Duro: SATA 200GB 7200rmp MAXTOR

    o Capacidad: 200GB

    o Interface: SATA 1.5Gb/s

    o Buffer: 8MB

    o RPM: 7200

    DVD: AOPEN 16x 48x IDE CAMALEON

    Grabadora DVD: PIONEER 109 16X Doble capa 4X OEM

    Impresora: Hewlett Packard K550 Scanner: Hewlett Packard ScanJet 3300C

    Aplicaciones: Windows XP, Microsoft Office Excel, Matlab 7.0.1

  • 8/12/2019 Procesamiento de Imagens

    70/248

    Reconocimiento de imgenes a travs de su contenido

    59

    4.3Especificacionesdelasaternativas.

    Debido al elevado tamao de las matrices a tratar y de la complejidad de los

    clculos para resolver las gaussianas, se aconseja la utilizacin de estaciones de trabajo

    con alto rendimiento.

    A continuacin se detalla los elementos hardware y software de la mquina Sun

    Ultra 40 Workstation

    P

    rocesador:

    o Processor: two AMD Opteron dual-core 2.6 GHz 285 with

    three 8-GBps HyperTransport interconnects per CPU.

    o Secondary cache (Level 2): 1 MB per CPU.

    Memoria:

    o 16GB maximum; up to four registered DIMMs per CPU.

    Interfaz estandar:

    o Network: Two on-board 10/100/1000 Base-T Gigabit

    Ethernet interfaces.

    o I/O

    Fig 25-Estacin de trabajo Sun Ultra 40 Workstation

  • 8/12/2019 Procesamiento de Imagens

    71/248

    Reconocimiento de imgenes a travs de su contenido

    60

    Eight USB 2.0 ports.

    Two IEEE 1394a (FireWire) ports

    o Audio I/O

    One line-in Two front ports and eight back ports

    o Expansion bus

    Two PCI Express x16 graphics slots (x8 logically)

    One PCI-Express x8 expansion slot (x4 logically)

    Two conventional 32-bit PCI slots operating at

    33MHz

    Memoria de almacenamiento

    o Internal disk:

    Up to four Serial ATA drives 500 GB

    2 TB maximum RAID 0 and RAID 1 support Optical

    drive: One slim dual DVD-RW/CD-RW drive.

    o Optical drive:

    DVD Dual (DVD-ROM and CD-RW combo)

    Grficos y imgenes

    o High-end 3-D: NVIDIA Quadro FX 540 (PCIe) Sotfware

    o Operating System: Operating Systems supported by Sun

    Solaris OS, Red Hat Enterprise Linux, SUSE Linux

    Enterprise Server, and Microsoft Windows.

    o Free Software: Preloaded Development Tools. Includes fully-

    licensed versions of the following:

    Sun Java Studio Creator 2 - 90-day installation support+ 1-year support via Sun Developer Network (SDN)

    Sun Java Studio Enterprise 8 - 90-day installation

    support + 1-year support via SDN.

    Sun Java Studio Enterprise 8 - 90-day installation

    support + 1-year support via SDN.

    Sun Studio 11ML - 90-day installation support.

    NetBeans 5.0 open source IDE

    Grid Software:

  • 8/12/2019 Procesamiento de Imagens

    72/248

  • 8/12/2019 Procesamiento de Imagens

    73/248

    Reconocimiento de imgenes a travs de su contenido

    62

    o Depth 569 mm (22.4 in.).

    o Weight 26.31 kg (58 lbs) fully configured, depending on

    configuration.

    Precio:

    o 2,295.00 $

  • 8/12/2019 Procesamiento de Imagens

    74/248

    Reconocimiento de imgenes a travs de su contenido

    63

    A continuacin se detalla los elementos hardware IBM IntelliStation A Pro.

    Procesador:

    o Dual-core AMD Opteronprocessors Dual-capable Opteron

    200 Series processors up to 2.8 GHz.

    o 1MB L2 cache per processor core Memoria:

    o 16GB max, PC3200 ECC DDR SDRAM, 128-bit controller; 8

    DIMM slots total.

    Interfaz estandar:

    o Network: Integrated high-bandwidth Gigabit Ethernet with

    Wake on LAN.

    o I/O: USB 2.0 (2 front, 3 back).

    2 IEEE 1394 (1 front, 1 back).

    2 serial.

    1 parallel.

    o Audio I/O

    AC-97 audio.

    Microphone in (front and back).

    Line in.

    Fig 26-Estacin de trabajo IBM IntelliStation A Pro

  • 8/12/2019 Procesamiento de Imagens

    75/248

    Reconocimiento de imgenes a travs de su contenido

    64

    Line out.

    Integrated speaker.

    o Expansion bus:

    (1/0) PCI Express x16.

    (1/1) 64-bit/133MHz PCI-X.

    (4/4) 64-bit/100MHz PCI-X.

    Memoria de almacenamiento

    o Internal disk:

    80GB/7,200rpm.

    160GB/7,200rpm.

    250GB/7,200rpm (optional).

    o Optical drive: IBM MultiBurner Plus CD-R, CD-RW, DVD-

    RAM, DVD-ROM, DVD-R, DVD-RW, DVD+R, DVD+RW.

    Grficos y imgenes

    o Extreme 3D NVIDIA Quadro FX 4500, 512MB GDDR3

    SDRAM, 470 MHz GPU core.

    Sotfware:

    o Microsoft Windows XP Professional (32-bit)and XP Professional x64 Edition available preinstalled.

    o Matlab 7.0.1

    Entorno:

    o 530W.

    o 3 temperature-controlled fans.

    Precio:

    o 5,219.00 $

  • 8/12/2019 Procesamiento de Imagens

    76/248

    Reconocimiento de imgenes a travs de su contenido

    65

    4.4Evaluacindelasalternativas

    4.4.1Evaluacin

    tcnica

    En la tabla 23 podemos ver una comparacin entre las dos mquinas propuestas.

    Tabla 23-Comparativa mquinas

  • 8/12/2019 Procesamiento de Imagens

    77/248

    Reconocimiento de imgenes a travs de su contenido

    66

    Como podemos observar en la mayora de los elementos es superior Sun Ultra 40

    Workstation a la mquina IBM IntelliStation A Pro.

    En este aspecto apostaremos por la mquina Sun Ultra 40 Workstation al ser estamas potente.

    4.4.2Evaluacineconmica

    En el anlisis de los costes de adquisicin tecnolgica se pondr especial nfasis en:

    Costes hardware: costes del equipo para el nuevo sistema.

    Costes software: licencias de productos ya desarrollados y comercializados

    a adquirir como hojas de clculo (estas son necesarias para poder salvar los

    datos calculados), sistemas operativos, matlab (para poder correr la

    aplicacin).

    ALTERNATIVA 1 2

    Costes del hardware $2,295.00 $5,219.00

    Costes software * *

    Tabla 24-Alternativas

    * En cuanto a los costes software en ambos casos sern los mismos ya que en

    ambas mquinas vienen instalados sistemas operativos, los nicos costes serian los de la

    adquisicin de la licencia de Matlab 7.0