153
EDSON JOSÉ RODRIGUES JUSTINO O GRAFISMO E OS MODELOS ESCONDIDOS DE MARKOV NA VERIFICAÇÃO AUTOMÁTICA DE ASSINATURAS Curitiba 2001

EDSON JOSÉ RODRIGUES JUSTINO - etsmtl.ca · Tabela 3.3 Características combinadas da grafologia e da grafoscopia. 49 Tabela 3.4 Relação de características associadas às classes

  • Upload
    vucong

  • View
    225

  • Download
    2

Embed Size (px)

Citation preview

  • EDSON JOS RODRIGUES JUSTINO

    O GRAFISMO E OS MODELOS ESCONDIDOS DE MARKOV NA

    VERIFICAO AUTOMTICA DE ASSINATURAS

    Curitiba2001

  • EDSON JOS RODRIGUES JUSTINO

    O GRAFISMO E OS MODELOS ESCONDIDOS DE MARKOV NA

    VERIFICAO AUTOMTICA DE ASSINATURAS

    Tese apresentada aoPrograma de Ps-Graduaoem Informtica Aplicada daPontifcia UniversidadeCatlica do Paran comoparte dos requisitos paraobteno do ttulo de Doutorem Cincias.

    rea de Concentrao:MTODOS E TCNICAS

    DE COMPUTAO

    Orientador:Prof. Dr. Flvio Bortolozzi

    Co-orientador:Prof. Dr. Robert Sabourin

    Curitiba2001

  • Justino, Edson Jos Rodrigues

    O grafismo e os modelos escondidos de Markov na verificaoautomtica de Assinaturas. Curitiba, 2001.

    131p.

    Tese (Doutorado) Pontifcia Universidade Catlica do Paran.Programa de Ps-Graduao em Informtica Aplicada.

    1. Anlise de Documentos 2. Verificao de Assinaturas 3.Modelos Escondidos de Markov.

    I. Pontifcia Universidade Catlica do Paran. Centro de CinciasExatas e de Tecnologia. Programa de Ps-Graduao em InformticaAplicada II-t

  • i

    minha esposa Marinice, pelo estmulo e

    incansvel compreenso durante todos

    esses anos de trabalho.

  • ii

    A G R A D E C I M E N T O S

    Pontifcia Universidade Catlica do Paran pelo apoio

    financeiro e estrutural, que permitiram a realizao desse

    trabalho.

    Ao amigo e orientador Prof. Dr. Flvio Bortolozzi pelas

    diretrizes sempre seguras e permanente incentivo diante de

    tantas atribulaes.

    Ao Prof. Dr. Robert Sabourin pelas importantes contribuies

    dadas a esse trabalho.

    Ao Prof Dr. Abdenam El Yacoubi pelas importantes

    contribuies dadas nos estudos dos Modelos Escondidos de

    Markov.

    Aos meus colegas de doutorado, que em todos os momentos

    difceis pelos quais passamos, mantiveram-se sempre unidos em

    busca de nosso objetivo comum.

    todos que direta ou indiretamente colaboraram na execuo

    deste trabalho.

  • iii

    Sumrio

    Lista de tabelas

    Lista de figuras

    Lista de abreviaturas e siglas

    Lista de smbolos

    Resumo

    Abstract

    1. Introduo 1

    1.1. Histrico geral 2

    1.2 O objetivo 2

    1.3 O desafio 2

    1.4 A motivao 3

    1.5 A proposta 3

    1.6 As contribuies 4

    1.7 A organizao 4

    2. Fundamentao Terica em Verificao Automtica de

    Assinaturas Manuscritas: Vantagens e Limitaes

    6

    2.1 A assinatura manuscrita e os fatores de complexidade 6

    2.1.1 Os fatores ligados autoria 6

    2.1.2 Os fatores ligados s diferenas regionais 7

    2.1.3 Os fatores ligados s falsificaes 8

    2.2 Os mtodos dinmicos e os mtodos estticos de verificao

    automtica de assinaturas

    9

    2.3 A classificao dos mtodos automticos de verificao esttica 11

    2.3.1 O pr-tratamento 11

    2.3.2 A segmentao e a extrao de primitivas 12

    2.3.2.1 Os mtodos globais 12

    2.3.2.2 Os mtodos locais 14

  • iv

    2.3.3 A produo do modelo e a comparao 18

    2.3.3.1 A classificao dos mtodos de verificao 19

    2.3.3.1.1 Os mtodos estatsticos 19

    2.3.3.1.1.1 Os mtodos paramtricos 19

    2.3.3.1.1.2 Os mtodos no paramtricos 21

    2.3.3.1.2 Os mtodos estruturais 21

    2.3.3.2 Os mtodos de verificao segundo a abordagem

    utilizada

    22

    2.3.4 Uma anlise crtica 24

    3. A Proposta para um Mtodo de Verificao Automtica de

    Assinaturas Manuscritas Estticas

    25

    3.1 A proposta 25

    3.1.1 Os requisitos 25

    3.1.2 As metas 26

    3.1.3 A abordagem adotada 27

    3.1.4 A base de dados de assinaturas 27

    3.2 Os recursos 31

    3.2.1 O grafismo 31

    3.2.1.1 A grafoscopia 32

    3.2.1.2 A grafologia 35

    3.2.1.2.1 Elementos bsico da grafia 36

    3.2.1.2.2 As letras e o movimento 38

    3.2.1.2.3 Os aspectos grficos 38

    3.2.1.2.4 O simbolismo do espao 39

    3.2.1.2.5 A ordem 43

    3.2.1.2.6 A proporo 44

    3.2.1.2.7 A dimenso 45

    3.2.1.2.8 A presso 45

    3.2.1.2.9 A forma 46

    3.2.1.2.10 O gesto caracterstico 46

    3.2.1.3 Consideraes sobre o grafismo 48

  • v

    3.2.2 Os modelos de Markov 50

    3.2.2.1 A matriz de transio 51

    3.2.2.2 A probabilidade de transio 51

    3.2.2.3 Os modelos escondidos de Markov (MEM) 52

    3.2.2.3.1 O modelo contnuo 52

    3.2.2.3.2 O modelo discreto 53

    3.2.2.3.3 Os tipos de MEM 54

    3.2.2.3.4 Os problemas bsicos do MEM 56

    3.2.2.3.4.1 A evoluo da probabilidade 56

    3.2.2.3.4.2 A seqncia tima de estados 59

    3.2.2.3.4.3 A reestimao dos parmetros 61

    3.2.2.3.4.4 A estimao inicial dos

    parmetros

    63

    3.2.2.3.4.5 O efeito do nmero insuficiente

    de dados de aprendizado

    64

    3.2.2.3.5 Os modelos escondidos de Markov e as

    mltiplas seqncias de observaes

    64

    3.2.2.3.6 Consideraes sobre o MEM 67

    3.2.3 A quantizao vetorial e a aglomerao 68

    3.2.3.1 A quantizao vetorial 68

    3.2.3.1.1 A medida das distores 70

    3.2.3.1.2 O projeto de um lxico 71

    3.2.3.2 A aglomerao 73

    3.2.3.3 Consideraes prticas sobre o QV 74

    3.3 Comentrios finais 75

    4. O Pr-tratamento, a Segmentao e a Extrao de Primitivas 76

    4.1 O pr-tratamento 76

    4.2 A segmentao 78

    4.2.1 A estratgia de segmentao adotada 79

    4.2.1.1 A estratgia de segmentao horizontal 81

    4.2.1.2 A estratgia de segmentao vertical 83

  • vi

    4.2.2 As caractersticas do grafismo incorporadas pelo mtodo de

    segmentao

    85

    4.2.2.1 As primitivas estticas 85

    4.2.2.2 As primitivas pseudo-dinmicas 87

    4.3 A extrao de primitivas 88

    4.3.1 As primitivas adaptadas s caractersticas estticas 88

    4.3.1.1 A densidade de pixels 88

    4.3.1.2 A distribuio de pixels 89

    4.3.2 As primitivas adaptadas s caractersticas pseudo-dinmicas

    das assinaturas

    90

    4.3.2.1 A inclinao axial 90

    4.3.2.2 A forma 92

    4.3.2.3 A progresso 93

    4.4 A gerao do lxico usando a quantizao vetorial 94

    4.5 Consideraes finais 96

    5. O Mtodo Proposto para a Verificao Automtica de

    Assinaturas Estticas usando MEM

    97

    5.1 O mtodo de verificao 97

    5.1.1 A escolha do modelo 97

    5.1.2 O processo de aprendizado 99

    5.1.2.1 O nmero de estados do modelo 99

    5.1.2.2 O algoritmo de aprendizado 100

    5.1.2.3 O algoritmo de validao 101

    5.1.2.4 A normalizao das probabilidades 102

    5.1.2.5 A determinao dos parmetros para o ajuste dos

    limiares de aceitao e rejeio

    103

    5.1.3 O processo de verificao 105

    5.2 Comentrios fnais 106

    6. Os Testes e a Anlise dos Erros 107

    6.1 Os resultados experimentais 107

  • vii

    6.1.1 O protocolo de avaliao 107

    6.1.2 O resultado usando mltiplas resolues de grade de

    segmentao e mltiplos lxico, para um nico MEM

    108

    6.1.3 A anlise qualitativa das primitivas isoladas 110

    6.1.4 Os resultados usando primitivas isoladas com uma segunda

    base dados e a presena de falsificaes simples e servis

    111

    6.1.5 As restries quanto ao nmero de primitivas usadas no MEM

    multi-dimensional

    112

    6.1.6 Os resultados usando primitivas combinadas em um MEM

    multi-dimensional

    113

    6.1.7 O ajuste dos limiares de aceitao e rejeio atravs dos

    valores de

    114

    6.1.8 Os problemas decorrentes do processo de coleta da base de

    dados

    115

    6.2 Consideraes finais 116

    7. Concluses e Trabalhos Futuros 117

    7.1 Concluses 117

    7.2 Sugestes para trabalhos futuros 118

    Anexo Normativas do Banco Central para Cheques 120

    Referncias Bibliogrficas 127

  • viii

    Lista de Tabelas

    Tabela 3.1 Descrio das bases de dados de assinaturas usadas para avaliar o

    desempenho dos mtodos de verificao automtica de assinaturas

    estticas.

    29

    Tabela 3.2 Avaliao estatstica da ocupao do espao grfico e da variao

    de escala da assinatura.

    42

    Tabela 3.3 Caractersticas combinadas da grafologia e da grafoscopia. 49

    Tabela 3.4 Relao de caractersticas associadas s classes de primitivas

    esttica e pseudo-dinmicas.

    50

    Tabela 4.1 Segmentao com mltiplas resolues. 83

    Tabela 6.1 Resultados obtidos pelo mtodo de verificao, para as

    falsificaes aleatrias, usando a densidade de pixels como

    primitiva e a base de dados com 40 autores.

    109

    Tabela 6.2 Analise qualitativa das primitivas isoladas. 110

    Tabela 6.3 Resultados obtidos usando o segundo subconjunto de autores e com

    o uso de falsificaes simples e servis.

    111

    Tabela 6.4 Resultados obtidos usando as mesmas primitivas em um MEM

    multi-dimensional.

    113

    Tabela 6.5 Resultados obtidos usando os valores mdios de . 115

  • ix

    Lista de Figuras

    Fig. 1.1 Variabilidades de estilos de assinaturas. 3

    Fig. 2.1 (a) Exemplo de assinatura latina e (b) japonesa. 8

    Fig. 2.2 (a) Exemplo de uma assinatura cursiva e (b) Exemplo de uma rubrica. 8

    Fig. 2.3 (a) Exemplo de assinatura genuna. (b) Exemplo de falsificao

    aleatria (assinatura original de outro autor). (c) Exemplo de

    falsificao simples. (d) Exemplo de falsificao servil.

    9

    Fig. 2.4 Diagrama de funcionamento do mtodo de verificao automtica. 11

    Fig. 2.5 Diagrama hierrquico de classificao dos mtodo de verificao

    automtica de assinaturas estticas.

    12

    Fig. 2.6 Diagrama esquemtico dos modelos Estticos e Pseudo-dinmicos. 12

    Fig. 2.7 Imagem do canto superior esquerdo desfocada com +2, +4, +8, +16

    e +32 pixels respectivamente. Adaptada de [BRUYNE & FORR,

    1988].

    13

    Fig. 2.8 (a) Assinatura genuna e (b) Falsificao simples. 13

    Fig. 2.9 (a) Exemplo de assinatura; (b) O envelope superior; c) O envelope

    inferior. Adaptada de [CHAUDHURY & BAJAJ, 1997].

    14

    Fig. 2.10 Pontos e linhas crticas em uma assinatura, para a extrao de

    caractersticas. Adaptada de [CHUANG, 1977].

    15

    Fig. 2.11 Imagem de uma assinatura segmentada pelo processo de segmentao

    proposto por Rosenfeld. Adaptado de [ROSENFELD et al., 1997].

    16

    Fig. 2.12 (a) Imagem binria de uma rubrica; (b) Ncleo da imagem binria. 16

    Fig. 2.13 Modelo de clula usado por Sabourin e Genest. (a) Modelo detalhado

    dos sensores. (b) Modelo do grid. Adaptado de [SABOURIN &

    GENEST, 1994].

    17

    Fig. 2.14 Modelo de clula usada por Rigoll e Kosmala. Adaptado de [RIGOLL

    & KOSMALA, 1998].

    17

    Fig. 2.15 (a) Ncleo da assinatura; (b) Contorno da assinatura; (c) Distribuio

    dos pixels; (d) Ajuste fino da assinatura; (e) Regio de alta presso.

    18

    Fig. 3.1 (a) Exemplo de assinatura que ocupa a rea de assinatura sem 26

  • x

    extrapolar. (b) Exemplo de assinatura que extrapola a rea destinada

    assinatura. A perda encontra-se na parte superior e inferior da

    assinatura, incluindo os laos maiores.

    Fig. 3.2 Tipos de assinaturas da base de dados: (a) assinatura genuna; (b)

    falsificao aleatria; (c) falsificao simples; (d) falsificao servil.

    30

    Fig. 3.3 Modelo do gabarito usado para a coleta das assinaturas. 31

    Fig. 3.4 Elementos tcnicos genticos. Adaptado de [GOMIDE & GOMIDE,

    1995].

    33

    Fig. 3.5 Elementos tcnicos genricos. Adaptado de [GOMIDE & GOMIDE,

    1995].

    34

    Fig. 3.6 Exemplo de alguns dos elementos bsicos da grafia. Zona inicial; (2)

    Zona final; (3) Haste; (4) Laada; (5) Bucle da haste; (6) Bucle da

    laada; (7) bucle em forma de lao; (A) Zona superior; (B) Zona

    mdia; (C) Zona inferior. Adaptado de [VELS, 1961].

    37

    Fig. 3.7 Exemplo das diferenas entre as partes de um elemento grfico: (A)

    Partes essenciais; (B) Partes secundrias. Adaptado de [VELS, 1961].

    38

    Fig. 3.8 Exemplos de assinaturas segundo a simbologia do espao grfico. (a)

    Diagrama representativo do espao grfico; (b) Escritor introvertido;

    (c) Escritor extrovertido; (d) Escritor espiritualista; (e) Escritor

    materialista e introvertido.

    39

    Fig. 3.9 Modelo do formulrio usado para a coleta das assinaturas para anlise

    da ocupao do espao.

    40

    Fig. 3.10 Modelo do formulrio de coleta de assinatura e a representao das

    sees.

    41

    Fig. 3.11 Exemplos de assinaturas do formulrio: (a) Exemplo do uso da seo

    d; (b) Exemplo do uso da seo e; (c) Exemplo do uso da seo a; (d)

    Exemplo do uso da seo b; (e) Exemplo do uso da seo c.

    43

    Fig. 3.12 Exemplos de assinaturas sob o ponto de vista da ordem: (a)

    Assinatura clara; (b) Assinatura confusa; (c) Assinatura concentrada;

    (d) Assinatura espaada.

    44

    Fig. 3.13 Exemplos de assinaturas sob o ponto de vista da proporcionalidade:

    (a) Assinatura proporcional; (b) Assinatura desproporcional; (c)

    44

  • xi

    Assinatura mista.

    Fig. 3.14 Exemplos de assinaturas sob o ponto de vista da dimenso: (a)

    Assinatura alta; (b) Assinatura baixa.

    45

    Fig. 3.15 Exemplos de assinaturas sob o ponto de vista da presso do trao: (a)

    Assinatura tensa; (b) Assinatura frouxa.

    45

    Fig. 3.16 Exemplos de assinaturas sob o ponto de vista da forma: (a) Assinatura

    caligrfica; (b) Assinatura arredondada; (c) Assinatura reta vertical;

    (d) Assinatura reta horizontal.

    46

    Fig. 3.17 Exemplos de assinaturas sob o ponto de vista dos gestos

    caractersticos: (a) Gancho; (b) Clava, espiral e inflada; (c) Golpe de

    sabre; (d) Bucle; (e) Tringulo e lao; (f) Guirlanda; (g) Serpentina;

    (h) Arco.

    47

    Fig. 3.18 Diagrama resumo das abordagens do grafismo e suas principais

    caractersticas.

    48

    Fig. 3.19 Exemplos de modelos discretos de MEM: a) Um exemplo de modelo

    ergtico; b)Um exemplo de um modelo esquerda-direita. Adaptado de

    [RABINER & JUANG, 1993].

    55

    Fig. 3.20 Seqncia de operaes requeridas para processamento da varivel

    forward t(i). Adaptado de [RABINER & JUANG, 1993].

    55

    Fig. 3.21 Seqncia de operaes requeridas para processamento da varivel

    backward t(i) . Adaptado de [RABINER & JUANG, 1993].

    59

    Fig. 3.22 Particionamento de um espao bidimensional (N = 2) em L = 18

    clulas. Todos os vetores de entrada Ci devem ser quantificados no

    vetor de cdigo yi. Adaptado de [RABINER & JUANG, 1993].

    69

    Fig. 3.23 A representao de um agrupamento de trs classes no espao

    bidimensional.

    73

    Fig. 3.24 Diagrama representativo do sistema de QV usando o mesmo modelo

    para todos os escritor.

    75

    Fig. 4.1 Imagem de um cheque bancrio brasileiro e a delimitao da rea

    destinada assinatura.

    76

    Fig. 4.2 (a) Imagem de uma assinatura em nveis de cinza; (b) Imagem binria;

    (c) Ncleo da assinatura.

    78

  • xii

    Fig. 4.3 (a) Grade usada por Rigoll e Kosmala; (b) Grade usada por Sabourin e

    Genest. Adaptado de [RIGOLL & KOSMALA, 1998] e [SABOURIN

    & GENEST, 1994].

    79

    Fig. 4.4 Exemplos da sobreposio das imagens afinadas dos vinte espcimes

    da base de aprendizado.

    80

    Fig. 4.5 Exemplo dos modelos de grade quadrada: (a) Grade com resoluo de

    40 pixels; (b) Grade com resoluo de 20 pixels; (c)Grade com

    resoluo de 16 pixels; (d) Grade com resoluo de 10 pixels.

    81

    Fig. 4.6 (a) Segmentao usada pelo Grafismo; (c) Exemplo de uma

    segmentao com 4 zonas de tamanho fixo.

    82

    Fig. 4.7 (a) e (b) Seqncias de observaes, usando clulas quadradas;(c) e

    (d) Seqncias de Observaes, usando clulas retangulares.

    84

    Fig. 4.8 (a) Baixa resoluo com 4 clulas verticais; (b) Mdia resoluo

    com 10 clulas verticais; (c) Alta resoluo com 25 clulas verticais.

    85

    Fig. 4.9 Calibre (Caractersticas do grafismo): (a) Assinatura alta; (b)

    Assinatura baixa.

    85

    Fig. 4.10 Exemplo da incorporao da proporo: (a) Assinatura proporcional;

    (b) Assinatura desproporcional; (c) Assinatura mista.

    86

    Fig. 4.11 Exemplo da incorporao do espaamento: (a) Assinatura com vrios

    espaos entre blocos; (b) Assinatura sem espaos.

    87

    Fig. 4.12 Exemplos da variao do comportamento base. 87

    Fig. 4.13 Imagem binria de uma assinatura e a correspondente tabela de

    densidade de pixels.

    89

    Fig. 4.14 Exemplo do uso do ESC . Adaptado de [SABOURIN & GENEST,

    1994].

    89

    Fig. 4.15 Exemplo do uso dos sensores na determinao da distribuio de

    pixels.

    90

    Fig. 4.16 Exemplo da caracterstica inclinao axial. 91

    Fig. 4.17 Conjunto de elementos estruturantes que representam os tipos de

    inclinao axial das clulas.

    92

    Fig. 4.18 Ncleo da imagem de uma assinatura e a correspondente tabela de

    inclinao axial.

    92

  • xiii

    Fig. 4.19 Vetor de caractersticas usado pela primitiva forma. 93

    Fig. 4.20 Exemplo da primitiva progresso. (a) Clculo da dinmica do traado;

    (b) Extrao do segmento mais significativo.

    94

    Fig. 4.21 Representao do conjunto de primitivas como um conjunto de

    vetores.

    95

    Fig. 4.22 (a) Representa a densidade de pixels para um lxico igual a 100; (b)

    Representa a inclinao axial para um lxico igual a 60.

    96

    Fig. 5.1 Modelo de MEM para palavras. Adaptado de [YACOUBI, 1996]. 98

    Fig. 5.2 (a) Modelo esquerda-direita; (b) Exemplo da representao do modelo. 98

    Fig. 5.3 Grfico indicador da variao do nmero de estados para cada modelo

    de assinatura.

    99

    Fig. 5.4 Grfico que representa o nmero de observaes dos 20 espcimes de

    cada autor (40 autores) usados no processo de aprendizado.

    100

    Fig. 5.5 Grfico tpico para as curvas de aprendizado e validao. 102

    Fig. 5.6 Exemplo do processo de normalizao para os 20 espcimes de

    aprendizado de um mesmo autor.

    103

    Fig. 5.7 Ponto de determinao dos melhores valores de .. 104

    Fig. 5.8 Representao dos limiares de aceitao e rejeio de uma assinatura. 105

    Fig. 6.1 Sobreposio, usando o centro de gravidade, dos 20 espcimes de

    aprendizado de um mesmo escritor: (a) Exemplo de assinatura com

    alta variabilidade intrapessoal. (b) Exemplo de assinatura com baixa

    variabilidade intrapessoal.

    112

    Fig. 6.2 (a) Assinatura genuna e (b) Falsificao simples. 114

    Fig. 6.3 Grfico que demonstra o comportamento da taxa de erro mdio,

    durante a determinao dos parmetros auxiliares .

    115

  • xiv

    Lista de Abreviaturas e Siglas

    ARD - Anlise e Reconhecimento de Documentos

    BMP - Arquivo no formato bit map

    CD-ROM - Compact Disk read only

    dpi - dot per inch

    HMM - Hidden Markov Model

    LARDOC - Laboratrio de Anlise e Reconhecimento de Documentos

    LBG - Linde, Buzo and Gray algorithm

    MEM - Modelos Escondidos de Markov

    PUCPR - Pontifcia Universidade Catlica do Paran

    QV - Quantizao Vetorial

    VQ - Vector Quantization

  • xv

    Lista de Smbolos

    P( . | . ), p - probabilidade condicional

    A, P[ ] - matriz de transies da cadeia de Markov

    t - intervalo de tempo

    Pt[ ] - matriz de transies da cadeia de Markov no instante t

    b( ) - distribuio da probabilidade de observao

    n, S - estados do modelo de Markov

    N - nmero mximo de estados do modelo de Markov

    k - smbolo observvel

    x - vetor de smbolos

    Q - conjunto de estados do modelo

    T - comprimento da seqncia de observaes

    V - conjunto de smbolos observveis

    M - nmero mximo de smbolos observveis em um alfabeto

    B - matriz de probabilidades de observaes de smbolos

    - matriz de densidades e probabilidades iniciais

    = {A,B,} - conjunto necessrio e suficiente na definio do modelo de

    Markov

    O - seqncia de observaes

    - varivel forward

    - varivel backward

    - probabilidade a priori

  • xvi

    argmax( ) - funo que retorna o ndice relacionado ao argumento de

    mxima probabilidade na seqncia de estados

    - as mais altas probabilidades ao longo de um caminho simples

    em uma seqncia

    - vetor que contm o caminho de mxima probabilidade

    - probabilidade condicional inicial

    x, y - vetores multi-dimensionais

    q( ) - operador de quantizao

    Ci - centride da classe

    d - medida da distoro

    d2 - erro mdio quadrtico

    W - funo de peso

    D - distncia Euclidiana

    J - mnimo erro quadrtico

    t - taxa de erro total

    Log P - logaritmo da probabilidade

    x , Em - mdia aritmtica

    pt, ptn - probabilidade de aprendizado e probabilidade de aprendizado

    normalizada, respectivamente

    pi, ps - probabilidade mxima do limiar de aceitao e probabilidade

    mnima do limiar de aceitao, respectivamente

    pv, pvn - probabilidade de verificao e probabilidade de verificao

    normalizada, respectivamente

    i, j e k - valores inteiros

  • xvii

    - mdia simples de uma classe

  • xviii

    Resumo

    O problema em verificao automtica de assinaturas , em teoria, um processo

    de reconhecimento de padres usado para discriminar as classes de assinaturas originais

    e as falsas. Apesar dos muitos esforos para desenvolver novas tcnicas de verificao

    de assinaturas estticas, a influncia dos vrios tipos de falsificaes ainda no foram

    extensamente estudados sob a luz do grafismo.

    Esse trabalho apresenta uma contribuio aos estudos j realizados em

    verificao de assinaturas estticas, considerando os diferentes tipos de falsificaes,

    aliada s tcnicas de modelagem Markovianas (usando Modelos Escondidos de Markov

    MEM). Os experimentos mostram que as taxas de erro, para as falsificaes aleatrias

    e simples, ficam bem prximas. Isso demostra a sua aplicabilidade real em cheques

    bancrios brasileiros, onde a falsificao simples representa o principal tipo de fraude

    envolvendo os cheques. Em adio a isso, os experimentos mostraram tambm

    resultados promissores na verificao de falsificaes servis.

  • xix

    Abstract

    The problem of signature verification is in theory a pattern recognition task used

    to discriminate two classes, original and forgery signatures. Even after many efforts in

    order to develop new verification techniques for static signature verification, the

    influence of the forgery types, using graphisms techniques, has not been extensively

    studied.

    This work reports the contribution to static signature verification, considering

    different forgery types in an Hidden Markov Model - HMM framework. The experiments

    have shown that the error rates of the simple and random forgery signatures are very

    closed. This reflects the real applications in which the simple forgeries represent the

    principal fraudulent case. In addition, the experiments show promising results in skilled

    forgery verification by using a graphisms features subset.

  • Captulo 1 - Introduo

    No domnio da Informtica Aplicada e especificamente na Anlise e

    Reconhecimento de Documentos (ARD), a soluo de problemas complexos exige uma

    grande quantidade de conhecimento e tambm alguns mecanismos para a manipulao

    desse conhecimento, a fim de criar solues para os mesmos. Para definir precisamente

    um problema necessrio incluir especificaes precisas sobre qual ser a situao ou

    situaes iniciais e tambm sobre quais situaes finais sero consideradas solues

    aceitveis. Existe tambm a necessidade de uma anlise detalhada do problema, pois

    umas poucas caractersticas importantes podem ter enorme impacto sobre as vrias

    tcnicas possveis para a soluo do mesmo.

    A identificao e representao do conhecimento necessrio para solucionar o

    problema, juntamente com a escolha das melhores tcnicas de soluo, formam o

    conjunto de atribuies necessrias para a sua soluo em ARD.

    A anlise grafotcnica tradicional de documentos manuscritos encaixa-se

    perfeitamente no contexto dos problemas abordados pela ARD, pois envolvem

    processos difceis de serem tratados, devido diversidade de critrios e subjetividades

    empregadas pelos especialistas.

    A despeito dos argumentos anteriores, as primeiras tentativas para

    automatizao desse processo ficaram sujeitas inmeras dificuldades. Alm da

    complexidade do problema j descrito, os pesquisadores encontraram limitaes

    oriundas da indisponibilidade de recursos computacionais suficientes para realizao de

    sistemas concretos e em tempo real. Os recentes progressos obtidos pelos sistemas

    computacionais tornaram possvel a soluo desses problemas, pelo menos

    parcialmente.

  • 2

    1.1 Histrico geral

    Apresenta-se a seguir um breve resumo das principais referncias bibliogrficas

    analisadas, sobre aplicaes do mtodo de verificao automtica de assinaturas, o

    grafismo e os modelos escondidos de Markov.

    Alguns dos principais trabalhos que abordam a verificao automtica de

    assinaturas foram apresentados por: Chuang em [CHUANG, 1977], Ammar em

    [AMMAR et al., 1988], Plamondon [PLAMNONDON & LORETTE, 1988] e Sabourin

    em [SABOURIN & GENEST, 1994].

    As primeiras publicaes sobre o grasfismo datam de 1622. No entanto, as mais

    recentes foram apresentadas por: Vel em [VELS, 1961], Minicucci em [MINICUCCI,

    1991] e Tito [GOMIDE & GOMIDE, 1995].

    Existem inmeras bibliografias sobre os modelos escondidos de Markov. No

    entanto, as que tiveram relevncia para esse trabalho foram: Rabiner em [RABINER &

    JUANG, 1993], Elms em [ELMS, 1996], El Yacoubi em YACOUBI, 1996], Yang

    [YANG et al., 1997] e Rigoll em [RIGOLL & KOSMALA, 1998].

    1.2 O objetivo

    O objetivo desse trabalho a apresentao de uma modelagem grafotcnica de

    assinaturas manuscritas e sua respectiva anlise, fundamentada em processos

    estocsticos, em razo do uso dos Modelos Escondidos de Markov (MEM). O ponto de

    partida desse estudo norteia-se numa aplicao real: a verificao de assinaturas

    manuscritas em cheques bancrios brasileiros.

  • 3

    1.3 O desafio

    A verificao de assinaturas manuscritas aborda diferentes fontes de

    conhecimento. Cada uma dessas fontes proporciona um conjunto complexo de

    problemas de difcil soluo: do pr-tratamento da imagem, passando pela segmentao

    e extrao de caractersticas, seguida pela gerao do modelo de referncia e culminado

    com o processo de verificao, cada fase impe um estudo detalhado do problema e o

    desenvolvimento de solues adequadas.

    Fig. 1.1 Variabilidades de estilos de assinaturas.

    1.4 A motivao

    A despeito da automatizao de inmeros processos envolvendo transaes

    bancrias ou mesmo comerciais, quer seja nos cheques bancrios ou em contratos em

    geral, a assinatura manuscrita continua ainda sendo o meio legal usado para firmar

    essas transaes.

    Existem no mercado, sistemas de verificao de assinaturas automticos e semi-

    automticos como o sistema Sival1 e SignPlus2. No entanto, ainda apresentam restries

    relevantes como, por exemplo, o no tratamento dos diferentes tipos de falsificaes.

    Isso faz com que a verificao de assinaturas ainda seja um problema em aberto.

    1 SIVAL: Signature Image Validation, IBM, http://www.ibm.de/go/ide/solutions/bfs/sival.ttml, 1997.2 SignPus Signature Verification System, SoftPro GmbH, http://www.softpro.de, 1997.

  • 4

    1.5 A proposta

    Dentro do domnio do problema existem algumas metas a serem atingidas, que

    no impe restries sobre a forma e o tipo da escrita da assinatura latina, e que

    confrontam com todos os fatores que originam a complexidade do processo de

    verificao. Essas metas so:

    Usar como base de dados de laboratrio, onde as assinaturas coletadas

    obedeceram aos mesmos critrios de preenchimento de um cheque bancrio real,

    com exceo da excluso do plano de fundo do cheque, da linha de base e de

    quaisquer outras informaes que no pertencessem ao contexto. As assinaturas

    estticas sero adquiridas atravs de um digitalizador;

    Estar adaptada s assinaturas cujo alfabeto e a forma da escrita sejam latinas;

    Permitir todos os estilos de assinaturas latinas possveis: cursiva e rubrica;

    Ser sensvel aos trs tipos bsicos de falsificaes encontradas em cheques

    bancrios brasileiros;

    Ser tolerante s variaes intrapessoais e intolerante s variaes interpessoais.

    1.6 As contribuies

    A principal contribuio desse trabalho apresentar uma nova proposta de

    modelagem no contextual de assinaturas (no existe a interpretao de texto), baseada

    nos princpios do grafismo, usando caractersticas estticas e pseudo-dinmicas.

    Outra contribuio importante encontra-se na definio a priori dos parmetros

    de ajuste dos limiares de aceitao e rejeio de cada modelo de assinatura.

    A base de dados de assinaturas criada para esse trabalho tambm uma

    importante contribuio para os trabalhos futuros.

  • 5

    1.7 A organizao

    Esse trabalho divide-se em sete Captulos. O primeiro contm essa breve

    introduo. No segundo Captulo so tratados as generalidades sobre o domnio da

    verificao automtica de assinaturas manuscritas e sua partes componentes. O terceiro

    Captulo contm a contextualizao do problema envolvendo a verificao de

    assinaturas em cheques bancrios brasileiros. Apresenta um estudo detalhado do

    grafismo e os preceitos da anlise pericial grafotcnica. Apresenta tambm a descrio

    dos princpios da codificao simblica usando a Quantizao Vetorial (QV) e a

    modelagem Markoviana. O quarto Captulo apresenta o pr-tratamento das assinaturas

    de laboratrio, a estratgia de segmentao e extrao de primitivas adotado. Por fim,

    apresenta o mtodo de verificao automtica de assinaturas estticas, usando os

    modelos escondidos de Markov (MEM). O sexto Captulo apresenta o protocolo de

    testes, os resultados e a anlise dos erros. No stimo Captulo, so apresentados os

    comentrios finais e propostas para trabalhos futuros.

  • Captulo 2 Fundamentao Terica em Verificao

    Automtica de Assinaturas Manuscritas: Vantagens e

    Limitaes

    Este Captulo contm as caractersticas principais relacionadas s assinaturas.

    Ele descreve as diferentes abordagens usadas na verificao automtica das mesmas.

    So apresentadas as anlises e discusses de suas partes componentes, suas vantagens e

    desvantagens.

    2.1 A assinatura manuscrita e os fatores de complexidade

    A escolha de um mtodo para a verificao de assinaturas manuscritas

    motivada pela apresentao de vantagens e desvantagens, e tambm pela aplicao a ser

    considerada. Tais parmetros influenciam de forma decisiva sobre a eficincia do

    mtodo utilizado para a soluo do problema. Pode-se encontrar na literatura diversos

    mtodos diferentes para o processo de verificao de assinaturas [AMMAR et al.,

    1988], [BROCKLEHURST, 1985], [BRUYNE & FORR, 1988], [CARDOT et al.,

    1992] [FUNG et al., 1996], [PLAMONDON et al., 1990], [RANDOLPH &

    KRISHNAN ,1990] e [SABOURIN & GENEST, 1994]. De maneira geral, todos

    buscam fatores que agregam melhorias em busca de uma soluo que satisfaa s

    necessidades e restries de uma aplicao em particular.

    2.1.1 Os fatores ligados autoria

    Apesar de seguir uma certa estabilidade, a escrita no um processo preciso.

    Somente em algumas caractersticas duas assinaturas do mesmo autor so idnticas. De

    fato, grandes diferenas podem ser observadas em assinaturas de acordo com o pas,

  • 7

    idade, tempo, hbitos, estado psicolgico ou mental e condies fsicas. No entanto,

    dois tipos de variaes so claramente identificveis:

    As intraclasses ou intrapessoais, que so variaes observadas dentro de uma

    mesma classe, entre espcimes de assinaturas genunas de um mesmo autor;

    As interclasses ou interpessoais, que so diferenas que existem entre classes

    de autores distintos.

    Em teoria, uma variao intraclasse deve ser a mnima possvel e uma variao

    interclasses deve ser a mxima possvel. Na prtica, as classes no so bem separadas.

    Um espcime aceito pode ser um dos seguintes:

    Autntica, se escrita pelo mesmo autor do modelo e se possuir uma

    similaridade boa com o modelo de referncia;

    Imitao, se escrita por algum escritor que no o autor e se possuir

    similaridades com o modelo de referncia.

    Igualmente, um espcime rejeitado pode ser um dos seguintes:

    Degenerada, se escrita pelo mesmo autor do modelo e se no similar

    assinatura de referncia. O termo disfarada freqentemente usado quando

    a degenerao voluntria;

    Falsa, se escrita por algum escritor que no o autor do modelo de

    referncia.

    2.1.2 Os fatores ligados s diferenas regionais

    A verificao de assinaturas manuscritas est relacionado diretamente com o

    alfabeto e a forma de escrita de uma determinada regio, como mostram os exemplos de

    assinaturas latina e japonesa na Fig. 2.1.

  • 8

    Fig. 2.1 (a) Exemplo de assinatura latina e (b) japonesa.

    Para as assinaturas latinas podem ser determinados dois tipos bsicos de estilos.

    A assinatura cursiva, derivada do texto manuscrito ou chamada contextual, onde o autor

    assina escrevendo o prprio nome. A rubrica, formada por um desenho estilizado feito

    pelo autor, chamada de no contextual. Nesse ltimo caso, o desenho pode ou no

    conter caractersticas de um texto, por exemplo as iniciais do nome do autor, mas isso

    no uma regra. Confira na Fig. 2.2.

    Fig. 2.2 (a) Exemplo de uma assinatura cursiva e (b) Exemplo de uma rubrica.

    2.1.3 Os fatores ligados s falsificaes

    A verificao de assinaturas manuscritas deve garantir a veracidade da amostra

    em teste, quando confrontada com um modelo. A identificao de uma falsificao

    portanto vista, em reconhecimento de padres, como um problema entre classes de

    aceitao e rejeio. Na prtica, a identificao de uma falsificao depende das

    condies de teste e do meio. Elas podem ser classificadas em:

    Falsificaes aleatrias so aquelas onde o falsificador reproduz a assinatura

    original sem conhece-la. Isto , a falsificao feita sem que o falsificador

    conhea a assinatura original. Na maioria das vezes, a assinatura forjada no

    possui semelhana com a original, conforme mostra a Fig. 2.3;

  • 9

    Falsificaes simples so aquelas onde o falsificador escreve o nome do

    autor, sem incluir as caractersticas de sua grafia. A assinatura forjada pode

    ou no ser semelhante assinatura original;

    Falsificaes servis so aquelas onde o falsificador copia a assinatura

    verdadeira usado um modelo como referncia.

    (a) (b)

    (c) (d)

    Fig. 2.3 (a) Exemplo de assinatura genuna. (b) Exemplo de falsificao aleatria

    (assinatura original de outro autor). (c) Exemplo de falsificao simples. (d) Exemplo de

    falsificao servil.

    2.2 Os mtodos dinmicos e os mtodos estticos de verificao automtica de

    assinaturas

    A principal diferena existente entre os mtodos automticos de verificao de

    assinaturas encontra-se no mecanismo de aquisio dos dados. Se o sinal que descreve o

    estilo da escrita obtido ao mesmo tempo em que a escrita executada, o mtodo dito

    dinmico ou on-line. Se por outro lado, as informaes foram previamente colocadas

    em uma folha de papel para o processamento posterior, o mtodo dito esttico ou off-

    line.

    Os mtodos dinmicos utilizam uma pequena mesa eletrnica que captura os

    dados no momento em que a escrita executada. J nos mtodos estticos, os dados

    esto armazenados em uma folha de papel, que so posteriormente transformados em

  • 10

    uma imagem composta por um conjunto de pixels, obtido atravs de uma cmera ou

    digitalizador.

    Tanto nos mtodos dinmicos como nos estticos, os dispositivos devem possuir

    recursos que permitam a aquisio dos dados, numa preciso capaz de captar as

    informaes relevantes. Para os digitalizadores, as resolues das imagens variam de

    100 a 300 pontos por polegada (dpi).

    A vantagem dos mtodos dinmico encontra-se na capacidade de obter as

    caractersticas dinmicas de um assinante com mais preciso. Tais caractersticas podem

    ser a velocidade do traado, presso da caneta, entre outras. Outra vantagem permitir a

    adaptao do escritor ao novo equipamento de captura dos dados e no o oposto. A

    grande desvantagem a falta de flexibilidade gerada por estes mtodos, pois a sua

    temporalidade no permite variaes suplementares de informaes que podem ser

    obtidas em uma imagem. O maior dos inconvenientes a necessidade de usar-se um

    equipamento especial, que em uma situao real, como no caso dos cheques, torna-se

    invivel.

    Apesar de dificultar a aquisio de caractersticas dinmicas, os mtodos

    estticos possuem a capacidade de obter dados mais permanentes, que podem viabilizar

    o processo de suplementao das caractersticas usadas. Isso o torna mais flexvel. Uma

    outra dificuldade a necessidade de usar-se um processo de pr-tratamento da imagem,

    o que eleva o custo computacional.

    Os mtodos estticos podem ser compostos por duas classes de caractersticas

    extradas da imagem. A primeira chamada de esttica, porque possui a capacidade de

    representar as caractersticas relacionadas com a forma, por exemplo o comprimento e a

    altura mxima de uma assinatura. A segunda chamada de pseudo-dinmica, porque

    possui a capacidade de representar as caractersticas relativas dinmica da escrita,

    como por exemplo curvatura, inclinao e tenso do traado.

  • 11

    2.3 A classificao dos mtodos automticos de verificao esttica

    No diagrama da Fig. 2.4 so apresentadas as partes componentes de um mtodo

    genrico de verificao automtica de assinaturas estticas. Nos itens seguintes sero

    apresentadas as principais abordagens adotadas pela literatura para cada parte.

    Fig. 2.4 Diagrama de funcionamento do mtodo de verificao automtica.

    2.3.1 O pr-tratamento

    O pr-tratamento da imagem de uma assinatura est ligado a dois fatores

    principais. O primeiro diz respeito s caractersticas do dispositivo de aquisio, como a

    resoluo, contraste, luminosidade, presena ou ausncia cor, entre outras. O segundo

    est diretamente ligado ao documento, como desgastes do papel, dobraduras,

    complexidade do plano de fundo (cheques bancrios), entre outras. Alm desses fatores,

    encontram-se outros decorrentes do processo de digitalizao, como rudos e falhas na

    imagem.

    No caso especfico dos cheques bancrios existe ainda o problema da separao

    da assinatura do restante dos dados manuscritos, decorrente da eventual sobreposio da

    data e do extenso.

    Como o pr-tratamento do cheque no parte integrante do escopo desse

    trabalho, somente no Captulo 4 sero abordadas as ferramentas de pr-tratamento

    adotadas para a base de dados de assinaturas de laboratrio.

  • 12

    2.3.2 A segmentao e a extrao de primitivas

    Existem basicamente dois enfoques na classificao dos mtodos de extrao de

    primitivas. O enfoque depende do critrio escolhido para efetuar a classificao. A

    escolha de um mtodo motivado pela apresentao de vantagens e desvantagens e,

    tambm, em funo da aplicao a ser considerada. Tais parmetros influenciam de

    forma decisiva sobre a eficincia do mtodo utilizado para a soluo do problema. As

    Fig. 2.5 e 2.6 apresentam os diagramas hierrquicos que buscam classificar, de forma

    estrutural, os mtodos de extrao.

    Fig. 2.5 Diagrama hierrquico de classificao dos mtodo de verificao automtica

    de assinaturas estticas.

    Fig. 2.6 Diagrama esquemtico dos modelos Estticos e Pseudo-dinmicos.

  • 13

    2.3.2.1 Os mtodos globais

    Os mtodos globais usam caractersticas gerais das assinaturas, como por

    exemplo a altura e a largura. Possuem a vantagem de serem mais insensveis s

    variaes intrapessoais. Contudo, no so capazes de distinguir detalhes pertinentes ao

    formato do traado da escrita, impedindo o registro de informaes relevantes,

    fundamentais na distino de falsificaes servis.

    Debruyne e Forr em [BRUYNE & FORR, 1988] descrevem o uso de um

    modelo global, onde a imagem de referncia e a de teste so sobrepostas, com o

    objetivo de obter a maior quantidade de pontos coincidentes, conforme mostrado na Fig.

    2.7. A vantagem desse mtodo a velocidade. A desvantagem propiciar o aumento da

    taxa de confuso entre assinaturas de diferentes autores e nas falsificaes, conforme

    exemplo na Fig. 2.8.

    Fig. 2.7 Imagem do canto superior esquerdo desfocada com +2, +4, +8, +16 e +32

    pixels respectivamente. Adaptada de [BRUYNE & FORR, 1988].

    (a) (b)

    Fig. 2.8 (a) Assinatura genuna e (b) Falsificao simples.

    Chaudhury e Bajaj em [CHAUDHURY & BAJAJ, 1997] apresentam um

    modelo, onde as caractersticas global utilizadas so o envelopes superiores e inferiores

    da assinatura.. A vantagem encontra-se no mapeamento dos segmentos ascendentes,

  • 14

    descendentes e laos. A desvantagem no incorporar aspectos dinmicos desses

    elementos, conforme apresentado na Fig. 2.9.

    Fig. 2.9 (a) Exemplo de assinatura; (b) O envelope superior.; c) O envelope inferior.

    Adaptada de [CHAUDHURY & BAJAJ, 1997].

    Hunt e Qi em [HUNT & OI, 1995] apresentam um modelo onde as

    caractersticas globais utilizadas so a altura da assinatura, o comprimento e o

    comprimento, com os espaos em branco na direo horizontal retirados. A vantagem

    permitir o mapeamento do calibre da assinatura e do dimensionamento dos

    espaamentos entre os blocos da mesma. Possui a desvantagem de sozinhas no

    modelarem espcimes de assinaturas similares, como as mostradas na Fig. 2.8.

    Com exceo do modelo apresentado por Debruyne e Forr, todos os demais

    apresentados anteriormente, fazem parte de um conjunto de caractersticas globais,

    associadas a outras caractersticas locais, que juntas contribuem para a soluo do

    problema.

    2.3.2.2 Os mtodos locais

    Os mtodos locais usam caractersticas que descrevem as particularidades do

    traado. Possuem a vantagem de serem mais eficientes na identificao dos tipos

    bsicos de falsificaes. No entanto, dependem fundamentalmente de um processo de

    segmentao e das caractersticas usadas.

    Em verificao automtica de assinatura estticas, a unidade bsica relacionada

    com a assinatura o segmento. Diferentemente do texto manuscrito, a assinatura latina

  • 15

    no pode ser segmentada em letras. Ela apresenta variaes de estilo e, portanto, podem

    possuir formas totalmente diferentes do nome do autor, como nas rubricas.

    Chuang em [CHUANG, 1977] apresenta a segmentao da assinatura usando a

    anlise local e contextual, baseada na grafometria. Em primeiro lugar, a assinatura

    dividida em trs zonas, a mdia, a alta e a baixa, equivalente tcnica usada pelos

    grafologistas, confira na Fig. 2.10. Em seguida, as seguintes caractersticas pseudo-

    dinmicas so procuradas, a fluncia (contnua ou interrompida), a presso (pesada ou

    suave) e velocidade (firme ou varivel). J as estticas so compreendidas pela margem

    (normal ou estendida), alinhamento da linha (uniforme, flutuante, espaada ou

    compacta), espao entre palavras (normal ou estendida), tamanho entre zonas

    (proporcional ou desproporcional), legibilidade (boa ou m), conexes entre segmentos

    (afilada, angular ou guirlanda), segmentos bsicos (linear ou cursivo), inclinao geral

    (para a esquerda, para a direita, vertical ou flutuante), segmentos iniciais ou finais

    (planos ou decorativo), barras dos ts (curta ou longa, alta ou baixa) e pingos dos is

    (pequeno ou grande, alto ou baixo). A vantagem desse mtodo incorporar as

    caractersticas pseudo-dinmicas, que pode atribuir ao processo robustez no trato das

    falsificaes simples e servis. A desvantagem encontra-se no uso de uma segmentao

    contextual, o que desfavorece o tratamento das rubricas.

    Fig. 2.10 Pontos e linhas crticas em uma assinatura, para a extrao de caractersticas.

    Adaptada de [CHUANG, 1977].

    Rosenfeld em [ROSENFELD et al., 1997] apresenta a segmentao da

    assinatura atravs dos pontos finais e de juno. Essa estratgia de segmentao permite

    a anlise local dos segmentos da assinatura, como o comprimento, o centro de

  • 16

    gravidade, a taxa de curvatura, entre outras. Confira na Fig. 2.11. Numa assinatura

    complexa, como a mostrada na Fig. 2.12, esse processo pode gerar um nmero relevante

    de segmentos, que no carregam consigo caractersticas importantes para o processo de

    verificao.

    Fig. 2.11 Imagem de uma assinatura segmentada pelo processo de segmentao

    proposto por Rosenfeld. Adaptado de [ROSENFELD et al., 1997].

    (a) (b)

    Fig. 2.12 (a) Imagem binria de uma rubrica; (b) Ncleo da imagem binria.

    Sabourin e Genest em [SABOURIN & GENEST, 1994] apresentam um mtodo

    de segmentao em clulas, para a extrao de caractersticas locais. Elas so

    representadas pelas projees dos segmentos dos traos sobre os sensores localizados

    nas quatro faces da clula e nas diagonais. O nmero de pixels de cada projeo

    posteriormente normalizado pelo tamanho da face. Confira na Fig. 2.13. Com essa

    caracterstica possvel mapear a distribuio geomtrica dos pixels na clula. No

    entanto, no incorpora caractersticas pseudo-dinmicas, como por exemplo o grau de

    curvatura do segmento.

  • 17

    (a)

    (b)

    Fig. 2.13 Modelo de clula usado por Sabourin e Genest. (a) Modelo detalhado dos

    sensores. (b) Modelo do grid. Adaptado de [SABOURIN & GENEST, 1994].

    Rigoll e Kosmala em [RIGOLL & KOSMALA, 1998] apresentam um mtodo

    de segmentao em clulas, para a extrao de caractersticas locais. Nesse caso, usa-se

    a contagem dos pixels pretos contidos em cada clula. Confira na Fig. 2.14. Essa

    caracterstica possui a capacidade de incorporar um descritor estatstico em cada clula.

    A vantagem a insensibilidade s variaes intrapessoais. No entanto, como no caso

    anterior, no descreve adequadamente as caractersticas pseudo-dinmicas.

    Fig. 2.14 Modelo de clula usada por Rigoll e Kosmala. Adaptado de [RIGOLL &

    KOSMALA, 1998].

  • 18

    Huang e Yan em [HUANG & YAN, 1997] apresentam um modelo de

    segmentao em clulas, para a extrao de caractersticas locais. As caractersticas so

    obtidas do ncleo da assinatura, Fig. 2.15a, do contorno, Fig. 2.15b, da distribuio dos

    pixels, Fig. 2.15c, do fator direcional de Fourier, Fig. 2.15d e da regio de mxima

    presso, Fig. 2.15e.

    Fig. 2.15 (a) Ncleo da assinatura; (b) Contorno da assinatura; (c) Distribuio dos

    pixels; (d) Ajuste fino da assinatura; (e) Regio de alta presso.

    As caratersticas estticas so formadas pela rea (calculada em (a) e (b)), regio

    de alta presso (calculada em (e)), pelo nmero de partes constituintes (calculada em (c)

    e (d)).

    2.3.3 A produo do modelo e a comparao

    A verificao de assinaturas consiste na extrao de uma forma desconhecida

    (uma assinatura manuscrita), e o estabelecimento de uma regra de deciso. Essa regra de

    deciso efetuada, geralmente, atravs da medida da verossimilhana da forma em

    anlise (comparao), com um modelo de referncia devidamente armazenado em uma

    base de conhecimento, que descreve uma representao anloga. O modelo de

    referncia obtido numa fase anterior, chamada de aprendizado (produo do modelo).

  • 19

    A fase de aprendizado uma etapa muito importante do sistema de verificao.

    Os modelos oriundos dessa fase possuem um conjunto rico de informaes que

    permitem uma boa preciso do processo de verificao. Essas informaes possuem a

    vantagem de possibilitar a eliminao de redundncias, que por sua vez propiciam a

    reduo do tempo gasto no processo de deciso.

    2.3.3.1 A classificao dos mtodos de verificao

    Conforme foi dito anteriormente, a escolha do tipo de representao (os tipos de

    primitivas) constitui uma etapa essencial na elaborao de um mtodo de verificao.

    As dificuldades surgem principalmente da maneira com a qual so tratadas as entidades

    naturais usadas para obter a descrio matemtica, induzidas por um mtodo terico

    formal. Essa induo possui dois reflexos, sendo o primeiro o dimensionamento do

    espao representativo do fenmeno, que deve possuir propriedades que facilitem o

    processo de deciso. O segundo reflexo a obteno de um espao de representao que

    permita uma implementao computacional. Os dois mtodos formais mais comuns so

    os mtodos estatsticos e os mtodos estruturais.

    2.3.3.1.1 Os mtodos estatsticos

    Os mtodos estatsticos de reconhecimento de padres consistem em efetuar as

    medies do espao mtrico atravs da estatstica [YACOUBI, 1996]. O aprendizado

    executado atravs da separao de um conjunto de amostras em classes obedecendo a

    um conjunto de caractersticas comuns. So especialmente importantes nos sistemas

    cujas classes possuem uma elevada instabilidade entre os vrios espcimes. A

    modelagem estatstica se beneficia dos processos automtico. Os mtodos principais so

    os chamados paramtricos e os no paramtricos.

    2.3.3.1.1.1 Os mtodos paramtricos

    Mtodos estatsticos paramtricos trabalham com hipteses de que as classes em

    questo possuem uma distribuio de probabilidade com comportamento determinado.

    O mtodo supe o conhecimento prvio das leis que regem a probabilidade das classes

  • 20

    envolvidas e que seus parmetros de estimao possuem normalmente um

    comportamento gaussiano. Esses mtodos exigem uma base de dados de aprendizado

    para uma correta estimao dos parmetros.

    Os modelo escondidos de Markov

    Os Modelos Escondidos de Markov (MEM) [RABINER & JUANG, 1993]

    possuem vrias propriedades teis para o reconhecimento de padres. Algumas dessas

    propriedades so descritas a seguir:

    O MEM apresenta uma representao complementar nos seus dois conjuntos de

    parmetros. A probabilidade de observao de smbolos, que representa os

    fenmenos morfolgicos e que possuem a capacidade de aproximar todas as

    funes de densidade e probabilidade arbitrrias. J a probabilidade de transio,

    representa a interao temporal entre os componentes interligados de uma

    forma. A otimizao conjunta desse dois grupos de parmetros faz com que o

    MEM sejam particularmente adaptado modelagem de dados variveis no

    tempo, como no caso das assinaturas manuscritas;

    Quer seja no reconhecimento de palavras como na verificao de assinaturas, o

    reconhecimento de padres apresenta problemas de difcil soluo, em funo

    do grau de variabilidade encontrada. Para tratar o problema de maneira eficiente,

    faz-se necessrio o uso de uma grande quantidade de exemplares para o

    aprendizado. Isso garante uma correta modelagem das variabilidades do

    fenmeno observado. O MEM possuidor da capacidade de adotar hipteses

    iniciais para a estrutura do modelo e, em seguida, utilizar a capacidade que os

    modelos possuem de gerar as probabilidade sobre a base de dados de

    aprendizado, para melhorar o prprio modelo;

    A verificao de assinaturas requer uma razovel insensibilidade s

    variabilidades intrapessoais. Sendo o MEM composto de modelos

    probabilsticos, portanto o candidato natural na representao dessas formas.

    A utilizao do MEM possui algumas limitaes, que podem ser resumidas da

    seguinte maneira:

  • 21

    O MEM apoia-se sobre uma hiptese de independncia das variveis

    aleatrias, para determinar a probabilidade de observao de uma seqncia de

    smbolos. Isso decorre da hiptese de que as observaes extradas de um sinal

    so independentes entre si, e que a gerao de um smbolo na seqncia de

    observao no funo do estado na cadeia de Markov. claro que essas

    afirmativas no so vlidas em todas as ocasies, mas oferecem a vantagem de

    simplificao dos clculos;

    O MEM necessita de uma quantidade elevada de amostra de treinamento

    para um boa definio do modelo. No caso especfico da verificao de

    assinaturas em cheques bancrios brasileiros, esse um problema ainda a ser

    resolvido, pois os bancos coletam apenas trs espcimes de assinaturas de cada

    cliente. No entanto, como os espcimes tm sua origem no mesmo autor, passam

    a ter uma variabilidade menor, diferentemente do que ocorre nos

    reconhecimento de palavras manuscritas.

    2.3.3.1.1.2 Os mtodos no paramtricos

    Nesses mtodos, as leis de formao da probabilidade de uma classe so

    desconhecidas. O problema consiste em propor algoritmos de convergncia que

    determinem o limiar ideal de deciso.

    As janelas de Parzen

    As janelas de Parzen [YACOUBI, 1996], que se enquadram no conjunto dos

    mtodos estatsticos no paramtricos, tm o objetivo de estimar a distribuio de

    probabilidade condicional f(x|w), para uma classe w. Esse mtodo no forma hipteses

    restritivas sobre a natureza das distribuies subjacentes.

    2.3.3.1.2 Os mtodos estruturais

    Os mtodos estruturais buscam descrever informaes geomtricas de maneira

    estrutural, representando formas complexas a partir de componentes elementares,

  • 22

    chamadas de primitivas. Os mtodos estruturais distinguem-se basicamente em dois

    tipos:

    Os mtodos estruturais propriamente ditos, onde a estrutura utilizada

    um grafo que permite representar as formas, as primitivas e as relaes entre

    elas. A fase de deciso consiste na comparao do grafo representativo da

    forma do modelo com o grafo da forma em teste;

    Os mtodos sintticos, onde a estrutura usada para codificar a forma em

    uma lista, utilizando um alfabeto cujos termos representam elementos da

    forma a descrever. A fase de deciso consiste na anlise da lista com a ajuda

    de regras sintticas, como as utilizadas em um texto escrito em uma

    linguagem natural.

    Em geral, a principal vantagem dos mtodos estruturais, sobre os mtodos

    estatsticos, a capacidade de fornecer um descritor de formas independente do

    processo de classificao. O descritor de estrutura de uma forma permite reconstruir

    uma forma a partir das primitivas.

    Por outro lado, contrariamente aos mtodos estatsticos, quando uma classe de

    caractersticas representada por um grande nmero de espcimes, com elevado grau de

    variabilidade num espao de representao, os mtodos estruturais fazem uso de um

    nmero muito elevado de prottipos representativos dessa classe.

    2.3.3.2 Os mtodos de verificao segundo a abordagem utilizada

    Bruyne e Forr em [BRUYNE & FORR, 1988] apresentam uma abordagem

    global esttica, com um mtodo de verificao estatstico baseado em matching. A

    imagem do modelo desfocada colocada sobre imagem em teste tambm desfocada.

    Esse processo se repete com as imagens em vrios nveis de resoluo. A taxa de

    verosimilhana entre as duas imagens determina a sua aceitao ou rejeio. A

    vantagem desse mtodo a rapidez no processamento. A desvantagem no definir de

  • 23

    forma robusta os limiares de aceitao e rejeio, principalmente envolvendo

    falsificaes simples e servis.

    Sabourin e Plamondon em [SABOURIN & PLAMONDON, 1986] apresentam

    uma abordagem global pseudo-dinmica, com um mtodo de verificao estatstico.

    Esse mtodo utiliza dois classificadores, o primeiro usa o princpio da mxima

    probabilidade, baseado em Bayes [HOEL, 1960]. O segundo utiliza um discriminante

    linear de Fisher [HOEL, 1960], para o clculo do erro mnimo.

    Hunt e Qi em [HUNT & QI, 1995] apresentam uma abordagem global com

    caractersticas estticas e pseudo-dinmicas, com um mtodo de verificao estatstico

    baseado em dois classificadores. O primeiro usa uma rede neural (RN), o segundo uma

    quantizao vetorial (QV). O classificador baseado em QV possibilita o processamento

    de mltiplas caractersticas com diferentes tamanhos e resolues. A RN capaz de

    delinear arbitrariamente os limites das classes a reconhecer, mas a performance da rede

    depende da arquitetura da mesma e do mtodo de treinamento.

    Chaudhury e Bajaj em [CHAUDHURY & BAJAJ, 1997] apresentam uma

    abordagem global com caractersticas estticas e pseudo-dinmicas, com um mtodo de

    verificao estatstico baseado em trs classificadores de RN. O uso de mltiplos

    classificadores introduzem um elemento de redundncia ao mtodo. possvel que os

    erros de classificao provocados por um determinado classificador possa ser

    compensado por outro.

    Revillet em [REVILLET, 1991] apresenta uma abordagem local e contextual,

    com caractersticas esttica e pseudo-dinmica, com um mtodo de verificao

    estatstico baseado no vizinho mais prximo com distncia Euclidiana. Essas distncias

    so ordenadas em ordem crescente e para cada classe de reconhecimento. Cada

    caracterstica foi separada e seqencialmente ordenada.

    Sabourin e Genest em [SABOURIN & GENEST, 1994] apresentam uma

    abordagem local com caractersticas estticas, com um mtodo de verificao estatstico

  • 24

    e mltiplos classificadores, baseado no vizinho mais prximo com distncia Euclidiana.

    A desvantagem desse processo o uso excessivo de classificadores.

    Rigoll e Kosmala em [RIGOLL & KOSMALA, 1998] apresentaram uma

    abordagem de verificao dinmica/esttica de assinaturas, com um mtodo de

    verificao estatstico baseado em duplo classificadores. Um classificador QV usado

    para modelar as colunas de clulas da grade de segmentao e um classificador MEM

    para a gerao dos modelos e o processo de deciso.

    2.3.4 Uma anlise crtica

    Muitos dos mtodos apresentados nos itens anteriores so promissores. Cada um

    deles possui pontos fortes que podem contribuir para a elaborao de um sistema

    verificao automtica de assinaturas real. Os que adotam a abordagem local esto mais

    preparados para tratar os trs tipos bsicos de falsificaes. O que utilizam a abordagem

    no contextual [SABOURIN & GENEST, 1994] e [RIGOLL & KOSMALA, 1998],

    possuem potencial para tratar mais eficientemente os diferentes tipos de assinaturas

    latinas (cursiva e rubrica). Os que adotam uma composio entre caractersticas

    estticas e pseudo-dinmica [HUNT & QI, 1995] e [HUANG & YAN, 1997], esto

    mais adaptados para a deteco de falsificaes simples e servis. Aqueles que se

    utilizam dos recursos da grafoscopia [CHUANG, 1977] possuem caractersticas

    robustas na discriminao das falsificaes.

    No caso especfico dos sistema de reconhecimento de documentos manuscritos,

    a variao entre os diversos espcimes de uma mesma forma fica evidenciada j no

    processo de extrao de primitivas. Os modelos estatsticos possuem requisitos

    importantes no tratamento dessas caractersticas, ficando evidenciado pela literatura

    apresentada. O interesse nos modelos de Markov encontra-se em sua capacidade de

    integrar coerentemente diferentes nveis de modelagem (morfolgica, lxica e sinttica)

    [YACOUBI, 1996] e na existncia de algoritmos eficientes na determinao de valores

    timos para os parmetros e no aferimento da qualidade de aprendizado.

    O prximo Captulo contm o mtodo de verificao automtica de assinaturas

    estticas proposto e as ferramentas que daro suporte para a elaborao do mesmo.

  • Captulo 3 A Proposta para um Mtodo de Verificao

    Automtica de Assinaturas Manuscritas Estticas

    Nesse Captulo ser apresentada inicialmente uma proposta para uma mtodo de

    verificao automtica de assinaturas esttica. Em seguida sero apresentados os

    recursos que daro suporte na elaborao do mtodo proposto.

    3.1 A proposta

    Nessa seo so apresentadas as formalizaes do problema envolvendo a

    verificao automtica de assinaturas em cheques bancrios brasileiros. Em seguida so

    apresentadas as metas a serem atingidas, baseado nas motivaes levantadas e as

    tcnicas a serem utilizadas em cada fase.

    3.1.1 Os requisitos

    A anlise de um problema, sob a luz de uma aplicao real, possui a vantagem

    de limitar o escopo no contexto do problema. No entanto, apresenta a desvantagem de

    impor restries em algumas etapas do processo. Essas restries podem auxiliar na

    soluo do problema ou dificult-la. A seguir so apresentados alguns requisitos

    relevantes, que devem ser objeto de um estudo detalhado em cada etapa do processo e

    que no foram suficientemente abordados pela literatura:

    A abordagem a ser adotada deve privilegiar a anlise no contextual, a fim

    de atender aos estilos de assinaturas latinas, a cursiva e a rubrica;

    O uso da abordagem no contextual, ligada aos requisitos legais, exige uma

    reavaliao das tcnicas grafomtricas, j que a literatura no contempla tal

    relao;

  • 26

    A adequao aos trs tipos bsicos de falsificaes exigem estudos

    aprofundados da grafometria e sua relao com as caractersticas estticas e

    pseudo-dinmicas, a fim de estabelecer suas contribuies para o processo de

    verificao;

    A adoo de critrios automatizados, para a determinao dos limiares de

    aceitao e rejeio de uma assinatura, deve ser privilegiado para os

    diferentes tipos de falsificaes;

    Deve ser considerada uma limitao do espao grfico de aproximadamente

    3x10 centmetros, que representa um retngulo destinado assinatura no

    cheque, segundo as normas do Banco Central, em Anexo. Como trata-se de

    uma rea reduzida, possvel a extrapolao desse rea durante o processo

    de escrita. Essa extrapolao implica numa invaso de outros campos do

    cheque, como a data e o montante por extenso. Sendo assim, necessrio

    considerar somente a rea definida pelo retngulo (3x10 cm), confira na Fig.

    3.1a e 3.1b.

    Fig. 3.1 (a) Exemplo de assinatura que ocupa a rea de assinatura sem extrapolar. (b)

    Exemplo de assinatura que extrapola a rea destinada assinatura. A perda encontra-se

    na parte superior e inferior da assinatura, incluindo os laos maiores.

    3.1.2 As metas

    Para atender aos requisitos estabelecidos no item anterior, faz-se necessrio a

    definio de metas a serem atingidas em cada fase, quais os recursos a serem utilizados

    e quais as limitaes impostas por esses recursos. Essa metas so:

  • 27

    Usar como base de dados de laboratrio, com um conjunto de assinaturas

    coletados obedecendo aos critrios de preenchimento de um cheque bancrio

    real, com exceo da excluso do plano de fundo do cheque, da linha de base

    e de quaisquer outras informaes que no pertenam ao contexto. As

    assinaturas devem ser adquiridas atravs de um digitalizador;

    Estar adaptado s assinaturas cujo alfabeto e a forma da escrita sejam latinas;

    Permitir todos os estilos de assinaturas latinas, a cursiva e a rubrica;

    Ser sensvel aos trs tipos bsicos de falsificaes encontradas em cheques

    bancrios brasileiros, a aleatria, a simples e a servil.

    3.1.3 A abordagem adotada

    Com o objetivo de atender aos requisitos legais, faz-se uma adequao aos

    estilos de escrita e aos tipos de falsificaes. A abordagem a ser adotada possui

    caractersticas no contextuais (no existe a interpretao de texto), apresenta um

    critrio de segmentao explcito em clulas [SABOURIN & GENEST, 1994] e

    [RIGOLL & KOSMALA, 1998] e utiliza os preceitos do grafismo, entre eles a

    grafoscopia [CHUANG, 1977], na definio de caractersticas estticas e pseudo-

    dinmicas.

    O mtodo a ser adotado para a verificao o estatstico, pela sua adaptao s

    variabilidade impostas pelo problema. O uso do quantizao vetorial (QV), como pr-

    classificador [HUNT & QI, 1995] e [RIGOLL & KOSMALA, 1998], permite a

    adaptao mais adequada ao processo de segmentao a ser adotado. A adoo dos

    modelo escondido de Markov [RIGOLL & KOSMALA, 1998] no aprendizado e na

    comparao, propicia a manuteno da mtua independncia entre as caractersticas

    extradas de cada observao.

    3.1.4 A base de dados de assinaturas

    Como a base de dados real depende de um processo de pr-tratamento para a

    extrao dos dados do cheque bancrio brasileiro (o montante numrico, o valor por

    extenso, a data e a assinatura), e como esse processo envolve um elevado grau de

  • 28

    complexidade, no faz parte do escopo desse trabalho. Adotou-se uma base de dados de

    laboratrio, que ser descrita na seqncia.

    Para avaliar o desempenho do processo de verificao de assinaturas, necessita-

    se fundamentalmente de uma base de dados que permita a sua validao estatstica. O

    nmero de espcimes por autor, bem como o nmero de autores, so fundamentais.

    Outros aspectos, como resoluo da imagem e nveis de cinza, tambm so elementos

    importantes, pois tratam da qualidade da imagem usada. A Tabela 3.1 mostra um

    comparativo entre as vrias bases de dados utilizadas em trabalhos publicados

    anteriormente. Esse resumo foi descrito por Plamondon e Lorette [PLAMONDON &

    LORETTE, 1988], para os mtodos estticos. Tendo como base a tabela original, foram

    feitas atualizaes incluindo trabalhos mais recentes.

    Para compor a base de dados de referncia, foram coletadas 5.200 imagens de

    assinaturas. Desse montante, existem 4.000 assinaturas genunas oriundas de 100

    autores diferentes (40 amostras de assinaturas para cada autor) e 1.200 falsificaes,

    geradas a partir dos 60 primeiros modelo de assinatura genunas. Foram produzidas 10

    falsificaes simples e 10 falsificaes servis. A Fig. 3.2 apresenta exemplos dos tipos

    de falsificaes coletadas para a base de dados.

  • 29

    RefernciasResoluo da imagem

    eNveis de Cinza (NC)

    Dados de Treinamento e TesteEspcimes (E) Assinantes(A)

    Ammar, Yoshida e Fukumura[AMMA et al., 1985]

    256x1024 grid256 NC

    200 genunas(20E x 10A)200 falsificaes(20E x 10 imitadores)

    Brocklehurts[BROCKLEHURST, 1985]

    60 pixels/cmbinria

    2820 genunas(60E x 47A)

    Chuang[CHUANG, 1977]

    100x300 gridbinria

    2400 genunas(6E x 400A)1600 falsificaes(4E / A)

    Bruyne eForr[BRUYNE & FORR, 1988]

    512x512 imagemdesfocadas

    150 teste em 10 assinaturas dereferncia

    Nagel eRosenfeld[NAGEL & ROSENFELD, 1977]

    500 pixels/polegada60 nveis de cinza

    11 genunas(6E x 1A + 5E x 1A)14 falsificaes(9E x 1A + 5E x 1 A)

    Nemcek eLin[NEMCK & LIN, 1974]

    128x256 gridbinria

    600 genunas(40E x 15A)120 falsificaes(10 A imitados 3E/A 4 imitadores)

    Sabourin e Genest[SABOURIN & GENEST, 1994]

    128x512 grid256 nveis de cinza

    800 genunas(40E x 20A)

    Sabourin e Plamondon[SABOURIN & PLAMONDON, 1986]

    Linhas rtmicas 63 genunas para 1A

    117 falsificaes simuladas de 6imitadoresamadores

    Huang e Yang[HUANG & YAN, 1997]

    12x2 cm100 dpi256 nveis de cinza

    504 genunas(24E x 21A)3024 falsificaes(24 x 6E x 21 imitadores)

    Plamondon, Lorette e Sabourin[PLAMONDON et al., 1990]

    128x512 pixels256 nveis de cinza

    248 genunas(31E x 8A)224 fotocopias das genunas

    Rigoll eKosmala[RIGOLL & KOSMALA, 1998]

    No especificado 280 genunas(20E x 14A)60 falsificaes(40 falsificaes perfeitas)(20 falsificaes simples)

    Tabela 3.1 Descrio das bases de dados de assinaturas usadas para avaliar o

    desempenho dos mtodos de verificao automtica de assinaturas estticas.

  • 30

    (a) (b)

    (c) (d)

    Fig. 3.2 Tipos de assinaturas da base de dados: (a) assinatura genuna ; (b) falsificao

    aleatria; (c) falsificao simples; (d) falsificao servil.

    As assinaturas foram coletadas utilizando uma folha de papel A4 em branco.

    Como elemento guia, foi usado um gabarito no formato de quatro cheques bancrios,

    conforme mostrado na Fig. 3.3. Portanto, as mesmas esto totalmente isentas de

    qualquer elemento de fundo (linhas de base, etc.). As folhas A4 foram digitalizadas com

    uma resoluo de 300dpi, 265 nveis de cinza. Em seguida, as imagens foram recortadas

    e gravadas em um arquivo no formato BMP, num retngulo de tamanho de 3x10 cm ou

    (400x1.000 pixels), correspondendo rea destinada assinatura no cheque.

    Durante o processo de coleta, nenhum tipo de restrio foi imposto aos autores,

    como por exemplo tipo de caneta. Por questes legais, definidas pelas normas do Banco

    Central, em Anexo, somente canetas com cores azul e preta puderam ser usadas. Os

    dados foram armazenados em CD-ROMs, que esto hoje aos cuidados do Laboratrio

    de Anlise de Documentos (LARDOC), situado na PUCPR.

  • 31

    Fig. 3.3 Modelo do gabarito usado para a coleta das assinaturas.

    3.2 Os recursos

    O objetivo desse item descrever detalhadamente as principais ferramentas a

    serem utilizadas no desenvolvimento da soluo para o problema proposto. Ele divide-

    se em trs partes principais. A primeira trata da anlise da assinatura sob a tica do

    grafismo e sua relao com os mtodos automticos. A segunda aborda os princpios da

    modelagem Markoviana. A terceira descreve os preceitos da quantizao vetorial .

    3.2.1 O grafismo

    No campo de estudo do grafismo encontram-se vrias abordagens

    [VELS, 1961], [MINICUCCI, 1991] e [GOMIDE & GOMIDE, 1995], como: a

    grafoscopia, que o estudo da origem do documento grfico; a grafologia, que o

    estudo da escrita visando determinar a psique do escritor; a paleografia, que o estudo

    histrico da escrita; a caligrafia, que o estudo artstico da escrita. Das quatro

    abordagens anteriores, duas delas, a grafoscopia e a grafologia, so importantes para

  • 32

    este trabalho, pois abordam o estudo das caractersticas pessoais de um escritor ligadas

    sua escrita.

    3.2.1.1 A grafoscopia

    A grafoscopia tradicional foi desenvolvida com o objetivo de esclarecer questes

    criminais. Tratando-se de um campo da criminalstica, ela tem sido conceituada como a

    rea cuja finalidade a de verificao da autenticidade de um documento, isto ,

    determinar caractersticas grficas na elaborao de um documento.

    Como a escrita est sujeita a inmeras mudanas, decorrentes de causas

    variadas, exigem conveniente interpretao tcnica, para o completo xito dos exames

    grafoscpicos periciais. As variaes do grafismo originam-se de causas normais,

    artificiais e ocasionais. As primeiras so aquelas que acompanham o prprio

    desenvolvimento humano, nos perodos abrangidos pela infncia e adolescncia,

    maturidade e velhice. J as segundas, so transformaes da escrita causadas pelo

    artificialismo ocorridos nos casos de falsificaes e dissimulaes grficas. As ltimas

    causas originam-se das molstias, dos estados emocionais, de leses na mo e de outros

    fatores fsicos.

    Os elementos tcnicos usados nos exames das identidades grficas, segundo Tito

    e Lvio Gomide [GOMIDE & GOMIDE, 1995], so: os genricos, que se dividem em

    calibre, espaamento, comportamento pauta, comportamento base, proporcionalidade,

    valores angulares, valores curvilneos e inclinao axial; os genticos, que se

    subdividem em, dinmicos (presso, progresso), trajetos (ataques, desenvolvimentos,

    remates, mnimos grficos). Cada um desses elementos podem ser enquadrados, em um

    exame grafoscpico, com convergncia ou divergncia (mnima, mdia, mxima). As

    Fig. 3.4 e 3.5 mostram exemplos de cada um dos casos.

  • 33

    Fig. 3.4 Elementos tcnicos genticos. Adaptado de [GOMIDE & GOMIDE, 1995].

  • 34

    Fig. 3.5 Elementos tcnicos genricos. Adaptado de [GOMIDE & GOMIDE, 1995].

    Segundo Tito e Lvio Gomide [GOMIDE & GOMIDE, 1995], a aceitao do

    princpio fundamental da grafoscopia, que considera a escrita individual, exclui a

    hiptese de erro na apurao da origem das escritas, inexistindo portanto as falsificaes

    perfeitas. Essa afirmativa verdadeira quando existem subsdios necessrios e

    suficientes para uma anlise correta.

  • 35

    No que se refere s assinaturas analisadas, elas nem sempre se apresentam em

    condies adequadas, ocorrendo casos em que existem recobrimentos, falhas devido a

    dobras ou desgastes do papel, ou outras anomalias, impedindo o levantamento de

    elementos tcnicos suficientes para uma concluso decisiva. Ainda nesse contexto,

    podem surgir dificuldades devido s caractersticas intrnsecas do grafismo, tais como

    os campos grficos reduzidos, os polimorfismos, as escritas patolgicas, as escritas

    mo guiadas, entre outras.

    Tito e Lvio Gomide [GOMIDE & GOMIDE, 1995] sugerem, em muitos casos,

    estabelecer um plano e projeto especfico, tal como a seleo de modelos seguros para a

    assinatura ou rubrica, ou critrios para a produo e arquivamento de padres de

    confronto seguros. Isto , o uso de um banco de dados de modelos.

    3.2.1.2 A grafologia

    O estudo pioneiro da grafologia foi realizado pelo italiano Camillo Baldi,

    professor de Lgica e Metafsica da Universidade de Bolonha, que publicou em 1622 o

    primeiro livro de grafologia [VELS, 1961].

    Existem inmeras escolas grafolgicas e grafoanalticas, mas o objetivo deste

    trabalho abordar somente aquelas que possam subsidiar os estudos aplicados

    verificao de assinaturas. Para tanto, sero comentados somente os movimentos com

    abordagem cientfica, ou seja, o movimento clssico que se baseia na mmica e o

    movimento moderno psicanaltico, que se orientam nos smbolos.

    A escola mmica baseia-se no movimento. Segundo a mmica, a grafologia

    comporta dois estudos, o dos sinais e o das resultantes. Os sinais so tomados no

    conjunto da escrita, onde se considera a altura, a largura, a inclinao, a regularidade ou

    no pormenor das palavras, das letras, dos sinais. Sendo assim, deve-se procurar os sinais

    de superioridade e de inferioridade, de natureza e dos meios de inteligncia, de carter

    moral (costumes e sentimentos), vontade, senso esttico, idade, sexo e algumas

    indicaes patolgicas.

  • 36

    J a escola simblica, baseia-se principalmente nos estudos da avaliao e

    interpretao dos smbolos. Existem, indubitavelmente, relaes entre os diversos

    smbolos grafolgicos de que se compem o trao individual e o psiquismo do escritor.

    A condio imprescindvel para compreender a expresso grfica adequadamente, o

    conhecimento dos conceitos bsicos, em sua maior parte inconscientes, que trabalham

    na pessoa ao escrever. Ao escrever, projetamos inconscientemente nosso ser. Escrever

    conscientemente o mesmo que desenhar inconscientemente. O desenho de si mesmo

    o auto-retrato. [MINICUCCI, 1991].

    importante salientar que, os sinais usados pela escola mmica e simblica

    assemelham-se aos utilizados pela grafoscopia, mas a anlise das resultantes possuem

    abordagens diferenciadas. As duas primeiras avaliam a psique do escritor, a fim de

    estabelecer possveis patologias. J a ltima avalia a veracidade da autoria da escrita,

    com a finalidade de identificar possveis fraudes.

    3.2.1.2.1 Elementos bsico da grafia

    Em grafologia pode-se considerar como elementares as noes e quase todos os

    traos e termos a seguir [VELS, 1961]:

    Campo grfico, o espao bidimensional em que a escrita feita;

    Gesto grfico ou movimento grfico, todo movimento de dedos e/ou da mo que

    o indivduo faz para escrever. Cada movimento grfico gera um trao grfico;

    Trao, o trajeto que a caneta descreve em um nico gesto executado pelo escritor;

    Trao descendente, fundamental, pleno, ou grosso, todo trao descendente e

    grosso de uma letra;

    Trao ascendente, ou perfil, o trao ascendente e fino de uma letra;

    Ovais, so os elementos em forma de crculo das letras a, o, g, q, etc;

    Hastes, so todos os traos plenos (movimento de descenso) das letras l, t, b,

    etc. e do f at a base da zona mdia. Tambm so consideradas hastes os traos

    verticais do m e do n maisculo e minsculo, confira na Fig. 3.6(3);

    Lanadas inferiores, so todos os planos (descendentes) do g, j, y, etc. e do

    f a partir da zona mdia at embaixo, confira na Fig. 3.6(4);

  • 37

    Bucles, so todos os traos ascendentes (perfis) das hastes e das laadas inferiores e,

    por extenso, todo movimento que ascende cruzando a haste e unindo-se a ela

    formando crculo, confira na Fig. 3.6(5)(6);

    Partes essenciais, o esqueleto da letra, a parte indispensvel da sua estrutura,

    confira na Fig. 3.7(A);

    Parte secundria ou acessria, o revestimento ornamental ou parte no

    necessria sua configurao, confira na Fig. 3.7(B).

    Nas letras temos de distinguir tambm as diferentes zonas das mesmas:

    Zona inicial, rea onde se encontra o ponto onde inicia-se a letra, confira na Fig.

    3.6(1);

    Zona final, rea onde se encontra o ponto onde termina a letra, confira na Fig.

    3.6(2);

    Zona superior, rea onde se encontra o ponto mais alto, ocupado pelas hastes, pelos

    pontos e acentos, pelas barras do t e parte das maisculas, confira na Fig. 3.6(A);

    Zona mdia, rea central, ocupada por todas as vogais minsculas (a, e, i , o, u) e

    pelas letras m, n, r, etc. cuja altura toma-se como base para medir o nvel da

    elevao das hastes e o nvel do descenso das lanadas inferiores, confira na Fig.

    3.6(B);

    Zona inferior, zona baixa da escrita a partir da base de todos os ovais descendentes,

    das maisculas ou de outras letras, confira na Fig. 3.6(C).

    Fig. 3.6 Exemplo de alguns dos elementos bsicos da grafia: (1) Zona inicial; (2) Zona

    final; (3) Haste; (4) Laada; (5) Bucle da haste; (6) Bucle da laada; (7) bucle em forma

    de lao; (A) Zona superior; (B) Zona mdia; (C) Zona inferior. Adaptado de [VELS,

    1961].

  • 38

    Fig. 3.7 Exemplo das diferenas entre as partes de um elemento grfico: (A) Partes

    essenciais; (B) Partes secundrias. Adaptado de [VELS, 1961].

    3.2.1.2.2 As letras e o movimento

    Sob o ponto de vista fisiolgico de movimento ou de execuo, o impulso grfico

    pode seguir quatro direes principais ou vetores [MINICUCCI, 1991]:

    De cima para baixo, cuja execuo obedece a um movimento de flexo do

    antebrao, da mo e dos dedos e produz os traos plenos;

    De baixo para cima, que obedece a um movimento de extenso e produz os perfis;

    Da direita para a esquerda, que exige do antebrao, da mo e dos dedos um

    movimento de abduso, cujo resultado so os traos em sentido horrio;

    Da esquerda para a direita, que est condicionada por movimentos de abduso e que

    d lugar aos traos em sentido anti-horrio.

    Esses movimentos podem ser: retos, curvos e angulosos. O movimento reto quando

    no apresenta inflexo, tores ou desvios em seu trajeto. O movimento curvilneo,

    quando os traos das letras tm a forma de segmentos de crculo ou oval (as letras

    interiores a, o, etc. ). O movimento anguloso quando as letras so formadas por

    retas que se cruzam ou se quebram.

    3.2.1.2.3 Os aspectos grficos

    Segundo Vels [VELS, 1961], a escrita como grafia psicomotriz deve ser vista e

    classificada sob seus aspectos e subaspectos, ou seja, medindo-se em cada caso o nvel

    de tenso, rapidez, profundidade, irradiao (altura-extenso), relevo, esttica, coeso,

  • 39

    regularidade, inclinao, direo das linhas, progresso e proporo. Quase todos esses

    aspectos do grafismo so mensurveis, isto , podem ser avaliados grafometricamente a

    partir de um modelo ou padro. Tudo que exceda ou fique abaixo deste modelo

    sintomtico.

    3.2.1.2.4 O simbolismo do espao

    Sob o ponto de vista simblico do espao e das formas, a grafologia moderna,

    embasada nas teorias de Freud e Piaget [PIAGET, 1978], descobriu quatro vetores ou

    direes principais do gesto grfico: o espiritual, o emocional, o biolgico e o de

    contato. Na Fig. 3.8a observa-se a simbolismo dos vetores. O vetor A (espiritual) a

    zona ou plano para onde se dirigem as tendncias que no tomam contato direto com a

    realidade dos sentidos, confira na Fig. 3.8d. O vetor B (biolgico), engloba as

    tendncias orgnicas (movimento fsico, trabalho, esporte, viagens, etc.), confira na Fig.

    3.8e. O vetor C (emocional), o plano do sentimento, da sensibilidade. O plano mais

    prximo do vetor C, ou seja, da zona mdia, representa o inconsciente. O vetor I,

    representam a vida cotidiana, introverso, passado, egosmo inibio, etc., confira na

    Fig. 3.8b e o D o futuro, extroverso, iniciativa, ambio, etc., confira na Fig. 3.8c.

    V e to r I V e to r D

    V e to r A

    V e to r B

    V e to r C

    (a )

    (b ) (c )

    (d ) (e )

    Fig. 3.8 Exemplos de assinaturas segundo a simbologia do espao grfico. (a) Diagrama

    representativo do espao grfico; (b) Escritor introvertido; (c) Escritor extrovertido; (d)

    Escritor espiritualista; (e) Escritor materialista e introvertido.

  • 40

    importante observar que, na simbologia de ocupao do espao grfico, podem ser

    encontradas mais de uma das caractersticas pessoais.

    No intuito de verificar o comportamento da ocupao de espao numa rea

    restrita, como no caso do cheque bancrio brasileiro, realizou-se um experimento.

    Foram usadas 13 amostras de assinaturas para 94 autores diferentes. Nesse caso, o

    objetivo foi testar as variaes de escala da assinatura de um mesmo escritor e a

    ocupao do espao destinado mesma, quando o espao disponvel para a assinatura

    reduzido. Para tanto, foi elaborado um formulrio no formato A4 contendo vrias linhas

    de base, algumas com bordas retangulares ajustadas para cima e para baixo, com o

    objetivo de reduzir ou aumentar a rea da parte superior/inferior da linha de base,

    confira na Fig. 3.9. Os escritores no foram instrudos a obedecer as fronteiras impostos

    pelas molduras do formulrio, isto , ficaram livres para assinar como desejassem.

    Fig. 3.9 Modelo do formulrio usado para a coleta das assinaturas para anlise da

    ocupao do espao.

  • 41

    O formulrio foi dividido em 6 sees. A seo (a) composta de reas para a

    assinatura emoldurada com uma reduo do espao na rea superior linha de base. O

    objetivo testar a reduo de escala da assinatura quando a rea reduzida. A seo (b)

    e (c), identificadas por no possuir molduras, possui o objetivo de analisar o

    comportamento do assinante quando o espao destinado assinatura no possui

    fronteiras perfeitamente determinadas. A seo (d) tem os mesmos objetivos de (a), s

    que a linha de base encontra-se na regio central. A seo (e) possui o efeito contrrio

    da (a), seu objetivo o mesmo de (a) e (d), confira na Fig. 3.10.

    Fig. 3.10 Modelo do formulrio para coleta de assinaturas e a representao das sees.

  • 42

    A Tabela 3.2 apresenta os resultados da avaliao estatstica feita sobre os

    formulrios.

    Observaes Comentrios

    Quantos escritores respeitaram as

    fronteiras da moldura (total de assinantes =

    94)?

    Sim = 45 (48%)

    No = 49 (52%)

    (dos 45 que respeitaram as fronteiras, 34

    mantiveram a escala da assinatura e 11 no

    mantiveram. Isto eqivale a dizer que 83

    escritores (88.3%) mantiveram a escala de

    suas assinaturas).

    A invaso das fronteiras da moldura

    ocorreu?

    Parte superior = 45 (48%)

    Parte inferior = 21 (23%)

    Lado esquerdo = 8 (9%)

    Lado direito = 10 (10%)

    No invadiram = 49 (52%)

    Percebe-se que a incidncia de invases do

    lado esquerdo, direito e em baixo da linha

    de base pequena. A grande maioria das

    invases ocorrem na parte superior. Isto

    acontece porque a maior parte da

    assinatura fica sobre a linha de base.

    OBS: O escritor pode ter ultrapassado mais

    de uma fronteira.

    A ocupao do espao grfico ocorreu?

    esquerda = 36 (38%)

    direita = 7 (8%)

    Centro = 51 (54%)

    A maioria dos escritores tende a ocupar a

    parte central da rea, mas existe tambm

    uma grande nmero que ocupa o lado

    esquerdo. O nmero de assinantes que usa

    o lado direito no muito expressivo.

    Tabela 3.2 Avaliao estatstica da ocupao do espao grfico e da variao de escala

    da assinatura.

    Como pode-se notar na Tabela 3.2, a variao de escala da assinatura em uma

    rea determinada mnima, mesmo que essa rea seja reduzida. Confira as variaes da

    posio da linha de base e na ausncia da moldura nos exemplos da Fig. 3.11.

  • 43

    Fig. 3.11 Exemplos de assinaturas do formulrio: (a) Exemplo do uso da seo d; (b)

    Exemplo do uso da seo e; (c) Exemplo do uso da seo a; (d) Exemplo do uso da

    seo b; (e) Exemplo do uso da seo c.

    Quanto ocupao do espao grfico, mesmo que os cheques apresentem uma

    rea reduzida, dificultado sua anlise [GOMIDE & GOMIDE, 1995], possvel

    observar na Fig. 3.8, que essa caracterstica capaz de agregar informaes de contexto

    importantes ao processo de verificao.

    3.2.1.2.5 A ordem

    Em relao ordem de distribuio dos elementos grficos, pode-se classificar a

    distribuio em: clara, boa separao entre letras e palavras, isto , uma harmnica

    distribuio das letras e palavras, confira na Fig. 3.12a; confusa, o texto aparece como

    uma massa desuniforme e embaralhada, confira na Fig. 3.12b; concentrada, na viso do

    conjunto prepondera o texto sobre os espaos em branco, confira na Fig. 3.12c;

    espaada, na viso do conjunto prepondera os espaos em branco, confira na Fig.

    3.12d.

  • 44

    Fig. 3.12 Exemplos de assinaturas sob o ponto de vista da ordem: (a) Assinatura clara;

    (b) Assinatura confusa; (c) Assinatura concentrada; (d) Assinatura espaada.

    3.2.1.2.6 A proporo

    Segundo Vels [VELS, 1961], valorizar as assimetrias, os centros de

    deslocamento das letras ou de seus elementos constitutivos, achar o centro de

    gravidade das tendncias inconscientes. Em relao simetria da escrita, pode-se

    classificar em: proporcional, assinatura onde as letras e as partes constitutivas da

    mesma apresentam pequenas desigualdades rtmicas, confira na Fig. 3.13a;

    desproporcional, a assinatura onde as letras ou partes de letras apresentam

    desequilbrio e translaes mais ou menos exageradas, confira na Fig. 3.13b; mista,

    nota-se a existncia simultnea da proporcionalidade e desproporcionalidade, afetando

    principalmente as letras maiscula e as hastes, confira na Fig. 3.13c.

    Fig. 3.13 Exemplos de assinaturas sob o ponto de vista da proporcionalidade: (a)

    Assinatura proporcional; (b) Assinatura desproporcional; (c) Assinatura mista.

  • 45

    3.2.1.2.7 A dimenso

    A dimenso traduz o grau de expansividade do escritor, cuja caracterstica mais visvel

    nas assinaturas. A dimenso pode ser resumida em duas classes: a escrita alta, onde o

    corpo da escrita (zona mdia) ultrapassa as propores em relao s hastes e as

    lanadas inferiores, confira na