processamento digital de sinais.pdf

Embed Size (px)

Citation preview

  • MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    Processamento

    Digital de Imagens

    Og Marques Filho Hugo Vieira Neto

    1999

  • MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    minha esposa Fabiana, pelo apoio incondicional e permanente. Og Marques Filho

    minha famlia e meus verdadeiros amigos. Hugo Vieira Neto

  • MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    ii

  • MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    Agradecimentos

    Inmeras pessoas colaboraram, direta ou indiretamente para a concretizao deste projeto e a elas dedicamos nossa eterna gratido.

    Editora Brasport, em especial ao Sr. Srgio Martins, pela confiana depositada na importncia deste trabalho e na seriedade de seus autores.

    Ao Sr. Joaquim Guerreiro, da Guerreiro Livros Tcnicos de Curitiba, amigo de longa data, pela sua generosidade e pelo apoio decisivo para a materializao desta obra.

    Aos familiares e verdadeiros amigos que apoiaram esta e outras iniciativas, nosso sincero reconhecimento.

    Aos professores e orientadores do Philips International Institute, Philips Research Laboratories e Delft University of Technology, particularmente Bart de Greef, D. E. Boekee e Harald Ihle, por terem guiado nossos primeiros passos nesta rea de estudo e pesquisa, nossa sincera gratido.

    Nosso agradecimento a todos os colegas docentes do Centro Federal de Educao Tecnolgica do Paran - CEFET-PR, em especial a lvaro Stelle, Maria Gertrudes Te Vaarwerk, Paulo Roberto Brero de Campos e Walter Godoy Junior, e particularmente ao colega Humberto Remigio Gamba, pela paciente reviso dos originais.

    A outros autores que nos inspiraram a trilhar o mesmo rumo, dentre eles: Borko Furht, Juarez do Nascimento, Raul Marques Pereira Friedmann e Volnei Antonio Pedroni.

    Ao apoio das bibliotecrias Arlene de Oliveira Dias, Mrcia Andreiko e Marilene do Rocio Veiga.

    Agradecemos de forma especial aos alunos e ex-alunos que dedicaram seus esforos na pesquisa e implementao de tcnicas de Processamento Digital de Imagens, dentre eles: Aderbal Paz, Alex Holztratner, Alsemiro Alves Junior, Augusto Serbena, Carlos Alberto Jayme, Carlos Alberto Zanella, Ciro de Carvalho Braga, Cludio Navarro, Dalton Roberto Maran Salvatti, Daniel Gri Palka, Diego de Alves e Souza, Domingo Edmundo Saucedo, Edson Luis Morais, Eduardo Nascimento de Freitas, Eduardo Saito, Emanuel-Werner Kohlscheen, Emerson Kamogari, Emerson Luis Parolin, Fabiana Leskiu Marques, Fabio Luis Ur, Fbio Luiz de Andrade, Fbio Morais da Costa, Gilson Yukio Sato, Hlio Okuyama, Horst Lindner Junio, Ildio Dinis Matola, Jefferson Osowsky, Joo Cadamuro Junior, Julio Fujisawa, Leonardo Carvalho Neto, Luiz Renato Quinalha, Manoel Garbuio de Souza, Marcelo Diogo dos Santos, Marcelo Mazzotti, Marcelo Monteiro, Marcos Alberto Lopes, Marcos Francisco Canali, Maurcio Hadime Suzuki, Otvio Sugeno, Ricardo Schmidlin Imbiriba, Rodrigo Nasts Acras, Sacha Tadeu Branco, Srgio Kubo, Srgio L. Rocha Loures, Sergio Luis Resnauer, Silvio Cezar Bortolini, Simone Crocetti Pereira, Wilson Kawano e Zundir Buzzi Junior.

  • MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    iv

  • MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    Sumrio

    Prefcio xix

    Captulo 1 Introduo 1

    1.1 Processamento de Imagens: breve histrico e exemplos de

    aplicaes 1

    1.2 Um sistema de processamento de imagens e seus componentes 2

    1.3 O sistema visual humano 5

    1.4 Sistemas de Viso Artificial: fundamentos e desafios 7

    1.5 Estrutura e escopo do livro 11

    Exerccios Propostos 11

    Na Internet 11

    Bibliografia 15

    Bibliografia Recomendada 16

    Captulo 2 - Fundamentos de Imagens Digitais 19

    2.1 Aquisio e digitalizao de imagens 19

    2.2 Propriedades de uma imagem digital 25

    2.3 Operaes lgicas e aritmticas 28

    2.4 Operaes de convoluo com mscaras 34

    2.5 Transformaes geomtricas 42

    Exerccios Propostos 48

    No computador 51

    Na Internet 51

    Bibliografia 52

    Captulo 3 - Tcnicas de Modificao de Histograma 55

    3.1 Conceito de histograma 55

    3.2 Transformaes de intensidade 59

    3.3 Equalizao de histograma 61

    3.4 Especificao direta de histograma 65

    3.5 Outras tcnicas 68

    3.6 Limiarizao (Thresholding) 71

  • MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    vi

    Exerccios Propostos 77

    No computador 79

    Na Internet 79

    Bibliografia 80

    Captulo 4 - Filtragem, Realce e Suavizao de Imagens 83

    4.1 Consideraes iniciais 83

    4.2 Suavizao de imagens no domnio espacial 85

    4.3 Realce de imagens no domnio espacial 95

    4.4 Transformada de Fourier 99

    4.5 Filtragem no domnio da freqncia 108

    4.6 Processamento de imagens coloridas 118

    4.7 Filtros adaptativos 126

    Exerccios Propostos 133

    No computador 134

    Na Internet 135

    Bibliografia 136

    Captulo 5 - Morfologia Matemtica 139

    5.1 Introduo 139

    5.2 Dilatao e Eroso 139

    5.3 Abertura e Fechamento 143

    5.4 Transformao hit-or-miss 147

    5.5 Algoritmos morfolgicos bsicos 148

    Exerccios Propostos 163

    No computador 164

    Na Internet 164

    Bibliografia 164

    Captulo 6 - Compresso e Codificao de Imagens 167

    6.1 Fundamentos 167

    6.2 Modelos de compresso de imagem 172

    6.3 Elementos de Teoria da Informao 175

    6.4 Compresso sem perdas 180

  • MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    vii

    6.5 Compresso com perdas 192

    6.6 Padres de compresso de imagens 197

    Exerccios Propostos 219

    No computador 221

    Na Internet 221

    Bibliografia 222

    Captulo 7 - Aspectos prticos de hardware e software para processamento de imagens 225

    7.1 O hardware 225

    7.2 O software 232

    Na Internet 239

    Bibliografia 240

    Apndice A - Formatos de arquivos de imagens 243

    A.1 Representao atravs de bitmaps e atravs de vetores 243

    A.2 Formatos de Arquivos de Imagem 244

    Na Internet 261

    Bibliografia 262

    Apndice B - Roteiros de laboratrio de processamento de imagens 263

    B.1 Conceitos Introdutrios 263

    B.2 Utilizando o MATLAB 263

    B.3 Comandos e Funes da Toolbox de Processamento de

    Imagens 267

    B.4 Roteiros de prticas de laboratrio 271

    Na Internet 298

    Bibliografia 298

    Glossrio 299

  • MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    viii

  • MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    Contedo

    Prefcio xix

    Captulo 1 Introduo 1

    1.1 Processamento de Imagens: breve histrico e exemplos de

    aplicaes 1

    1.2 Um sistema de processamento de imagens e seus componentes 2

    1.2.1 Aquisio 2

    1.2.2 Armazenamento 2

    1.2.3 Processamento 3

    1.2.4 Transmisso 4

    1.2.5 Exibio 4

    1.3 O sistema visual humano 5

    1.4 Sistemas de Viso Artificial: fundamentos e desafios 7

    1.4.1 Estrutura de um Sistema de Viso Artificial 9

    1.4.2 Domnio do problema e resultado 9

    1.4.3 Aquisio da imagem 9

    1.4.4 Pr-processamento 9

    1.4.5 Segmentao 10

    1.4.6 Representao e Descrio 10

    1.4.7 Reconhecimento e Interpretao 10

    1.4.8 Base de Conhecimento 10

    1.5 Estrutura e escopo do livro 11

    Exerccios Propostos 11

    Na Internet 11

    Bibliografia 15

    Bibliografia Recomendada 16

    Captulo 2 - Fundamentos de Imagens Digitais 19

    2.1 Aquisio e digitalizao de imagens 19

    2.1.1 Aquisio 21

    2.1.2 Digitalizao 22

    2.2 Propriedades de uma imagem digital 25

  • MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    x

    2.2.1 Vizinhana 25

    2.2.2 Conectividade 26

    2.2.3 Adjacncia 27

    2.2.4 Caminho 27

    2.2.5 Medies de distncia 27

    Distncia Euclidiana 27

    Distncia D4 (city-block) 27

    Distncia D8 (tabuleiro de xadrez) 27

    2.3 Operaes lgicas e aritmticas 28

    2.3.1 Operaes aritmticas pixel a pixel 29

    2.3.2 Operaes lgicas pixel a pixel 31

    2.3.3 Operaes orientadas a vizinhana 33

    2.4 Operaes de convoluo com mscaras 34

    2.4.1 Deteo de pontos isolados 37

    2.4.2 Deteo de linhas 37

    2.4.3 Deteo de bordas 37

    2.5 Transformaes geomtricas 42

    2.5.1 Ampliao e reduo (zoom) 42

    2.5.2 Alteraes de dimenses (scaling e sizing) 42

    2.5.3 Translao 44

    2.5.4 Rotao 44

    2.5.5 Espelhamento (Flip) 45

    2.5.6 Warping 45

    2.5.7 Cropping, cutting e pasting 47

    Exerccios Propostos 48

    No computador 51

    Na Internet 51

    Bibliografia 52

    Captulo 3 - Tcnicas de Modificao de Histograma 55

    3.1 Conceito de histograma 55

    3.2 Transformaes de intensidade 59

    3.3 Equalizao de histograma 61

    3.4 Especificao direta de histograma 65

  • MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    xi

    3.5 Outras tcnicas 68

    3.5.1 Hiperbolizao 69

    3.5.2 Hiperbolizao quadrtica 69

    3.5.3 Expanso de histograma (Input cropping) 70

    3.5.4 Compresso de histograma (Output cropping) 70

    3.6 Limiarizao (Thresholding) 71

    3.6.1 Influncia da iluminao 74

    3.6.2 Limiarizao pelas propriedades estatsticas da imagem 75

    Exerccios Propostos 77

    No computador 79

    Na Internet 79

    Bibliografia 80

    Captulo 4 - Filtragem, Realce e Suavizao de Imagens 83

    4.1 Consideraes iniciais 83

    4.1.1 Filtragem no domnio espacial 83

    4.1.2 Filtragem no domnio da freqncia 84

    4.2 Suavizao de imagens no domnio espacial 85

    4.2.1 Introduo 85

    4.2.2 Filtro da mdia 86

    4.2.3 Filtro da mediana 90

    4.2.4 Outros filtros 93

    Mdia de mltiplas imagens 93

    Mdia dos k vizinhos mais prximos 94

    4.3 Realce de imagens no domnio espacial 95

    4.3.1 Filtro passa-altas bsico 95

    4.3.2 Realce por diferenciao 96

    4.3.3 Filtragem high-boost 97

    4.4 Transformada de Fourier 99

    4.4.1 Transformada de Fourier para sinais unidimensionais (1-D)

    contnuos 99

    4.4.2 Transformada de Fourier para sinais bidimensionais (2-D)

    contnuos 100

    4.4.3 Transformada de Fourier para sinais unidimensionais (1-D)

    discretos 101

  • MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    xii

    4.4.4 Transformada de Fourier para sinais bidimensionais (2-D)

    discretos 102

    4.4.5 Propriedades da transformada de Fourier para sinais

    bidimensionais (2-D) discretos 103

    Separabilidade 103

    Translao 104

    Periodicidade e simetria conjugada 104

    Distributividade 105

    Rotao 105

    Escala 106

    Valor mdio 106

    Laplaciano 107

    Convoluo 107

    4.4.6 A Transformada Rpida de Fourier (FFT) 107

    4.5 Filtragem no domnio da freqncia 108

    4.5.1 Filtro passa-baixas (FPB) 108

    Filtro passa-baixas ideal 108

    Filtro passa-baixas Butterworth 111

    4.5.2 Filtro passa-altas (FPA) 113

    Filtro passa-altas ideal 114

    Filtro passa-altas Butterworth 114

    4.5.3 Filtragem homomrfica 115

    4.6 Processamento de imagens coloridas 118

    4.6.1 Conceitos bsicos 119

    4.6.2 Modelos de representao de cores 121

    Modelo RGB 122

    O modelo CMY 122

    O modelo YIQ 122

    O modelo HSI 122

    4.6.3 Pseudocolorizao 124

    4.6.4 Processamento de imagens coloridas full color 125

    4.7 Filtros adaptativos 126

    4.7.1 Introduo 126

    4.7.2 Aspectos Estatsticos 126

  • MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    xiii

    4.7.3 Alguns tipos de filtros adaptativos 128

    Filtro de Erro Mdio Quadrtico Mnimo (MMSE - Minimum Mean-

    Square Error) 128

    Filtro de mdia e mediana com dupla janela (DW-MTM - Double

    Window-Modified Trimmed Mean) 129

    Filtro da Mediana Adaptativo (SAM - Signal Adaptive Median) 131

    Exerccios Propostos 133

    No computador 134

    Na Internet 135

    Bibliografia 136

    Captulo 5 - Morfologia Matemtica 139

    5.1 Introduo 139

    5.2 Dilatao e Eroso 139

    5.2.1 Definies bsicas 140

    5.2.2 Dilatao 140

    5.2.3 Eroso 142

    5.3 Abertura e Fechamento 143

    5.3.1 Interpretao geomtrica da abertura e do fechamento 144

    5.3.2 Propriedades da abertura 144

    5.3.3 Propriedades do fechamento 144

    5.4 Transformao hit-or-miss 147

    5.5 Algoritmos morfolgicos bsicos 148

    5.5.1 Extrao de contornos 148

    5.5.2 Preenchimento de regies (Region filling) 149

    5.5.3 Extrao de componentes conectados 150

    5.5.4 Casco convexo (Convex Hull) 151

    5.5.5 Afinamento (Thinning) 153

    5.5.6 Espessamento (Thickening) 155

    5.5.7 Esqueletos 155

    5.5.8 Poda (Pruning) 158

    Exerccios Propostos 163

    No computador 164

    Na Internet 164

  • MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    xiv

    Bibliografia 164

    Captulo 6 - Compresso e Codificao de Imagens 167

    6.1 Fundamentos 167

    6.1.1 Redundncia de Codificao 168

    6.1.2 Redundncia Interpixel 170

    6.1.3 Redundncia Psicovisual 170

    6.1.4 Critrios de Fidelidade 171

    6.2 Modelos de compresso de imagem 172

    6.2.1 O codificador e decodificador de fonte 172

    6.2.2 O codificador e decodificador de canal 173

    6.3 Elementos de Teoria da Informao 175

    6.3.1 Medidas de informao 175

    6.3.2 O canal de informao 176

    6.3.3 Utilizando a Teoria da Informao 179

    6.4 Compresso sem perdas 180

    6.4.1 Cdigos de palavra-cdigo de comprimento varivel 180

    Cdigo de Huffman 181

    Cdigo de Huffman Truncado 182

    Codificao Aritmtica 182

    Codificao LZW (Lempel-Ziv-Welch) 185

    6.4.2 Codificao bit-plane 188

    Decomposio bit-plane 188

    Codificao de reas constantes 189

    Run-length unidimensional 189

    Run-length bidimensional 190

    6.4.3 Codificao Preditiva sem Perdas 190

    6.5 Compresso com perdas 192

    6.5.1 Codificao Preditiva com Perdas 192

    Modulao Delta (DM) 193

    Modulao por Codificao Diferencial de Pulsos (DPCM) 195

    A etapa de quantizao 195

    6.5.2 Codificao por transformadas 196

    Seleo de Transformadas 196

  • MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    xv

    6.5.3 Outras tcnicas 197

    6.6 Padres de compresso de imagens 197

    6.6.1 Padres CCITT para fac-smiles Grupo 3 e Grupo 4 198

    Codificao unidimensional 198

    Codificao bidimensional 198

    6.6.2 JPEG 203

    Caractersticas do JPEG 203

    Codificador seqencial 204

    DCT (Transformada Discreta de Cossenos) 204

    Quantizao 205

    Ordenao zig-zag 205

    Codificador por entropia 205

    Decodificador seqencial 206

    Compresso progressiva 207

    Codificao seqencial sem perdas 207

    Outros aspectos do JPEG 208

    6.6.3 H.261 209

    Caractersticas do H.261 209

    Estrutura de dados 210

    Codificador 211

    Decodificador 211

    6.6.4 H.263 212

    6.6.5 MPEG 213

    Caractersticas do MPEG 1 e 2 214

    Estrutura dos quadros MPEG 215

    Codificao interframe 216

    MPEG-4 218

    MPEG-7 218

    Exerccios Propostos 219

    No computador 221

    Na Internet 221

    Bibliografia 222

  • MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    xvi

    Captulo 7 - Aspectos prticos de hardware e software para processamento de imagens 225

    7.1 O hardware 225

    7.1.1 Sensores 225

    Sensores a vlvula 225

    Sensores de estado slido (linear e de rea) 226

    7.1.2 Frame grabbers / frame buffers 227

    7.1.3 Arquiteturas 228

    7.1.4 Dispositivos de sada 229

    Monitores de vdeo 229

    Impressoras 230

    Plotters 231

    7.1.5 Dispositivos de armazenamento 232

    7.2 O software 232

    7.2.1 Ttulos disponveis e classificao 233

    Software para Aplicaes Cientficas 233

    Software para Composio de Imagens Animadas 234

    Software para Converso de Formatos 234

    Software para Manipulao de Imagens 235

    Software para Visualizao de Imagens 236

    7.2.2 Linguagens e ambientes para desenvolvimento 237

    Na Internet 239

    Bibliografia 240

    Apndice A - Formatos de arquivos de imagens 243

    A.1 Representao atravs de bitmaps e atravs de vetores 243

    A.1.1 Comparaes entre as formas de representao 243

    A.1.2 Outras classes de representao 244

    A.2 Formatos de Arquivos de Imagem 244

    A.2.1 Arquivos de Imagens 2-D 244

    A.2.2 Arquivos de Imagens 3-D 257

    A.2.3 Arquivos de Animao e Vdeo 259

    Na Internet 261

    Bibliografia 262

  • MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    xvii

    Apndice B - Roteiros de laboratrio de processamento de imagens 263

    B.1 Conceitos Introdutrios 263

    B.2 Utilizando o MATLAB 263

    Operadores matriciais 264

    Operadores relacionais 264

    Operadores lgicos 264

    Caracteres especiais 264

    Entrada de variveis e matrizes 265

    Principais funes 266

    B.3 Comandos e Funes da Toolbox de Processamento de

    Imagens 267

    B.4 Roteiros de prticas de laboratrio 271

    Prtica 1 - Fundamentos da toolbox de processamento de imagens

    do MATLAB 272

    Prtica 2 - Operaes lgicas, aritmticas e estatsticas com

    imagens 276

    Prtica 3 - Transformaes geomtricas e verificao de nveis de

    cinza de pixels 280

    Prtica 4 - Mtodos ponto-a-ponto de realce e anlise de

    imagens 284

    Prtica 5 - Filtragem no domnio espacial 287

    Prtica 6 - Filtragem no domnio da freqncia 291

    Prtica 7 - Morfologia Matemtica 294

    Na Internet 298

    Bibliografia 298

    Glossrio 299

  • MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    xviii

  • MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    Prefcio

    As reas de processamento de imagens e viso por computador vm apresentando expressivo desenvolvimento nas ltimas dcadas. Tal crescimento pode ser detetado na rea acadmica / onde o assunto objeto de pesquisas, teses e dissertaes nas mais importantes universidades brasileiras e mundiais /, na esfera industrial / onde a cada dia aumenta o nmero de empresas que produzem, comercializam e utilizam solues de processamento eletrnico de imagens em seus processos / e na vida cotidiana, com a popularizao dos computadores pessoais e das aplicaes multimdia. Profissionais das reas de Engenharia, Informtica, Matemtica e Fsica, dentre outras, esto sendo reciclados para incorporarem os novos conhecimentos oriundos desta rea e contam com pequeno nmero de referncias em portugus sobre o assunto. Alm disso, o crescimento espantoso do uso de microcomputadores em ambientes residenciais e a popularizao da multimdia e da Internet colaboraram ainda mais para a difuso de informaes com forte contedo visual e, conseqentemente, despertaram tambm no chamado 'pblico leigo' a curiosidade de conhecer melhor as tcnicas de processamento e manipulao de imagens disponveis. Foi por ver todo este crescente interesse em torno destes temas que este livro foi escrito. Com ele, esperamos poder atender as expectativas dos leitores vidos por informaes tcnicas precisas e adequadas explorao deste fantstico universo da imagem.

    Sobre o contedo e filosofia do livro Este livro resultado de resultado de quase 10 anos de experincia na docncia e pesquisa nas reas de viso por computador e processamento de imagens e procura refletir o resultado desta experincia, suprindo o leitor com uma obra que aborda temas clssicos e obrigatrios relacionados a esta rea de conhecimento / permitindo sua utilizao como livro-texto em disciplinas de graduao e ps-graduao / bem como abrindo os horizontes para a explorao de assuntos inovadores de grande interesse tanto para aqueles que esto travando um primeiro contato com o assunto quanto para pesquisadores da rea. Procuramos estrutur-lo de forma didtica, clara e agradvel, incluindo grande quantidade de imagens ilustrativas das tcnicas descritas, exemplos, exerccios resolvidos e propostos, prticas utilizando computador e o programa MATLAB e sugestes de endereos na Internet para maiores informaes sobre cada captulo. Por filosofia, entendemos que este livro no deveria se limitar a compilar os principais aspectos da rea de processamento de imagens, mas deveria ir um pouco alm, e ser tambm um guia de estudo. Por esta razo foram empreendidos esforos para que o leitor perceba que o assunto no se esgota aqui e para gui-lo na busca de informaes adicionais sobre cada tpico. Exemplos destes esforos so as sees Leitura Complementar e Na Internet. Elas trazem indicaes bibliogrficas precisas para um aprofundamento do assunto assim como apresentam sugestes de sites na Internet diretamente relacionados aos temas considerados. Ainda em funo da filosofia do livro, entendemos ser oportuno fazer algumas ressalvas sobre seu contedo. As tcnicas de processamento de imagens descritas neste livro trabalham fundamentalmente com imagens digitais, monocromticas e estticas, com raras excees (fundamentos de imagens coloridas, apresentados no captulo 4 e tcnicas de compresso de imagens coloridas e seqncias de vdeo, no captulo 6). Este livro no trata de anlise de imagens bi- ou tridimensionais nem detalha tcnicas ticas para processamento de imagens. As menes feitas a empresas e produtos de hardware e software so meramente ilustrativas e no tm qualquer carter comercial. Os produtos mencionados neste livro so marcas registradas de propriedade dos seus respectivos fabricantes.

  • xx

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    Finalmente, o livro no traz exemplos de cdigo-fonte para a implementao dos algoritmos descritos, mas contm inmeras referncias bibliogrficas e indicaes de endereos na Internet para o leitor interessado.

    A quem se destina Este livro naturalmente dedicado a estudantes de graduao e ps-graduao, professores e pesquisadores das reas de Engenharia, Informtica e correlatas, pelo contedo tcnico e abordagem didtica dos captulos. Neste caso, houve uma preocupao em adequar seu contedo ao programa recomendado pela Sociedade Brasileira de Computao (SBC), que em documento datado de 1996, intitulado "Currculo de Referncia da SBC para Cursos de Graduao Plena em Computao", menciona a disciplina "Processamento de Imagens", cujo ementrio completamente coberto pelo contedo desta obra. Serve tambm a profissionais de diversas reas, atrados pela inevitvel popularizao do uso de tcnicas e sistemas de processamento de imagens e pelo aspecto prtico do livro, ressaltado particularmente pelos roteiros de experimentos utilizando microcomputador e pelas indicaes de endereos na Internet. Comentrios, crticas, sugestes e colaboraes para o contnuo aprimoramento de nosso trabalho so bem-vindos e podem ser feitos por e-mail para: [email protected] ou

    [email protected].

    Og Marques Filho Hugo Vieira Neto

    Curitiba, Brasil, 1999.

  • MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    Captulo 1

    Introduo

    1.1 Processamento de Imagens: breve histrico e exemplos de aplicaes A rea de processamento de imagens vem sendo objeto de crescente interesse por permitir viabilizar grande nmero de aplicaes em duas categorias bem distintas: (1) o aprimoramento de informaes pictricas para interpretao humana; e (2) a anlise automtica por computador de informaes extradas de uma cena. Ao longo deste livro, reservaremos a expresso 'processamento de imagens' para designar a primeira categoria, adotando os termos 'anlise de imagens', 'viso por computador' (ou 'viso computacional') e 'reconhecimento de padres' para a segunda. Uma das primeiras aplicaes na primeira categoria remonta ao comeo deste sculo, onde buscavam-se formas de aprimorar a qualidade de impresso de imagens digitalizadas transmitidas atravs do sistema Bartlane de transmisso de imagens por cabo submarino entre Londres e Nova Iorque. Os primeiros sistemas Bartlane, no incio da dcada de 20, codificavam uma imagem em cinco nveis de intensidade distintos. Esta capacidade seria expandida, j em 1929, para 15 nveis, ao mesmo tempo em que era desenvolvido um mtodo aprimorado de revelao de filmes atravs de feixes de luz modulados por uma fita que continha informaes codificadas sobre a imagem. Mas o grande impulso para a rea de Processamento de Imagens viria cerca de trs dcadas mais tarde, com o advento dos primeiros computadores digitais de grande porte e o incio do programa espacial norte-americano. O uso de tcnicas computacionais de aprimoramento de imagens teve incio no Jet Propulsion Laboratory (Pasadena, California - EUA)1 em 1964, quando imagens da lua transmitidas por uma sonda Ranger2 eram processadas por computador para corrigir vrios tipos de distoro inerentes cmera de TV acoplada sonda. Estas tcnicas serviram de base para mtodos aprimorados de realce e restaurao de imagens de outros programas espaciais posteriores, como as expedies tripuladas da srie Apollo, por exemplo. De 1964 aos dias atuais, a rea de processamento de imagens vem apresentando crescimento expressivo e suas aplicaes permeiam quase todos os ramos da atividade humana. Em Medicina, o uso de imagens no diagnstico mdico tornou-se rotineiro e os avanos em processamento de imagens vm permitindo tanto o desenvolvimento de novos equipamentos quanto a maior facilidade de interpretao de imagens produzidas por equipamentos mais antigos, como por exemplo o de raio X. Em Biologia, a capacidade de processar automaticamente imagens obtidas de microscpios, por exemplo contando o nmero de clulas de um certo tipo presentes em uma imagem, facilita sobremaneira a execuo de tarefas laboratoriais com alto grau de preciso e repetibilidade. O processamento e a interpretao automtica de imagens captadas por satlites auxiliam os trabalhos nas reas de Geografia, Sensoriamento Remoto, Geoprocessamento e Meteorologia, dentre outras. Tcnicas de restaurao de imagens auxiliam arqueologistas a recuperar fotos borradas de artefatos raros, j destrudos. O uso de robs dotados de viso artificial em tarefas tais como controle de qualidade em linhas de produo aumenta a cada ano, num cenrio de crescente automao industrial. Inmeras outras reas to distintas como Astronomia, Segurana, Publicidade e Direito / para citar apenas algumas / vm sendo beneficiadas com os avanos nas reas de processamento de imagens e viso por computador.

    1 "http://www.jpl.nasa.gov"

    2 "http://www.jpl.nasa.gov/missions/ranger/"

  • 2 Introduo

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    Leitura complementar Mascarenhas [Mascarenhas 1990] apresenta um abrangente texto introdutrio aos assuntos abordados neste livro.

    1.2 Um sistema de processamento de imagens e seus componentes Os elementos de um sistema de processamento de imagens de uso genrico so mostrados na figura 1. Este diagrama permite representar desde sistemas de baixo custo at sofisticadas estaes de trabalho utilizadas em aplicaes que envolvem intenso uso de imagens. Ele abrange as principais operaes que se pode efetuar sobre uma imagem, a saber: aquisio, armazenamento, processamento e exibio. Alm disso, uma imagem pode ser transmitida distncia utilizando meios de comunicao disponveis. Todas estas operaes so descritas a seguir.

    Aquisio Processamento Sada

    Armazenamento

    Cmeras de Vdeo

    Scanners

    Computador

    Monitores de Vdeo

    Impressoras

    Plotters

    Discos pticos

    Discos Magnticos

    Fitas Magnticas

    Videotape

    Figura 1 - Elementos de um sistema de processamento de imagens.

    1.2.1 Aquisio A etapa de aquisio tem como funo converter uma imagem em uma representao numrica adequada para o processamento digital subseqente. Este bloco compreende dois elementos principais. O primeiro um dispositivo fsico sensvel a uma faixa de energia no espectro eletromagntico (como raio X, ultravioleta, espectro visvel ou raios infravermelhos), que produz na sada um sinal eltrico proporcional ao nvel de energia detetado. O segundo / o digitalizador propriamente dito / converte o sinal eltrico analgico em informao digital, isto , que pode ser representada atravs de bits 0s e 1s. Um mdulo de aquisio de imagens normalmente conhecido pelo nome de frame grabber. Os captulos 2 e 7 deste livro trazem mais detalhes sobre os aspectos envolvidos na aquisio de imagens digitais.

    1.2.2 Armazenamento O armazenamento de imagens digitais um dos maiores desafios no projeto de sistemas de processamento de imagens, em razo da grande quantidade de bytes necessrios para tanto. Este armazenamento pode ser dividido em trs categorias: (1) armazenamento de curta durao de uma imagem, enquanto ela utilizada nas vrias etapas do processamento, (2) armazenamento

  • Introduo 3

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    de massa para operaes de recuperao de imagens relativamente rpidas, e (3) arquivamento de imagens, para recuperao futura quando isto se fizer necessrio. O espao de armazenamento requerido normalmente especificado em bytes (8 bits) e seus mltiplos: KB (kilobyte 1000 bytes), MB (megabyte 1 milho de bytes), GB (gigabyte 1 bilho de bytes) e TB (terabyte 1 trilho de bytes). O captulo 7 discute aspectos de armazenamento de imagens em maior profundidade. Para o armazenamento de curta durao, a alternativa mais simples utilizar parte da memria RAM do computador principal. Outra opo consiste no uso de placas especializadas, chamadas frame buffers, que armazenam uma ou mais imagens completas e podem ser acessadas a uma alta velocidade, tipicamente 30 imagens completas por segundo. O uso de frame buffers permite tambm que operaes de zoom (ampliao ou reduo para fins de visualizao), scroll (rolagem na vertical) e pan (rolagem na horizontal) sejam executadas de forma praticamente instantnea. Placas frame buffers disponveis no mercado atualmente apresentam capacidade de armazenamento na faixa de alguns MB de memria. A segunda categoria de armazenamento normalmente requer o uso de discos magnticos de no mnimo algumas centenas de MB e recentemente passou a utilizar tambm discos magneto-pticos, por vezes agrupados em jukeboxes contendo de 30 a 100 discos. Nesta categoria o fator 'tempo de acesso' to ou mais importante que a capacidade (em bytes) do meio de armazenamento. Atravs de clculos simples (n de pixels na horizontal x n de pixels na vertical x n de bits necessrios para a escala de cinza / 8), pode-se estimar a quantidade de bytes necessrios para armazenar uma imagem monocromtica em disco. Este clculo entretanto considera uma imagem representada como uma matriz, cujos elementos so os valores de tons de cinza dos respectivos pixels.3 Na prtica, informaes adicionais (tamanho da imagem e nmero de cores ou tons de cinza, no mnimo) so necessrias. Estas informaes costumam ser colocadas em um cabealho (header) no incio do arquivo. Infelizmente, no existe um nico cabealho ou formato de armazenamento de imagens padronizados. Alguns dos formatos mais comuns so o BMP, PCX, TIFF, JPEG e GIF. Estes formatos de arquivos de imagem, alm de muitos outros, so apresentados no Apndice A. Finalmente, o arquivamento de imagens caracterizado por quantidades gigantescas de bytes contendo imagens cuja recuperao espordica. Nesta categoria, as fitas magnticas esto dando lugar aos discos pticos WORM (Write-Once-Read-Many), com capacidade que pode chegar a mais de 10 GB por disco, e que tambm podem ser agrupados em jukeboxes, com capacidade total de armazenamento superior a 1 TB.

    1.2.3 Processamento O processamento de imagens digitais envolve procedimentos normalmente expressos sob forma algortmica. Em funo disto, com exceo das etapas de aquisio e exibio, a maioria das funes de processamento de imagens pode ser implementada via software. O uso de hardware especializado para processamento de imagens somente ser necessrio em situaes nas quais certas limitaes do computador principal (por exemplo, velocidade de transferncia dos dados atravs do barramento) forem intolerveis. A tendncia atual do mercado de hardware para processamento de imagens a comercializao de placas genricas compatveis com os padres de barramento consagrados pelas arquiteturas mais populares de microcomputadores e estaes de trabalho. O software de controle destas placas que determinar sua aplicao especfica a cada situao. As vantagens mais imediatas so: reduo de custo, modularidade, reutilizao de componentes de software em outra aplicao rodando sobre o mesmo hardware e independncia de fornecedor. Convm notar, entretanto, que sistemas dedicados continuam sendo produzidos e comercializados para atender a tarefas especficas, tais como processamento de imagens transmitidas por satlites.

    3 Para imagens coloridas, a situao um pouco mais complexa. Normalmente estes nmeros sero

    ndices (endereos) de uma tabela de cores, denominada palheta ou palette. Para maiores detalhes, veja a seo 4.6 e o Resumo da Teoria da Prtica de Laboratrio n 1.

  • 4 Introduo

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    1.2.4 Transmisso Imagens digitalizadas podem ser transmitidas distncia utilizando redes de computadores e protocolos de comunicao j existentes. O grande desafio da transmisso de imagens distncia a grande quantidade de bytes que se necessita transferir de uma localidade a outra, muitas vezes atravs de canais de comunicao de baixa velocidade e banda passante estreita. Este problema ainda mais srio quando se deseja transmitir seqncias de vdeo (imagens em movimento com udio associado) em tempo real, onde outros fatores, como por exemplo sincronizao, devem ser considerados. Nestes casos, o uso de tcnicas de compresso e descompresso de imagens, como as descritas no captulo 6, mandatrio.

    1.2.5 Exibio O monitor de vdeo um elemento fundamental de um sistema de processamento de imagens. Os monitores em uso atualmente so capazes de exibir imagens com resoluo de pelo menos 640 x 480 pixels com 256 cores distintas. A tecnologia mais usual ainda o TRC (Tubo de Raios Catdicos). Um TRC para um sistema de processamento de imagens normalmente segue um padro de vdeo. O padro de vdeo mais comum para sistemas monocromticos o RS-170. Ele prev 480 linhas horizontais entrelaadas, isto , a varredura de um quadro feita em duas etapas, abrangendo primeiramente as linhas mpares e posteriormente as linhas pares. Cada uma destas etapas denominada campo. O tempo necessrio para percorrer um campo 1/60 s; conseqentemente, o tempo total de um quadro 1/30 s. As caractersticas de persistncia visual do olho humano fazem com que, nesta velocidade, a varredura individual de cada campo no seja perceptvel, bem como do a impresso de que a seqncia de quadros explorados perfeitamente contnua. O padro RS-170 especifica resoluo vertical de 480 pixels, sendo a resoluo horizontal determinada pelos circuitos eletrnicos do monitor e pelo tamanho dos pontos de fsforo na tela. Este nmero costuma ser 512, proporcionado imagens de 512 x 480 pixels. A resoluo espacial dos monitores normalmente especificada em pontos por polegada (dots per inch - dpi). Um valor tpico de resoluo 72 dpi, suficiente para exibir uma imagem de 1024 x 1024 pixels em um monitor de 19 polegadas ou uma imagem de 640 x 400 pontos em uma tela cuja diagonal mea 12 polegadas. A ttulo de comparao, uma tela de TV tem resoluo na faixa de 40 dpi. Um TRC colorido difere radicalmente de seu antecessor monocromtico, por apresentar trs feixes eletrnicos, cada um correspondente a uma das trs cores primrias (vermelho, verde e azul). A superfcie interna da tela constituda por trs tipos de fsforo, dispostos de forma triangular, cada qual sensvel a uma das cores primrias e excitado pelo respectivo canho eletrnico. Isto significa dizer que, do ponto de vista construtivo, cada pixel na verdade uma combinao de trs pequenos pixels, um para cada cor primria. A indstria de dispositivos de exibio vem apresentando sistematicamente novas tecnologias de fabricao de monitores de vdeo, dentre eles os monitores de cristal lquido (LCD), cada vez mais populares graas disseminao dos computadores portteis (notebooks). Existem diversas formas de reproduo de imagens em papel. A melhor, e mais cara, a reproduo fotogrfica, onde o nmero de gradaes de cinza funo da densidade dos grnulos de prata no papel. Outra possibilidade o uso de papel sensvel a temperatura, cuja composio qumica faz com que ele apresente colorao mais escura medida que a temperatura aumenta. Este tipo de impresso ainda o mais difundido em equipamentos de fax. Uma de suas desvantagens o desvanecimento das imagens com o tempo. Nos ltimos anos aumentou consideravelmente a oferta de impressoras trmicas coloridas no mercado. Estas impressoras baseiam-se na deposio de cera colorida sobre um papel especial para produzir a impresso. O captulo 7 apresenta maiores informaes sobre dispositivos de exibio e impresso de imagens. Dispositivos perifricos de sada especializados na produo de cpias da imagem em forma de fotografias, slides ou transparncias tambm esto se tornando cada vez mais usuais.

  • Introduo 5

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    Uma alternativa s tcnicas fotogrficas consiste no uso de tcnicas de halftoning. o mtodo usado por jornais e por impressoras convencionais (laser, matriciais ou a jato de tinta) para a impresso de imagens. Esta tcnica consiste basicamente em imprimir pontos escuros de diferentes tamanhos, espaados de tal maneira a reproduzir a iluso de tons de cinza. medida que a distncia entre o observador e a imagem impressa aumentam, os detalhes finos vo desaparecendo e a imagem parece cada vez mais uma imagem contnua monocromtica. No jargo computacional, d-se o nome de dithering ao processo de produo do efeito de halftoning, bem como a todas as tcnicas de converso de uma imagem para adapt-la a resolues menores, tanto para efeito de exibio como para impresso. Existem vrios algoritmos de dithering, sendo o mais comum o de Floyd-Steinberg, que consiste de um processo adaptativo no qual o padro de dither a ser atribudo a um pixel depende de seu tom de cinza e de seus vizinhos. Uma discusso mais detalhada destes algoritmos foge ao escopo deste livro.

    Leitura complementar O captulo 7 de [Lindley 1991] e o captulo 11 de [Rimmer 1993] trazem explicaes tericas e cdigo-fonte em C para impresso de imagens monocromticas e/ou coloridas utilizando dithering. O captulo 10 de [Dougherty 1994] uma excelente referncia para um estudo mais aprofundado dos conceitos e tcnicas de halftoning.

    1.3 O sistema visual humano A figura 2 mostra um corte horizontal do olho humano. O globo ocular tem formato aproximadamente esfrico e um dimetro de cerca de 20 mm. Ele envolvido por trs membranas: a camada externa formada pela crnea e pela esclertica, a coride e a retina, que a camada interna. A crnea uma pelcula transparente que cobre a parte anterior do olho. Dando continuidade crnea, a esclertica uma membrana opaca que reveste o globo ocular. A coride est situada abaixo da esclertica. Essa membrana contm uma rede de vasos sangneos que servem como a principal fonte de nutrio do olho. O revestimento da coride fortemente pigmentado, o que ajuda a reduzir a quantidade de luz que entra no olho. Ela dividida em corpo ciliar e diafragma da ris, sendo este ltimo responsvel por controlar a quantidade de luz que deve penetrar no olho. O dimetro da abertura central da ris (pupila) varia entre 2 mm e 8 mm. A parte frontal da ris contm o pigmento visvel do olho, enquanto sua poro posterior possui um pigmento negro. A membrana mais interna do olho a retina, situada na sua parede posterior. Quando o olho focaliza uma cena, a imagem correspondente projetada sobre a retina, na qual esto distribudos dois tipos de receptores de luz discretos: os cones e os bastonetes. Os cones so em nmero de 6 a 7 milhes em cada olho e esto localizados na poro central da retina, chamada de fvea. Eles so altamente sensveis a cor e cada qual est conectado a uma terminao nervosa dedicada. O nmero de bastonetes bastante maior, cerca de 75 a 150 milhes, distribudos em toda a superfcie da retina. Os bastonetes servem para dar uma viso geral da imagem captada no campo de viso. Eles no distinguem cores, mas so sensveis a baixos nveis de iluminao. A fvea uma reentrncia circular na retina com aproximadamente 1,5 mm de dimetro. De forma aproximada, podemos consider-la um sensor de rea quadrada de 1,5 mm por 1,5 mm. A densidade de cones nesta rea da retina de aproximadamente 150.000 elementos por mm2. Baseando-se nessas aproximaes, o nmero de cones na regio de maior acuidade do olho de aproximadamente 337.000 elementos. Para efeito comparativo, esta resoluo facilmente alcanada pela tecnologia atual, usando CCD de rea no superior a 7 mm x 7 mm.

  • 6 Introduo

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    Figura 2 - Vista em corte do olho humano (adaptado de Gonzalez, R.C., Woods, R.E., Digital Image Processing, Addison-Wesley, 1992).

    Dentre as caractersticas do sistema visual humano relevantes para o projeto de sistemas de viso artificial, podemos destacar a enorme faixa de valores de intensidade luminosa (da ordem de 1010) aos quais o olho pode se adaptar e a relao aproximadamente logartmica entre os nveis de intensidade luminosa presentes na cena e a sensao subjetiva de brilho, ilustrada na figura 3. Convm notar, entretanto, que o olho humano no pode operar sobre toda esta faixa simultaneamente. Ao invs disso, ele excursiona ao longo de toda esta faixa atravs de adaptaes em sua sensibilidade global, um fenmeno conhecido como adaptao de brilho. A faixa total de valores de intensidade que o olho pode discriminar simultaneamente comparativamente pequena em relao faixa total de adaptao. Para um certo conjunto de condies, o nvel de sensibilidade atual do sistema visual chamado nvel de adaptao de brilho, como por exemplo o valor Ba na figura 3. A pequena poro de curva que intercepta a curva principal representa a faixa de brilho subjetivo que o olho pode perceber quando adaptado a este nvel. Esta faixa bastante restrita, existindo um nvel de brilho Bb abaixo do qual todos os estmulos so indistinguveis. O trecho tracejado da curva no , na verdade, restrito, mas se estendido alm de um limite perde seu sentido, porque neste caso o olho humano buscaria outro nvel de adaptao maior que Ba.

  • Introduo 7

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    -6 -2-4 0 42Log da Intensidade (mL)

    Limiar Escotpico

    Limite de Claridade

    Escotpica

    Fotpica

    Ba

    Bb

    Brilh

    o Su

    bjetiv

    o

    Gam

    a de

    ad

    apta

    o

    Figura 3 - Curva que relaciona a sensao subjetiva de brilho com o logaritmo da intensidade luminosa incidente sobre o olho humano.

    A tabela 1 apresenta uma viso comparativa entre o sistema visual humano e um sistema de viso artificial.

    Leitura complementar Para maiores informaes sobre aspectos do processo de percepo visual humana e suas implicaes no projeto de sistemas de viso artificial, uma referncia obrigatria [Marr 1982]. A seo 2.1 de [Gonzalez e Woods 1992] apresenta interessantes fenmenos de percepo visual tais como contraste simultneo, discriminao de brilho usando a razo de Weber e o padro de faixas de Mach.

    1.4 Sistemas de Viso Artificial: fundamentos e desafios Nas primeiras pginas de seu livro Digital Image Processing and Computer Vision, Robert J. Schalkoff [Schalkoff 1989] formula uma sugestiva pergunta quando questiona: "O que estamos tentando fazer e por que isto to difcil?" Uma resposta simplista primeira parte da pergunta acima : "Estamos tentando ensinar robs a enxergar." Ao relacionarmos as dificuldades inerentes ao processo de dotar o computador de uma capacidade visual semelhante dos seres humanos, deparamo-nos com trs admirveis caractersticas do processo de percepo visual humano, que so:

    uma base de dados muito rica; altssima velocidade de processamento; e a capacidade de trabalhar sob condies muito variadas.

    Os avanos na tecnologia de dispositivos de armazenamento de massa e o surgimento de novas CPUs e arquiteturas computacionais cada vez mais rpidas, com alto grau de paralelismo, nos induzem a crer que dispomos de condies cada vez melhores de modelar as duas primeiras caractersticas relacionadas acima. O grande desafio permanece sendo o de fazer com que os sistemas de viso artificial trabalhem em diferentes condies de luminosidade, contraste,

  • 8 Introduo

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    posicionamento relativo dos objetos em uma cena sem perder a capacidade de interpretar a cena, de forma anloga a nossa capacidade de reconhecer um amigo ou parente com relativa facilidade, independentemente de ele estar usando culos ou no, ter deixado crescer a barba ou estar no carro ao lado do nosso em uma esquina num final de tarde, onde no dispomos de outra imagem seno a vista de perfil e onde as condies de luminosidade so bastante inferiores s que obteramos ao meio-dia.

    Tabela 1 - Comparao entre o sistema visual humano e um sistema de viso artificial. Sistema visual humano Sistema de viso ar tificial Espectro Limitado faixa de luz visvel

    (300 nm a 700 nm) do espectro de ondas eletromagnticas.

    Pode operar em praticamente todo o espectro de radiaes eletromagnticas, dos raios X ao infravermelho.

    Flexibilidade Extremamente flexvel, capaz de se adaptar a diferentes tarefas e condies de trabalho.

    Normalmente inflexvel, apresenta bom desempenho somente na tarefa para a qual foi projetado.

    Habilidade Pode estabelecer estimativas relativamente precisas em assuntos subjetivos.

    Pode efetuar medies exatas, baseadas em contagem de pixels e, portanto, dependentes da resoluo da imagem digitalizada.

    Cor Possui capacidade de interpretao subjetiva de cores.

    Mede objetivamente os valores das componentes R, G e B para determinao de cor.

    Sensibilidade Capaz de se adaptar a diferentes condies de luminosidade, caractersticas fsicas da superfcie do objeto e distncia ao objeto. Limitado na distino de muitos nveis diferentes de cinza, simultaneamente.

    Sensvel ao nvel e padro de iluminao, bem como distncia em relao ao objeto e suas caractersticas fsicas. Pode trabalhar com centenas de tons de cinza, conforme projeto do digitalizador.

    Tempo de resposta Elevado, da ordem de 0,1 s. Dependente de aspectos de hardware, podendo ser to baixo quanto 0,001 s.

    2-D e 3-D Pode executar tarefas 3-D e com mltiplos comprimentos de onda (dentro do espectro de luz visvel) facilmente.

    Executa tarefas 2-D com relativa facilidade, mas lento e limitado em tarefas 3-D.

    Percepo Percebe variaes de brilho em escala logartmica. A interpretao subjetiva de brilho depende da rea ao redor do objeto considerado.

    Pode perceber brilho em escala linear ou logartmica.

  • Introduo 9

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    1.4.1 Estrutura de um Sistema de Viso Artificial Definiremos um Sistema de Viso Artificial (SVA) como um sistema computadorizado capaz de adquirir, processar e interpretar imagens correspondentes a cenas reais. A figura 4 mostra esquematicamente um diagrama de blocos de um SVA. Suas principais etapas so explicadas a seguir, partindo da premissa de que um problema prtico, por exemplo a leitura do Cdigo de Endereamento Postal (CEP) de um lote de envelopes, deve ser solucionado.

    Aquisio

    Pr-processamento

    Segmentao

    Extrao deCaractersticas

    Reconhecimentoe Interpretao

    Base deConhecimento

    Problema

    Resultado

    Figura 4 - Um Sistema de Viso Artificial (SVA) e suas principais etapas.

    1.4.2 Domnio do problema e resultado O domnio do problema, neste caso, consiste no lote de envelopes e o objetivo do SVA ler o CEP presente em cada um deles. Logo, o resultado esperado uma seqncia de dgitos correspondentes ao CEP lido.

    1.4.3 Aquisio da imagem O primeiro passo no processo a aquisio de imagens dos envelopes. Para tanto so necessrios um sensor e um digitalizador. O sensor converter a informao ptica em sinal eltrico e o digitalizador transformar a imagem analgica em imagem digital. Dentre os aspectos de projeto envolvidos nesta etapa, pode-se mencionar: a escolha do tipo de sensor, o conjunto de lentes a utilizar, as condies de iluminao da cena, os requisitos de velocidade de aquisio (assumindo que os envelopes passariam pela frente da cmera a uma certa velocidade), a resoluo e o nmero de nveis de cinza da imagem digitalizada, dentre outros. Esta etapa produz sada uma imagem digitalizada do envelope.

    1.4.4 Pr-processamento A imagem resultante do passo anterior pode apresentar diversas imperfeies, tais como: presena de pixels ruidosos, contraste e/ou brilho inadequado, caracteres (especialmente os dgitos do CEP) interrompidos ou indevidamente conectados etc. A funo da etapa de pr-

  • 10 Introduo

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    processamento aprimorar a qualidade da imagem para as etapas subseqentes. As operaes efetuadas nesta etapa so ditas de baixo nvel porque trabalham diretamente com os valores de intensidade dos pixels, sem nenhum conhecimento sobre quais deles pertencem aos dgitos do CEP, a outras informaes impressas no envelope ou ao fundo. A imagem resultante desta etapa uma imagem digitalizada de melhor qualidade que a original.

    1.4.5 Segmentao A tarefa bsica da etapa de segmentao a de dividir uma imagem em suas unidades significativas, ou seja, nos objetos de interesse que a compem. Esta tarefa, apesar de simples de descrever, das mais difceis de implementar. No caso especfico do problema do CEP, possvel que o problema seja dividido em duas etapas: em um primeiro momento os algoritmos de segmentao tentaro localizar o CEP do restante das informaes para posteriormente, trabalhando sobre esta subimagem, segmentar cada dgito individualmente. Segundo esta linha de raciocnio, este bloco produzir sada oito subimagens, cada qual correspondendo a um dgito do CEP.

    1.4.6 Extrao de Caractersticas Esta etapa procura extrair caractersticas das imagens resultantes da segmentao atravs de descritores que permitam caracterizar com preciso cada dgito e que apresentem bom poder de discriminao entre dgitos parecidos, como o '5' e o '6'. Estes descritores devem ser representados por uma estrutura de dados adequada ao algoritmo de reconhecimento. importante observar que nesta etapa a entrada ainda uma imagem, mas a sada um conjunto de dados correspondentes quela imagem. Para maior clareza, suponhamos que os descritores utilizados para descrever um caractere sejam as coordenadas normalizadas x e y de seu centro de gravidade e a razo entre sua altura e largura. Neste caso, um vetor de trs elementos uma estrutura de dados adequada para armazenar estas informaes sobre cada dgito processado por esta etapa.

    1.4.7 Reconhecimento e Interpretao Nesta ltima etapa do sistema, denominamos reconhecimento o processo de atribuio de um rtulo a um objeto baseado em suas caractersticas, traduzidas por seus descritores. A tarefa de interpretao, por outro lado, consiste em atribuir significado a um conjunto de objetos reconhecidos. Neste exemplo, uma forma simples de interpretao seria a verificao do CEP em uma base de dados de CEPs vlidos, para descobrir se o conjunto dos oito caracteres (cada qual reconhecido individualmente) faz sentido ou no.

    1.4.8 Base de Conhecimento Todas as tarefas das etapas descritas acima pressupem a existncia de um conhecimento sobre o problema a ser resolvido, armazenado em uma base de conhecimento, cujo tamanho e complexidade podem variar enormemente. Idealmente, esta base de conhecimento deveria no somente guiar o funcionamento de cada etapa, mas tambm permitir a realimentao entre elas. Por exemplo, se a etapa de representao e descrio recebesse 7 caracteres ao invs de 8, ela deveria ser capaz de realimentar a etapa de segmentao (provvel responsvel pela falha) para que esta procurasse segmentar novamente a subimagem 'suspeita' (aquela de maior largura), buscando dividi-la em duas. Esta integrao entre as vrias etapas atravs da base de conhecimento ainda um objetivo difcil de alcanar e no est presente na maioria dos SVAs existentes atualmente. Finalmente, cumpre observar que nem todos os SVAs possuem todos estes blocos e que a maioria das tcnicas descritas neste livro esto delimitadas at o bloco 'pr-processamento'.

    1.5 Estrutura e escopo do livro Este livro est estruturado em sete captulos, sendo os dois primeiros dedicados apresentao de conceitos fundamentais que serviro de base para a compreenso dos captulos seguintes. O captulo 2 apresenta os principais aspectos das imagens digitais, caracterizando-as sob o ponto

  • Introduo 11

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    de vista matemtico, apresentando suas principais propriedades e ilustrando as principais operaes lgicas, aritmticas e transformaes geomtricas que se pode efetuar sobre elas. O captulo 3 define histograma de uma imagem e apresenta diversas tcnicas de modificao de histograma. Os captulos 4, 5 e 6 tratam das tcnicas de pr-processamento aplicadas a uma imagem. O captulo 4 abrange as principais tcnicas de filtragem de imagens no domnio espacial ou freqencial, tanto com o objetivo de real-las como de remover rudo eventualmente presente sobre elas. Tambm so apresentados conceitos de processamento de imagens coloridas e de filtragem adaptativa. J o captulo 5 inteiramente dedicado a tcnicas de processamento e anlise de imagens baseadas em morfologia matemtica. Por sua vez, o captulo 6 trata de um tema importante e atual que a compresso de imagens, desde os fundamentos conceituais at os padres mais utilizados atualmente. O captulo 7 serve como referncia prtica para o leitor interessado em implementar seu prprio sistema de processamento de imagens, abrangendo informaes conceituais e prticas sobre o hardware e software disponvel para tanto. O livro contm ainda dois apndices. O apndice A apresenta uma viso resumida, porm abrangente, dos principais formatos de arquivos de imagens disponveis atualmente. O apndice B traz um conjunto de roteiros de prticas de laboratrio utilizando a toolbox de Processamento de Imagens do software MATLAB. Estas prticas so referenciadas nos captulos correspondentes ao longo do livro.

    Exerccios Propostos 1. Seja o diagrama da figura 4, destacando as principais etapas de um sistema de viso artificial. Supondo que se deseje utilizar os conceitos de anlise de imagens para reconhecer placas de veculos entrada e/ou sada de um estacionamento automatizado, comente quais as tarefas que cada bloco desempenhar na soluo do problema, indicando os principais aspectos prticos envolvidos e seu impacto no projeto do sistema completo.

    2. Em nosso estudo de viso por computador, vimos que as dificuldades em simular o sistema visual humano residem em trs frentes: Base de dados muito extensa Velocidade de processamento muito alta Condies de trabalho muito variadas Explique cada uma delas e comente o grau de dificuldade relativa de cada uma, bem como a relao entre os progressos tecnolgicos em software e hardware e seu impacto na minimizao destas dificuldades.

    3. Qual a diferena entre os termos 'processamento de imagens' e 'reconhecimento de padres' ?

    Na Internet4 Para maiores informaes sobre alguns dos tpicos deste captulo, sugerimos as pginas a seguir: "http://www.jpl.nasa.gov" NASA Jet Propulsion Laboratory Home page do Jet Propulsion Lab da NASA.

    4 Convm lembrar que a referncia a informaes disponveis na Internet est sujeita a problemas

    decorrentes da natureza extremamente dinmica da rede. possvel que alguns links indicados neste livro sejam removidos de seus servidores, transferidos para outros servidores ou estejam temporariamente fora do ar.

  • 12 Introduo

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    "http://www.jpl.nasa.gov/missions/ranger/" Ranger : Mission to the Moon Apresenta detalhes tcnicos e histricos das misses Ranger.

    Para aprofundar ou complementar outros assuntos tratados neste livro, existem inmeras pginas teis e interessantes relacionadas s reas de processamento de imagens e viso por computador na World Wide Web. Relacionamos a seguir algumas delas, classificando-as em seis grupos, a saber: Top 10: dez pginas selecionadas pelos autores por apresentarem grande quantidade de

    informao e inmeros links a outros sites de interesse. Grupos de pesquisa: pginas com links para grupos de pesquisa em viso computacional e

    processamento de imagens no Brasil e no exterior.5 Publicaes: neste grupo esto includas informaes tcnicas sobre processamento de

    imagens e tpicos correlatos, incluindo pginas relativas a peridicos cientficos (journals), sites de revistas tcnicas, pginas de perguntas mais freqentes (FAQs), cursos interativos disponveis na WWW, (trechos de) livros disponveis on-line, notas de aula de professores da rea, resenhas de livros etc.

    Eventos: contm links para as pginas dos principais simpsios e conferncias mundiais na rea.

    Imagens: sites contendo imagens para teste e ilustrao de resultados de algoritmos.

    Top 10 "http://www.cs.cmu.edu/~cil/vision.html" Computer Vision Home Page Excelente ponto de partida para pesquisas na WWW. Desdobra-se em vrias pginas especficas, cada qual contendo inmeros links de interesse.

    "http://www.ph.tn.tudelft.nl/PRInfo.html" Pattern Recognition Information Pgina de referncia para assuntos relacionados ao reconhecimento de padres e temas correlatos.

    "http://www.lpac.ac.uk/SEL-HPC/Articles/VisionArchive.html" SEL-HPC Vision and Image Processing Archive Repositrio de artigos tcnicos na rea de processamento de imagens. Pode ser atualizado dinamicamente.

    "http://iris.usc.edu/Vision-Notes/bibliography/contents.html" USC Annotated Computer Vision Bibliography Extensa e bem estruturada compilao de quase tudo o que j foi publicado na rea. Um bookmark obrigatrio.

    "http://ecvnet.lira.dist.unige.it" ECVNet Relata atividades de um consrcio europeu na rea de viso computacional e contm diversos links teis.

    5 Se o leitor for pesquisador da rea, procure verificar se seu grupo de pesquisa est cadastrado nestes

    sites.

  • Introduo 13

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    "http://viswiz.gmd.de/MultimediaInfo" Multimedia Info & Resources Excelente site para pesquisa de tpicos ligados a sistemas multimdia, processamento de sons, imagens e vdeo e temas correlatos.

    "http://reality.sgi.com/employees/rchiang_esd/TI-ImageProc.html" Technical Information - Image Processing Outra tima pgina repleta de links classificados de forma razoavelmente estruturada.

    "http://peipa.essex.ac.uk/" The Pilot European Image Processing Archive: Home Page Repositrio de arquivos de interesse nas reas de processamento de imagens e viso por computador, mantido pela University of Essex (Inglaterra).

    "http://www.vision1.com/" The Vision and Imaging Technology Resource! Guia tcnico-comercial de produtos, servios e recursos para desenvolvedores de solues em viso computacional. Possui uma extensa biblioteca de links.

    "http://vision.arc.nasa.gov/VisionScience/VisionScience.html" Vision Science: The Wor ld-Wide Web Vir tual Library Guia de referncia para pesquisa de temas relacionados a viso biolgica (principalmente) e computacional na Web.

    Grupos de pesquisa "http://www.cs.cmu.edu/~cil/v-groups.html" Computer Vision: Research Groups Pgina com links para os principais grupos de pesquisa em processamento de imagens e viso por computador em todo o mundo.

    "http://www.cs.cmu.edu/~cil/txtv-groups.html" Computer Vision: Research Groups (text only) Verso texto da pgina indicada acima, adequada para reduzir o tempo de carga da pgina de abertura na tela.

    "http://www.ph.tn.tudelft.nl/PRInfo/groups.html" Pattern Recognition Research Groups Lista de grupos de pesquisa ativos na rea, classificados por continente.

    Publicaes "http://www.lpac.ac.uk/SEL-HPC/Articles/VisionArchive.html" SEL-HPC Vision and Image Processing Archive Repositrio de artigos tcnicos na rea de processamento de imagens. Pode ser atualizado dinamicamente. Selecionado pelos autores deste livro como um dos dez sites mais relevantes na rea.

    "http://www.nr.com/" Numer ical Recipes in C

  • 14 Introduo

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    Referncia obrigatria para programadores na rea cientfica, este livro est agora disponvel on-line. A verso PostScript de cada captulo pode ser obtida gratuitamente no endereo acima.

    "http://www.cs.hmc.edu/~fleck/computer-vision-handbook/index.html" The Computer Vision Handbook Ainda em construo, prope-se a ser um grande livro-texto on-line sobre o assunto, com muitos links e referncias bibliogrficas.

    "http://www.khoral.com/dipcourse/dip17sep97/" Digital Image Processing (DIP) with Khoros 2 Pioneira e feliz iniciativa do Prof. Roberto de Alencar Lotufo da Unicamp, em parceria com o Prof. Ramiro Jordn da University of New Mexico (EUA), um curso interativo completo de processamento de imagens na rede. Parte do curso exige a plataforma Khoros.

    "http://www.cogs.susx.ac.uk/users/davidy/teachvision/vision0.html" Sussex Computer Vision: Introduction to the HTML teach files Curso on-line de viso por computador com exemplos de programas em POP-11 [Barrett et al. 1985].

    "http://www.ime.usp.br/mac/khoros/mmach.old/tutor/mmach.html" A Tutor ial on Mathematical Morphology Curso interativo de Morfologia Matemtica desenvolvido pela Universidade de So Paulo sobre a plataforma Khoros 2.0. Possui opo para aqueles que desejarem uma viso geral do assunto de forma rpida e independente de hardware ou software.

    "http://www.cs.washington.edu/research/metip/metip.html" Mathematics Exper iences Through Image Processing (METIP) Home-page de inovador projeto desenvolvido pela University of Washington que se prope a utilizar operaes de processamento de imagens para motivar e facilitar o ensino de matemtica. Permite o download gratuito dos ttulos de software j desenvolvidos no mbito do projeto.

    "http://www.cm.cf.ac.uk/Dave/Vision_index.html" MSc AI (and Engineer ing Application) Vision Systems Course Documentation Curso abrangendo tpicos clssicos em formato eletrnico, porm pouco interativo e com pequeno nmero de imagens.

    "http://www.inforamp.net/~poynton/Poynton-T-I-Digital-Video.html" A Technical Introduction to Digital Video Contm o ndice do livro homnimo, bem como verses on-line dos captulos 1 e 6.

    "http://www.eecs.wsu.edu/IPdb/title.html" Digital Image Processing Home Page Curso de processamento de imagens em formato de hipertexto, ainda em construo, apresentando a teoria bsica, exemplos de imagens e trechos de cdigo-fonte em C.

    Eventos "http://iris.usc.edu/Information/Iris-Conferences.html" Computer Vision Conference Listing from USC Contm bem diagramada agenda de eventos e links para as pginas relacionadas a cada evento.

  • Introduo 15

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    "http://www.cs.cmu.edu/~cil/v-conf.html" Computer Vision: Conferences and Symposia Lista de conferncias e eventos na rea, com links para as pginas de cada evento e para outras listas de eventos.

    "http://www.ph.tn.tudelft.nl/PRInfo/conferences.html" Pattern Recognition Related Conferences Outra lista de conferncias e eventos na rea, com links para as pginas de cada evento.

    "http://afrodite.lira.dist.unige.it/confs/confs.html" Conferences Main Menu Pgina de links para conferncias e eventos, mantida pela ECVNet.

    Imagens "http://www.ics.forth.gr/ecvnet/imageDB/index.html" ECVNet Image DataBases Page Pgina contendo links para diversos repositrios de imagens na Internet.

    "http://www.cs.cmu.edu/~cil/v-images.html" Computer Vision: Test Images Outra pgina contendo diversos links para diversos repositrios de imagens na Internet.

    Bibliografia

    [Barrett et al. 1985] Barrett, R. et allii, POP-11: a practical language for artificial intelligence. Ellis Horwood Ltd., 1985.

    [Dougherty 1994] Dougherty, E.R. (ed.), Digital Image Processing Methods, Marcel Dekker, 1994.

    [Gonzalez e Woods 1992] Gonzalez, R.C. e Woods, R.E., Digital Image Processing - Third Edition, Addison-Wesley, 1992.

    [Lindley 1991] Lindley, C.A., Practical Image Processing in C, Wiley, 1991.

    [Marr 1982] Marr, D., Vision: A Computational Investigation into the Human Representation and Processing of Visual Information, W. H. Freeman and Co., 1982.

    [Mascarenhas 1990] Mascarenhas, N.D., "Introduo ao Processamento Digital de Imagens", Anais da I Jornada EPUSP/IEEE de Computao Visual, 1990, 387-420.

    [Rimmer 1993] Rimmer, S., Bit-Mapped Graphics, Windcrest Books, 1993.

    [Schalkoff 1989] Schalkoff, R.J., Digital Image Processing and Computer Vision, Wiley, 1989.

  • 16 Introduo

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    Bibliografia Recomendada Cada captulo deste livro contm ao seu final indicaes bibliogrficas referentes ao assunto abordado. Para uma viso mais abrangente das principais fontes de consulta na rea, relacionamos a seguir alguns dos mais renomados livros e peridicos disponveis atualmente. Alguns dos principais peridicos cientficos (journals) ligados s reas de processamento de imagens e viso por computador so (em ordem alfabtica): Computer Vision, Graphics and Image Processing Graphical Models and Image Processing IEEE Computer Graphics and Applications IEEE Expert-Intelligent Systems and their Applications IEEE Multimedia IEEE Transactions on Image Processing IEEE Transactions on Information Theory IEEE Transactions on Medical Imaging IEEE Transactions on Multimedia IEEE Transactions on Pattern Analysis and Machine Intelligence IEEE Transactions on Signal Processing IEEE Transactions on Systems, Man and Cybernetics Image and Vision Computing Image Understanding, International Journal of Computer Vision Journal of Mathematical Imaging and Vision Machine Vision and Applications Pattern Recognition Proceedings of the IEEE. Real-Time Imaging Dentre os livros-texto consagrados na rea, citamos e recomendamos (por ordem alfabtica de autor): Castleman, K.R., Digital Image Processing, Prentice-Hall, 1995. Dougherty, E.R. e Giardina, C.R., Matrix Structured Image Processing, Prentice-Hall, 1987. Gonzalez, R.C. e Woods, R.E., Digital Image Processing, Addison-Wesley, 1992. Jain, A.K., Fundamentals of Digital Image Processing, Prentice-Hall, 1989. Jain, R.C., Kasturi, R., e Schunck, B.G., Machine Vision, McGraw-Hill, 1995. Lim, J.S., Two-dimensional Signal and Image Processing, Prentice-Hall, 1990. Lindley, C.A., Practical Image Processing in C, Wiley, 1991. Marr, D., Vision: A Computational Investigation into the Human Representation and

    Processing of Visual Information, W. H. Freeman and Co., 1982. Myler, H.R. e Weeks, A.R., Computer Imaging Recipes in C, Prentice Hall, 1993. Pavlidis, T., Algorithms for Graphics and Image Processing, Computer Science Press, 1982. Pratt, W. K., Digital Image Processing, Wiley Interscience, 1991. Russ, J. C., The Image Processing Handbook, CRC Press, 1995. Schalkoff, R.J., Digital Image Processing and Computer Vision, Wiley, 1989. Sonka, M., Hlavac, V. e Boyle, R., Image Processing, Analysis and Machine Vision,

    Chapman & Hall, 1993.

  • Introduo 17

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

  • MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    Captulo 2

    Fundamentos de Imagens Digitais

    Este captulo tem por objetivo apresentar as principais caractersticas das imagens digitais. A primeira seo caracteriza uma imagem do ponto de vista matemtico e descreve o processo de aquisio de imagens e sua converso para o formato digital. A seo 2.2 descreve as principais propriedades de uma imagem digital, padronizando a terminologia a ser utilizada no restante do livro. As principais operaes lgicas e aritmticas sobre imagens so exemplificadas na seo 2.3. A seo 2.4 introduz o importante conceito de convoluo com mscaras e fornece exemplos de mscaras teis para enfatizar e/ou detetar propriedades de uma imagem. Finalmente, a seo 2.5 trata das transformaes geomtricas que podem ser aplicadas a imagens, fundamentando-as matematicamente e ilustrando-as com exemplos.

    2.1 Aquisio e digitalizao de imagens Uma imagem monocromtica pode ser descrita matematicamente por uma funo f(x,y) da intensidade luminosa, sendo seu valor, em qualquer ponto de coordenadas espaciais (x,y), proporcional ao brilho (ou nvel de cinza) da imagem naquele ponto. A figura 1 mostra uma imagem monocromtica e a conveno utilizada neste livro para o par de eixos (x,y)1.

    Y

    X

    (0,0)

    Figura 1 - Uma imagem monocromtica e a conveno utilizada para o par de eixos (x,y).

    A funo f(x,y) representa o produto da interao entre a iluminncia i(x,y) / que exprime a quantidade de luz que incide sobre o objeto / e as propriedades de refletncia ou de transmitncia prprias do objeto, que podem ser representadas pela funo r(x,y), cujo valor

    1 Como o leitor deve ter notado, a posio e a direo dos eixos x e y so diferentes das utilizadas na

    Geometria Analtica. Em Processamento de Imagens, a notao (x,y) pode ser entendida como (linha, coluna). Convm observar que esta notao no est padronizada na literatura tcnica da rea.

  • 20 Fundamentos de Imagens Digitais

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    exprime a frao de luz incidente que o objeto vai transmitir ou refletir ao ponto (x,y). Estes conceitos esto ilustrados na figura 2. Matematicamente:

    f ( x, y ) = i ( x, y ) . r ( x, y ) (2.1)

    com:

    0 < i ( x, y ) < e 0 < r (x,y) < 1

    RI

    Figura 2 - Os componentes iluminncia (I) e refletncia (R) de uma imagem.

    As tabelas 1 e 2 apresentam valores tpicos de iluminncia e refletncia.

    Tabela 1 - Exemplos de valores para i(x,y) [em lux ou lmen/m2] i(x,y) 900 dia ensolarado 100 dia nublado 10 iluminao mdia de escritrio 0,001 noite clara de lua cheia

    Tabela 2 - Exemplos de valores para r(x,y) r(x,y) 0,93 neve 0,80 parede branco-fosca 0,65 ao inoxidvel 0,01 veludo preto

    Ao longo deste livro, a intensidade de uma imagem monocromtica f nas coordenadas (x,y) ser denominada nvel de cinza (ou tom de cinza) (L) da imagem naquele ponto. Este valor estar no intervalo:

    L L Lmin max~ ~ sendo Lmin e Lmax valores positivos e finitos. O intervalo [Lmin, Lmax] denominado escala de cinza da imagem. comum deslocar este intervalo numericamente para o intervalo dos inteiros [0, W), onde L = 0 significa pixel preto e L = W-1 representa pixel branco. Normalmente, W uma potncia inteira positiva de 2.

  • Fundamentos de Imagens Digitais 21

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    No caso de uma imagem que possui informaes em intervalos ou bandas distintas de freqncia, necessrio uma funo f(x,y) para cada banda. o caso de imagens coloridas padro RGB, que so formadas pela informao de cores primrias aditivas, como o vermelho (R - Red), verde (G - Green) e azul (B - Blue). A seo 4.6 apresenta informaes adicionais sobre imagens coloridas. As tcnicas de processamento de imagens descritas neste livro trabalham fundamentalmente com imagens monocromticas, bidimensionais e estticas. Para que uma imagem seja processada por alguma destas tcnicas, fundamental representar sua informao num formato adequado ao tratamento computacional, por exemplo, uma matriz de nmeros inteiros no-negativos, cujos valores referenciam o brilho mdio amostrado no ponto correspondente da cena. Para converter uma cena real em uma imagem digitalizada, duas etapas so imprescindveis: a aquisio da imagem e sua digitalizao.

    2.1.1 Aquisio Chamaremos de aquisio de uma imagem o processo de converso de uma cena real tridimensional em uma imagem analgica, ou seja, delimitaremos esta etapa ao processo de transduo optoeletrnica. O primeiro passo na converso de uma cena real tridimensional em uma imagem eletrnica a reduo de dimensionalidade. Assumiremos que uma cmera fotogrfica, cmera de vdeo ou outro dispositivo converter a cena 3-D em uma representao 2-D adequada, sem nos preocuparmos com as questes envolvidas nesta etapa. O dispositivo de aquisio de imagens mais utilizado atualmente a cmera CCD (Charge Coupled Device). Ela consiste de uma matriz de clulas semicondutoras fotossensveis, que atuam como capacitores, armazenando carga eltrica proporcional energia luminosa incidente. O sinal eltrico produzido condicionado por circuitos eletrnicos especializados, produzindo sada um Sinal Composto de Vdeo (SCV) analgico e monocromtico. Para a aquisio de imagens coloridas utilizando CCDs necessrio um conjunto de prismas e filtros de cor encarregados de decompor a imagem colorida em suas componentes R, G e B, cada qual capturada por um CCD independente. Os sinais eltricos correspondentes a cada componente so combinados posteriormente conforme o padro de cor utilizado (NTSC (National Television Standards Committee) ou PAL (Phase Alternating Line), por exemplo). Uma cmera CCD monocromtica simples consiste basicamente de um conjunto de lentes que focalizaro a imagem sobre a rea fotossensvel do CCD, o sensor CCD e seus circuitos complementares. A figura 3 mostra uma viso simplificada da aquisio de imagens com cmera CCD. O captulo 7 traz maiores detalhes sobre sensores de imagem.

    Corpo da CmeraObjeto

    Imagem

    CCD

    Lente

    Figura 3 - Viso esquemtica de uma cmera CCD.

  • 22 Fundamentos de Imagens Digitais

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    2.1.2 Digitalizao O sinal analgico de vdeo obtido sada do dispositivo de aquisio deve ser submetido a uma discretizao espacial e em amplitude para tomar o formato desejvel ao processamento computacional. Chamaremos de amostragem o processo de discretizao espacial e daremos o nome de quantizao ao processo de discretizao em amplitude. Basicamente, a amostragem converte a imagem analgica em uma matriz de M por N pontos, cada qual denominado pixel (ou elemento de imagem):

    f x y

    f f f Nf f f N

    f M f M f M N

    ( , )

    ( , ) ( , ) ... ( , )( , ) ( , ) ... ( , )

    ( , ) ( , ) ... ( , )

    ?//

    / / / /

    0 0 0 1 0 11 0 11 1 1

    1 0 11 1 16 6 6 6 (2.2)

    Maiores valores de M e N implicam em uma imagem de maior resoluo. Por seu lado, a quantizao faz com que cada um destes pixels assuma um valor inteiro, na faixa de 0 a 2n-1. Quanto maior o valor de n, maior o nmero de nveis de cinza presentes na imagem digitalizada. Do ponto de vista eletrnico, a digitalizao consiste em uma converso analgico-digital na qual o nmero de amostras do sinal contnuo por unidade de tempo indica a taxa de amostragem e o nmero de bits do conversor A/D utilizado determina o nmero de tons de cinza resultantes na imagem digitalizada. Sob uma abordagem matemtica formal, o processo de amostragem pode ser visto como uma diviso do plano xy em uma grade, com as coordenadas do centro de cada grade sendo uma dupla de elementos do produto cartesiano ZxZ (tambm escrito Z), o qual o conjunto de todos os pares ordenados dos elementos (a, b) com a e b sendo nmeros pertencentes a Z (conjunto dos inteiros). Portanto f(x,y) uma imagem digital se (x,y) forem nmeros inteiros de ZxZ e f uma funo que atribui um valor de nvel de cinza (isto , um nmero real do conjunto de nmeros reais R) para cada par distinto de coordenadas, ou seja, f o processo de quantizao descrito anteriormente. Se os nveis de cinza resultantes forem tambm nmeros inteiros (como geralmente o caso), Z substitui R e uma imagem digital ento se torna uma funo bidimensional cujas coordenadas e valores de amplitude so nmeros inteiros. Na especificao do processo de digitalizao deve-se decidir que valores de N, M e n so adequados, do ponto de vista de qualidade da imagem e da quantidade de bytes necessrios para armazen-la. A tabela 3 fornece uma idia estimativa do nmero de bytes necessrios para armazenar uma imagem de N x N pixels com 2n tons de cinza, calculados como: N x N x n / 8. Assume-se que um pixel estar inteiramente contido em um byte, mesmo que isto signifique que alguns bits de cada byte permaneam vazios. Por exemplo, para n = 5, assume-se que cada pixel ocupa um byte, restando 3 bits sem utilizao em cada byte. Do ponto de vista qualitativo, poder-se-ia perguntar: quantos pontos e nveis de cinza sero necessrios para que a verso digitalizada de uma imagem apresente qualidade comparvel imagem original? Parece evidente que quanto maiores os valores de M, N e n, melhor a imagem digital resultante. Mas sabendo que elevados valores de M, N e n implicaro em maiores custos de digitalizao e armazenamento, deve existir uma forma de definir valores adequados qualidade desejada. Convm observar ainda que 'qualidade de imagem' um conceito altamente subjetivo, que tambm depende fortemente dos requisitos da aplicao dada. Para que o leitor possa tirar suas prprias concluses sobre a dependncia entre qualidade subjetiva e resoluo espacial, a figura 4(a) mostra uma imagem de 256 x 256 pixels, com 256 nveis de cinza. Mantendo constante o nmero de tons de cinza, as figuras 4 (b)-(d) mostram os resultados da reduo espacial de N = 256 para N = 128, 64 e 32, respectivamente.

  • Fundamentos de Imagens Digitais 23

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    Tabela 3 - Nmero de bytes necessrios para armazenar uma imagem digital NxN com 2n nveis de cinza

    n

    N 1 2 3 4 5 6 7 8

    32 128 256 512 512 1.024 1.024 1.024 1.02464 512 1.024 2.048 2.048 4.096 4.096 4.096 4.096

    128 2.048 4.096 8.192 8.192 16.384 16.384 16.384 16.384256 8.192 16.384 32.768 32.768 65.536 65.536 65.536 65.536512 32.768 65.536 131.072 131.072 262.144 262.144 262.144 262.144

    1.024 131.072 262.144 393.216 524.288 655.360 786.432 917.504 1.048.576

    (a)

    (b)

    (c)

    (d)

    Figura 4 - Efeito da resoluo espacial na qualidade da imagem.

    A figura 5 ilustra os efeitos da reduo do nmero de nveis de cinza sobre a qualidade da imagem. Na figura 5(a) tem-se uma imagem de 442 x 299 pixels com 256 tons de cinza (n = 8). As figuras 5(b)-(h) foram obtidas reduzindo-se o nmero de bits de n = 7 at n = 1, enquanto a resoluo espacial foi mantida constante em 442 x 299 pixels. A partir da imagem com 32 tons de cinza perceptvel o surgimento de uma imperfeio na imagem, conhecida como 'falso contorno' (false contouring).

  • 24 Fundamentos de Imagens Digitais

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    (a)

    (b)

    (c)

    (d)

    (e)

    (f)

    (g) (h) Figura 5 - Efeito do nmero de nveis de cinza na qualidade de uma imagem 442 x 299 com 256, 128, 64, 32, 16, 8, 4 e 2 nveis de cinza, respectivamente.

  • Fundamentos de Imagens Digitais 25

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    Para obter uma imagem digital de qualidade semelhante a de uma imagem de televiso P&B, so necessrios 512 x 512 pixels e 128 nveis de cinza. Em geral, 64 nveis de cinza so considerados suficientes para o olho humano. Apesar disto, a maioria dos sistemas de viso artificial utiliza imagens com 256 nveis de cinza. Os processos de amostragem e quantizao podem ser aprimorados usando tcnicas adaptativas. Sob o aspecto da amostragem, a idia bsica utilizar maior nmero de pontos em regies de grande detalhe, em detrimento das regies homogneas de grandes dimenses, que poderiam ser amostradas com menor nmero de pixels. Sob o ngulo da quantizao, uma vez que o olho humano no capaz de perceber sutis diferenas de tons de cinza nas imediaes de variaes abruptas de intensidade, o objetivo seria utilizar poucos nveis de cinza nestas regies. O principal obstculo para a implementao destas tcnicas a necessidade de identificao prvia (ainda que aproximada) das regies presentes na imagem e das fronteiras entre elas. No caso da quantizao, entretanto, outra tcnica adaptativa pode ser utilizada. Efetuando um levantamento da freqncia de ocorrncia de todos os nveis de cinza permitidos, pode-se diminuir os degraus de quantizao nas regies da escala de cinza com maior concentrao de ocorrncia de pixels, aumentando-os nas demais regies.

    Leitura complementar Para uma introduo questo da converso de uma cena tridimensional em uma imagem bidimensional, incluindo transformaes de perspectiva, aspectos de calibrao de cmeras e viso estreo, sugerimos [Faugeras 1993], o captulo 2 de [Schalkoff 1989] e a seo 2.5 de [Gonzalez e Woods 1992]. Para maiores detalhes sobre o funcionamento de cmeras CCD e fundamentos de sinais analgicos de vdeo recomendamos [Nince 1991]. Os captulos 1 a 5 de [Lindley 1991] trazem uma descrio pormenorizada de um projeto de digitalizador de imagens (hardware e software). Para uma anlise dos efeitos produzidos na qualidade da imagem pela variao simultnea da resoluo espacial e do nmero de nveis de cinza, ver o trabalho de Huang [Huang 1965], resumido na seo 2.3 de [Gonzalez e Woods 1992]. O captulo 2 de [Pavlidis 1982] traz informaes adicionais sobre os aspectos de amostragem e quantizao. Aos interessados em um aprofundamento matemtico dos aspectos abordados nesta seo, recomendamos os captulos 1, 4, 5 e 6 de [Pratt 1991].

    2.2 Propriedades de uma imagem digital Nesta seo consideraremos as principais relaes entre pixels em uma imagem digital. Uma imagem digital uma imagem f(x,y) discretizada tanto espacialmente quanto em amplitude. Portanto, uma imagem digital pode ser vista como uma matriz cujas linhas e colunas identificam um ponto na imagem, cujo valor corresponde ao nvel de cinza da imagem naquele ponto. Para efeito de notao, uma imagem digital ser indicada por f(x,y). Quando nos referirmos a um pixel em particular, utilizaremos letras minsculas, tais como p e q. Um subconjunto de pixels de f(x,y) ser indicado por S.

    2.2.1 Vizinhana Um pixel p, de coordenadas (x,y), tem 4 vizinhos horizontais e verticais, cujas coordenadas so (x+1, y), (x-1, y), (x, y+1) e (x, y-1). Estes pixels formam a chamada "4-vizinhana" de p, que ser designada N4(p). Os quatro vizinhos diagonais de p so os pixels de coordenadas (x-1, y-1), (x-1, y+1), (x+1, y-1) e (x+1, y+1), que constituem o conjunto Nd(p). A "8-vizinhana" de p definida como:

  • 26 Fundamentos de Imagens Digitais

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Brasport, 1999. ISBN 8574520098.

    N8(p) = N4(p) Nd(p) (2.3)

    Os vrios tipos de vizinhana esto ilustrados na figura 6.

    p p p

    Figura 6 - Conceitos de 4-vizinhana, vizinhana diagonal e 8-vizinhana.

    2.2.2 Conectividade A conectividade entre pixels um importante conceito usado para estabelecer limites de objetos e componentes de regies em uma imagem. Para se estabelecer se dois pixels esto conectados, necessrio determinar se eles so adjacentes segundo algum critrio e se seus nveis de cinza satisfazem a um determinado critrio de similaridade. Por exemplo, em uma imagem binria, onde os pixels podem assumir os valores 0 e 1, dois pixels podem ser 4-vizinhos, mas somente sero considerados 4-conectados se possurem o mesmo valor. Seja V o conjunto de valores de tons de cinza utilizados para se definir a conectividade. Por exemplo, numa imagem binria, V = {1} para a conexo de pixels com valor 1. Numa imagem de mltiplos tons de cinza, para a conexo de pixels com valores de intensidade na faixa de 32 a 64, V = {32, 33, ..., 63, 64}. Conhecendo o conceito de vizinhana e dado o conjunto V, podemos definir os seguintes critrios de conectividade: 1. "4-conectividade": dois pixels p e q com valores de tom de cinza contidos em V, so "4-

    conectados" se q N4(p). 2. "8-conectividade": dois pixels p e q com valores de tom de cinza contidos em V, so "8-

    conectados" se q N8(p). 3. "m-conectividade (conectividade mista)": dois pixels p e q com valores de tom de cinza

    contidos em V, so "m-conectados" se: (i) q N4(p) ou (ii) q Nd(p) e N4(p) N4(q) = .

    A conectividade mista uma modificao da 8-conectividade e introduzida para eliminar os mltiplos caminhos que geralmente surgem quando a 8-conectividade usada. Por exemplo, seja o trecho de imagem da figura 7(a). Para V = {1} os caminhos entre 8 vizinhos do pixel do centro so indicados por linhas contnuas na figura 7(b), onde se pode observar a existncia de caminhos redundantes entre os pixels do centro e do canto superior esquerdo da figura. Esta redundncia resolvida utilizando-se a m-conectividade, que remove a conexo diagonal redundante, como mostra a figura 7(c).

    1 1 0 1 1 0 1 1 0 0 1 0 0 1 0 0 1 0 1 0 0 1 0 0 1 0 0

    (a) (b) (c) Figura 7 - (a) Segmento de imagem binria, (b) 8-vizinhos do pixel central, (c) m-vizinhos do pixel central.

  • Fundamentos de Imagens Digitais 27

    MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento