Fundamentos da Representação de Informações em Computadores Prof. Carlos H. Marcondes...

Preview:

Citation preview

Fundamentos da Representação de Informações em Computadores

Prof. Carlos H. Marcondes

marcon@vm.uff.br

Representação e magia

Pinturas pré-históricas, grutas de Altamira (Espanha) e Lascaux (França)

Caracter instrumental da representação

• Manipula-se a representação por que é mais econômico que manipular a realidade diretamente

• O resultado da manipulação da representação é subsídio para a praxis sobre a realidade

• Similaridade: Representação e Realidade

Manipulação = Simulaçãocomputador é a máquina capaz de simular a realidade

Representação de conceitos no computador

Carro

Realidade Representação computacional

Objeto, conceito

Representação simbólica (codificação, linguagem)

Representação por imagens

• Representação por IMAGENS – formatos “mapa-de-bits” (bitmap): .BMP, .PCX, .GIF, .TIFF, .JPEG

• Representação simbólica – uso da linguagem, caracteres são CODIFICADOS – códigos ASCII e EBCDIC– Cada caracter é representado por um código

de 8 bits

Representação de informações no computador

Possibilidades de codificação de informações em função do conjunto de sinais

- 1 bit : 0 - 21=2

1

- 2 bits: 00 - 22=4

10

01

11

00

- 3 bits: 000 - 23=8

100

010

001

110

101

011

111

000

Caracteres codificados permitem a busca por um padrão de bits ligados e desligados

A palavra “BRASIL”

01000010-01010010-01000001-01010011-01001001-01001100

B R A S I L

FORMATOS para representação de informações

• Um FORMATO é um específico arranjo de informações, formando um arquivo digital

• Um FORMATO contém informações voltadas para pessoas (conteúdo) e informações voltadas para os programas que processam estes conteúdos

• Ex: formato WINWORD (.DOC)– Conteúdo – - o caráter “A”– Informações para o programa - tipo de fonte

- cor- normal, negrito ou itálico- etc, etc, etc

Formatos proprietários – exclusivos de um fabricante. Ex: .DOC, PDF

Formatos abertos - padronizados. Ex. HTML, XML, JPEG, GIF

X

Tabela ASCII

#NJoão da Silva#EPetrobras#Mjoao@petrobras.com.br###NMaria da Conceição#EBanco do Brasil#Mmaria@bb.com.br##

João da Silva, Petrobras e joao@petrobras.com.br são os Conteúdos,

#N, #E, #M e ## são o Informações de codificação dos elementos do Vocabulário , de modo que minha mala direta possa ser comprendida por um programa

Arquivos em formato “mapa de bits”:

•     

Arquivos em formato “mapa de bits”: como reconhecer um caracter?

A a A a A a a

a A ? ? ? ? ?

Processo de digitalização

A digitalização é o processo de transformar documentos em papel em arquivos digitais de imagem tipo ¨mapa-de-bits¨

Nos arquivos de imagem tipo “mapa-de-bits” cada ponto de um documento, cada ponto de cada caracter de um documento é desenhado e não representado por um código como no conjunto de caracteres ASCII

Processo de digitalizaçãoImagens são formadas por pontos

Pixel - (Picture Element) É o menor ponto de luz cuja cor e luminosidade podem ser controladas na tela. As imagens são formadas com a combinação de grande número de pixels. O termo é usado para referir-se a resolução de uma placa de vídeo ou monitor (ex: 800 x 600 pixels).

Pixels são representados por 1 ou mais “bits”

Bitonal ou preto-e-branco: 1 bit por pixel:

pontos pretos: “1”pontos brancos: “0”

Monocromático: preto-e-branco com diversas intensidades – 4 bits, 6 bits, 8 bits, por pixel)Colorido

8 bits por pixel: 256 cores12 bits por pixel : 4096 cores24 bits por pixel : 16.800.000 cores (“true color”)

0000000000 0000000000 0000000000 0111111110 0100000010 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0000000000 0000000000 0000000000 0000000000

Arquivo “mapa-de-bits”

Imagem na Tela 10 X 20

Correspondência Arquivo “mapa-de-bits”, imagem na tela do computador

Processo de digitalização - RESOLUÇÃO

• Relação entre número de pontos de uma imagem (Pixels) / Área

• Unidade: “dpi” (“dots per inch”) pontos por polegada quadrada

• A resolução é uma medida da LEGIBILIDADE de uma imagem

Processo de digitalizaçãoRESOLUÇÃO - aplicação da digitalização em

DOCUMENTOS

Arquivos de imagens ( de documentos) com baixa resolução são POUCO LEGÍVEIS (abaixo de 50 dpi)

Acima de 800 dpi a vista humana NÃO DISTINGUE MAIS MELHORAS DE LEGIBILIDADE

Quanto maior a resolução de uma imagem, maior o tamanho do arquivo que vai armazena-la

Resolução razoável para documentos: 300 dbi

Processo de digitalização

• Como não existe um código único para cada caracter, as imagens dos caracteres são desenhadas!

A a A a A a a a A a,

• nos arquivos “mapa-de-bits” não é possível fazer busca por conteúdo

Processo de digitalização• Os sistemas de gerenciamento de imagens

eletrônicas de documentos – GED - associam a cada arquivo de imagem, um registro de uma base de dados com conteúdos textuais codificados, para fins de busca.

• Estes sistemas são a combinação das tecnologias de bancos de dados com a digitalização de documentos através do uso de escaners

Tipo | Num. | Setor | Data | Assunto |

Registro de um banco de dados: pontos de acesso para

recuperação

Imagem digitalizada de um documento

Recommended