1 Cap.9: Fundamentos de vídeo Prof. Dr. Abel Gomes (agomes@di.ubi.pt)

Preview:

Citation preview

1

Cap.9: Fundamentos de vídeo

Prof. Dr. Abel Gomes(agomes@di.ubi.pt)

2Parte 2

Sumário

História Elementos de sistemas de difusão (broadcasting) Scanning e entrelaçamento Cor e gamma Sub-amostragem chroma Representações

3Parte 2

História 1839: câmeras fotográficas do tipo Daguerre (www.fi.edu/pieces/

myers ). 1893: difusão de áudio por telefone, (Puskas). 1895: comunicação sem fios (Marconi e Popov). 1895: criação do filme (irmãos Lumiére). 1919: difusão de rádio (Holanda e Canadá). 1934: Estados Unidos fundam FCC (Federal Communications

Commission, www.fcc.gov) 1935: difusão de TV (Alemanha e Grã-Bretanha). 1941: TV b&w nos Estados Unidos.

1951: gravador de vídeo (Bing Crosby Enterprises). 1963: satélite geo-estacionário Meados de 70: transmissão em cabo de fibra óptica 1985: FCC determina a criação da norma ATSC até 1993? 1989: difusão de HDTV analógica (Japão) 1996: adopção da norma ATSC

Ainda: invenção do telefone, fundação da ATT, invenções de TV, primeiras estações/redes de rádio

Ainda: primeiras emissões de TV NTSC, primeiro sistema por cabo, VCR doméstico, dispositivo tivoli/replay, TV directa, primeiras emissões HDTV

4Parte 2

Grupos de Normalização ITU-T (ITU Telecommunications), sucedânea da

CCITT ITU-R (ITU Radiocommunications), sucedânea da

CCIR FCC (Federal Communications Commission) SMPTE (Society of Motion Picture and Television

Engineers) etc.

5Parte 2

Sistema de emissão/difusão (broadcasting)

OBJECTIVOS: Utilização eficiente da largura de banda Elevada percepção da qualidade de

video/áudio

Tra

nsm

iss

or

Rece

pto

r

6Parte 2

Varrimento e entrelaçamento

Transmissão é um sinal contínuo O transmissor capta e codifica imagens O receptor descodifica iamgens para

visualização A imagem é traçada linha-a-linha

O varrimento é da esquerda para a direita, de cima para baixo.

Há um intervalo em branco vertical/horizontal

O sinal é entrelaçado Melhora a percepção do movimento Alternativa: varrimento progressivo

7Parte 2

Varrimento do dispositivo de visualização de vídeo

O vídeo é composto de dois sinais: luma e chroma Video composto (composite video) faz a combinação dos dois sinais. Video separado (component video) envia os dois sinais

separadamente

Amplitude

Time

Cathode

8Parte 2

Funcionamento duma câmera

Uma câmera tem 1, 2 ou 3 tubos para amostragem Mais tubos (CCDs) e melhores lentes produzem melhores

figuras

Beam Splitter

Color Filters

En

cod

er

Camera Tubes

Zoom Lens Luma

Chroma

G

R

B

9Parte 2

CRT de visão directa (Direct View CRT)

3 canhões (RGB) energizam fósforos:

Variando a energia altera a intensidade percepcionda

Diferentes energias em diferentes fósforos produzem diferentes cores

Os fósforos têm de ser refrescados para evitar o esmorecimento da cor

Tipos de tecnologias: Máscara sombra (shadow mask

ou delta-gun dot mask) PIL slot mask Grelha-abertura de canhão

simples com 3 feixes (single-gun aperture-grille); exemplo: Trinitron

Shadow Mask

HolesScreen

Phosphors

RG

B

RGB

10Parte 2

Notação de varrimento Especificação de linhas/”frame rate”

NTSC 525/59.94 PAL 625/50

ATSC – tudo é variável 1080i 1920x1080 varrimento entrelaçado 720p 1280x720 varrimento progressivo

Porquê 59.94? Evita o problema de interferência entre as sub-

portadoras de cor e de som.

11Parte 2

Campos entrelaçados(interlaced fields)

vertical blanking

vertical blanking

Field 1

Field 2

Line 1 ---

Line 21 ---

Line 263 ---

Line 283 ---

Line 525 ---

1

484

485

...

485

24

...

485

484

23

Signal Format

Raster Format

ITU-R Rec. 601: 720x483

12Parte 2

Varrimento (525/59.94)

Active

Active

Active

squarepixel

601

4fsc

Total Size Active Area

780X525

858X525

910X525

644X483

720X483

757X483

13Parte 2

Razão de aspecto/ taxa de refrescamento

Razão de aspecto TV convencional usa 4:3 (1.33) HDTV usa 16:9 (2.11) Cinema usa 1.85:1 ou 2.35:1

Taxa de refrescamento NTSC usa 60Hz (59.94Hz) PAL usa 50Hz Cinema usa 48Hz (mas ainda só 24 fps)

14Parte 2

Vídeo NTSC(525 linhas, 60 campos/s)

525 linhas de varrimento repetidas 29.97 vezes por segundo (i.e. 33.37 ms/frame)

Linhas de varrimento entrelaçadas dividem uma frame em dois campos com 262.5 linhas cada um (i.e. 16.68 ms/campo)

20 linhas reservadas para informação de controlo no início de cada campo

só 483 linnhas de dados visíveis Laserdisc e S-VHS mostram cerca de 420 linhas (percepção) Emissão/difusão TV normal mostra cerca de 320 linhas

Uma linha dura 63.6 s (10.9 s em branco)

15Parte 2

Vídeo PAL(625 linhas, 60 campos/s)

625 linhas de varrimento repetidas 25 vezes por segundo (i.e. 40 ms/frame)

Linhas de varrimento entrelaçadas dividem uma frame em 2 campos com 312.5 linhas cada um (i.e. 20 ms/campo)

Aproximadamente 20% mais linhas que o NTSC

NTSC vs. PAL grosseiramente a mesma largura de banda

16Parte 2

Percepção da cor Color é o resultado da percepção da luz

A retina capta ondas de luz no espectro entre 400nm e 700nm

Os seres humanos são mais sensíveis ao brilho do que à cor A retina é composta de cones e bastonetes

Cones respondem a diferentes frequências (RGB) Bastonetes medem o brilho a baixos níveis de luz

(i.e., visão nocturna) CIE estabeleceu normas relativas à cor

CIE XYZ, CIE xyY RGB linear

17Parte 2

Gammawww.cgsd.com./papers/gamma.html

Um CRT é inerentemente não-linear

As alterações de visualização são baseadas na voltagem alimentadora.

A visão humana é também não-linear

A sensação de luminosidade é função potência da intensidade de luz (y=xw)

Surpresas agradáveis acontecem… CRT não-linear tem uma

relação próxima com a luminosidade humana inversa

A codificação da intensidade num sinal com correcção gamma maximiza a percepção da imagem

Y -vs- Y’

                     Sample Input to Monitor                      Graph of Input

                     Output from Monitor                      Graph of

Output L = V 2.5

18Parte 2

Gamma em vídeowww.cgsd.com./papers/gamma.html

Câmera faz a correcção gamma

A visualização (display) impõe a função potência inversa

y = x 1/2.5

                     Sample Input                      Graph of Input

                     Gamma Corrected Input                      Graph of Correction L' =

L 1/2.5

                     Monitor Output                       Graph of Output

camera transmission display

19Parte 2

Codificação de imagens a cores

Imagem representada por 24 bits/pixel (8 bpp) Cada cor com valor entre 0 e 255

Vídeo usa codificação não-linear Distribuição uniforme de cores na

codificação RGB R’G’B’ (RGB c/ correcção gamma)

Vídeo usa luminância/crominância R’G’B’ Y’CBCR

Luminância é Y (tecnicamente luma é Y’) Crominância é CBCR

20Parte 2

Sub-amostragem cromática

A sub-amostragem cromática reduz dados: 2 chroma/luma 16 bpp 1 chroma/luma 12 bpp

A notação é a:b:c a é o número de amostras luma b é o número de amostras chroma por linha

ímpar c é o número de amostras chroma por linha

par Ex. 4:4:4, 4:2:2, 4:1:1, 4:2:0, …

21Parte 2

Amostragem de linhaY Y Y Y Y

4:4:4

CR/CB CR/CB CR/CB CR/CB CR/CBY Y Y Y Y

4:2:2

CR/CB CR/CB CR/CB

Y Y Y Y Y4:1:1

CR/CB

4:2:2 é conhecida por broadcast quality4:1:1 é conhecida por VHS quality4:2:0 é 2:1 nas direcções horizontal e vertical

22Parte 2

Representações Composta

NTSC - 6MHz (4.2MHz video), 29.97 frames/second PAL - 6-8MHz (4.2-6MHz video), 50 frames/second

Componente Vídeo com separação (luma, chroma) - svhs, Hi8mm RGB, YUV, YIQ, … YCBCR – usado na maior parte de representações

comprimidas

Vídeo com separação chamado “s-video”

23Parte 2

Representações analógicas de vídeo

NTSC Y = 0.299R + 0.587G + 0.114B I = 0.596R - 0.275G - 0.321B Q = 0.212R - 0.523G + 0.311B composite = Y + Icos(Fsc t) + Qsin(Fsc t)

PAL Y = 0.299R + 0.587G + 0.114B U = 0.492(B-Y) Q = 0.877(R-Y) composite = Y + Usin(Fsc t) + Vcos(Fsc t)

24Parte 2

Digitalização TV analógica é um sinal contínuo TV digital utiliza valores numéricos

discretos O sinal é amostrado As amostras são quantizadas Pequenas regiões discretas são digitalizadas

A imagem é representada por um array 2-dimensional de pixéis

25Parte 2

Tamanhos da imagem

QSIF(19Kp)

SIF (82Kp)

601 (300Kp)

SVGA (500Kp)

ATV (1Mp)

Workstation (1Mp)

HDTV (2Mp)

120

240

483

600

720

900

1080

160 352 720 800 1152 1280 1920

26Parte 2

Imagens de estações de trabalho

[1 Mega Pixel] 1152 x 900 = 1,036,800 pixels

[xvga] 1024 x 768 = 786,432 pixels

[?] 1280 x 1024 = 1,310,720 pixels

27Parte 2

Representações de vídeo digital

Digital Composite Video(D2/D3,SMPTE 244M) 142 Mb/s data rate, em paralelo ou em série Sinais de cor sub-amostrados 4:2:2

• Digital Component Video(D1/D5,SMPTE RP125)

Mantém sinais separados para luma e chroma 270 Mb/s data rate, em paralelo ou em série Sinais de cor sub-amostrados 4:2:2

• Compressed Digital Video MPEG, MJPEG, H.26x, DV, …

28Parte 2

Sub-amostragem cromática digital (estrutura de blocos)

29Parte 2

O que é video data rate? Digital

720x483 = 347,760 pixels/frame A amostragem 4:2:2 dá 695,520 bytes/frame 21 MB/sec (167 Mbs) A amostragem 4:4:4 dá 250 Mbs

ATV (MPEG MP@ML) 1280x720 = 921,600 pixels/frame A amostragem 4:2:0 dá 1,382,400 bytes/frame 41 MB/sec (328 Mbs)

(Nota: MPEG coded streams are 1.5-80 Mbs)

30Parte 2

O que é video data rate? (cont.)

ATSC (720P) 720x1280 = 921,600 pixels/frame A amostragem 4:2:2 = 1,843,200 bytes/frame 24 fps = 44,236,800 bytes per second 44 MB/s = 354 Mbs

ATSC (studio 1080I) 1080x1920 = 2,073,600 pixels/frame A amostragem 4:4:4 = 6,220,800 bytes/frame 30 fps = 186,624,000 bytes/second 187MB/s = 1.5 Gbs

31Parte 2

Taxa de dados vídeo digital em série

Vídeo digital em série é uma norma de transporte de vídeo Largamente usada em estúdios de produção e

de emissão/difusão Taxas de dados

NTSC SDI aproximadamente 200 Mbs ATSC SDI aproximadamente 1.5 Gbs

Routing Switcher Recorde-se que um recurso típico em redes de

computadores é um 256x256 routing switcher Qual é a taxa de dados através do switch?

32Parte 2

Percepção humana Movimento suave

Depende do material em movimento Grande parte da acção é percebida a níveis suaves

de 24 fps Seres humanos muito sensíveis a

Baixas frequências Mudanças na luminância e no sub-espectro azul-

laranja Visão dá realce à detecção de arestas

Forte propensão para as linhas horizontais e verticais Mascaramento visual face a grandes alterações

de luminância

33Parte 2

Produção de vídeo de alta qualidade

É necessária câmera de alta qualidade S-Video(SVHS, Hi8mm) melhor que vídeo composto 3 chips melhor que 1 chip Digital melhor que analógico

Luzes, luzes, luzes … Experimente produzir vídeo com filtros para alterar as

cores

Construa cenas a partir de ângulos diferentes para criar estimulação visual

Estude técnicas de filme/vídeo Deixe a pessoa sair de cena sem mover a câmera Mantenha a orientação correcta das imagens Mude de cena para reflectir a mudança temporal

34Parte 2

Conclusões NTSC/PAL foram excelentes normas que

duraram cerca de 50 anos A tecnologia mudou duma forma completa durante

este espaço de tempo A revolução digital está a mudar a indústria

O impacto principal está no desenvolvimento da norma ATSC

A revolução Internet está também a mudar a indústria Webcasting versus emissão/difusão para o mercado

de massas Wireless versus cable versus transmissão de

pacotes FIM

Recommended